реклама

У дома - Дизайнерски съвети
Отпечатана е буквата th. “Y” не е “и” е кратко! За важността на нормализирането на Unicode. Беззвучни и озвучени звуци

През последните шест месеца интернет просто беше наводнен с „буквата“ „th“. Срещнах я в новинарски сайтове, в месинджъри, в Habrahabr и geektimes. „За какво изобщо говорим?“ - питате - "Виждам обичайната буква y!" Какъв резултат. Виждам го така:



Ако сте един от късметлиите, чиято буква "y" изглежда точно като "истинско" "y", ето трик за вас: копирайте я (буквата "y") в Notepad, поставете курсора в края на буквата и натиснете Backspace. Магия, умопомрачителна!
как става това

Графеми, глифове, кодови точки, оформление и байтове

Много кратко въведение:
Графема е това, което сме свикнали да наричаме буква в смисъла на единица текст. Глифът е графична единица и може графично да представя самата графема или част от нея (например различни диакритични знаци: ударения, умлаути, горен индекс за буквата е и др.).
Кодовата точка е начинът, по който текстът е написан в Unicode представяне. Една графема може да бъде написана с различни кодови точки.
Кодовите точки са кодирани в различни представяния на байтове в зависимост от стандарта: UTF-8, UTF-16, UTF-32, BE, LE…
Езиците за програмиране обикновено работят с кодови точки; Обичайно за нас, хората, е да мислим с глифове.

Нека най-накрая разберем нашата буква th. Какво му е толкова специалното?
Тази буква е една графема (накратко „и“), но се изписва с две кодови точки:
U+000438 МАЛКА БУКВА I НА КИРИЛИЦА U+000306 КОМБИНИРАНЕ НА BREVE
Ако сте направили трика с връщането назад, вие всъщност сте изтрили COMBINING BREVE или, на типографски език, иконата за краткост над гласната.

Обичайната кратка буква „и“, която всички сме свикнали да въвеждаме на клавиатурата, е съставен знак, написан с една кодова точка:
U+000439 КИРИЛИЦА МАЛКА БУКВА КРАТО I
Показването на диакритичните знаци зависи от шрифта и рендера. Например в прозореца за редактиране на тази публикация символът изглежда правилен, но когато се гледа, се мести. Някои шрифтове могат да показват диакритичните знаци отделно дори в съставни знаци.

Защо това е лошо?

Не всички програми и още по-малко уебсайтовете могат да конвертират кодови точки във форма, която ви позволява да сравнявате идентични глифове, написани с различни кодови точки. С други думи, не всяка програма и уебсайт разпознават „th“ и „th“ като един знак, което прави невъзможно например търсенето с такива букви.

Не е нужно да търсите далеч за пример: сравнително нова статия с преглед на мишката в geektimes, екранна снимка от която е дадена по-горе в статията. Нека потърсим в Google следната фраза, която изглежда е в статията:
никой не ви притеснява да създадете „празен“ профил

Публикацията е вторият резултат и както можете да видите от удебелената част, имаме пълно съвпадение на текста. Страхотно, отваряме го и се опитваме да намерим същия текст на страницата и виждаме, че Firefox не е намерил нищо:

Търсенето в Geektimes също не дава подходящи резултати:

Но веднага щом замените съставното „th“ с неговия разложен брат „th“, всичко си идва на мястото:

Очевидно Google по някакъв начин трансформира заявката за търсене, за да ви позволи да търсите по глифове, а не по техните кодови точки.
Как работи?

Нормализация

Стандартът за нормализиране на Unicode описва два еквивалента на знаци: каноничен и съвместим. Първият ви позволява да сравнявате идентични глифове с различни кодови точки, а вторият ви позволява да ги сравнявате с опростени аналози - ½ с 1/2, ℌ с H и т.н.

Има и 4 вида нормализация:

  • Форма за нормализиране D (NFD)- канонична декомпозиция. Разложете cześć (здравей на полски) на c, z, e, c + ´, s + ´.
  • Форма за нормализиране C (NFC)- ще събере това, което предишната версия изложи.
  • Формуляр за нормализиране KD (NFKD)- разлагане на съвместимостта. Ще направи 1/2 от ½, 25 от 2⁵.
  • Формуляр за нормализиране KC (NFKC)- ще се опита да събере това, което предишният изложи.
Ако говорим за сайт като Habrahabr, тогава има смисъл да извършите NFC нормализиране на всички публикации, преди да бъдат публикувани, и да подложите заявката за търсене на NFKD обработка.

В Python, например, това може да стане с модула unicodedata.

Скрит текст

импортиране на сис
импортиране на unicodedata
print(unicodedata.normalize("NFKD", sys.argv))

% python unicode.py cześć | hexdump -C
00000000 63 7a 65 73 cc 81 63 cc 81 0a |czes..c...|
% ехо "cześć" | hexdump -C
00000000 63 7a 65 c5 9b c4 87 0a |cze.....|

Заключение

Не мога да кажа с пълна сигурност кой е виновен за появата на „th“ в RuNet, но подозрението пада върху Google Docs. За щастие, изглежда, че грешката е отстранена, защото... Вече 3 седмици не ми се е налагало да гледам пълзещия бриф.

Проблеми с глифове се случват и офлайн. Ето снимка на истински паспорт с буква, вероятно “е” (МАЛКА БУКВА НА КИРИЛИЦА IE + КОМБИНИРАЩА ДИАЕРЕЗИС)

Обемните букви отдавна са популярни в домашния декор, на фотосесии, подаряват се и се използват като сватбена украса. Ако решите да ги направите сами, в този майсторски клас ще ви покажа един начин да направите триизмерни букви от картон със собствените си ръце.

Направи си сам обемни букви - материали и инструменти

За такива букви не много дебело велпапе работи добре. Този картон обикновено се използва за направата на различни кутии и опаковки. Задържа добре формата си и се реже доста лесно. Също така не трябва да изхвърляте тръби от хартиени кърпи (или тоалетна хартия), въпреки че можете да ги замените (с тапи за вино, например).

И така, за да направим триизмерни букви от картон, ще ни трябва:

  • Картон
  • ножици
  • PVA лепило
  • Бяла хартия
  • Молив
  • Тръби за хартиени кърпи
  • Владетел
  • Бои
  • Четка.

Обемни букви от картон - напредък в работата

Реших да направя първите английски букви от моето име и името на съпруга ми от картон. И разбира се, никъде без амперсанд. Да започваме.

1. Начертайте или отпечатайте желания размер буква някъде на А4 и го изрежете.

2. Очертайте буквата и я изрежете от картон в 2 екземпляра.

3. Изрежете лента от хартия с ширина около 2 см. Като цяло ширината зависи от това колко обемна ще бъде вашата буква. Ако правите наистина големи букви, можете да използвате пластмасови или хартиени чаши за еднократна употреба.

4. Вземете тръба от хартиени кърпи, нанесете лента на ръба й и я очертайте с молив, за да направите пръстен с ширина 2 см. В зависимост от размера на буквата ще ни трябват около 6 такива пръстена.

5. Изрежете пръстените с ножица или нож за хартия.

6. Разпределете пръстените според една от буквите им. Те ще ни дадат обема, от който се нуждаем, и ще държат картонените половини заедно.

7. Загрейте топящото се лепило. Намазваме едната страна на всеки пръстен и го залепяме за буквата.

8. Сега намазваме горните страни на пръстените и ги покриваме с втората половина на буквата. Това трябва да се направи бързо и внимателно, за да се получи гладко. Натиснете леко детайла отгоре, така че лепилото да залепне добре.

9. Сега нека намачкаме малко бялата хартия, нарежете я на малки ленти и залепете страните на буквата.

10. В резултат на това цялото писмо трябва да бъде покрито с дебел слой хартия. Когато лепилото изсъхне и се втвърди, ще имате доста здрава структура.

11. Остава само да нарисуваме нашите букви с акрилна боя. Акрилните бои покриват много повърхности плътно и имат добра устойчивост на влага. Нарисувах инициалите с бяла боя, а амперсанда с богат корал.

По този начин можете да направите всякакви букви, за да образувате имена или думи.Те няма да отнемат много време, но не са и най-бързият начин. Написването на едно писмо ми отне около 30-40 минути.

Честито творчество!

Разгледайте снимките на слайд 2 с вашето дете. Чуйте първите звуци в думите авлига и йоги. В думата авлига първият звук е [i]. Когато произнасяме този звук, въздухът преминава свободно през устата, без да среща никакви препятствия. Можете да го влачите дълго време и да го пеете. Това е гласен звук. Означава се с буквата I. В думата йоги първият звук е [th". Въздухът в устата среща преграда (езикът ни пречи). Това е мека съгласна. Когато се произнася, чуваме глас , това е звучна съгласна. Този звук се обозначава с буквата "и кратко".

Гледайте видео за буквите. Попитайте детето дали му е харесало видеото, какво му е харесало, какво е запомнило. Каква е разликата между буквата I и Y?

Прочетете стиховете на следващите слайдове. Нека вашето дете пляска с ръце, когато чуе нови звуци. Вижте слайд 6. Назовете думи с буквата I. Измислете свои думи с буквата I.

Разгледайте снимките на слайд 10. Назовете думите с буквата „и кратко“. Прочетете стихотворението на слайд 11. Моля, обърнете внимание, че звукът [th"] може да се появи в средата и в края на думата. Помислете за такива думи.

Напишете буквите в албума. Как изглежда всяка буква? Можете да завършите буквите към изображението.

Разгледайте слайдовете с картинки за всяка буква. Обсъдете какви звуци се чуват в началото на всяка дума. Слайдове за писане на писма за първокласници. Късмет!

Фирма Арт-Ин предлага цялостни решения в следните системи: електроснабдяване;управление на електрическо оборудване (управление на осветление);аудио-видео, домашно кино;охранителна и пожароизвестителна система;видеонаблюдение;контрол на достъп (домофон);телефонни, локални компютърни и телевизионни мрежи;укрепване на клетъчния сигнал; интегрирано управление (Smart Home).

Без кратко

А краткото (Y) съществува като самостоятелна буква от правописната реформа от 1918 г. Но те започнаха да пишат I с кратко много по-рано: правописът I дойде в руския език от малко руски книги през 17 век, по време на църковната реформа на патриарх Никон, и постепенно премина от църковнославянския и в светската руска писменост. „Кратка“ е руското наименование на диакритичния знак breve (от латинското breve - „късо“), заимствано от латиница и кирилица от старогръцки. Бревата изглежда като дъга над буквата, а експертите по шрифта различават бревето на кирилица по удебеленията в краищата на лъка от латинското бреве, което е по-дебело в средата.

През 1708 г. Петър I, за да опрости писането на букви от руската азбука, въвежда граждански шрифт. В кирилицата надписите бяха премахнати, а преките пътища също легнаха под ножа. През 1735 г. правата на Y са възстановени, но те не са признати като отделна буква - в речниците Y се комбинира с I.

В края на 19 век законодателят на руския правопис, професор Яков Грот, се оплака, че I и E с диакритични знаци означават напълно различни звуци. Той предложи да се включат буквите Y и E в азбуката наравно с останалите и да се нарече Y не „I с кратко“, а „И кратко“. Буквите не бяха въведени в азбуката приживе, но името остана и скоро стана единственото.

Под кратко

За лингвистите е трудно да определят точно звука, който означава буквата Y. Дълго време в речниците се наричаше гласна, но сега се нарича съгласна. Факт е, че в различни позиции Y означава различни звуци: когато Y идва след гласна, звукът е гласна (както в думата „може“), а когато е пред гласна, тогава съгласната е [yot] (както в думата „йод“). За да разберем такова сложно минало на краткото I, си струва да си припомним историята на буквата I. До 1918 г. в руския език имаше три букви за предаване на звука [и]. Първото - I - звучеше като I след съгласни (по-долу). Тази буква се нарича „I decimal“, тъй като съответства на числовата стойност 10. Съвременната кирилица I произлиза от главната гръцка буква eta - Η (горе). Интересно е, че буквата I има общ финикийски предшественик с гръцката Η/η и произлязлата от нея латинска Η/h. Това е финикийската буква Хет. Тя, между другото, предаде звука [йот] в позицията между гласните или в началото на думата: iena, maiorъ. Имаше и осмично And (модерно And, което имаше цифрово съответствие 8). Имаше и Ижица (в центъра), идваше от гръцката буква ипсилон и беше поставена главно в църковни термини, тъй като беше въведена, за да направи заемите възможно най-близки до гръцкия оригинал. Реформата, която последва през 1918 г., намали броя на вариантите на I, като не остави място за латинската йота.

С кратък

Смята се, че реформата на правописа от 1918 г. има за цел да опрости живота на гражданите, тъй като новото правителство обяви курс към всеобща грамотност. Строителите на новата държава предпочетоха да не помнят, че реформата е обсъдена и подготвена от подкомисията по правопис към Императорската академия на науките много преди революцията и е одобрена още през 1912 г. С указ на народния комисар на просвещението Анатолий Луначарски от 1 януари 1918 г. е установен нов правопис за всички държавни издания. Между другото, т.е. В текста на закона няма нито дума за Ижица, но по това време тя умря от само себе си и хората спряха да я използват. Така за звука [и] остана само една буква - тази, която използваме и днес. Реформата не се грижи за краткото I отделно, но от 1918 г. Y вече е посочено като отделна буква в учебниците. А през 1934 г. в Обяснителния речник на руския език, редактиран от Д.Н. Ушаков, то е записано със задна дата като част от руската азбука.

Буква "у": твърда или мека? Този въпрос много често се задава от ученици, които трябва да анализират дума според всички правила на фонетиката. Отговорът на това ще получите малко по-нататък.

Главна информация

Преди да поговорим за това какъв вид буква е "th" (мека или твърда), трябва да разберете защо буквите на руската азбука обикновено се разделят според такива критерии.

Факт е, че всяка дума има своя собствена звукова обвивка, която се състои от отделни звуци. Трябва да се отбележи, че звукът на конкретен израз е напълно свързан с неговото значение. В същото време различните думи и техните форми имат напълно различен звуков дизайн. Освен това самите звуци нямат смисъл. Те обаче играят жизненоважна роля в руския език. В крайна сметка благодарение на тях можем лесно да различаваме думите. Ето един пример:

  • [къща] - [дама] - [хаусма];
  • [m’el] - [m’el’], [tom] - [там], [house] - [volume].

Транскрипция

Защо се нуждаем от информация какъв тип е буквата „th“ (твърда или мека)? Когато произнасяте дума, е много важно да изведете правилно транскрипцията, която описва нейния звук. В такава система е обичайно да се използват следните символи:

Това обозначение се нарича Те трябва да се използват за обозначаване на транскрипция.

[´] е ударението. Поставя се, ако думата има повече от една сричка.

[b’] - вид запетая се поставя до съгласната буква и обозначава нейната мекота.

Между другото, по време на фонетичен анализ на думи често се използва следният символ - [j]. По правило той обозначава звука на буквата „th“ (понякога се използва символ като [th]).

Буква "у": съгласна или гласна?

Както знаете, в руския език всички звуци са разделени на съгласни и гласни. Те се възприемат и произнасят по съвсем различен начин.

  • Гласните звуци са онези звуци, при произнасянето на които въздухът лесно и свободно преминава през устата, без да среща никакви препятствия по пътя си. Освен това можете да ги дърпате, можете да викате с тях. Ако поставите дланта си на гърлото си, можете лесно да усетите работата на гласните струни по време на произношението на гласни. В руския език има 6 ударени гласни, а именно: [a], [e], [u], [s], [o] и [i].
  • Съгласните звуци са тези звуци, при произнасянето на които въздухът среща препятствие по пътя си, а именно лък или празнина. Появата им определя естеството на звуците. Като правило се образува празнина при произнасяне на [s], [w], [z] и [z]. В този случай върхът на езика се приближава до горните или долните зъби. Представените съгласни могат да бъдат изтеглени (например [z-z-z], [z-z-z]). Що се отнася до спирането, такава бариера се образува поради затварянето на говорните органи. Въздухът, или по-скоро неговият поток, рязко го преодолява, поради което звуците са енергични и кратки. Затова се наричат ​​експлозивни. Между другото, невъзможно е да ги дръпнете (опитайте сами: [p], [b], [t], [d]).

В допълнение към горните съгласни, руският език има и следните: [m], [y], [v], [f], [g], [l], [r], [ch], [ts] , [х] . Както можете да видите, има много повече от гласните.

Беззвучни и озвучени звуци

Между другото, много съгласни звуци образуват двойки глухота и звучност: [k] - [g], [b] - [p], [z] - [c], [d] - [t], [f] - [v] и т.н. Общо има 11 такива двойки на руски език. Има обаче звуци, които нямат двойки на тази основа. Те включват: [y], [p], [n], [l], [m] са нечифтни звучни, а [ch] и [ts] са нечифтни беззвучни.

Меки и твърди съгласни

Както знаете, съгласните букви се различават не само по звучност или, обратно, по глухота, но и по мекота и твърдост. Това свойство е втората по важност характеристика на звуците.

И така, буквата „th“ твърда или мека ли е? За да отговорите на този въпрос, трябва да разгледате всеки знак поотделно:

  • При произнасяне на меки съгласни целият език се придвижва леко напред, а средната му част леко се повдига.
  • При произношението на твърди съгласни целият език буквално се изтегля назад.

Трябва специално да се отбележи, че много съгласни букви образуват двойки една с друга въз основа на характеристики като мекота и твърдост: [d] - [d'], [p] - [p'] и т.н. Има общо 15 такива двойки . Има обаче и звуци, които нямат двойки на тази основа. Кои букви от твърди съгласни звукове са несдвоени? Те включват следните - [w], [f] и [c]. Що се отнася до несдвоените меки, това са [sch’], [h’] и [th’].

Обозначение на писмото

Сега знаете информацията дали буквата „th“ е твърда или мека. Но тук възниква нов въпрос: „Как се посочва мекотата на такива звуци в писмен вид?“ За това се използват напълно различни методи:

  • Буквите „е“, „ю“, „е“, „я“ след съгласните (без да се броят „ж“, „ш“ и „ц“) показват, че тези съгласни са меки. Да дадем пример: чичо - [d'a'd'a], леля - [t'o't'a].
  • Буквата „i“ след съгласните (без да се броят „zh“, „sh“ и „ts“) показва, че тези съгласни са меки. Нека дадем пример: сладко - [m'i'ly'], листо - [l'ist], ni´tki - [n'i´tk'i].
  • Мекият знак ("b") след съгласни (без да се броят "zh" и "sh") е показател за граматична форма. Също така показва, че съгласните са меки. Примери: далеч - [дал’], блокиран - [м’ел’], заявка - [проз’ба].

Както можете да видите, мекотата на съгласните звуци в писмен вид се предава не от отделни букви, а от техните комбинации с гласните „e“, „yu“, „e“, „ya“, както и мек знак. Ето защо експертите препоръчват да се обърне внимание на съседните символи.

Що се отнася до гласната буква „th“, тя винаги е мека. В тази връзка при транскрипция обикновено се обозначава по следния начин: [th’]. Тоест символът запетая, показващ мекотата на звука, трябва винаги да бъде поставен. [ш'], [ч'] също се подчиняват на същото правило.

Нека обобщим

Както можете да видите, няма нищо трудно да направите всяка дума правилно. За да направите това, просто трябва да знаете какви са гласните и съгласните, беззвучни и гласни, както и меки и твърди. За по-добро разбиране как трябва да се форматира транскрипцията, ще предоставим няколко подробни примера.

1. Думата "герой". Състои се от две срички, като втората е под ударение. Да направим анализа:

g - [g’] - звучен, съгласен и мек.

e - [i] е неударена гласна.

p - [p] - звучен, съгласен, несдвоен и твърд.

o - [o] - ударена гласна.

th - [th’] - звучен, съгласен, несдвоен и мек.

Общо: 5 букви и 5 звука.

2. Думата "дървета". Състои се от три срички, като 2-рата е под ударение. Да направим анализа:

d - [d’] - звучен, съгласен и мек.

e - [i] е неударена гласна.

p - [p’] - звучен, съгласен, несдвоен и мек.

e - [e´] - ударена гласна.

в - [v’] - звучен, съгласен и мек

e - [th’] - звучна, съгласна, несдвоена и мека и [e] - гласна, неударена;

v - [f] - тъп и твърд.

Общо: 8 букви и 8 звука.



 


Прочети:



Чийзкейкове от извара на тиган - класически рецепти за пухкави чийзкейкове Чийзкейкове от 500 г извара

Чийзкейкове от извара на тиган - класически рецепти за пухкави чийзкейкове Чийзкейкове от 500 г извара

Продукти: (4 порции) 500 гр. извара 1/2 чаша брашно 1 яйце 3 с.л. л. захар 50 гр. стафиди (по желание) щипка сол сода бикарбонат...

Салата Черна перла със сини сливи Салата Черна перла със сини сливи

Салата

Добър ден на всички, които се стремят към разнообразие в ежедневната си диета. Ако сте уморени от еднообразни ястия и искате да зарадвате...

Рецепти за лечо с доматено пюре

Рецепти за лечо с доматено пюре

Много вкусно лечо с доматено пюре, като българско лечо, приготвено за зимата. Така обработваме (и изяждаме!) 1 торба чушки в нашето семейство. И кой бих...

Афоризми и цитати за самоубийство

Афоризми и цитати за самоубийство

Ето цитати, афоризми и остроумни поговорки за самоубийството. Това е доста интересна и необикновена селекция от истински „перли...

feed-image RSS