domov - Nasveti oblikovalca
Natisnjena je črka th. "Y" ni "in" je kratko! O pomenu normalizacije Unicode. Zvočni in zveneči zvoki

V zadnjih šestih mesecih je bil internet preprosto preplavljen s "črko" "th". Spoznal sem jo na spletnih mestih z novicami, v hitrih sporočilih, na Habrahabru in geektimesu. "O čem sploh govorimo?" - vprašate - "Vidim običajno črko y!" Kakšen rezultat. Jaz to vidim takole:



Če ste eden izmed srečnežev, katerih črka "y" je videti kot "pravi" "y", je tukaj trik za vas: kopirajte jo (črko "y") v beležnico, postavite kazalec na konec črko in pritisnite vračalko. Čarobno, osupljivo!
Kako se to zgodi?

Grafemi, glifi, kodne točke, postavitev in bajti

Zelo kratek uvod:
Grafem je tisto, kar smo navajeni imenovati črka v smislu enote besedila. Glif je grafična enota in lahko grafično predstavlja sam grafem ali njegov del (na primer različni diakritični znaki: naglasi, preglasi, nadnapisano dvopičje za črko е itd.).
Code Point je, kako je besedilo napisano v predstavitvi Unicode. En grafem lahko zapišemo z različnimi kodnimi točkami.
Kodne točke so kodirane v različnih predstavitev bajtov, odvisno od standarda: UTF-8, UTF-16, UTF-32, BE, LE…
Programski jeziki običajno delujejo s kodnimi točkami; Za nas ljudi je običajno, da razmišljamo v glifih.

Končno ugotovimo našo črko th. Kaj je tako posebnega na njem?
Ta črka je en grafem (na kratko »in«), vendar je zapisana z dvema kodnima točkama:
U+000438 CIRILIČNA MALA ČRKA I U+000306 ZDRUŽEVANJE BREVE
Če ste izvedli trik s vračalko, ste dejansko izbrisali COMBINING BREVE ali, v tipografskem jeziku, ikono za kratkost nad samoglasnikom.

Običajna kratka črka "in", ki smo jo vsi navajeni tipkati na tipkovnici, je sestavljen znak, ki je napisan z eno kodno točko:
U+000439 CIRILA MALA ČRKA KRATKA I
Prikaz diakritičnih znakov je odvisen od pisave in upodabljalnika. Na primer, v oknu za urejanje te objave je simbol videti pravilen, vendar se ob ogledu premika. Nekatere pisave lahko diakritike prikazujejo ločeno, tudi v sestavljenih znakih.

Zakaj je to slabo?

Vsi programi, še manj pa spletna mesta, ne morejo pretvoriti kodnih točk v obliko, ki omogoča primerjavo enakih glifov, zapisanih z različnimi kodnimi točkami. Z drugimi besedami, vsak program in spletna stran ne prepoznata »th« in »th« kot enega znaka, zaradi česar je na primer nemogoče iskati s takimi črkami.

Za primer vam ni treba iskati daleč: razmeroma nov članek s pregledom miške na geektimes, posnetek zaslona iz katerega je podan zgoraj v članku. Poiščimo z Googlom naslednji stavek, za katerega se zdi, da je v članku:
nihče vas ne moti, da ustvarite "prazen" profil

Objava je drugi rezultat in kot lahko vidite iz odebeljenega dela, imamo popolno besedilno ujemanje. Super, odpremo jo in poskušamo najti isto besedilo na strani in vidimo, da Firefox ni našel ničesar:

Iskanje na Geektimesu tudi ne vrne ustreznih rezultatov:

Toda takoj, ko zamenjate sestavljeni "th" z njegovim razpadljivim bratom "th", se vse postavi na svoje mesto:

Očitno Google nekako preoblikuje iskalno poizvedbo, da vam omogoči iskanje po glifih in ne po njihovih kodnih točkah.
Kako deluje?

Normalizacija

Standard normalizacije Unicode opisuje dva ekvivalenta znakov: Canonical in Compatibility. Prvi vam omogoča primerjavo enakih glifov z različnimi kodnimi točkami, drugi pa vam omogoča primerjavo s poenostavljenimi analogi - ½ z 1/2, ℌ s H ​​itd.

Obstajajo tudi 4 vrste normalizacije:

  • Normalizacijski obrazec D (NFD)- kanonična razgradnja. Razčlenite cześć (zdravo v poljščini) na c, z, e, c + ´, s + ´.
  • Normalizacijski obrazec C (NFC)- bo zbral tisto, kar je določila prejšnja različica.
  • Normalizacijski obrazec KD (NFKD)- združljivostna razgradnja. Bo 1/2 od ½, 25 od 2⁵.
  • Normalizacijski obrazec KC (NFKC)- bo poskušal zbrati tisto, kar je prejšnji postavil.
Če govorimo o spletnem mestu, kot je Habrahabr, potem je smiselno izvesti NFC normalizacijo vseh objav, preden so objavljene, in iskalno poizvedbo podrediti obdelavi NFKD.

V Pythonu je to na primer mogoče storiti z modulom unicodedata.

Skrito besedilo

uvoz sys
uvoz unicodedata
print(unicodedata.normalize("NFKD", sys.argv))

% python unicode.py cześć | hexdump -C
00000000 63 7a 65 73 cc 81 63 cc 81 0a |czes..c...|
% echo "cześć" | hexdump -C
00000000 63 7a 65 c5 9b c4 87 0a |če.....|

Zaključek

Ne morem s popolno gotovostjo trditi, kdo je kriv za pojav "th" v RuNetu, vendar sum pade na Google Dokumente. Na srečo je videti, da je napaka odpravljena, ker... Že 3 tedne mi ni bilo treba pogledati na puzeče hlače.

Težave z glifi se dogajajo tudi brez povezave. Tukaj je fotografija pravega potnega lista s črko, verjetno »е« (CIRILIČNA MALA ČRKA IE + KOMBINIRANA DIAEREZA)

Volumetrične črke so že dolgo priljubljene v dekorju doma, na fotografiranju, podarjajo in uporabljajo kot poročne dekoracije. Če se odločite, da jih naredite sami, vam bom v tem mojstrskem razredu pokazal en način, kako narediti tridimenzionalne črke iz kartona z lastnimi rokami.

Volumetrične črke naredite sami - materiali in orodja

Za takšne črke se dobro obnese ne zelo debela valovita lepenka. Ta karton se običajno uporablja za izdelavo različnih škatel in embalaže. Dobro drži obliko in ga je zelo enostavno rezati. Prav tako ne smete zavreči cevk papirnatih brisač (ali toaletnega papirja), čeprav jih lahko nadomestite (na primer z zamaški za vino).

Torej, za izdelavo tridimenzionalnih črk iz kartona bomo potrebovali:

  • Karton
  • Škarje
  • PVA lepilo
  • bel papir
  • Svinčnik
  • Cevi za papirnate brisače
  • Ravnilo
  • Barve
  • Čopič.

Volumetrične črke iz kartona - napredek pri delu

Odločila sem se, da naredim prve angleške črke svojega imena in imena svojega moža iz kartona. In seveda nikamor brez znaka &. Začnimo.

1. Nariši ali natisni želeno velikost črk nekje na A4 in jo izreži.

2. Obrisi črko in jo izreži iz kartona v 2 izvodih.

3. Izrežite trak papirja širine približno 2 cm. Na splošno je širina odvisna od tega, kako obsežno bo vaše pismo. Če izdelujete res velike črke, lahko uporabite plastične ali papirnate kozarce za enkratno uporabo.

4. Vzamemo tubo papirnatih brisač, na njen rob prilepimo trak in ga s svinčnikom obrišemo, da dobimo obroč širok 2 cm, potrebujemo približno 6 takih obročev.

5. S škarjami ali nožem za papir izrežemo kolobarje.

6. Prstane razdelite glede na eno od njihovih črk. Dali nam bodo prostornino, ki jo potrebujemo, in držali kartonske polovice skupaj.

7. Segrejte talilno lepilo. Vsak obroč premažemo po eni strani in ga prilepimo na črko.

8. Sedaj premažemo zgornje stranice obročev in jih pokrijemo z drugo polovico črke. To je treba storiti hitro in previdno, da se izkaže gladko. Obdelovanec rahlo pritisnite na vrh, da se lepilo dobro oprime.

9. Zdaj pa bel papir malo zmečkajmo, narežemo na majhne trakove in zlepimo stranice črke.

10. Posledično mora biti celotno pismo prekrito z debelo plastjo papirja. Ko se lepilo posuši in strdi, boste imeli dokaj močno strukturo.

11. Ostaja le, da naše črke pobarvamo z akrilno barvo. Akrilne barve tesno pokrivajo številne površine in imajo dobro odpornost na vlago. Inicialke sem pobarvala z belo barvo, ampersand pa z bogato koralno.

Na ta način lahko naredite poljubne črke za sestavo imen ali besed. Ne bodo vzeli predolgo, vendar tudi niso najhitrejši način. Za pisanje enega pisma sem potreboval približno 30-40 minut.

Srečno ustvarjalnost!

Skupaj z otrokom si oglejte slike na diapozitivu 2. Poslušajte prve glasove v besedah ​​oriola in jogi. V besedi oriole je prvi glas [i]. Ko izgovorimo ta zvok, gre zrak prosto skozi usta, ne da bi pri tem naletel na ovire. Lahko jo dolgo vlečeš in poješ. To je samoglasnik. Označujemo ga s črko I. V besedi jogi je prvi glas [th". Zrak v ustih naleti na oviro (jezik nas moti). To je mehak soglasnik. Ko ga izgovorimo, slišimo glas , to je zveneč soglasnik. Ta zvok je označen s črko "in kratek".

Oglejte si video o črkah. Vprašajte svojega otroka, ali mu je bil video všeč, kaj mu je bilo všeč, česa se je spomnil. Kakšna je razlika med črko I in Y?

Preberite pesmi na naslednjih prosojnicah. Naj vaš otrok ploska z rokami, ko zasliši nove zvoke. Oglejte si diapozitiv 6. Poimenujte besede s črko I. Izmislite si svoje besede s črko I.

Oglejte si slike na diapozitivu 10. Poimenujte besede s črko "in kratko". Preberite pesem na diapozitivu 11. Upoštevajte, da je zvok [th"] lahko na sredini ali na koncu besede. Izmislite si takšne besede.

Zapiši črke v album. Kako izgleda posamezna črka? Lahko dopolnite črke do slike.

Oglejte si diapozitive s slikami za vsako črko. Pogovorite se, kateri glasovi se slišijo na začetku vsake besede. Diapozitivi za pisanje črk za prvošolce. Vso srečo!

Podjetje Art-In ponuja celovite rešitve v naslednjih sistemih: oskrba z električno energijo;nadzor električne opreme (kontrola razsvetljave);avdio-video, hišni kino;varnostni in požarni alarmni sistem;CCTV;kontrola pristopa (domofon);telefonska, lokalna računalniška in televizijska omrežja;krepitev celičnega signala; integriran nadzor (Smart Home).

Brez kratkega

In kratka (Y) obstaja kot samostojna črka od pravopisne reforme leta 1918. S kratkim pa so I začeli pisati veliko prej: črkovanje I je prišlo v ruski jezik iz maloruskih knjig v 17. stoletju, med cerkveno reformo patriarha Nikona, in postopoma prešlo iz cerkvenoslovanskega v posvetno rusko pisanje. "Kratka" je rusko ime za diakritični znak breve (iz latinskega breve - "kratek"), ki sta si ga latinica in cirilica izposodili iz stare grščine. Breve je videti kot pentlja nad črko, strokovnjaki za pisave pa ločijo cirilski breve po zadebelitvah na koncih pentlje od latinskega breveja, ki je debelejši na sredini.

Leta 1708 je Peter I, da bi poenostavil pisanje črk ruske abecede, uvedel civilno pisavo. V cirilici so ukinili nadpise, pod nož so prišle tudi bližnjice. Leta 1735 so bile pravice Y obnovljene, vendar niso bile priznane kot ločena črka - v slovarjih je bil Y združen z I.

Konec 19. stoletja se je zakonodajalec ruskega črkovanja, profesor Yakov Grot, pritožil, da I in E z diakritičnimi znaki označujeta popolnoma različne zvoke. Predlagal je vključitev črk Y in E v abecedo pod enakimi pogoji kot druge in Y ne poimenovati "I s kratkim", ampak "In kratkim". Črke v času njegovega življenja niso bile uvedene v abecedo, vendar se je ime prijelo in kmalu postalo edino.

Pod kratkim

Jezikoslovci težko natančno določijo glas, ki ga pomeni črka Y. Dolgo časa so ga v slovarjih imenovali samoglasnik, zdaj pa soglasnik. Dejstvo je, da Y v različnih položajih pomeni različne glasove: ko Y pride za samoglasnikom, je zvok samoglasnik (kot v besedi »lahko«), in ko je pred samoglasnikom, je soglasnik [yot] (kot v besedi "yod"). Da bi razumeli tako zapleteno preteklost kratkega I, se je vredno spomniti zgodovine črke I. Do leta 1918 so bile v ruskem jeziku tri črke za prenos zvoka [in]. Prvi - I - je zvenel kot I po soglasnikih (spodaj). To črko so imenovali "I decimal", saj je ustrezala številski vrednosti 10. Sodobna cirilica I izhaja iz velike grške črke eta - Η (zgoraj). Zanimivo je, da ima črka I skupnega feničanskega prednika z grško Η/η in iz nje izpeljano latinsko Η/h. To je feničanska črka Het. Prav ona je mimogrede prenesla zvok [iot] v položaj med samoglasniki ali na začetku besede: iena, maiorъ. Obstajal je tudi osmiški And (sodobni And, ki je imel številčno korespondenco 8). In bila je tudi Izhitsa (v središču), izhajala je iz grške črke ipsilon in je bila postavljena predvsem v cerkvenem smislu, saj je bila uvedena, da bi bile izposoje čim bolj podobne grškemu izvirniku. Reforma, ki je sledila leta 1918, je zmanjšala število različic I in ni pustila prostora za latinsko joto.

S kratkim

Domneva se, da je bila reforma črkovanja iz leta 1918 namenjena poenostavitvi življenja državljanov, saj je nova vlada napovedala smer k univerzalni pismenosti. Graditelji nove države se raje niso spomnili, da je reformo obravnaval in pripravil pravopisni pododbor pri cesarski akademiji znanosti že dolgo pred revolucijo in je bila odobrena že leta 1912. Z odlokom ljudskega komisarja za izobraževanje Anatolija Lunačarskega je bil od 1. januarja 1918 za vse državne publikacije uveden nov črkopis. Med drugim je bil ukinjen i. V besedilu zakona ni niti besede o Izhitsi, vendar je do takrat umrla sama od sebe in so jo prenehali uporabljati. Tako je za glas [in] ostala samo ena črka - tista, ki jo uporabljamo še danes. Reforma kratkega I ni posebej poskrbela, ampak je bil Y od leta 1918 že naveden kot posebna črka v učbenikih. In leta 1934 je v Razlagalnem slovarju ruskega jezika, ki ga je uredil D.N. Ušakova, je bila retroaktivno zapisana kot del ruske abecede.

Črka "y": trda ali mehka? To vprašanje zelo pogosto postavljajo učenci, ki morajo besedo razčleniti po vseh pravilih fonetike. Odgovor na to boste dobili malo naprej.

Splošne informacije

Preden se pogovorimo o tem, kakšna je črka "th" (mehka ali trda), morate ugotoviti, zakaj so črke ruske abecede na splošno razdeljene glede na te značilnosti.

Dejstvo je, da ima vsaka beseda svojo zvočno lupino, ki je sestavljena iz posameznih zvokov. Opozoriti je treba, da je zvok določenega izraza popolnoma povezan z njegovim pomenom. Hkrati imajo različne besede in njihove oblike popolnoma različno zvočno zasnovo. Poleg tega zvoki sami nimajo pomena. Vendar pa igrajo ključno vlogo v ruskem jeziku. Konec koncev, zahvaljujoč njim lahko zlahka razlikujemo besede. Tukaj je primer:

  • [hiša] - [gospa´] - [hiša´ma];
  • [m'el] - [m'el'], [tom] - [tam], [hiša] - [glasnost].

Transkripcija

Zakaj potrebujemo informacije o tem, kakšna črka »th« je (trda ali mehka)? Pri izgovorjavi besede je zelo pomembno, da pravilno prikažete transkripcijo, ki opisuje njen zvok. V takem sistemu je običajno uporabljati naslednje simbole:

Ta oznaka se imenuje Uporabiti jih je treba za označevanje transkripcije.

[´] je naglas. Postavi se, če ima beseda več kot en zlog.

[b’] - nekakšna vejica se postavi ob črko soglasnika in označuje njegovo mehkobo.

Mimogrede, med fonetično analizo besed se pogosto uporablja naslednji simbol - [j]. Praviloma označuje zvok črke "th" (včasih se uporablja simbol, kot je [th]).

Črka "y": soglasnik ali samoglasnik?

Kot veste, so v ruskem jeziku vsi zvoki razdeljeni na soglasnike in samoglasnike. Dojemajo in izgovarjajo se povsem drugače.

  • Samoglasniki so tisti zvoki, med izgovorjavo katerih zrak zlahka in prosto prehaja skozi usta, ne da bi pri tem naletel na ovire. Še več, lahko jih vlečete, lahko kričite z njimi. Če dlan prislonite k grlu, lahko zlahka začutite delo glasilk med izgovorjavo samoglasnikov. V ruskem jeziku je 6 poudarjenih samoglasnikov, in sicer: [a], [e], [u], [s], [o] in [i].
  • Soglasniki so tisti zvoki, med izgovorjavo katerih zrak naleti na oviro na svoji poti, in sicer na lok ali vrzel. Njihov videz določa naravo zvokov. Pri izgovorjavi [s], [w], [z] in [z] praviloma nastane vrzel. V tem primeru se konica jezika približa zgornjim ali spodnjim zobem. Predstavljene soglasnike je mogoče izvleči (na primer [z-z-z], [z-z-z]). Kar zadeva postanek, se takšna pregrada oblikuje zaradi zaprtja govornih organov. Zrak oziroma njegov tok ga naglo premaga, zaradi česar so zvoki energični in kratki. Zato se imenujejo eksplozivne. Mimogrede, nemogoče jih je potegniti (poskusite sami: [p], [b], [t], [d]).

Poleg zgornjih soglasnikov ima ruski jezik še naslednje: [m], [y], [v], [f], [g], [l], [r], [ch], [ts] , [x] . Kot vidite, jih je veliko več kot samoglasnikov.

Zvočni in zveneči zvoki

Mimogrede, veliko soglasnikov tvori pare gluhosti in zvočnosti: [k] - [g], [b] - [p], [z] - [c], [d] - [t], [f] - [v] itd. Skupno je v ruskem jeziku 11 takih parov. Vendar pa obstajajo zvoki, ki na tej podlagi nimajo parov. Sem spadajo: [y], [p], [n], [l], [m] so neparni zveneči, [ch] in [ts] pa neparni brezglasni.

Mehki in trdi soglasniki

Kot veste, se soglasne črke razlikujejo ne le po zvočnosti ali, nasprotno, gluhosti, temveč tudi po mehkobi in trdoti. Ta lastnost je druga najpomembnejša lastnost zvokov.

Torej, ali je črka "th" trda ali mehka? Če želite odgovoriti na to vprašanje, morate razmisliti o vsakem znaku posebej:

  • Pri izgovorjavi mehkih soglasnikov se celoten jezik nekoliko pomakne naprej, njegov srednji del pa se nekoliko dvigne.
  • Pri izgovorjavi trdih soglasnikov se ves jezik dobesedno potegne nazaj.

Posebej je treba opozoriti, da veliko soglasnikov tvori pare med seboj na podlagi značilnosti, kot sta mehkoba in trdota: [d] - [d'], [p] - [p'] itd. Skupaj je 15 takih parov . Obstajajo pa tudi zvoki, ki na tej osnovi nimajo parov. Katere črke trdih soglasnikov so neparne? Ti vključujejo naslednje - [w], [f] in [c]. Kar zadeva neparne mehke, so to [sch’], [h’] in [th’].

Oznaka na pismu

Zdaj veste, ali je črka "th" trda ali mehka. Toda tu se pojavi novo vprašanje: "Kako je mehkoba takih zvokov označena v pisni obliki?" Za to se uporabljajo popolnoma drugačne metode:

  • Črke "e", "yu", "e", "ya" za soglasniki (razen "zh", "sh" in "ts") kažejo, da so ti soglasniki mehki. Navedimo primer: stric - [d'a'd'a], teta - [t'o't'a].
  • Črka »i« za soglasniki (razen »zh«, »sh« in »ts«) pomeni, da so ti soglasniki mehki. Navedimo primer: srčkan - [m'i'ly'], list - [l'ist], ni´tki - [n'i´tk'i].
  • Mehki znak (»b«) za soglasniki (razen »zh« in »sh«) je pokazatelj slovnične oblike. Označuje tudi, da so soglasniki mehki. Primeri: daleč - [dal'], nasedli - [m'el'], zahteva - [proz'ba].

Kot lahko vidite, se mehkoba soglasnikov v pisni obliki ne prenaša s posameznimi črkami, temveč z njihovimi kombinacijami z samoglasniki "e", "yu", "e", "ya", pa tudi z mehkim znakom. Zato strokovnjaki priporočajo, da bodite pozorni na sosednje simbole.

Kar zadeva samoglasniško črko "th", je vedno mehka. V zvezi s tem je v transkripciji običajno označeno na naslednji način: [th’]. To pomeni, da mora biti vedno vstavljen simbol vejice, ki označuje mehkobo zvoka. Enako pravilo upoštevata tudi [ш'], [ч'].

Naj povzamemo

Kot lahko vidite, ni nič težko narediti katere koli besede pravilno. Če želite to narediti, morate samo vedeti, kaj so samoglasniki in soglasniki, brezglasni in zveneči, pa tudi mehki in trdi. Za boljše razumevanje oblikovanja prepisa bomo podali več podrobnih primerov.

1. Beseda "junak". Sestavljen je iz dveh zlogov, pri čemer je drugi poudarjen. Naredimo analizo:

g - [g’] - zveneč, soglasen in mehak.

e - [i] je nenaglašen samoglasnik.

p - [p] - zveneče, soglasno, neparno in trdo.

o - [o] - naglašen samoglasnik.

th - [th’] - zveneče, soglasno, neparno in mehko.

Skupaj: 5 črk in 5 glasov.

2. Beseda "drevesa". Sestavljen je iz treh zlogov, pri čemer je 2. poudarjen. Naredimo analizo:

d - [d’] - zveneč, soglasen in mehak.

e - [i] je nenaglašen samoglasnik.

p - [p’] - zveneč, soglasen, neparen in mehak.

e - [e´] - naglašen samoglasnik.

v - [v’] - zveneče, soglasno in mehko

e - [th'] - zveneč, soglasnik, neparen in mehak in [e] - samoglasnik, nenaglašen;

v - [f] - dolgočasno in trdo.

Skupaj: 8 črk in 8 glasov.



 


Preberite:



Računovodstvo obračunov s proračunom

Računovodstvo obračunov s proračunom

Račun 68 v računovodstvu služi za zbiranje informacij o obveznih plačilih v proračun, odtegnjenih tako na račun podjetja kot ...

Skutni kolački v ponvi - klasični recepti za puhaste sirove kolačke Skutni kolački iz 500 g skute

Skutni kolački v ponvi - klasični recepti za puhaste sirove kolačke Skutni kolački iz 500 g skute

Sestavine: (4 porcije) 500 gr. skute 1/2 skodelice moke 1 jajce 3 žlice. l. sladkor 50 gr. rozine (po želji) ščepec soli sode bikarbone...

Solata Črni biser s suhimi slivami Solata Črni biser s suhimi slivami

Solata

Lep dan vsem tistim, ki stremite k raznolikosti vsakodnevne prehrane. Če ste naveličani enoličnih jedi in želite ugoditi...

Recepti lecho s paradižnikovo pasto

Recepti lecho s paradižnikovo pasto

Zelo okusen lecho s paradižnikovo pasto, kot je bolgarski lecho, pripravljen za zimo. Takole v naši družini predelamo (in pojemo!) 1 vrečko paprike. In koga bi ...

feed-image RSS