Kui sa seda pole veel teinud, siis lae oma arvutisse Praat. Kui sul on Praat, aga sa ei ole seda ammu kasutanud, siis tasuks tõmmata endale uuem versioon. Mine kodulehele http://www.praat.org. Vali lehe vasakult ülanurgast endale sobiv OP-süsteem. Praat ei nõua installimiseks arvuti administraatori õigusi. Macis kopeeri Praat.app Applications kausta. Windowsis paki zip lahti ja tõsta Praat.exe fail kuhugi arvuti kõvakettale (näteks Desktopile). Kuigi Windowsis Praat küll läheb tööle ka zip kataloogist, aga paki ikkagi lahti.
Lae enda arvutisse ka Praati plugin geminaatide poolitamiseks: https://kodu.ut.ee/~partel/praat-skriptid/plugin_geminaadiPoolitamine.zip Kopeeri see kataloog oma arvuti oma seadete kataloogis olevasse Praati seadete kausta (vt kust seda leida).
Kui kasutad Maci, siis seadete kaust on tavaliselt peidetud. Kui sul ei õnnestu seda kausta üles leida, siis mine Go > Utilities > Terminal.app ning kirjuta käsureale
open /users/KASUTAJA/Library/Preferences/Praat\ Prefs/
kus KASUTAJA asemele kirjuta oma kasutajanimi arvutis, mida kasutad. Vajuta Enter. Nüüd peaks õige kataloog avanema.
Kui kataloog plugin_geminaadiPoolitamine
on õigesse kohta tõstetud, pane Praat korra kinni ja siis ava uuesti. Sellega peaks plugin olema installitud ja edaspidi on TextGrid Editori menüüs Editi käsud „Q2 geminaat“ ja „Q3 geminaat“. Nende käskude rakendamisest tuleb juttu allpool seoses geminaatide poolitamisega.
Ava Praat. Loe sisse helifail (wav) ja TextGrid-fail käsuga Open > Read from file...
(Ctrl+O). Avanenud dialoogiaknas võid nad valida ka korraga (kliki hoides Ctrl klahvi all).
Juhul, kui teed oma esimest proovitööd “Põhjatuule ja päikese” salvestusega, siis oled saanud ainult helifaili ning TextGridi pead ise looma. Kui oled helifaili Praatis avanud, nii et objektiaknasse on tekkinud Sound POHJA_…, siis vali paremalt menüü Annotate
> To TextGrid...
, kirjuta dialoogiaknas esimesse kasti “Mary John bell” asemele “sõnad häälikud” ja vajuta OK.
Kui nüüd Sound ja TextGrid mõlemad on Praati objektiaknas, vali mõlemad objektid (Ctrl-klahvi all hoides peal klõpsates) ning vajuta nuppu View & Edit. Avaneb umbes selline aken:
Kui sinul selles vaates on pool ekraani täis IPA sümbolite tabelit, siis selle saab ära peita, mine File
> Preferences
> võta linnuke ära teisest kastist Show IPA chart.
Sellel TextGrid-failil on sõnatasand, mis on tekitatud automaatse kõnetuvastusega. Automaatne kõnetuvastus on statistiline meetod helisalvestuse automaatseks transkribeerimiseks, aga see teeb küllaltki palju vigu, eriti spontaanse kõne puhul. Sinu ülesanne on neid vigu parandada: kuulata ja parandada valesti tuvastatud sõnad ning parandada ja täpsustada sõnasegmentide piirid. Samuti pead sa märkima sõnatasandile hingamised ja täidetud pausid, mida kõnetuvastus ei märgi.
Sinu peamine ülesanne sõnatasandi parandamise kõrval on lisada TextGridile häälikutasand ja märkida häälikute piirid. Häälikutasandi lisamiseks vali menüüst Tier
käsk Add interval tier...
. Uus häälikukiht on järjekorras teine ja selle nimeks pane häälikud.
Kasuta kindlasti kvaliteetseid kõrvaklappe. Selleks, et häälduse pisidetaile kuulda, peaks täpselt ja palju kuulama.
SALVESTA! Praat ei salvesta automaatselt ise ühtegi faili ega tee varukoopiaid. Iga natukese aja tagant salvesta oma tehtud töö menüüst File käsuga Save TextGrid as text file...
, või veel parem, harjuta omale sisse klahvikombinatsioon Ctrl+S. Kui Praat või kogu arvuti mingil põhjusel kokku peaks jooksma, kaotad kõik salvestamata töö! Samuti oleks mõistlik varunda aegajalt TextGrid faili kuhugi mälupulgale või võrgukettale.
Alusta sõnatasandi piiride (ja sisu) kontrollimisest ja parandamisest.
Kui sõnatasandi piirid on paigas ja segmendi sisu (tekst) on õige, siis märgenda häälikutasand. Sõna algus- ja lõpupiirid peaksid olema mõlemal kihil täpselt kohakuti.
Sõnatasandilt saad piirid kopeerida häälikutasandile nii, et valid kursoriga sõnatasandi segmendi (klõpsa segmendi keskele, tekst läheb punaseks ja taust kollaseks, punase katkendjoonega on üle spektrogrammi ja helilaine algus- ja lõpupiirid) ja vali menüüst Boundary > Add on tier 2. Veel lihtsam on harjutada kätte klahvikombinatsioon Ctrl+2. Teine võimalus on aktiveerida kursoriga üks sõnatasandi piir ning vajutada selle alla häälikutasandil tekkiva mullikese peale. Kolmas võimalus on lisada Enteriga piirid enam-vähem õige koha peale ja siis lohistada kursoriga kinni hoides häälikutasandi piir sõnatasandi piiri peale (või vastupidi, sõltuvalt sellest, kumb paremini paika sai).
Kui kahel tasandil on piirid kohakuti, aga tahaksid nende asukohta natuke korrigeerida, saad mõlemat piiri korraga liigutada, kui hoiad Shift-klahvi all ja vead hiirega.
Igal kõneleja jutt on salvestatud eraldi faili ja kuna igal kõnelejal oli eraldi mikrofon, aga nad seisid lähestiku, siis on teiste juttu küll natuke kuulda, aga selle kõneleja hääl peaks olema selgelt eristatav. Märgenduse TextGrid faili peaks märkima ainult selle ühe kõneleja juttu ja kui taustal on kuulda teisi, siis seda peaks ignoreerima.
Järgnevalt on toodud mõningaid näiteid erinevate häälikupiiride märgendamisest. Siin keskendume just piiride leidmisele, helilaine ja spektrogrammi lugemisele. Süstemaatilise ülevaate märgenduspõhimõtetest saad järgmisest peatükist.
Pausi järel vokaaliga algava sõna alguspiir pane sinna, kus helilaines algab perioodiline võnkumine ja spektrogrammil algavad tugevad formandid.
Vokaali ja frikatiivi /s/ vaheline piir pane sinna, kus perioodiline helilaine muutub “karvaseks” ja spektrogrammil alumised formandid hääbuvad. Eelmises näites (Näide 1) on kõik /s/-id muutunud vokaalide vahel heliliseks. Järgmises Näites 2 järgneb vokaalile helitu /s/.
Vokaali ja klusiili vaheline piir pane sinna, kus tugev perioodiline helilaine lõppeb ja spektrogrammil hääbuvad alumised formandid. Ka helitu klusiili puhul on helilaines peale klusiili algust veel paar-kolm hääbuvat võnget, aga sellele järgneb sulg. Klusiili ja vokaali vaheline piir peaks minema sinna, kus peale eksplosiooni (ja sellele järgnevat lühikest kahinat) algab perioodiline helilaine ning spektrogrammil algavad tugevad formandid.
Näites 3 lõppeb üks sõna klusiiliga /t/ ja järgmine algab klusiiliga /p/. Esimese klusiili lõpus ei ole selget kuuldavat (ega nähtavat) eksplosiooni, mistõttu nende vahele piiri tõmmata on akustiliste tunnuste põhjal keeruline. Siin on jagatud segment pooleks „Q2 geminaat” käsuga.
Näites 3 on näha ka sõna said, mille lõpus klusiil on muutunud heliliseks. Helilise klusiili ja vokaali piir on siin näha helilaine oluliselt väiksema intensiivsusega. Klusiili lõpus on spektrogrammil näha eksplosiooni õrn “kriips”. Seda, et klusiil on heliline, saame aru perioodilisest helilainest ning ka sellest, et põhitooni sinine joon ei katke. Helitu klusiili sulg (nagu sõna need pildid piiril) on vaikne, helilaine on “sirge kriips”.
Pausile eelneva vokaali lõpp pane sinna, kus hääbuvad spektrogrammil ülemised formandid. Sellele võib järgneda veel paar perioodilist helilainevõnget, mis on aga pisut lihtsama struktuuriga kui vokaali omad. Kui seda kuulad, siis see kostab /h/ moodi kahinana, see märgi sõnatasandile aspiratsiooniks: .h.
Pausile järgnev klusiil. Kui vaiksele pausile järgneb klusiil, ei ole tihti selle algust võimalik akustiliste tunnuste põhjal määrata. Sel juhul võiks klusiili kestuseks jääda kuni 100 ms. Tihti eelneb pausi järel klusiiliga algavale sõnale sissehingamine, sel juhul võiks panna piiri sissehingamise lõppu:
Klusiilile järgnev paus. Klusiili ja sõna lõpu piir pane eksplosiooni järele. Tihti järgneb eksplosioonile aspiratsioon, mis tuleks märkida .h-ga sõnatasandile:
Vokaalide ja heliliste konsonantide piirid eristuvad helilaines väikeste helilaine kuju muutustena ja spektrogrammil formantstruktuuri muutustena. Helilistel konsonantidel on madalam intensiivsus (sest erinevalt vokaalidest on nende puhul vaba õhuvool takistatud), mistõttu helilaine amplituud on madalam ja spektrogrammil on formandid heledamad.
Poolvokaalid ei eristu üldjuhul selgepiiriliselt ümbritsevatest vokaalidest ja nende piirid tuleks panna poole siirde peale:
(Siin näites on sõna hakka hääldatud teisevältelisena, erinevalt tavapärasest kolmandast vältest, ja seetõttu on geminaat jagatud pooleks. Kui geminaadiga sõna oleks hääldatud kolmandavältelisena, tuleks geminaat jagada käsuga “Q3 geminaat” ja esimene osa märkida k:, teine osa k.)
Diftongid jagatakse samuti umbes siirde keskelt pooleks (piiri võib aidata määrata ka helilaines väiksem intensiivsus kahe vokaali piiril):
Värihäälik /r/ peaks eesti keeles häälduma nii, et keeletipp väriseb vastu hambasompe, moodustades lühikesi suletud ja avatud perioode, mis korduvad 3–5 tsüklit sõltuvalt hääliku pikkusest. Tegelikkuses on /r/-i hääldus väga varieeruv, sulgusid tekib võib-olla kas ainult üks või enamasti mitte ühtegi, sel juhul realiseerub /r/ poolvokaalina. Selle jaoks eraldi märki pole, vaid võib igal juhul panna SAMPA märgiks r
. Ainult kui moodustuskoht ei ole mitte keeletipp-hambasombud vaid kurgunibu ehk kui /r/ on uvulaarne, siis võiks kasutada SAMPA märki R
. Uvulaarne /r/ on tavaliselt idiomaatiline, st on üksikud kõnelejad, kes kasutavad seda alati ja enamik ei kasuta kunagi.
Üneemid tuleks märkida ainult sõnatasandile ja märgend algab punktiga.
Hingamise algus ja lõpp tuleks märkida umbes helilaine ja spektrogrammi pildi järgi, enamasti piiri väga täpselt ei ole võimalik kindlaks teha. Seda, kas tegemist on sisse- või väljahingamisega, on lihtne kuulda, raske visuaalselt otsustada.
Kärin on mittemodaalne häälelaad. Häälekurrud vibreerivad ebakorrapäraselt ja madala sagedusega. Kuna nad siiski vibreerivad, iseloomustab kärin muidu helilisi häälikuid. Kärina puhul on nii meestel kui naistel põhitoon umbes 40–80 Hz ja võnked on ebakorrapärased, nii et põhitoonianalüüs on katkendlik. Oluline on tähele panna, et kärina all siin mõeldakse kitsalt häälekurdude töö eripära, mitte igasugust ragisevat või krõbisevat heli, mida võib põhjustada näiteks sügamine või kratsimine (mis tuleks märkida taustamüraks).
Kähisev hääl on samuti mittemodaalne häälelaad, mille puhul häälekurrud ei sulgu korralikult ja perioodilist võnkumist saadab õhu hõõrdumine kõnetraktis, mistõttu helilaine on “karvane”. See kõlab veidi nagu “ära suitsetatud” hääl, võib kaasneda näiteks naerdes rääkimisega. Kähisev hääl igal juhul peaks olema häälelaadi muutus, st häälekurdude tööd kirjeldav mõiste, mitte igasugune kahin.
Kui viimase näite vokaali sisse suumida, siis näeb, et üldkujult perioodiline laine on “karvane”, st seal on palju ebakorrapäraseid pisivõnkeid, mida põhjustab õhu hõõrdumise müra.
Ja veel üks näide, kus kähisev on esimene sõna “idaring”, edasi läheb modaalse häälelaadiga:
Sõnatasandile märgitakse leksikaalsete sõnade piirid ja täidetud pauside piirid.
Sõnad peaks olema kirjutatud väikeste tähtedega ja muidu tavalises ortograafilises kirjaviisis. See tähendab, et sõnatasandil peaks sõnad välja kirjutama nii, nagu nad kirjakeeles on, mitte häälduspäraselt. Hääldus märgitakse nagunii häälikutasandile täpselt üles ja ortograafiline kirjaviis võimaldab sõnatasandit kasutada n-ö märksõnana otsingutes, samuti võimaldab see kerge vaevaga kasutada korpuse analüüsimisel nt automaatset morfoloogilist analüüsi. Seega mitte tegelt vaid tegelikult, mitte kolgend vaid kolm+kümmend. Samas ei peaks kõnekeelseid (või murdelisi) sõnu siiski asendama kirjakeelsetega, nt siuksed ei peaks asendama sõnaga sellised.
Liitsõnad märgime plussiga (nt kauba+maja
, aja+loo+õpetaja
, teema+valik
). Sõnatasandil kirjutame plussiga (nagu kõik liitsõnad) ka need, mis muidu on sidekriipsuga, nt Lõuna+Eesti/.kohanimi
, Mari+Liis/.isikunimi
, võib+olla
. Võõrsõnu, mis küll algkeeles on liitsõnad, liitsõnaks ei märgita: nt foneetika
, fonoloogia
, televiisor
, kolhoos
.
Kui sõna jääb pooleli takerdumise tõttu, siis näitab seda lõppu pandud sidekriips (nt sinna > sin-
). Nii peaks märkima juhul, kui hääldus katkeb. Kui kõneleja redutseerib häälikuid, n-ö “sööb sõnalõpud ära”, siis see on reduktsioon, mis kajastub häälikutasandil ja sel juhul sõnatasandil peaks sõna ikka välja kirjutama. Kui sõna jääb takerdumise tõttu pooleli, siis tuleks kirjutada nii palju kui on välja hääldatud ja lõppu panna sidekriips, nt kon-
.
Lisainfo sõnatasandi segmentidele lisatakse põhimärgendi järele, eraldades kaldkriipsuga, ilma tühikuteta. Kui ühe sõna kirjeldamiseks on vaja kasutada mitut lisamärgendit, eristatakse need kaldkriipsuga: anyways/.inglise/.sosin
Nimed peaks algama suure algustähega, ilma jutumärkideta. Neile võiks ka panna otsa nime lisamärgi, mis on nimest eristatud kaldkriipsuga ja algab punktiga. Mitmesõnalise pealkirja puhul iga sõna eraldi segmendiks ja igale segmendile pealkirja lisamärk.
Eesti/.kohanimi
Riia/.kohanimi
Tiiu/.isikunimi
Andrus/.isikunimi|Saareste/.isikunimi
Chomsky/.isikunimi
YouTube/.nimi
Rehepapp/.pealkiri
Tõde/.pealkiri|ja/.pealkiri|õigus/.pealkiri
Võõrkeelsed tsitaatsõnad või fraasid, siis kirjuta selle keele reeglite järgi ja pane lisamärgiga keel:
thanks/.inglise
l'amour/.prantsuse
what/.inglise|the/.inglise|hell/.inglise
bukmol/.norra
Lühendid ja võõrapärased nimed kirjutame nii, nagu on nad originaalis:
IBM
mp3
Chomsky/.isikunimi
Veel oleks hea lisamärkidega tähistada sosistamine, sissehingates ja naerdes rääkimine jms. Kärinat (.?) ja kähinat (.Hv) oleks eelistatum märkida häälikutasandile ja kui häälikutasandil (või häälelaaditasandil) juba on märgitud, siis sõnatasandil ei ole vaja. Aga kui kärinaga on hääldatud üneem, mida häälikutasandil ei ole segmenditud, siis kindlasti märkida kärin sõnatasandile. Mõningaid märke ja näiteid:
.vaikne
, .aeglasem
, .falsett
(modaalsest häälest kõrgem register), .takerdus
, .naer
, .kiirem
, .kõrgem
, .sosin
, .takerdumine
, .peenikese_häälega
, .näideldud
, .ohates
, .pressitud
, .haigutades
, .häälevärinal
, .lauldes
; .?
(kärin), .Hv
(kähisev).jah/.sisse
kitarrid/.sosin
vaatad/.naer
Mitteleksikaalsed segmendid on kas vaiksed pausid, mis märgitakse #
, või täidetud pausid, mille märgend algab punktiga.
.sisse
, .välja
;.ee
, .õõ
, .mm
, .eem
jne; Kui üneem on lühike, siis ühe tähega, kui pikk, siis kahega; katsu üldistada ja mitte liiga detailselt järele aimata;.h
(kahin), .q
(kärisev), .m
(suletud huultega);.maigutus
, .matsutus
, .kähin
, .köha
, .köhatus
, .oie
, .neelatus
, .niutsatus
, .norsatus
, .nuusatus
, .ohe
, .puristades_välja
, .turtsatus
, .naksatus
, .ümin
, .haigutus
, .aevastus
, .naer
, .neelatus
, .rögin
;.koputus
, .klõpsatus
, .mobiil
, .taustamüra
, .tehniline_viga
, .aplaus
, .plaks
.Arusaamatud sõnad. Kui sa ei saa üldse aru, mida kõneleja ütleb, ega suuda ka häälikutasandist midagi välja lugeda, siis märgi see sõnatasandile märgiga .--
ja häälikutasandil jäta märgendamata. Kui häälikutasandil suudad häälikuid eristada, aga sõna jääb arusaamatuks, märgenda häälikutasandil häälikud ja sõnatasandile märgi --
.
Kui on midagi, milles sa pole kindel, siis tähista tärniga *, nii on võimalik see kontrollimise käigus kergesti üles leida.
Häälikutasandile märgitakse häälikute piirid ja transkribeerimisel kasutatakse SAMPA transkriptsiooni. Märgendatakse kõik leksikaalsed sõnad, nii et sõnade algus- ja lõpupiirid on TextGridil kohakuti esimese hääliku algus- ja viimase hääliku lõpupiiriga. Täidetud pause (kõik sõnatasandil punktiga algavad märgendid) häälikutasandile ei märgita.
Segmentimisel jälgitakse häälikutevahelisi piire nii ostsillogrammil kui spektrogrammil. Diftongid jagatakse kaheks, arvestades kahe vokaali vahelist siiret, mis poolitatakse (vt näide 9). Geminaatkonsonandid jagatakse Q2 sõnades pooleks, Q3 sõnades põhimõttel 2/3+1/3 (jagamiseks kasutatakse selleks kirjutatud skript’i abi). Sõnalõpulisi pikki konsonante osadeks ei jagata (v.a juhul kui järgnev sõna algab vokaaliga, nt naljakat asja – n|A|l’|j|A|k|k|A|t:|t|A|s’:|j|A). Klusiili ja järgneva helilise hääliku piir pannakse sinna, kus algab järgneva hääliku helilisus. Kui klusiil jääb sõna algusesse, märgitakse foneetiliste iseloomustajate puudumisel selle kestuseks kuni 100 ms (vt näide 5). Sõnalõpuvokaalide lõpp märgitakse sinna, kus hääbuvad ülemised formandid (kõrgemal kui F2, vt näide 2).
Huuled | Huul-hammas | Hambasombud | Kõva suulagi | Pehme suulagi | Kurgunibu | Kõri | |
---|---|---|---|---|---|---|---|
Klusiil | p | t | k | ? | |||
Nasaal | m | n | N | ||||
Tremuilant | r | R | |||||
Frikatiiv | f v | s S | h | ||||
Poolvokaal | w | j | |||||
Lateraal | l |
Ees | Redutseeritud | Taga | |||
---|---|---|---|---|---|
ümardamata | ümardatud | ümardamata | ümardatud | ||
Kõrge | i | y | u | ||
Keskkõrge | e | 2 | @ | 7 | o |
Madal | { | A |
Häälelaad | Vokaali häälduskoht | Konsonandid |
---|---|---|
0 helitu n_0 A_0 | + eespoolne A_+ | ’ palataliseeritud t’ l’ |
v heliline s_v t_v | - tagapoolne e_- | = silbiline s_= l_= |
k kärisev m_k A_k | r kõrgenenud e_r | |
t kähisev m_t A_t | o madaldunud e_o | |
~ nasaleeritud o_~ |
Vokaalid (sulgudes häälikut tähistav kirjatäht) A (a), e, i , o, u, 7 (õ), { (ä), 2 (ö), y (ü), @ (tugevalt redutseeritud vokaal)
Konsonandid p, t, k, s, S (š ja ž), Z (ž, kui on heliline), f, v, h, m, n, N (velaarne n ng- ja nk-ühendis), l, r, R (uvulaarne r), j, w, ? (kõrisulghäälik).
Poolvokaalid: j, w (nt siijA
, sii:jA
, lyi:jA
, luuwA
, luu:wA
, lAuwA
)
Fonoloogilist pikkust märgitakse rõhulistes (ja kaasrõhulistes) silpides.
Üldine reegel on:
Rõhutud silbid on alati fonoloogiliselt lühikesed, seega rõhutu silbi vokaal alati ühe põhimärgi ja ilma koolonita.
Sõltumata fonoloogilisest pikkusest võivad nad olla venitatud. Venitust märgitakse kahe pikendusmärgiga, nt “mida” mit_vA::
, m::i::t_vA
.
Pikendusmärke võib ühel häälikul olla maksimaalselt kaks, st kui venitatud on kolmandavältelise sõna rõhulist silpi, siis läheb info kolmandavältelisuse kohta kaotsi, nt sAA::tA
.
(Järgnevates näidetes |
tähistab häälikusegmendi piiri.)
Q1 | Q2 | Q3 | |||
---|---|---|---|---|---|
kalu | |k|A|l|u| | kaalu | |k|AA|l|u| | kaalu | |k|AA:|l|u| |
sada | |s|A|t|A| | saada | |s|AA|t|A| | saada | |s|AA:|t|A| |
kaardi | |k|AA|r|t|i| | kaardu | |k|AA:|r|t|u| | ||
(te) saate | |s|AA|t|t|e| | saate | |s|AA|t:|t|e| | ||
koot | |k|oo|t’:| | ||||
eest | |ee|s:|t| |
Diftongi osised märgitakse eraldi segmentideks, piir läheb siirde keskele (vt näide 9).
Diftong on nagu pikk vokaal. Diftong saab olla teises või kolmandas vältes, aga mitte esimeses. Kui sõnas peaks olema vokaal, aga vokaalne segment on väga lühike (<50ms), siis on võimalik, et see on lühikeseks vokaaliks redutseerunud ja siis ära seda diftongiks märgi.
Q2 | Q3 | ||
---|---|---|---|
kaela | |k|A|e|l|A| | kaela | |k|A|e:|l|A| |
lauda | |l|A|u|t|A| | lauda | |l|A|u:|t|A| |
süidi | |s|y|i|t|i| | süiti | |s|y|i|t:|t|i| |
auto | |A|u|t|t|o| | laud | |l|A|u:|t| |
laut | |l|A|u|t:| | ||
soust | |s|o|u|s’:|t| |
Eesti keele fonoloogilises struktuuris algavad silbid üldiselt ühe lühikese konsonandiga. Kui kahe vokaali vahele jääb pikk konsonant, siis jaguneb see kahe silbi vahel. Kuna selle konsonandi seest jookseb läbi silbipiir, tuleb geminaadid jagada kaheks ja märkida omaette segmentideiks. Kuna akustiliste tunnuste alusel pole piiri alati võimalik leida, on kokku lepitud, et teises vältes jagatakse geminaat pooleks, kolmandas vältes nii, et esimene osa oleks 2/3 ja teine osa 1/3 (Praatis kasutatakse jagamiseks skript’i).
Kolmandavälteliste sõnade pikad konsonandid märgitakse ühe konsonandimärgi ja pikkusemärgiga (samamoodi tähistatakse ka pikad konsonandid sõna lõpus).
Q2 | Q3 | ||
---|---|---|---|
konna | |k|o|n|n|A| | konna | |k|o|n:|n|A| |
könni | |k|2|n’|n’|i| | könni | |k|2|n’:|n’|i| |
katu | |k|A|t|t|u| | kattu | |k|A|t:|t|u| |
šefi | |S|e|f|f|i| | šeffi | |S|e|f:|f|i| |
tuši | |t|u|S|S|i| | tušši | |t|u|S:|S|i| |
peret (rõhutu silp) | |p|e|r|e|t:| | tugevat (kaasrõhk) | |t|u|k|e|v|A|t:| |
paat | |p|AA|t’:| | ||
patt | |p|A|t:| | ||
õpetlik (kaasrõhk) | |7|p|p|e|t|l|i|k:| | ||
varss | |v|A|r|s:| |
Kui pika konsonandiga lõppevale sõnale järgneb vokaaliga algav sõna, jagatakse konsonant pooleks, nt aastat on |AA|s:|t|A|t|t|o|n:|
. Kui konsonandiga lõppeb rõhuline silp, siis 2/3-1/3, nt pütt on |p|y|t’:|t|o|n|
. Kuigi see konsonant jaguneb kahe silbi vahel, peaks sõnatasandil jääma vokaaliga algava sõna algus vokaaliga kohakuti.
Kõigil muudel juhtudel, kui on pikk konsonant, aga ei ole silbipiiri (konsonantühendis või sõna lõpus ja ei järgne vokaaliga algavat sõna), märgitakse pikk konsonant ühe häälikumärgi ja pikendusmärgiga üheks segmendiks, nt |s|ii|t:|#|
. Kui konsonantühendis on pikk konsonant, siis üldiselt ei ole see viimane komponent ja jagada pole tarvis, sest pikk konsonant jääb ühte silpi ja uue silbi algusesse jääb üks lühike konsonant.
V.a erandjuhul, kui klusiil helilise konsonandi järel, siis on pikk konsonant silbipiiril ka konsonantühendis, nt panka |p|A|N|k:|k|A|
, kurta |k|u|r|t:|t|a|
.
Q2 | Q3 | ||
---|---|---|---|
õrna | |7|r|n|A| | õrna | |7|r:|n|A| |
kongi | |k|o|N|k|i| | kongi | |k|o|N:|k|i| |
karda | |k|A|r|t|A| | karda | |k|A|r:|t|A| |
narta | |n|A|r|t|t|A| | karta | |k|A|r|t:|t|A| |
rütmi | |r|y|t|m|i| | rütmi | |r|y|t:|m|i| |
põdra | |p|7|t|r|A| | põtra | |p|7|t:|t|r|A| |
fakti | |f|A|k|t|i| | fakti | |f|A|k:|t|i| |
metsa | |m|e|t|s|A| | metsa | |m|e|t:|s|A| |
kõrtsi | |k|7|r|t|s|i| | kõrtsi | |k|7|r|t:|s|i| |
arsti | |A|r|s|t|i| | arsti | |A|r|s:|t|i| |
pang | |pA|N:|k| | ||
pank | |p|A|N|k:| | ||
palk | |p|A|l|k:| – |p|A|l’|k:| | ||
rütm | |r|y|t:|m| | ||
soodsa | |s|oo:|t|s|A| – |s|oo|t:|s|A| | ||
andsin | |A|n’:|t|s|i|n| – |A|n’|t:|s|i|n| | ||
jalgsi | |j|A|l:|k|s|i| – |j|A|l|k:|s|i| |
Palatalisatsioon ('
). Palataliseeruda saavad ainult konsonandid, vokaalidele seda märki lisada ei saa, konsonantidest palataliseeruvad /t, s, n, l/, enamasti siis kui järgneb /i/ või /j/, ja see tähendab artikulatoorselt seda, et konsonandi hääldamise ajal keeleselg liigub rohkem kõva suulae poole kui muidu selle sama konsonandi hääldamisel. Palatalisatsioonimärk tuleks lisada kõigile palataliseeritud konsonantidel ja poolitatud pika konsonandi mõlemale osale. Näiteks: pAl'i
, pAl'l'i
, lun'in
, kAn':n'e
, pAt'i
, vAt':t'i
, k{s'i
, kAs':t'i
Nasalisatsioon (_~
). Seda peaks märkima siis, kui redutseerumise tõttu nasaali ei hääldata ja eelnev/järgnev vokaal on tuntavalt nasaleeritud. Näiteks: o_~
(on).
Häälelaadi tähistavad lisamärgid:
_v
). Seda peaks märkima helitute konsonantide puhul (k, p, t, h, s, S), kui neid hääldatakse (heliliste häälikute kontekstis) helilisena. Pane tähele, et helilisus tähendab siis häälelaadi st et hääldamise ajal häälekurrud vibreerivad ja helilaine on perioodiline. See ei tähenda seda, et helitu klusiili suluperioodil on kuulda mingit heli, mis on tekkinud aspiratsioonist vms. Samuti ei peaks seda märkima muidu loomult helilistele häälikutele. Nt Ah_vi
(ahi), Arent_vAt_vA
(arendada), sAt_vA
(sada), vik_vA
(viga), is_vA
(isa)._0
). Seda peaks märkima heliliste konsonantide ja vokaalide puhul, kui nad on helitu konteksti tõttu helituks muutunud, on hääldatud sosinal. See on samuti häälelaadi märk, st et häälekurrud ei vibreeri ja heli tekitab õhuvoo hõõrdumine kõnetraktis, see pole perioodiline. Seda ei peaks märkima helitute konsonantide puhul, mis oma loomult vaikimisi ongi helitud (klusiilid, s). Nt leh:m_0
(lehm, kui jääb heliliseks, on m silbiline: leh:m_=
), lat:v_0
(latv), k7h:n_0
(kõhn), k7hr_0
(kõhr), vAstAttA_0
(vastata).Lisamärgid _t
(kähisev) ja _k
(kärisev), _0
(helitu) ja _v
heliline on üksteist välistavad, hääl ei saa korraga käriseda ja olla heliline või helitu.
Ainult vokaalide moodustuskohta iseloomustavad lisamärgid, mis tähistavad moodustuskoha, st keele positsiooni muutumist. Pane tähele, et kõrgenemine ja madaldumine ei tähista intonatsiooni, hääle kõrguse, põhitooni muutust, vaid vokaali moodustuskohta. Need märgid käivad ainult vokaalidele.
ju_+s:t
(just, /u/ hääldub /ü/-poolsena), jA_+nu
(janu, /a/ hääldub /ä/-poolsena), As’:su_+
(asju, /u/ hääldub /ü/-poolsena).kirikkutte_-st
(kirikutest, /e/ hääldub /õ/-poolsena), v{_-kA
(väga, /ä/ hääldub /a/-poolsena)ko_re:r
(koer, /o/ hääldub /u/-poolsena), pe_rA
(pea, /e/ hääldub /i/-poolsena), nii märgime ka /j/-i madalate ja keskkõrgete vokaalide vahel, kui see on hääldatud e-poolselt, nt Ae_rA
(aja,), oe_rA
(oja).suve_ol
(suvel, /e/ hääldub /ä/-poolsena, kui /e/ hääldub täiesti /ä/-na, võib märkida ka v{h_v{
(vähe, /h/ heliliseks muutunud)), Au_otto
(auto, /u/ hääldub /o/-poolsena).Silbiline konsonant silbituumana (_=
). Kui üldjuhul moodustab silbi tuuma vokaal, siis erandjuhtudel võib silbituumaks saada ka konsonant. Sel juhul tuleks konsonant märkida silbiliseks. Teoreetiliselt võib seda juhtuda näiteks siis, kui sõna lõpus helitule konsonandile järgneb heliline konsonant, mis ei muutu helituks, nt “lehm” leh:m_=
, “mahl” mAh:l_=
. Sagedamini tuleb seda aga ette siis, kui vokaal on redutseerunud, aga sõna silbistruktuur on säilinud, nt “seda” s_=tA
, “mingi” m_=ki
.
Esimesel kohal on hääliku põhikvaliteedi märk (pika vokaali puhul topelt), sellele järgneb palatalisatsioonimärk [’] (ainult konsonantidel), siis üks või mitu lisakvaliteedimärki, kõige lõpus pikendusmärk. Lisakvaliteedimärkide järjekord on [+ -] [r o] [~] [v 0 k t] [=] (kõigepealt vokaali kvaliteedi muutumist kirjeldavad märgid, seejärel häälekvaliteeti kirjeldavad märgid; nurksulgudes üksteist välistavad märgid). Näiteks kui vokaal on eespoolsemaks muutunud ja käriseb ning on ühtlasi venitatud, siis märgime A_+_k::
või kui palataliseeritud konsonant on helilistunud ning silbiline, siis t'_v_=
.
Lisamärkidega ei maksa liialdada: kui nt A on kõvasti kõrgenenud ja eespoolsemaks muutunud ja käriseb ka, siis oleks parem märkida @_k
(kärisev redutseerunud vokaal), mitte A_r_+_k
.
Kui eelmine sõna lõppeb pika konsonandiga ja järgmine sõna algab vokaaliga, siis võiks pika konsonandi poolitada kaheks segmendiks, nii et silbitamisel saaks panna silbipiiri konsonandi keskele ja sõnaalgulist silpi alustaks lühike konsonant, nt “et oli” et|toli. Samuti võib kahe sõna piiril lühike konsonant gemineeruda, nt “õuna+puu” 7unAp|puu:
.
Kui eelnev sõna lõppeb vokaaliga ja järgmine sõna algab samuti vokaaliga, siis võib nende piirile tekkida siirdehäälik (nt j või w). Nt “ei ole” ei|jole
~ e|jole
.
Kui kahe sõna piiril on samasugused vokaalid, siis võib jagada vokaali akustiliste parameetrite puudumisel pooleks (seda võib teha geminaadi poolitamise skriptiga). Seda võib teha siis, kui vokaalne segment on piisavalt pikk et seda võiks pidada kaheks vokaaliks, sest on ka võimalik, et kaks järjestikust vokaali redutseeruvad üheks lühikeseks vokaaliks.
Kui fraasi viimase sõna lõpus enne pausi on aspiratsioon, siis märgime selle .h
märgiga sõnatasandile. See kõlab kas lühikese tugeva väljahingamisena või /h/-na, mis võib olla ka heliline (isegi kui eelnev häälik kärises). Nt |siit|.h|#|
, |midA|.h|
. Aspiratsioon võib heliliste häälikute järel olla ka kinnise suuga ja nasaalne (.m
) või larüngaalne (.q
). Häälikutasandile seda pausieelset aspiratsiooni ei märgi. Kui sõnale järgneb fraasi lõpus pikem väljahingamine, siis märgime väljahingamisena (.välja
).
Venitused märgitakse kahekordse kooloniga vastava hääliku lõpus (nt sõna lõpus “seda” sedA::
või sõna alguses “mina” m::inA
). Venituseks tuleks märkida selgelt venitatud hääldus, mitte lihtsalt igasugune pikem häälikukestus. Pane tähele, et esmavältelise sõna teine vokaal ongi eesti vältesüsteemi eripära tõttu pikema kestusega kui rõhuline silp, seda ära märgi pikaks (ühe kooloniga) ning venitatuks märgi see ainult siis, kui sa kuuled seda venitusena.
Autosegmenteerija on automaatsel kõnetuvastusel põhinev tööriist, mis viib kokku kirjaliku teksti ja sellele vastava heli. See erineb automaatsest kõnetuvastusest selle poolest, et üldiselt kõnetuvastusele antakse ainult helisalvestus ja ta teeb oletusi selle kohta, mis sõnad kõnes esinevad, siis autosegmeteerijale anname transkribeeritud teksti ja ta teeb oletusi selle kohta, kus need sõnad ja sõnas olevad häälikud helifailis paiknevad. Foneetikakorpuse märgendamisel kasutame TalTechi autosegmenteerijat.
Kui kontrollid üle autosegmenteerijaga märgendatud häälikutasandit, siis on mõned asjad, mida peaksid tähele panema:
Silbitasandi märgend koosneb silbi järjekorranumbrist ja kahetähelisest silbiliigi lühendist. Nt “kauba+maja” kAu|pa|ma|ja
– 1PL|2LL|1LL|2LL
.
Silbiliigid on:
LL
- lühike lahtine. Silbituum on üks lühike vokaal, lõpukonsonanti ei ole;PL
- pikk lahtine. Silbituum on pikk vokaal või diftong, lõpukonsonanti ei ole;PK
- pikk kinnine. Silbituum võib olla lühike või pikk vokaal või diftong, silp lõppeb konsonandi või konsonantühendiga.Kõik silbid võivad sisaldada silbi alguskonsonanti, milleks üldjuhul on üks lühike konsonant, mõningatel juhtudel ka konsonantühend.
Üldiselt on silbitamisreegliks see, et silp algab konsonandiga ja kestab kuni järgmisele vokaalile eelneva konsonandini. Seega sõnapiirid ja silbipiirid ei pea tingimata kattuma, kui eelmine sõna lõppeb konsonandiga ja järgmine algab vokaaliga. Samas on mõningaid ebareeglipäraseid konsonantühendeid mis mitmekesi alustavad silpi, ja mitte ainult võõrsõnades: |plirts|jA|pl{rts|te|gi|prof|fes:|sor|
või |krõnk|sus|ja|prunt|tis|
. Kui vokaal on silbist ära kadunud, aga tundub, et silp on ikka iseseisev silp, siis üksiku silbilise konsonandi märgime lühikeseks silbiks ja kui pikast kinnisest silbist on vokaal kadunud, siis ikka pikk kinnine. Nt “mida” asemel m_=tA
, siis |1LL|2LL|
. Samuti kui on märgendatud „mhmh“ häälikutasandil m|h|m|h:|
, siis ta võib-olla on 1LL|2PK
või 1PK|2PK
.
Kui sõna lõppeb pika konsonandiga ja järgmine algab vokaaliga, siis võib selle klusiili jagada pooleks, nii et esimene pool jääb esimese sõna viimase silbi koodaks ja teine pool alustab järgmise sõna esimest silpi. Sellisel juhul jällegi sõnatasandi piir ja häälikutasandi piir ei kattu.
Silbinumber näitab, mitmes silp see sõnas on, nummerdamist peab alustama sõna tüvest. Liitsõnade puhul tuleks silbid eraldi nummerdada alates iga tüve algusest (nt “laste+aed” lAs|te|Ae:t
- 1PK|2LL|1PK
).
Silbitasand on esmalt genereeritud reeglipõhise Praati skriptiga. Peamine reegel on see, et silbipiir on vokaalile eelneva konsonandi ees. Skripti reeglid on koostatud nii, et ühte silpi ei saa kuuluda üle kahe vokaali, aga kõiki juhtumeid ei ole võimalik lihtsate reeglite abil lahendada, mistõttu skript võib teha vigu (nt kui järjestikku satub 3 vokaali).
Kõnetakte märgendatakse failides, kus käsitsi on märgendatud sõnad ja häälikud ning tihti on käsitsi üle käidud ka häälelaad. Aga kui näed neis kihtides vigu, siis paranda.
Silbikiht on tehtud reeglipõhise skriptiga. Kui on vigu, siis paranda. Tüüpilised vead võivad olla
Ar|vut|ti|A|pi
- 1PK|2PK 3LL|1LL|2LL
Kõnetakti kiht on skriptiga “eelmärgendatud”, st sinna on kopeeritud sõnatasandi piirid ja on lisatud mõned kergestituletatavad märgid. Piire tuleks vajadusel nihutada.
Kõnetakti märgid koosnevad rõhumärgist ja vältemärgist. Rõhumärgid on “p” - pearõhk ja “k” - kaasrõhk, ning numbrid 1, 2, 3 vastavalt esimene, teine ja kolmas välde. Lisaks on märk “00”, mis tähistab üksikut rõhutut silpi, mis ei kuulu rõhutakti. Sellised esinevad fraasi alguses, nt rõhutud pronoomenid “#ma tulen” |mA|tulen|
– 0|p1
või võõrsõnades, kus rõhk ei ole esisilbil, “foneetika” |fo|neettikkA|
– 0|p2
. Kui rõhutu silbiga algav sõna on fraasi keskel, siis tavaliselt liitub see rõhutu silp eelneva sõna viimase rõhutaktiga.
Taktitasandi märgendid on siis:
00
- rõhutu eeltaktp1
- pearõhuline esmavälteline taktp2
- pearõhuline teisevälteline taktp3
- pearõhuline kolmandavälteline taktk1
- kaasrõhuline esmavälteline taktk2
- kaasrõhuline teisevälteline taktk3
- kaasrõhuline kolmandavälteline taktKõnetakt koosneb rõhulisest ja sellele järgnevatest ühest kuni kahest silbist. Ühes kõnetaktis saab olla maksimaalselt kaks rõhutut silpi, seega pikemates kui kolmesilbilistes sõnades peaks olema alati üks kaasrõhutakt.
Ühes sõnas (sh liitsõnas) saab olla vaid üks pearõhutakt. See, millisele silbile kaasrõhk langeb, sõltub kõne rütmist (ja natuke morfoloogiast). Nt “kavalamale” – kAvA|lAmAle
– p1|k1
, kAvAlA|mAle
– p1|k1
.
Kolmandas vältes võib takti moodustada ainult rõhuline silp ilma järgnevate rõhulisteta. Seetõttu loetakse ühesilbilised rõhulised sõnad kolmandavältelisteks. Ja kolmandas vältes saab olla kõrvuti kaks rõhulist silpi, mis siis moodustavad pearõhutakti ja kaasrõhutakti, nt sõnas “kontsert” kont:sert:
– p3|k3
).
Ühesilbilised sõnad võivad liituda kõnetaktideks üle sõnapiiride, nt fraasis “kas sa tuled” võiks “kas sa” kokku anda ühe teisevältelise takti |kAssA|tulet|
- p2|p1
. Seda muidugi siis, kui see nii hääldatud on, vahel võib kõneleja rõhutada ka mõlemat ühesilbilist sõna eraldi.
Üldiselt vähemalt kolme silbi tagant peaks algama uus kõnetakt. Seega, kui sõnas on neli silpi, siis tõenäoselt on seal kaks kahesilbilist takti ja esimene on pearõhuline, teine kaasrõhuline. Aga see pole päris prognoositav.
Skriptiga on märgitud p1
neile taktidele, kus esimene silp on 1LL
ehk lühike ja lahtine. Need peaks olema esmavältelised. Ja skriptiga on märgitud p3
nendele taktidele, kus esimeses silbis on üks pikendusmärki sisaldav segment, sest need peaks olema kolmandavältelised.
Peaksid kontrollima seda, et häälikutasandil kolmanda välte puhul oleks kas vokaalil või konsonandil pikendusmärk ja teise välte puhul ei peaks seal pikendusmärki olema.
Ühes sõnas saab korraga olla ainult üks pearõhk. Kui on rohkem takte, siis teine/teised on kaasrõhulised. Seda ka liitsõnades.
IP-piiride kiht on natuke spetsiifilisem kui lausungi kiht, kus jagatakse kõne pausidevahelisteks üksusteks. IP kihi genereerib Praati skript, mis märgib intonatsioonifraasi piiriks kas
Peale selle peaks faili käsitsi üle käima ja märkima IP piirid täiendavalt sinna, kus on pitch-reset ehk kus kõnevooru sees langev põhitoon liigub üles ja hakkab jälle langema.
Ühesõnalised pausidevahelised üksused ning fillerid (täidetud pausid, üneemid vms) märgitakse vastavalt funktsioonile he
(hesitatsioon) või ts
(tagasiside). Vaiksed pausid, hingamine, füsioloogilised helid jms märgitakse pausideks #
.
Praati skript, mille abil IP-kiht luuakse, otsustab märgendite he
ja ts
kasuks (korpuses sõnatasandil punktiga märgitud märgendite listi vaatluse põhjal käsitsi koostatud) sõnalistide põhjal. Üksikud pausidevahelised takerdumise tõttu pooleli jäänud sõnad loetakse samuti hesitatsioonideks.