Programseks kasutamiseks sobiv liides on teenus.eki.ee/synthub/. Synthub on klassikaline CGI liides, mis registreeritud kontot ega API võtit ei nõua, parameetrid on ainult v=[hääle number] ja t=[tekst], nt teenus.eki.ee/synthub/?v=458&t=tere%20talv. Vastus pole mitte helifail, vaid JSONi struktuur linkidega valmis helifailidele: {"wav":"https://koneveeb.ee/syntees/wave/hub1701337491.94075_1118.wav","mp3":"https://koneveeb.ee/syntees/wave/hub1701337491.94075_1118.mp3"}
Registreeritud hääled
Oma vajadusteks sobiv hääl valige Kõnesünteesi kodulehel. Mitte kõik hääled ei pruugi sobida suuremahuliseks tööks, mõni ühe või teise meetodi katsetuse tulemusel loodud sünteesimootor on loomu poolest aeglasem (sel juhul on aeglased ka teised sama sama mootoriga hääled). Samal põhjusel ei saa ka hinnata, kui suuri tekstilõike on võimalik sünteesi saata. Liiga suur tekst võib lihtsalt vastuseta jääda.
Häälte nimed korduvad põhjusega – tegemist ongi samade diktoritega, küll aga erineb sünteesimeetod.
foneemHMM (HTS)
- 50 Eva
- 51 Tõnu
- 52 Liisi
- 53 Riina
- 54 Meelis
- 55 Kihnu
- 56 Lee (lapsehääl)
- 57 Liivika
- 58 Peeter
- 59 Tambet
TransformerTTS
- 304 Külli
- 404 Peeter
foneemDNN (Merlin)
- 450 Tõnu
- 451 Indrek
- 452 Külli
- 453 Liivika
- 454 Peeter
- 455 Tambet
- 456 Liisi
- 457 Riina
- 458 Lee (lapsehääl)
- 459 Tambet (otsekõne)
- 461 Andreas (spontaanne)
foneemDNN (VITS)
- 471 Indrek
- 472 Külli
- 473 Liivika
- 474 Peeter
- 478 Lee (lapsehääl)
- 479 Tambet
- 480 Albert
- 481 Kalev
- 482 Kersti
- 483 Mari
- 484 Meelis
- 485 Vesta
Uudistelugeja on üles ehitatud valmistükkidest, lisaks serveri ja äpi koodile koosneb see skriptitükkidest, mis säilitavad kogutud uudiste arhiivi, regulaarselt küsivad seadistatud uudisteallikatest RSS voogu (nt ERR, Õhtuleht, Äripäev), tõmbavad veebist arhiivis veel puuduvad uued artiklid, teisendavad HTML-i lihttekstiks, jälgivad, et uudistekogu maht ja sisukord oleksid pidevalt uuendatud jms.
Helifailid genereeritakse vajadusel dünaamiliselt, kui keegi uudist kuulata soovib. Kuna sama tarkvara teenindab Pimedate raamatukogu päringuid võib juhtuda, et sobiva hääle ja kiirusega helifail on juba ette valmistatud, samuti genereerib server vaikimisi seadistuste jaoks helifailid kohe pärast uudise laekumist.
Serveripoolne kood kirjeldab (mobiili)rakenduse võimalikke pöördumisi ja nende vastuseid: ekinews.cgi
Testimiseks võib kasutada veebiväljundit: esmalt küsida olemasolevate uudiste sisukorda päringuga http://elte.eki.ee/cgi-bin/ekinews.cgi?w=1, seejärel kuulata (kui brauser lubab) konkreetset uudist.
Androidi kood: EKINews_src.zip
Sellelt lehelt saad alla laadida ja installeerida erinevaid eestikeelseid sünteeshääli. Uuemad hääled on eespool. Sünteeshäälte paigaldamine on vajalik ekraanilugeja või muude rakenduste tööks.
1. HTS-hääled
Pärast faili install_eki_sapi5_13111815.exe paigaldamist tuleb juhtpaneelis (Control panel) otsida üles „kõnesünteesi sätete muutmine“ (Change text to speech settings).
2. Üksuste valikul põhinevad hääled
3. eSpeak hääl
4. Mbrola difoonsüntesaator
Mudeli parameetrid:
A – neutraalsest (r=1.0, ht=-1.0, gv1=1.0, gv2=1.0) – kurvaks (r=0.8, ht=-4.0, gv1=0.7, gv2=1.0);
B – neutraalsest (r=1.0, ht=-1.0, gv1=1.0, gv2=1.0) – rõõmsaks (r=1.3, ht=2.5, gv1=0.9, gv2=1.4);
C – neutraalsest(r=1.0, ht=-1.0, gv1=1.0, gv2=1.0) – vihaseks (r=1.5, ht=-5.0, gv1=1.0, gv2=0.8).
Emotsioonide modelleerimine HTS parameetrilisel sünteesil
Järgnevates näidetes on püütud emotsioone modelleerida nii, et muudetakse sünteesi käigus parameetrite (kõnetempo, põhitoon, põhitooni ulatus ja kõneintensiivsus) väärtusi. Kõiki emotsioone on sünteesitud kolme mudeli (M1, M2 ja M3) järgi.
Meeshääl
Naishääl