Indstilling

Sørg for at dit talesynteseprogram virker inden du bruger KTTS. Følg instruktionerne som levereredes med programmet.

Vink

I visse tilfælde skal du give skriveadgang til lydenheden.

chmod a+rw /dev/dsp*

Brug med Festival (interaktivt)

Festival er et af de bedste frie tekst-til-tale programmer med åben kildekode som er tilgængelige. Stemmekvalitet er i almindelighed god og der er støtte for en hel del sprog og stemmer. For mange stemmer kan du styre lydstyrke, den oplæste tales hastighed og tonehøjde fra KTTS.

Syntesenavn: Festival interaktiv

URL: http://www.cstr.ed.ac.uk/projects/festival/

Debian installationskommando: apt-get install festival

Du skal installere mindst et sprog. Følg instruktionerne som leveres med Festival. Hvis du vil oplæse hjemmesider, må du installere rab_diphone (mandlig britisk) stemme.

Yderligere engelske stemmer for Festival er tilgængelige fra

http://hts.ics.nitech.ac.jp/.

Yderligere spanske, engelske og tyske stemmer er tilgængelige fra

http://cslu.cse.ogi.edu/tts/download/

Du skal kompilere yderligere et modul for disse stemmer, og derfor skal du have kildekoden for Festival. De tyske stemmer har en begrænset distribution.

En finsk mandlig stemme er tilgængelig fra

http://www.ling.helsinki.fi/suopuhe/download/.

En polsk mandlig stemme er tilgængelig fra

http://www.artegence.com/download/voicexml/speech/festival_polish_voice.tgz.

En russisk mandlig stemme er tilgængelig fra

http://nshmyrev.narod.ru/festival/festival.html

Du skal have Festival 1.95 beta eller senere for at bruge denne stemme. Stemmen er stadigvæk i en tidlig udviklingsfase. Pak festival/lib/voices/russian/ ud. Når du indstiller den russiske oplæser, er stemmekoden msu_ru_nsh_diphone. Sørg for at vælge et kyrillisk 8+bit tegnsæt, såsom KOI8-R.

Italienske stemmer for Festival 1.95 beta er tilgængelige på

http://www.csrf.pd.cnr.it/TTS/It-FESTIVAL-download.htm.

Hvis du får CRC-fejl når du pakker ud, så forsøg at hente igen.

Kiswahili, zulu og ibibio stemmer for Festival 1.95 beta er tilgængelige på

http://www.llsti.org/.

Desværre fungerer Hindi-stemmen ikke som også er tilgængelig her med KTTS.

Kommercielle stemmer, inklusive en fransk canadisk stemme, kan købes af Cepstral, LLC på

http://www.cepstral.com/

OSS på deres supportside har information om hvordan deres stemmer bruges i Festival.

Festival indgår ofte i Linux®-distributioner. Kontrollér din distributions-cd for at se om det indgår.

Bemærk

Når sprogene polsk, ungarsk eller tjekkisk bruges, så sørg for at tilvalget Kodning er indstillet til ISO 8859-2.

Når den russiske stemme bruges, så sørg for at tilvalget Tegnsæt er indstillet til et 8-bit cyrillisk tegnsæt såsom KOI8-R.

Brug Festival med MBROLA

Festival kan bruges i kombination med MBROLA-talesyntese. I denne tilstand gør Festival leksikalanalysen og MBROLA laver lyden. den binære MBROLA-filen og MBROLA-stemmefiler kan hentes fra

http://festvox.org/mbrola/.

Følg instruktionerne i filen readme.txt som kommer med det der er hentet.

Bemærk at MBROLA ikke er et fuldstændig system for tekst-til-tale. MBROLA syntetiserer tale fra difon-filer. Du skal have yderligere programmel som kan oprette difonerne. Ved kombination med Festival, laver Festival difonerne som MBROLA behøver. txt2pho kan også bruges til at oprette difoner fra tysk tekst. Se Brug med Hadifix for mere information.

Der er tre metoder for at kombinere Festival med MBROLA.

Brug Festival med MBROLA-indpakning

Med denne metoden tilføjes yderligere omgivelseskode til i Festival for at muliggøre talesyntese med MBROLA stemmefiler. Bemærk at MBROLA-stemmefilerne ikke installeres i MBROLA-mappetræet. I stedet installeres de i mappetræet festival/lib. For instruktioner, se

http://www.cstr.ed.ac.uk/projects/festival/mbrola.html

Brug IMS tysk Festival

IMS tysk Festival er en ændret version af Festival som bruger tyske MBROLA-stemmer. Det virker enten med Festival version 1.4.1 eller Festival 2.0 (1.95 beta). Installér først Festival og MBROLA, hvis du ikke allerede har gjort det. Hent derefter IMS tysk Festival fra

http://www.ims.uni-stuttgart.de/phonetik/synthesis/festival_opensource.html.

Følg instruktionerne i filen README som indgår i pakken. (Bemærk: hvis dette bruges sammen med Festival 2.0, er det ikke nødvendigt at installere det komprimerede arkiv fixes, men du skal alligevel bygge Festival igen.) Tilføj til sidst følgende linjer i filen festival/lib/siteinit.scm.

(voice-location "german_de1_os" "/usr/local/mbrola/de1"
  "German Female, IMS Festival de1")
(voice-location "german_de2_os" "/usr/local/mbrola/de2"
  "German Male, IMS Festival de2")
(voice-location "german_de3_os" "/usr/local/mbrola/de3"
  "German Female, IMS Festival de3")

lige over linjen som lyder

(provide 'siteinit)

(På visse systemer, er filen du redigerer /etc/festival.scm.) Tilføj kun linjerne som svarer til de tyske stemmer som du har installeret. Erstat /usr/local/mbrola med den rigtige søgesti. Bemærk også at IMS tysk Festival ikke virker med de tyske stemmer de4, de5 eller de6 (mens dette skrives).

Brug af tjekkisk Festival

Denne metode bruger en del speciel kode for at aktivere talesyntese ved brug af Festival og en MBROLA tjekkisk stemme. For at installere den, hentes først Festival og MROLA, de installeres og du sikrer dig at begge virker. Hent derefter tjekkisk Festival fra

http://www.freebsoft.org/festival-czech

Bemærk

Erstat de rigtige mappesøgestier efter behov i følgende procedurer.

Pak op i en passende mappe og byg ordbogen igen. Den kørbare fil for Festival skal være i din PATH.

cd /usr/local
tar xvfz festival-czech.tar.gz
cd festival-czech
make

Hent stemmefilen cz2 fra MBROLA's netsted, og pak den ud i MBROLA's mappe.

cd /usr/local/mbrola
mkdir cz2
cd cz2
unzip cz2-001009.zip

Tilføj følgende linjer til filen festival/lib/siteinit.scm:

(set! czech-lexicon-file "/usr/local/festival-czech/czech-lexicon.out")
(set! load-path (cons "/usr/local/festival-czech" load-path))
(require 'czech)
(set! czech-mbrola_database "/usr/local/mbrola/cz2/cz2")
(set! mbrola_progname "/usr/local/mbrola/mbrola")
(voice-location "czech_mbrola_cz2" "/usr/local/mbrola/cz2"
    "Czech Male, MBROLA")
(require 'czech-mbrola)

lige over linjen som lyder

(provide 'siteinit)

(På visse systemer er filen du redigerer /etc/festival.scm)

Brug med Festival Lite (flite)

Festival Lite er et frit program med åben kildekode som for øjeblikket understøtter et begrænset antal stemmer og sprog. Det er letvægts, men giver lidt op på stemmekvalitet. Du kan ikke styre tonehøjde, lydstyrke eller hastighed for programmet fra KTTS.

Syntesenavn: Festival Lite (flite)

URL: http://www.speech.cs.cmu.edu/flite/index.html

Debian installationskommando: apt-get install flite

Programmet flite indgår ofte i Linux®-distributioner. Tjek din distributions-cd for at se om det indgår.

Byg og installér flite ved at følge instruktionerne i filen README som levereres med det.

Brug med Hadifix (MBROLA og txt2pho)

Hadifix er et totrins talesynteseprogram baseret på difoner. Værktøjet txt2pho konverterer tekst til difoner og programmet MBROLA syntetiserer difonerne til lyd. Stemmekvaliteten er god, men sprogunderstøttelsen er for øjeblikket noget begrænset. Du kan styre stemme, tonehøjde, hastighed og lydstyrke fra kttsmgr.

Syntesenavn: Hadifix

URL: se nedenfor

Debian installationskommando: ingen

Hvis du ikke allerede har installeret Hadifix, så gør følgende:

  1. Hent MBROLA's binære filer fra http://festvox.org/mbrola/.

  2. Installér MBROLA i mappen /usr/local/mbrola.

  3. Hent mindst en tysk sprogfil fra MBROLA-stedet. Pak den ud i mappen /usr/local/mbrola.

  4. Hent txt2pho fra

    http://www.ikp.uni-bonn.de/dt/forsch/phonetik/hadifix/HADIFIXforMBROLA.html.

  5. Pak txt2pho ud til /usr/local/txt2pho.

  6. Redigér filen txt2phorc, og tilføj rigtige datastier.

  7. Kopiér enten txt2phorc til ~/.txt2phorc eller til /etc/txt2pho. Bemærk at du fjerner "rc" fra filnavnet.

  8. Vælg sproget tysk i kttsmgr (de), og tilføj Hadifix.

  9. På skærmen Indstil Oplæser, indstilles en stemme og søgestierne til MBROLA og txt2pho.

  10. Klik på knappen Test for at teste.

En ungarsk implementering af MBROLA og txt2pho er tilgængelig på

http://tkltrans.sourceforge.net/.

Brug med Epos

Epos er et frit tjekkisk og slovakisk program med åben kildekode. Det er letvægts, men har lidt dårligere stemmekvalitet. Du kan ikke styre lydstyrke for programmet fra KTTS.

Syntesenavn: Epos tekst-til-tale syntesesystem

URL: http://epos.ure.cas.cz/

Debian installationskommando: apt-get install epos

Start kttsmgr. Klik på knappen Tilføj på siden Oplæsere. Vælg sproget tjekkisk eller slovakisk og Epos tekst-til-tale syntesesystem. Hvis den kørbare Epos-server og klienten ikke er i din søgesti, indtast den fuldstændige søgestier til disse kørbare programmer på siden Indstil Oplæser. Tilvalgsfelterne tillader dig at sende yderligere flag til serveren og klienten. Skriv epos -h eller say -h i en terminal for information.

Brug med FreeTTS

FreeTTS er et frit talesynteseprogram med åben kildekode skrevet i Java™, hvilket betyder at du skal have Javas virtuelle maskine installeret på dit system for at bruge den. Den har for øjeblikket begrænset understøttelse for stemmer og sprog. Du kan ikke styre tonehøjde, lydstyrke eller hastighed for programmet fra KTTS.

Syntesenavn: FreeTTS

URL: http://sourceforge.net/projects/freetts/

Debian installationskommando: ingen

Brug plugin for kommando

Plugin-programmet for kommando tillader at du bruger KTTS med et hvilket som helst talesyntesprogram, som kan køres som en kommando i en terminal.

Syntesenavn: Kommando

URL: ingen

Debian installationskommando: ingen

Ideelt bør du bruge en kommando som syntetiserer til en midlertidig lydfil (wav), i stedet for at sende talen direkte til lydenheden.

Hvis talesyntesprogrammet kræver at tekst skal have et andet tegnsæt end desktoppens tegnsætindstilling, skal du bruge flaget %f til at sende teksten til programmet. KTTS koder teksten med indstillingerne du angiver når det skriver teksten til den midlertidige filen. Hvis du forsøger at sende tekst på kommandolinjen med flaget %t, kodes det med tegnsætindstillingen i desktoppens indstilling af land. Du kan også bruge tilvalget Send data som standardindtastning for at løse problemet, hvis programmet accepterer inddata fra standardindtastningen. Her er et eksempel på en kommando til at sende polsk tekst til Festival med kodningen ISO 8859-2 og fjerne tegnsætning som ikke skal læses op.

cat %f | tr '(){}[]"' ' ' | festival --tts --language polish