TTS!?

Tags:    diverse

Hvordan ville i lave et Text To Speech program? Jeg sidder og overvejer om man skal indtale alle bogstaverne, og sætte dem sammen - eller om det ville være bedre at indtale hvert ord!?



7 svar postet i denne tråd vises herunder
4 indlæg har modtaget i alt 4 karma
Sorter efter stemmer Sorter efter dato
Jeg vil tro at du skal indtale lyde. Og derefter stykke dem sammen til et ord...



Altså for sjov skyld kunne man godt indtale alle bogstaver og sætte dem sammen, men tror først og fremmest det ville komme til at lyde sjovt, for det ville jo lyde som om du stavede dig gennem ordet. Derudover har været bogstav jo også forskellige lyde.

Microsoft har lavet et API, som kan bruges til at lave text to speech og speech recognition, de bruger det blandet andet til microsoft sam, som du måske kender. API'et hedder SAPI, og du kan finde en masse info om det på nettet.

Du kan også læse følgende artikel om problemstillingerne og mulighederne med text to speech og speech recognition.
http://www.microsoft.com/msj/archive/s233.aspx



Jeg kan kun anbefale at bruge Microsoft's API.
Jeg lavede engang selv et TTS-program vha. dette API, og det er faktisk ikke så svært igen.

Det skal dog lige siges at det var et meget simpelt program;
der var ingen mulighed for at skifte stemme, hastighed etc.,
men alt dette kan, så vidt jeg husker, også lade sig gøre med API'et.



Hvis du vil lave det selv skal du have gang i det der hedder speech syntesesis. Her laver man en form for simulering af de indre taleorganer til at danne lydene.

F.eks vil forskellige fonemegrupper kunne laves på bestemte måder. /s/,/t/,/z/ er foreksempel nærmest støj hvor /a/,/i/,/e/ er ustemte lyde som kan genereres med en sum af sinuser.

Det er et utrolig kompliceret topic som nok kræver at du kender til noget meget advanceret lydteori.. Hvis du bare vil lave noget gøgl for sjov så tag og prøv Microsoft's TTS



Synes ellers jeg skrev et svar for lang tid siden..
Anyways. I får jeres "tak" nu :) (Jeg er desværre ikke nået i gang med noget af det :/ )

Jeppe: Hvor lang tid tager det at sætte sig ind i det med lydene. Som du skriverdet der lyder det jo ret simpelt..



Nu ved jeg godt tråden er lukket men hvis jeg var dig ville jeg da helt klart bruge SAPI. Det er det letteste i verden at bruge og det kan også bruges til scripting, fx:
(her et VBScript)


Dim tekst
tekst = "Hello wonderfull world!"
set tale = CreateObject("SAPI.SPVoice")
tale.Speak tekst



t