MiaM skrev: ↑22 oktober 2024, 14:26:18
pi: Vocoder är väl dock inte talsyntes utan en slags ljudeffekt som används främst för musikproduktion? Mest tänkt för att använda röst för att styra ljud från instrument, men t.ex. Adolphson&Falk använde vocoder på trummorna :O
Även detta är, minst på gränsen till, off-topic. Men jag vill förklara.
Jag tänkte när jag skrev om vocoder att ordets betydelse har glidit en hel del sedan början av 1970-talet.
Jag borde nog ha skrivit om det, men jag gjorde inte det. My bad.
Ett kort citat före en kort förklaring.
Vocoder (från engelskans voice encoder) är en ljudprocessor som fångar upp karaktären hos en ljudsignal för att påverka en annan ljudsignal.
Tekniken bakom vocodern användes först i ett försök att syntetisera röster. Praktiskt fungerar vocodern genom att den kombinerar två signaler, en instrumentsignal (carrier) och en annan signal som vanligen är en röstinspelning (source eller modulator). Resultatet blir att rösten har samma ljud och ton som instrumentsignalen.
(Min rödmarkering)
https://sv.wikipedia.org/wiki/Vocoder
Den vocoder som Ericson utvecklade i början av 1970-talet var utvecklad för röstsyntes, med syftet att skapa tal. En dator styrde vocodern med, väsentligen, text.
Syntesmekanismen baserades på att talet väsentligen består at tre komponenter:
– En grundton.
– Ett övertonsspektra.
– Ett brusliknande väsljud, som i s.
Grundtonens frekvens och nivån på dom olika komponenterna kan varieras.
Man kan också lagra tal genom att sampla, med iakttagande av samplingsteoriemt, och lagra nivån. Så som man t.ex. gör i en CD-skiva. Då med 44,1 kHz samplingsfrekvens och med fyra byte per sample. Det blir 176,4 kByte/s. I början av 1970-talet kostade en megabyte massor. Det kunde handla om miljonbelopp. För tal räcker betydligt lägre samplingfrekvens. Kanske 10 kHz och 2 byte/sample skulle ge ganska bra tal med 20 kByte/s. 1,2 MByte/minut. Med höga minnespriser blev det dyrt att lagra.
Jag minns inte "siffrorna" för Ericsons vocoder, men det kan ha varit ca 15-30 byte per sekund. Kanske 1200 Byte/minut. Det var under alla omständigheter en mycket liten bråkdel av den datamängd som behövs vid sampling och lagring av data för varje samplingspunkt. A la samplingsteoremet. En liten repertoire som, "vill du tala med försäljning, tryck ett, vill du tala med service, tryck två" och ytterligare ett antal fraser, kunde utan problem lagras med en vocoder.
Såvitt jag vet kommersialiserades aldrig den vocoder för talsyntes som utvecklades på Ericson. Några andra produkter, från andra företag, kommersialiserades.
Jag försökte hitta ett exempel på hur tal från en tidig vocoder låter. Men, jag hittade bara exempel från vocodrar av den typ som används av musiker. Dom som varit med på 1970 och början av 1980-talen kanske minns dom "artificiella och mekaniska" rösterna från tidiga vocodrar för talsyntes.
Texten om vocodrar på engelska hos Wikipedia täcker historiken lite bättre än den text som finns på svenska.
https://en.wikipedia.org/wiki/Vocoder
/π