vocodificador
*

m
Electrònica i informàtica

Codificador de la veu humana.

La finalitat d’un vocòder és poder emmagatzemar o transmetre digitalment la veu humana amb menys bits dels que serien necessaris si en fes un simple procés de mostreig. Són codificadors específics per a la veu, i no s’utilitzen per a la música, que ja té altres tipus de codificadors (MP3). En la implementació d’un vocòder hi ha dues fases: la d’anàlisi de la veu, en què s’extreuen unes característiques (paràmetres) que són les que permeten transmetre o emmagatzemar la veu de forma més eficient que si es fes directament a partir de les mostres del senyal vocal, i la de síntesi, que permet reproduir la veu a partir de les característiques anteriors.

Els principals tipus de vocòder són els de classificació de l’espectre de la veu en subbandes de freqüència mitjançant un banc de filtres passabanda, parametritzant el senyal de sortida del filtre de cada subbanda i emmagatzemant o transmetent aquests paràmetres, a partir dels quals es pot reproduir la veu. Un segon tipus de vocòder es basen en un processament homomòrfic, que es va repetint en intervals d’uns 20 mil·lisegons i permet deduir si durant aquest interval de temps la font vocal és fricativa o oclusiva. En reproducció de la veu, aquesta informació servirà per a decidir, també cada 20 mil·lisegons, si el vocòder s’excita amb una font de soroll (cas fricatiu) o amb un tren d’impulsos (cas oclusiu). Aquesta excitació és convertida en el senyal de veu original passant-la per un filtre ajustat segons uns formats, que són paràmetres calculats durant la fase d’anàlisi de la veu i que estan relacionats amb la seva resposta freqüencial. El tercer tipus de vocòder, dels quals hi ha variants, són els basats en tècniques de predicció lineal, les quals van avaluant la tendència de la veu i codificant les diferències entre aquestes prediccions i la realitat. Aquestes diferències (o errors) són les que es transmeten o s’emmagatzemen.

En síntesi de veu, s’utilitza el mateix algorisme de predicció lineal que en la fase d’anàlisi, corregint les prediccions amb els errors que s’han codificat prèviament. Les tècniques de predicció lineal són utilitzades en sistemes de telefonia, com és el cas del sistema GSM, en què es prenen mostres de la veu a una velocitat de 8 kHz, guardant cada mostra amb una precisió de 13 bits. Si es transmetés directament aquesta informació, caldrien 8 000 × 13 = 104 kbps. Gràcies al vocòder, que codifica la veu en intervals de 20 mil·lisegons, la transmissió es pot fer a 13 kbps, la qual cosa permet emprar canals de comunicacions de menys amplada de banda (o multiplexar més usuaris en el mateix canal).

El terme prové del terme anglès vocoder, acrònim deVoice Coder.