Voice over IP: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Nessun oggetto della modifica
Etichette: Modifica da mobile Modifica da web per mobile
Nessun oggetto della modifica
Etichette: Modifica da mobile Modifica da web per mobile
Riga 37:
=== Implementazione su linea analogica e ISDN ===
{{Vedi anche|Segnale analogico|ISDN}}
Poichè non è infatti possibile comprimere un [[segnale analogico]], coi [[formati di [[compressione dei dati]] diventa possibile ridurre drasticamente la banda richiesta intervenendo dopo la [[digitalizzazione]] della voce e prima del suo invio. Esistono frequenze del segnale digitali anche superiori alla frequenza della voce naturale; il segnale analogico rimane il limite da raggiungere per il [[campionamento (teoria dei segnali)|campionamento]] digitale, la frontiera con la qualità dell'audio migliore. Un segnale analogico ha una qualità in generale maggiore di uno digitale ed è il massimo riferimento da raggiungere. Tuttavia frequenze di digitalizzazione superiori hanno un'utilità limitata perché non aggiungono informazione al segnale di partenza, come la copia non può essere migliore dell'originale. Con linea [[ISDN]] si dispone di una connessione simmetrica su due linee: la velocità in upstream è la stessa che si ha in downstream. Con una larghezza di banda di 64 kbit/s, ovvero impegnando anche una sola linea, è possibile stabilire una chiamata Voice Over IP anche con formati di compressione della voce meno efficienti che campionano a 50-60 kbit/s (sempre riferendosi a pari valore di un indice di qualità della riproduzione). Con l'utilizzo dei due canali ISDN è possibile gestire due chiamate Voice Over IP contemporaneamente.
 
Le tecnologie di [[compressione audio|compressione della voce]] dedicano una [[banda (informatica)|banda]] che varia dai 4 kbit/s agli 82 kbit/s nei formati di compressione meno efficienti. Ad esempio il [[GSM]] codifica la voce con [[algoritmo]] RPE-LTP (''Regular Pulse Excitation - Long Term Prediction'') con [[Linear predictive coding|LPC]] loop e campionamento a 13 kbit/s. Esiste un encoder della voce a 13 kbit/s.<ref>{{cita web|url=http://www.cs.cmu.edu/~robust/Papers/icslp98_juan.pdf|titolo=Speech recognition from GSM codec parameters|accesso=23 giugno 2015|autore=Juan M. Huerta and Richard M. Stern}}</ref> Gran parte dell'energia della voce umana può essere concentrata in uno spettro limitato a 2,7&nbsp;kHz.<ref>{{Cita web|url = http://www.uoverip.com/voice-fundamentals-human-speech-frequency/|titolo = Voice Fundamentals - Human Speech Frequency|accesso = 2015-06-23}}</ref><ref>{{Cita web|url = http://www.proav.de/index.html?http&&&www.proav.de/audio/speech-level.html|titolo = proAV / data and information, lists, tables and links|accesso = 2015-06-23|sito = www.proav.de}}</ref> Per campionare un tale spettro il [[teorema del campionamento di Nyquist-Shannon|teorema di Shannon]] – chiamato anche "disuguaglianza di Nyquist" -, richiede una [[larghezza di banda]] di almeno 5,4&nbsp;kHz. Secondo tale teorema è possibile ricostruire correttamente un segnale continuo, variabile nel tempo, da una serie di valori discreti quando questi sono stati presi con una frequenza di campionamento almeno superiore al doppio della massima frequenza contenuta nel segnale in ingresso. Ad un segnale analogico di X Hz di banda corrisponde un segnale digitale di 2*X*N bit/s, dove N è il numero di bit usati per rappresentare ogni campione: per la voce si avrebbe 4000*2*8=64 kbit/s (c'è un certo margine rispetto ai 2,7&nbsp;kHz), che per altro è la medesima banda fornita da una singola linea ISDN.