Cepstrum: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Tappoz (discussione | contributi)
Tappoz (discussione | contributi)
mNessun oggetto della modifica
Riga 16:
Il grafico del cepstrum serve ad analizzare le velocità di cambiamento del contenuto spettrale di un segnale. Originariamente venne inventato per analizzare [[terremoto|terremoti]] ed esplosioni oltre che analizzare le risposte ai segnali [[radar]].
 
Attualmente è una feature molto efficace per discriminare la [[voce]] umana nell'informatica musicale. Per queste applicazioni lo spettro viene prima trasformato attraverso le bande di frequenza della [[scala mel]]. Il risultato sono i coefficienti spettrali Mel o MFCCs. È usato per l'identificazione della voce e gli algoritmi di [[pitch]] detection (ricerca dell'[[altezza]] di una [[nota]]). Recentemente è preso in considerazione per ricerche di ''music retrieval''.
 
Un risultato del cepstrum è separare l'energia che viene dalle corde vocali dal resto dell'energia proveniente dal tratto che percorre l'aria dalla gola all'esterno per produrre la voce.
 
==Concetti ''cepstrali''==
La variabile indipendente del cepstrum è chiamata [[quefrenza]]. La quefrenza è una misura di tempo, ma non nel senso proprio di segnale che evolve nel dominio del tempo. Per esempio se la [[frequenza di campionamento]] di un segnale audio è di 44100 Hz e c'è un alto picco nel cepstrum la cui quefrenza è di 100 campioni, il picco indica la presenza di un [[pitch]] ([[altezza]] di una nota) alla frequenza di 44100/100 = 441 Hz. Questo picco appare nel cepstrum perché le armoniche nello spettro sono periodiche e il periodo corrisponde alall'[[altezza]] (pitch) della nota.
 
==Liftering==
Riga 32:
 
==Il cepstrum nell'analisi vocale==
Il cepstrum è utilizzato per separare la parte di segnale che contiene le informazioni di eccitazione (relative a parole eed [[altezza]]/[[pitch]] del suono) dalla [[funzione di trasferimento]] attuata dalla [[gola ]](che contiene il timbro della voce).
L'azione di ''lifter'' (filtraggio nel dominio della [[quefrenza]]) ha come obiettivo appunto la separazione del segnale di eccitazione (parte alta della [[quefrenza]]) dalla funzione di trasferimento (parte bassa della [[quefrenza]])<ref>[http://cnx.org/content/m12469/latest/ cnx.org]</ref>.