Cos'è spettrogramma?

Uno spettrogramma, detto anche sonogramma, è una rappresentazione visiva della frequenza di un segnale (solitamente sonoro) nel tempo. Fornisce un'analisi dettagliata delle componenti spettrali di un suono, rivelando come la sua frequenza varia nel corso del tempo.

In sostanza, uno spettrogramma visualizza:

  • Tempo: Solitamente rappresentato sull'asse orizzontale (asse x). Mostra la durata del segnale audio analizzato.
  • Frequenza: Solitamente rappresentata sull'asse verticale (asse y). Indica le diverse frequenze presenti nel segnale. Le unità di misura più comuni sono Hertz (Hz) o kiloHertz (kHz).
  • Ampiezza (o Intensità): Rappresentata tramite il colore o l'intensità del colore in ogni punto. Un colore più scuro o più intenso indica una maggiore ampiezza (e quindi, un suono più forte) a quella specifica frequenza e in quel momento nel tempo.

Come si crea uno spettrogramma:

Gli spettrogrammi vengono creati analizzando il segnale audio utilizzando una tecnica chiamata Trasformata di Fourier (in particolare la Short-Time Fourier Transform o STFT). La STFT divide il segnale audio in piccoli segmenti temporali e applica la Trasformata di Fourier a ciascun segmento. Questo processo determina le frequenze dominanti in ciascun segmento e la loro ampiezza. I risultati vengono quindi visualizzati come l'immagine dello spettrogramma.

Applicazioni degli spettrogrammi:

Gli spettrogrammi sono utilizzati in una vasta gamma di campi, tra cui:

  • Analisi del parlato: Per studiare e analizzare la fonetica e la struttura del linguaggio.
  • Elaborazione del segnale audio: Per identificare e rimuovere il rumore, migliorare la qualità audio e riconoscere pattern sonori.
  • Bioacustica: Per studiare i suoni emessi dagli animali, come il canto degli uccelli o i richiami dei mammiferi marini.
  • Diagnostica medica: Per analizzare i suoni del corpo, come i suoni del cuore o dei polmoni, per identificare potenziali problemi di salute.
  • Geofisica: Per analizzare i segnali sismici e identificare terremoti o altre attività geologiche.
  • Riconoscimento vocale: Per visualizzare e analizzare i suoni della voce umana al fine di addestrare i sistemi di riconoscimento automatico del parlato.

Interpretazione degli spettrogrammi:

Imparare a leggere uno spettrogramma richiede pratica, ma alcuni elementi comuni sono:

  • Armoniche: Righe orizzontali che rappresentano multipli della frequenza fondamentale.
  • Formanti: Bande di frequenza più intense che caratterizzano i suoni vocalici nel parlato. Le formanti sono cruciali per distinguere i diversi suoni vocalici.
  • Rumore: Visualizzato come macchie casuali o diffuse.
  • Transienti: Picchi verticali che rappresentano eventi sonori brevi e intensi, come colpi o esplosioni.

La risoluzione temporale e di frequenza di uno spettrogramma sono inversamente proporzionali. Aumentare la risoluzione temporale (utilizzando finestre temporali più corte nella STFT) riduce la risoluzione di frequenza, e viceversa. La scelta della finestra temporale appropriata dipende dall'applicazione specifica.