Il formato MP3 (acronimo di Moving Picture Expert Group-1/2 Audio Layer 3), anche noto come MPEG-1 Audio Layer III e MPEG-2 Audio Layer III, è un algoritmo di compressione audio di tipo lossy (cioè a perdita di informazione), sviluppato dal gruppo MPEG, in grado di ridurre drasticamente la quantità di dati richiesti per memorizzare un suono, rimanendo comunque una riproduzione accettabilmente fedele del file originale non compresso.

La compressione dei dati avviene eliminando tutti quei suoni che non vengono percepiti dal sistema uditivo umano. Infatti le registrazioni in formato WAV contengono in realtà molte più informazioni di quante il nostro orecchio sia in grado di distinguere: eliminando le informazioni di troppo, si riescono ad ottenere riduzioni nelle dimensioni di oltre 10 volte (rispetto al formato WAV non compresso).

In pratica il formato MP3 sfrutta i limiti del nostro sistema uditivo, limiti che dipendono sia dalla struttura del nostro orecchio (non in grado di percepire frequenze maggiori di 20 kHz, ma particolarmente sensibile alla gamma intermedia che va dai 700 Hz ai 6000 Hz circa), sia dalle modalità con cui il nostro cervello percepisce e interpreta i suoni. 

Storia

Il formato è da inquadrarsi nell'attività di ricerca della codifica per i media digitali da parte dei gestori di reti di telecomunicazioni, durante gli anni ottanta e novanta. In questo campo, la ricerca italiana del centro di ricerca CSELT aveva un gruppo attivo a livello internazionale.

Nel 1988, su iniziativa CSELT, venne fondato in ISO il Moving Picture Experts Group (MPEG) che, con lo sviluppo dei due standard MPEG-1 ed MPEG-2 e con il supporto ottenuto dall'industria nello sviluppo, ha dato ai gestori la possibilità di mandare segnali audiovisivi di alta qualità sulla rete telefonica attuale.

Lo CSELT è stato il primo, nel marzo 1992, a dimostrare una realizzazione completa dello standard MPEG-1 con un decoder integrato in un'applicazione su personal computer, dapprima in locale e successivamente in rete. A questa prima realizzazione hanno fatto seguito altri sviluppi sempre più mirati per permettere la sperimentazione di servizi multimediali interattivi.

La codifica "MPEG-1/2 Layer 2" cominciò come progetto presso la DAB e promosso dalla Fraunhofer IIS-A. Venne finanziato dall'Unione europea come parte di un programma di ricerca più vasto chiamato EUREKA, comunemente conosciuto con il codice EU-147.

Nel dicembre 1988 il gruppo, originariamente costituito per la codifica video per apparati di registrazione, costituì un gruppo di lavoro per la codifica audio, presieduto da Hans-Georg Mussmann. Ne derivarono, per la parte audio, le tecnologie che diedero origine ai tre “layer” dello standard ISO/IEC 11172-3 (detto MPEG-1 Audio): i layer I e II dalla tecnologia proposta dal consorzio MUSICAM costituito da CCETT, Philips e Institut für Rundfunktechnik, e il layer III dalla tecnologia proposta dal consorzio ASPEC costituito da AT&T, France Télécom, Fraunhofer-Gesellschaft e Thomson Consumer Electronics. 

Nel marzo 1992 lo CSELT di Torino dimostrò la prima versione funzionante del sistema MPEG-1, sia localmente su un personal computer, che in rete. MPEG approvò in via definitiva lo standard ISO/IEC 11172-3 a novembre 1992. L'acronimo MP3 fu ideato nel 1997 via email da un gruppo di esperti MPEG.

Un'ulteriore fase del progetto MPEG Audio si concluse nel 1994 con la creazione dell'MPEG-2, definito come standard internazionale video con il codice ISO/IEC 13818-3 e pubblicato nel 1995.

Caratteristiche

La codifica MP3 permette scegliere quanto spinta deve essere la compressione: a maggiori compressioni corrisponderanno sempre qualità inferiori del suono. La qualità della compressione MP3 viene regolata da un parametro detto bit rate il quale specifica quanti kbit il file MP3 deve usare per ogni secondo di audio registrato.

Vi è anche la possibilità di variare il bit rate all'interno di un unico file MP3, usando bit rate maggiori per alcune parti e bit rate inferiori per altre (per esempio si può usare un bit rate più basso per le parti di silenzio o che contengono pochi strumenti e usare un bit rate maggiore per le parti che presentano una maggiore complessità).

Noto il bit rate è facile calcolare le dimensioni di un file mp3, poiché basta moltiplicare tale valore per la durata della registrazione. La tabella seguente mette a confronto le dimensioni corrispondenti a diversi valori del bit rate:

Bitrate Dim. file KB/s Dim. file KB/m Dim. file MB/h
 8 Kbps 1 KB 60 KB 3.6 MB
16 Kbps 2 KB 120 KB 7.2 MB
32 Kbps 4 KB 240 KB 14.4 MB
40 Kbps 5 KB 300 KB 18.0 MB
48 Kbps 6 KB 360 KB 21.6 MB
56 Kbps 7 KB 420 KB 25.2 MB
64 Kbps 8 KB 480 KB 28.8 MB
80 Kbps 10 KB 600 KB 36.0 MB
96 Kbps 12 KB 720 KB 43.2 MB
112 Kbps 14 KB 840 KB 50.4 MB
128 Kbps 16 KB 960 KB 57.6 MB
160 Kbps 20 KB 1.20 MB 72.0 MB
192 Kbps 24 KB 1.44 MB 86.4 MB
224 Kbps 28 KB 1.68 MB 100.8 MB
256 Kbps 32 KB 1.92 MB 115.2 MB
320 Kbps 40 KB 2.40 MB 144.0 MB

 

I valori di bit rate utilizzabili sono molti (da 8 fino a 320 kbit/s) ma un buon compromesso fra compressione e qualità viene considerato il valore di 128 kbit/s. Tuttavia, esso non si avvicina a quella di un CD-Audio, pur garantendo delle discrete prestazioni con dimensioni del file molto ridotte. Questo bit rate è infatti il risultato di un tasso di compressione che si avvicina al rapporto di 11.02:1 per brani musicali con voce maschile mentre, in caso di voce femminile, in quanto più acuta e difficilmente comprimibile, il rapporto diviene circa 10.17:1.

La qualità di un file MP3 dipende dalla qualità della codifica e dalla difficoltà con la quale il segnale deve essere codificato. Buoni codificatori hanno una qualità accettabile da 128 a 160 kbit/s, la chiarezza perfetta di un brano si ottiene da 160 a 192 kbit/s. Un codificatore che ha bassa qualità lo si riconosce ascoltando persino un brano a 320 kbit/s. Per questo non ha senso parlare di qualità di ascolto di un brano di 128 kbit/s o 192 kbit/s. Una buona codifica MP3 a 128 kbit/s prodotta da un buon codificatore produce un suono migliore di un file MP3 a 192 kbit/s codificato con uno scarso codificatore.

Una caratteristica importante dell'MP3 è la perdita di dati dovuta alla compressione – è il modo con cui si rimuove l'informazione dal file audio originale allo scopo di risparmiare spazio. Nei moderni codificatori MP3 gli algoritmi più efficaci fanno di tutto per assicurare che i suoni rimossi siano quelli che non possono essere rilevati e/o che vengono rilevati meno dall'orecchio umano. Questo risultato è stato ottenuto anche grazie alla scienza della psicoacustica.