MP3, venticinque anni dalla nascita dell'estensione musicale

Una delle più celebri citazioni dedicate a quella forma artistica che è la musica, arriva da uno dei più grandi filosofi contemporanei, Friedrich Nietzsche, il quale sosteneva che "Senza musica, la vita sarebbe un errore". Pensiamo a tutti quei dispositivi che permettono la riproduzione di brani musicali nella nostra vita quotidiana: dalle radio, agli iPod, fino al nostro smartphone, banalmente, che si tratti di YouTube, Spotify, o altre applicazioni dedicate. Che dire invece di tutti quei CD che ascoltavamo, o ascoltiamo, negli appositi lettori, e che preparavamo noi scaricando musica dal web? No, non stiamo parlando di pirateria e download legali, ma più genericamente di quell'algoritmo che ha concesso la nascita di tutte le playlist "casalinghe" e non solo: l'MP3, che iniziava ufficialmente la sua trionfale esistenza il 14 luglio 1994.

Ci avete mai pensato a quanto sia stata una rivoluzione per la nostra fruizione dei contenuti? No? Ma che ne sanno i 2000, direbbe Gabry Ponte; vi diamo allora qualche spunto di riflessione, in occasione del venticinquesimo compleanno di questa estensione.

L'amarcord è il vostro pane quotidiano? Sapete tutto del "padre" del DVD e Bluray? Recuperiamo insieme la nascita del videoregistratore nel nostro approfondimento!

Racconti di un passato recente

Era il 7 luglio 1994, quando la Fraunhofer Society rilasciò il primo codificatore MP3, chiamato l3enc. L'estensione del nome del file .mp3 è stata poi scelta ufficialmente dal team Fraunhofer il 14 luglio 1995. In precedenza infatti, i file erano stati nominati .bit, ma i trascorsi per realizzare questa estensione non sono stati semplicissimi. Andiamo dunque con ordine e capiamo prima di tutto cosa significa questa sigla: MP3 sta per Moving Picture Expert Group-1/2 Audio Layer 3), ed era originariamente nota anche come MPEG-1 Audio Layer III e MPEG-2 Audio Layer III.

Si tratta di un algoritmo di compressione audio di tipo lossy, che come ci indica il nome, non promette benissimo. Dall'inglese loss, perdita, questo termine indica una classe di algoritmi di compressione dati che può condurre alla perdita parziale delle informazioni originali, in particolare nella fase di compressione e decompressione dei dati.

Questo algoritmo è stato sviluppato dal gruppo MPEG, ossia il Moving Picture Experts Group, che all'atto pratico si trattava di un comitato tecnico formato dalle organizzazioni internazionali ISO e IEC, nato nel 1988.

Venne creato con lo scopo di definire standard la rappresentazione in forma digitale di audio, video e altre tipologie di contenuti multimediali, in modo da soddisfare un'ampia varietà di applicazioni. Tra queste, appunto l'estensione per riprodurre brani musicali, in grado di dare un taglio netto alla quantità di dati richiesti per memorizzare un suono, mantenendo però una riproduzione fedele del file originale e non compresso.

I suoi natali devono essere ricercati non troppo indietro nel tempo; dobbiamo risalire per la precisione a dicembre del 1988, quando il gruppo MPEG, originariamente costituito per la codifica video per apparati di registrazione, costituì un gruppo di lavoro per la codifica audio, presieduto da Hans-Georg Musmann. Dopo alcuni mesi di lavoro, vengono presentati nel giugno 1989 14 algoritmi di codifica audio, raggruppati in quattro gruppi di sviluppo.

Nascita di un sogno digitale

Gli immediati predecessori dell'estensione MP3 erano chiamati Optimum Coding in the Frequency Domain (OCF) e Perceptual Transform Coding (PXFM): questi due codec distinti, insieme ai contributi di block-switching di Thomson-Brandt, sono stati uniti in un unico codec chiamato ASPEC, sottoposto al gruppo MPEG e che è risultato ottimale in termini di qualità, ma erroneamente rifiutato perché ritenuto troppo complesso da implementare.

La prima implementazione pratica di un codificatore percettivo audio (OCF) in hardware è stata quella di un codificatore trasformante psicoacustico basato su chip Motorola 56000 DSP.

Un altro predecessore del formato e della tecnologia MP3 è stato il codec percettivo MUSICAM, meglio noto come MPEG-1 Audio Layer II, sviluppato nel 1993, basato su un'aritmetica intera 32 sub-bande filterbank e guidato da un modello psicoacustico. Questo modello conferisce infatti una buona qualità alla compressione audio lossy (con perdita di informazione), indicando quale parte del segnale audio da comprimere può essere rimossa, o compressa, senza perdite significative nella qualità.

È stato progettato principalmente per la Digital Audio Broadcasting, ossia la radio digitale, e la TV digitale, i cui principi di base divulgati alla comunità scientifica dal CCETT e dall'IRT ad Atlanta furono durante una conferenza nel 1991, dopo aver lavorato su MUSICAM con Matsushita (azienda successivamente battezzata Panasonic) e Philips dal 1989.

Questo codec incorporato in un sistema di trasmissione che utilizza la modulazione COFDM, è stato messo alla prova in onda insieme a Radio Canada e CRC Canada durante lo spettacolo NAB (Las Vegas), sempre nel 1991. L'implementazione della parte audio è stata basata su un encoder a due chip: uno per la trasformazione della sottobanda, uno per il modello psicoacustico progettato dal team tedesco di Stoll, più tardi noto come modello psicoacustico I.

MUSICAM maestro!

Accanto a questi venne utilizzato un decoder in tempo reale, utilizzando un chip DSP Motorola 56001 con un software di aritmetica intera progettato dal team di Y.F. Dehery. La semplicità del decoder corrispondente insieme all'alta qualità audio di questo codec utilizzando per la prima volta una frequenza di campionamento a 48 kHz e un formato di ingresso a 20 bit/campione sono stati i motivi principali per adottare in seguito le caratteristiche di MUSICAM come base per ottenere un codec avanzato di compressione di musica digitale.

Durante lo sviluppo del software di codifica MUSICAM, il team di Stoll e Dehery ha fatto un uso completo di un set di materiale di valutazione audio di alta qualità, selezionato da un gruppo di professionisti audio dell'Unione Europea di Radiodiffusione e successivamente utilizzato come riferimento per la valutazione dei codec di compressione musicale.

La tecnica di codifica delle sottobande si è rivelata dunque efficiente, non solo per la codifica percettiva dei materiali sonori di alta qualità, ma soprattutto per la codifica di materiali sonori percussivi critici (quelli emessi da strumenti come batteria o triangolo) a causa dello specifico effetto di mascheramento temporale del sottofondo MUSICAM (questo vantaggio è una caratteristica specifica delle tecniche di codifica a breve trasformazione).

A tal proposito, un importante passo nella storia della nascita dell'MP3 è stato compiuto da uno studente di dottorato presso l'Università tedesca di Erlangen-Norimberga. Seguito dal Professor Dieter Seitzer (esperto in psicoacustica), Karlheinz Brandenburg ha iniziato a lavorare sulla compressione della musica digitale nei primi anni Ottanta, concentrandosi sul modo di percepire la musica da parte delle persone.

Il risultato della sua ricerca pose le basi per il formato MPEG-1 Layer 3, MPEG-2 Advanced Audio Coding e molti altri schemi di compressione moderni.

Nel 1990, Brandenburg divenne assistente professore a Erlangen-Norimberga, continuando a lavorare sulla compressione musicale con altri scienziati presso l'Heinrich Herz Institute della Fraunhofer Society. Una "nota" curiosa è che la prima canzone usata da Brandenburg per sviluppare l'estensione MP3 fu Tom’s Diner di Suzanne Vega, ascoltandola ripetutamente e ogni volta raffinando lo schema, assicurandosi che non influenzasse negativamente la sottigliezza della voce di Vega.

E musica fu

Arriviamo agli inizi degli anni Novanta, nel 1991, quando esistevano due proposte disponibili e valutate per uno standard audio MPEG: MUSICAM (Masking pattern adapted Universal Subband Integrated Coding And Multiplexing) e ASPEC (Adaptive Spectral Perceptual Entropy Coding). Venne scelta la tecnica MUSICAM, proposta da Philips, CCETT, Institute for Broadcast Technology e Matsushita per la sua semplicità e robustezza nell'errore, nonché per l'alto livello di efficienza computazionale.

Mentre gran parte della tecnologia e delle idee MUSICAM sono state incorporate nella definizione di MPEG Audio Layer I e Layer II, la sola banca di filtri e la struttura dei dati basata sull'inquadratura di 1152 campioni di MUSICAM sono rimasti nel Layer III, appunto il famoso MP3, come parte della banca dei filtri ibridi inefficiente dal punto di vista computazionale.

Dunque, sotto la presidenza del professor Musmann dell'Università di Hannover di Leibniz, la redazione dello standard è stata delegata a Leon van de Kerkhof, Gerhard Stoll e Yves-François Dehery, che ha lavorato su Layer I e Layer II. ASPEC, come anticipavamo, era la proposta congiunta di AT&T Bell Laboratories, Thomson Consumer Electronics, Fraunhofer Society e CNET.

Così, un gruppo composto da Van de Kerkhof, Stoll, Leonardo Chiariglione, Yves-François Dehery, Karlheinz Brandenburg e James D. Johnston ha ripreso le idee di ASPEC, integrando la banca dei filtri del Layer II e aggiungendo alcune delle proprie idee, come la codifica stereo comune di MUSICAM e ha creato il formato MP3, che è stato progettato per raggiungere la stessa qualità a 128 kbit/ s come MP2 a 192 kbit/ s.

Ulteriori lavori sull'audio MPEG sono stati finalizzati nel 1994 come parte della seconda suite di standard MPEG, MPEG-2, più formalmente conosciuta come MPEG-2 Part 3 (o MPEG-2 Audio o MPEG-2 Audio BC), originariamente pubblicata nel 1995. MPEG-2 Parte 3 ha definito lo standard di 42 bit rate e sample rate aggiuntivi per il livello audio I, II e III MPEG-1. Le nuove frequenze di campionamento sono dunque esattamente la metà di quelle originariamente definite in MPEG-1 Audio.

Una terza generazione di flussi di dati in stile "MP3" estese le idee e l'implementazione di MPEG-2, ma fu chiamata MPEG-2.5 audio, dal momento che MPEG-3 aveva già un significato diverso. Questa estensione è stata sviluppata presso Fraunhofer IIS, i titolari dei brevetti registrati di MP3, riducendo il campo di sincronizzazione dei fotogrammi nell'intestazione MP3 da 12 a 11 bit.

L'arrivo nelle nostre mani

Come e quando l'estensione arriva al grande pubblico? Il 7 luglio 1994, la Fraunhofer Society rilasciò il primo software codificatore MP3, chiamato l3enc. L'estensione del nome del file .mp3 è stato scelto dal team il 14 luglio 1995 (in precedenza i file erano stati nominati .bit).

Con il primo lettore MP3, Winplay3, rilasciato il 9 settembre 1995, molte persone sono state in grado di codificare e riprodurre i file MP3 sui loro PC, ma a causa dei dischi rigidi dell'epoca, relativamente piccoli , (500-1000 MB), la compressione con perdita di qualità era praticamente richiesta per memorizzare più album.

Nella seconda metà degli anni Novanta, i file MP3 hanno cominciato a diffondersi su Internet, spesso tramite reti musicali pirata. Il primo esperimento conosciuto nella distribuzione su Internet è stato organizzato dall'Internet Underground Music Archive, meglio conosciuto con l'acronimo IUMA.

Dopo alcuni esperimenti utilizzando file audio non compressi, questo archivio ha iniziato a fornire su Internet in tutto il mondo a bassa velocità alcuni file audio MPEG compressi utilizzando il formato MP2 (Layer II) e successivamente utilizzando file MP3 quando lo standard è stato completamente completato.

La popolarità degli MP3 iniziò ad aumentare rapidamente con l'avvento del lettore audio di Nullsoft Winamp, pubblicato nel 1997. Nel 1998, il primo lettore audio digitale a stato solido portatile Mpman, sviluppato dalla coreana Saehan Information Systems, viene rilasciato e il Rio PMP300 è stato venduto in seguito nel 1998, nonostante gli sforzi legali di repressione da parte della RIAA.

Nel novembre 1997, il sito web mp3.com offriva gratuitamente migliaia di MP3 creati da artisti indipendenti. Le piccole dimensioni dei file MP3 consentivano la condivisione di file peer-to-peer di musica estratta da CD, che in precedenza sarebbe stata quasi impossibile.

La prima rete di condivisione file peer-to-peer, Napster, è stata lanciata nel 1999 e da lì il formato ha cominciato a vagare sempre più nell'etere, fino a popolare CD e lettori MP3, iPod e quant'altro abbiamo quasi sempre riposto nel cassetto di casa nostra, e della nostra memoria.

I tempi si sono evoluti, un buon motivo per recuperare la sesta generazione di iPod Touch o un lettore MP3 Walkercam!