Audio Codecs + File Format (explicação + dicas para produtores)

sound_by_dorinootje-d886p21

O som, que não passa de uma onda mecânica, tem duas propriedades fundamentais cujo seu conhecimento é necessário para que este possa ser reproduzido, estas são a amplitude de onda, ou intensidade se preferirem, e a frequência com que a onda oscila. Sons complexos não são mais que a sobreposição de sons simples que podem ser “limpos” (harmónicos, som diapasão) ou com com uma forma de onda “rugosa” que dá um timbre característico.

Para que o som seja gravado num formato que seja reproduzível este, por exemplo, tem de passar por membranas que absorvem as ondas mecânicas e vibram conforme a onda incidente. Esta vibração é então transformada num sinal eléctrico analógico que tem a informação de amplitude e frequência proporcional à onda de som incidente. De seguida é preciso armazenar a informação que é recolhida, esta pode ser “escrita” conforme um padrão de altos e baixos de altura variável (amplitude) com larguras variáveis conforme o tempo que o som permanece numa amplitude (frequência) que depois é impressa num objecto, possivelmente circular e possivelmente em vinyl. Ou então o padrão do som pode ser guardado em fitas magnéticas que permitem  uma maior resolução e menor desgaste do material, e consequentemente da informação guardada cada vez que este é reproduzido. Estas formas de armazenar a informação têm a natureza de serem o mais contínuas e directas na reprodução possível, limitadas apenas pelo material e processos de gravação. Por outras palavras a onda sonora é escrita como se fosse uma foto de alta resolução onde todos os pequenos pontinhos do desenho da onda nos mostram curvas perfeitas. Quando o som é reproduzido destes meios de gravação, temos uma reprodução de som mais natural que é possível arranjar.

Contudo, fitas magnéticas e discos de polímero não são práticos para armazenar informação e muito menos para manipular dita informação.

Entrando na era digital, a conversão dos sinais eléctricos no processo de armazenamento da informação sonora é feita de uma forma que pode ser vista como menos natural e de uma certa forma “artificial”. A amplitude dos sons é então registada de forma binária de modo a corresponder a um valor de intensidade por cada ponto e a quantidade de pontos por cada segundo podemos ver como sendo a frequência com que a informação é guardada, que também determina a resolução máxima com que a informação é guardada. Desta forma, quando convertemos a informação sonora em formatos digitais estamos a guardar vários pontos de informação que juntos representam a forma da onda original.

FZCDYNVHAWSLID9.LARGE

Num pequeno à parte deixem-me sumarizar os benefícios e contrapartidas de ambas as formas de guardar informação.

-Físico: maior resolução e por consequência melhor fidelidade do sinal original em relação à maioria dos formatos mais aceitados no mercado digital, mas ocupam espaço e são capazes de conter pouca informação (estão adaptados ao tamanho de um álbum)

-Digital: São muito versáteis ao ponto de tanto possuírem melhor resolução em relação aos físicos mas como os tamanhos de memória restringem o seu uso, na maioria o som acaba por ser guardado em formatos com muito menos informação que os formatos físicos tradicionais. (nota: um CD guarda em formato digital). A qualidade do som pode ser manipulável desde o processo de armazenamento até ao processo de reprodução. Pode existir tanto num formato fraco de mp3 com uma taxa de bits a 128 Kbps a 16 bit 44 KHz como pode vir num formato equiparado a um vinyl de qualidade  96 KHz 24 bit em fidelidade máxima.

whatsHraBlock3Img

Ora até aqui é tudo muito simples mas as confusões sobre os formatos digitais começam aqui. Como não é prático guardar GBs de informação para umas míseras 15 músicas, a informação é então tratada matematicamente de forma a optimizar a quantidade de informação necessária para reproduzir de forma aceitável e remover informação redundante ou simplesmente desnecessária (como os tempos silenciosos de uma música). Para processar a informação que é recolhida em RAW (bruta) para informação tratada usa-se o que se chamam de Codecs.

Muito sucintamente um codec de som é uma programa capaz de codificar e descodificar um conjunto de informação digital de som. A maneira como este o faz depende do que queremos do produto final. A informação pode ser guardada de forma a manter toda a informação necessária original (Lossless) ou podemos remover parte da informação de forma a poupar espaço (lossy), por exemplo remover gamas de frequência às quais o ouvido humano não permite recolher.

Depois da informação ser codificada pelo codec esta fica no que é chamado de formato de ficheiro de som (audio file format) que é descodificada pelo codec quando esta é reproduzida. Logo para que um dispositivo consiga ler um formato de som, este tem de possuir o codec que o descodifica.

No mercado existem vários codecs cada um com os seus usos específicos, uns servem para armazenar e reproduzir grandes quantidades de informação informação, como o exemplo dos codecs usados em DVDs e Blu-Rays (onde são usados vários canais de som com), outros são mais simples pois só são usados para reproduzir musica. Os standards das indústrias de som para definirem como a música haveria de ser codificada geraram dois formatos que permanecem  em domínio até aos dias de hoje que foram originalmente desenvolvidos nos anos 80s e inícios dos 90s, estes são o CDA ou também conhecido por Red Book audio standard que são usados nos CDs de música e o famoso mp3 ou MPEG-2 Audio Layer III que domina o mercado da música digital.

Há 15 anos atrás deu para perceber a importância que era existir um formato como o mp3, o tamanho reduzido deste permitia guardar uma música típica de 3 minutos em cerca de 3 MB. De um ponto de vista tecnológico isto foi crucial para poder criar os leitores de mp3 portáteis e telemóveis com toque “reais” que hoje são o comum de se ver, isto porque o espaço que a tecnologia existente na altura não permitia armazenar muita informação em dispositivos móveis e como o formato de codificação e descodificação era simples e eficiente por ter sido desenvolvido no início dos anos 90s (onde não havia muito poder de processamento) também levou à criação de dispositivos baratos com pouco poder de processamento mas que era o suficiente para reproduzir um mp3, e como a evolução de uma tecnologia depende essencialmente da aceitação do mercado, o facto do mp3 permitir produtos baratos foi crucial para a evolução das tecnologias móveis.

Contudo, hoje em dia a potência de um brinquedo que temos no bolso equivale a um computador fixo de há 5 anos atrás, logo as limitações do mp3 já não deveriam ser aceites nos dias correntes. De facto, o mp3 possui muitas limitações tanto tecnológicas como do ponto de vista legal. Um mp3 guarda a informação de uma forma lossy, ou seja, os processos de compressão removeram grande parte do original. As limitações técnicas ficam no máximo de taxa de bits de 320 Kbps e a uma resolução de  16 bits. Por comparação um CD de música que está à venda desde os meados dos anos 80s poderá ter até  1411  Kbps de taxa informação e vem com muita mais informação do produto original. Em termos legais o mp3 é um formato e codec proprietário o que significa que cada empresa que produz e comercializa um produto que reproduza mp3 terá de pagar pelo uso do codec á empresa com os direitos do mp3. Para responder ao problema das limitações técnicas e satisfazer as necessidades dos consumidores que realmente amam o som das musicas que ouvem, empresas como a Apple lançaram formatos alternativos com melhores algoritmos de compressão de musica que permitem ocupar quantidade de memória semelhante aos mp3 enquanto que possuem melhor qualidade de som pois é permanecida maior quantidade de informação após a compressão. Contudo permanece o problema das licenças onde os formatos da Apple são proprietários e tendem a permanecer exclusivos aos dispositivos da Apple.

Entretanto existem outros  formatos lossy com melhor qualidade do que mp3 mas que são livres sem restrições de uso. Aqui eu quero salientar o formato Vorbis (que se costuma encontrar com as extensões .ogg ou .oga) que é um formato que dá boa qualidade de musica após a compressão e ocupa memória semelhante a um mp3 e o facto de ser livre e de código aberto permite a criadores de conteúdo digital usar este formato com bons resultados sem ter de pagar licenças de uso.

Infelizmente estes formatos alternativos tiveram muita dificuldade em se destacar no mercado pois só com o aparecimento dos SmartPhones é que os telemóveis e leitores de música portáteis começaram a trazer sistemas operativos complexos capazes de ler formatos mais exóticos.

Por fim venho mencionar os formatos lossless (sem perda de informação) que são o que eu uso principalmente para armazenar a minha música. O mais antigo que vou mencionar é um formato sem compressão que apareceu em 1991 e que muitos devem conhecer, o WAV (.wav ) que foi dos primeiros formatos disponíveis para que o consumidor pudesse “ripar” um CD de música sem perder informação. o segundo que menciono é o Apple lossless que é a tentativa da Apple vender música com qualidade de um CD…enquanto tenta cobrar mais pelo álbum digital do que o preço a que o mesmo álbum em CD se encontra à venda…sigh…

O último formato que menciono é talvez o mais importante de todos estes anteriores, o FLAC! O Free Lossless Audio Codec permite a qualquer um ter uma cópia exacta de um CD ou Vinyl e é de uso livre!! Este Codec além de ter as características do WAV, é também compresso de forma a não perder informação, o que permite ocupar sensivelmente metade da memória que ocuparia uma musica em WAV. A aceitação deste formato no mercado está a ser…assim assim, o mp3 continua a ser o “standard” na cabeça das pessoas menos informadas mas hoje em dia já existem lojas digitais com o catálogo dos artistas mais conhecidos em FLAC. Destas venho destacar a www.hdtracks.com e para artistas indie existe o bandcamp.com que também costuma distribuir os álbuns em FLAC.

High_Res_File_Formats

Deixem-me também salientar uma outra vantagem de comprar música num formato lossless que seja livre, a música depois de comprada pode ser convertida para o que quiseram mantendo sempre a cópia original, mas se for obtida num formato lossy nunca irão ter uma cópia com a mesma qualidade que um CD ou vinyl.

Resumindo existem 3 tipos de codificar e armazenar a informação digital de som:

RAW uncompressed: WAV, PDM, DSD (usado nos Super Audio CDs)…

Lossless compressed: FLAC, Apple Lossless, Dolby True HD, MP4 ALS…

Lossy: mp3, vorbis, advanced audio coding (.aac), mp4, windows media audio (.wma)

-Ricardo Fernandes

Links interessantes:

Lista de Codecs de som

Noções sobre taxa de bits

Formatos de som

Som em alta resolução

Audio Digital vs Analógico

Advertisements

Deixe uma Resposta

Preencha os seus detalhes abaixo ou clique num ícone para iniciar sessão:

Logótipo da WordPress.com

Está a comentar usando a sua conta WordPress.com Terminar Sessão / Alterar )

Imagem do Twitter

Está a comentar usando a sua conta Twitter Terminar Sessão / Alterar )

Facebook photo

Está a comentar usando a sua conta Facebook Terminar Sessão / Alterar )

Google+ photo

Está a comentar usando a sua conta Google+ Terminar Sessão / Alterar )

Connecting to %s