Qualidade de áudio: entendendo bits, sample rate e formatos

O que veremos nesse post:

Índice

Formatos, extensões e codecs: o que significam? Taxa de compressão: qual é a relação com a qualidade de áudio? Resolução de amplitude: 16 bits ou 24 bits? Taxa de amostragem: o que esse valor nos diz? Aplicando esse conhecimento no dia a dia: o que você deve considerar? Quais os melhores aparelhos/aplicativos para a gravação de áudio? Por onde um produtor iniciante pode começar?

A qualidade do áudio é um aspecto importante para criadores de conteúdo. Mas o que é necessário para garantir a excelência nos áudios para podcasts e vídeos? Neste post, vamos ver tudo sobre o assunto.

Configurações de áudio para gravadores ou interfaces de som podem ser bastante confusas. Mas se você vai trabalhar com vídeos ou podcasts, é bom saber como interpretar esses parâmetros ao gravar e exportar arquivos, seja no Audacity (gratuito), Reaper, Adobe Audition ou, mesmo, em programas editores de vídeo.

Aqui vamos falar sobre diferenças entre taxas de amostragem (sample rate), resolução (bit depth), taxas de compressão de arquivo e variações de formatos. Assim, você vai ficar mais seguro de suas escolhas em relação à qualidade de áudio e garantir bons resultados.

Resumindo, você vai entender porque recomendamos gravar em formato não comprimido (WAV, por exemplo) em 24 bits e 48 kHz. Além disso, também saberá o motivo de, na maior parte dos casos, não precisarmos mais do que um MP3 de 192 kbps para exportar áudio de ótima qualidade.

Falaremos, ainda, sobre a possibilidade de maior compressão em arquivos de podcasts, que podem ser gerados em MP3 de 64 kbps, mono, facilitando o consumo online.

Formatos, extensões e codecs: o que significam?

Ao lidar com arquivos de áudio, podemos falar em formatos, extensões e codecs. Em uma explicação simplificada, o formato de áudio nada mais é que o tipo de arquivo, identificado por sua extensão (*.mp3, *.wav, *.ogg, *.wma etc.), que muitas vezes já nos diz como aquele arquivo foi codificado — ou qual o seu codec.

Como exemplo, um arquivo no formato MP3 tem a extensão *.mp3 e codec MPEG-1 Audio Layer III.

Qualidade do áudio - Exemplos de extensões de arquivos de áudio

Exemplos de extensões de arquivos de áudio

Normalmente essas terminações se misturam, mas o que importa saber é que, assim como nos vídeos, arquivos com o mesmo tipo de extensão nem sempre apresentam o mesmo codec e vice-versa.

Essa informação é válida para você não ficar perdido caso não entenda o motivo de um software que normalmente toca seus arquivos *.m4a de repente se recusar a tocar um outro de mesma extensão, por exemplo.

Uma situação do tipo poderia indicar que os codecs utilizados foram diferentes. No caso, a solução seria usar outro software para ler o arquivo ou realizar uma conversão de formato (nova codificação), que pode ser feita, até mesmo, em editores de vídeo.

Essas variações de formatos e codecs dependem das escolhas das empresas desenvolvedoras dos softwares que rodam os arquivos. Aí, muita coisa entra em jogo, como especificidades técnicas e relações com patentes.

Já sobre os arquivos, eles costumam ser divididos em dois tipos: sem compressão ou comprimidos.

Arquivos sem compressão

Equipamentos de gravação de áudio dedicados costumam nos dar opções de gravar arquivos sem nenhuma perda de informação. Esses arquivos — não comprimidos — podem ser gerados em vários formatos e extensões, como WAV, AIFF, FLAC e ALAC. Para quem é familiarizado com fotografia, são equivalentes ao RAW ou DNG.

Já que costumam ser bastante pesados, a utilização desses formatos sem perdas (lossless) no produto final só é recomendada em alguns casos, como:

quando o produto final poderá ser processado pelo consumidor (arquivos destinados a bancos sonoros, por exemplo);
quando ocorrerá gravação em mídia física (CD, DVD e Blue-Ray);
ou para mercado de audiófilos (por uma questão de valor percebido e garantia de alta qualidade).

Entretanto, mesmo que você não tenha interesse em finalizar o processo com um WAV (um dos mais comuns), os formatos lossless podem ser bastante úteis na etapa de edição. Por comportarem muita informação, eles suportam alterações mais extremas sem degradar o som, impactando a qualidade de áudio.

Assim, por meio de plugins, conversões e processamentos, é possível manipulá-los de maneira mais livre, garantindo ótima qualidade, mesmo se posteriormente for gerado um arquivo comprimido.

Arquivos comprimidos

A maior parte dos equipamentos disponíveis no mercado (câmeras, celulares e gravadores de áudios) costuma entregar arquivos já comprimidos. Eles são mais práticos, fáceis de processar e demandam menos espaço de armazenagem, apresentando tamanhos bem reduzidos (em bytes).

Alguns exemplos desses formatos são: 3GP, AAC, M4A, OGG, WMA e o MP3 — este é, sem dúvida, o mais conhecido. Esses arquivos são como o JPEG ou GIF no campo das imagens.

Por meio de um complexo algoritmo, tais arquivos são gerados buscando manter apenas informações relevantes para nossos ouvidos. Dependendo do modo de compressão, podemos gerar um MP3 a partir de um WAV e ter um arquivo 10 vezes menor, sem alterações perceptíveis no som.

Qualidade do áudio - Comparação de tamanho MP3 e Wave

Comparação de tamanho entre MP3 e Wave

Por falar em MP3, apesar de sua grande popularidade, atualmente ele é considerado um formato obsoleto, já que outros como o ACC (extensão .acc ou .m4a) possibilitam arquivos ainda menores e com mais qualidade.

Ainda assim, o MP3 continua a ser amplamente utilizado, pois grande parte dos softwares e equipamentos foram desenvolvidos visando tal formato. É por isso que, para falar de taxas de compressão, vamos utilizá-lo como exemplo.

Taxa de compressão: qual é a relação com a qualidade de áudio?

Você já entendeu que um arquivo pode ser comprimido e ainda manter qualidade de áudio suficiente para nossos ouvidos. Agora, é preciso saber que esse nível de compressão pode variar bastante.

É pelo valor da taxa de compressão (ou bitrate) que conseguimos controlar o tamanho do arquivo e, consequentemente, a qualidade do áudio.

Por exemplo, um MP3 de 320 kbps (kilobits por segundo) pode soar tão bem quanto o áudio não comprimido de um CD ou DVD. À medida que se abaixa o valor do bitrate, menor fica o arquivo, mas perdas sonoras passam a ser perceptíveis, dependendo do áudio em questão.

Qualidade do áudio - Player Winamp mostrando a taxa de compressão de um MP3

Player Winamp mostrando a taxa de compressão de um MP3

Para se ter uma noção de como essa taxa afeta a qualidade de som, veja as referências:

320 kbps – áudio indistinguível da qualidade de um CD;
192 kbps – sem perdas significativas para a maioria das pessoas;
128 kbps – perdas ligeiramente perceptíveis;
96 kbps – qualidade similar à de rádio FM;
32 kbps – similar à rádio AM;
16 kbps – similar à rádio de ondas curtas (“walkie-talkie”).

Lembrando que os valores e descrições acima são apenas uma aproximação, pois a compressão de arquivo age de maneira distinta em cada tipo de áudio. Quanto mais informação perceptível (ou quanto mais complexo for o áudio em questão), mais margem haverá para a compressão afetar a qualidade.

É por isso que, para um podcast sem trilha sonora, pode não haver problema ao gerar um arquivo de apenas 64 kbps, mono — com um único sinal de áudio tocando simultaneamente nos canais da esquerda (L) e direita (R).

No entanto, uma música bem produzida em estúdio, tocada com vários instrumentos diferentes, pode sofrer perdas perceptíveis mesmo se o arquivo comprimido for de 128 kpbs, estéreo — com um sinal diferente para cada caixa, direita e esquerda.

Aqui, estamos falando de taxas de compressão fixas (CBR — constant bitrate), mas há ainda a possibilidade de gerar arquivos com taxas variáveis, como as chamadas VBR (variable bitrate) ou ABR (average bitrate).

No VBR, o algoritmo analisa o áudio e decide em quais partes pode comprimir de maneira mais agressiva e em quais deve tirar menos informação. O ABR age de modo similar, mas se mantém na média da taxa estipulada previamente. Esses dois métodos, apesar de mais inteligentes, podem gerar incompatibilidade com alguns players.

Quando falamos sobre compressão x qualidade, lembre-se de que não há regras: cada caso é um caso e é preciso avaliá-los individualmente para saber até que ponto as perdas são aceitáveis, ou quando vale a pena abrir mão da qualidade em prol da facilidade de uso (download mais rápido ou menor impacto de armazenamento, por exemplo).

Lembre que alguns sites e serviços recodificam o áudio após você fazer upload. Como não temos controle sobre esse processo, pode ser uma boa ideia enviar arquivos com qualidade um pouco acima do necessário para que se tenha uma margem de segurança no caso de novas conversões.

Resolução de amplitude: 16 bits ou 24 bits?

Se você for utilizar uma interface/placa de som ou um gravador dedicado, vai se deparar com opções de valores de bit depth. Isso está relacionado ao padrão de áudio digital PCM e não se aplica a arquivos comprimidos.

Os valores dizem respeito à relação sinal-ruído. Em outras palavras, tem a ver com dinâmica, ou níveis de volume que o arquivo consegue registrar com qualidade de áudio.

É como se fosse uma resolução de amplitude do som. Assim, em teoria, um áudio em 16 bits consegue representar 65.536 níveis de volume entre o valor mais baixo e o mais alto da escala. Já em 24 bits, há 16.7 milhões de gradações.

Qualidade do áudio - Representação ilustrativa de resolução de amplitude

Representação ilustrativa de resolução de amplitude

Apesar da grande disparidade numérica, na prática, não se trata de uma variação perceptível aos nossos ouvidos. Porém, existe uma diferença técnica que pode, em alguns casos, dar vantagem ao arquivo 24 bits no momento de captação e edição.

Sabemos que devemos ter cuidado com o nível de entrada ao gravar, para que o áudio não “estoure” (gerando clipping). Isso é o que acontece quando deixamos o medidor gráfico subir demais, chegando a passar de 0 dB (valor máximo antes de ocorrer saturação/distorção digital). Por isso, deve-se respeitar uma certa margem de segurança, chamada “headroom”.

Em 16 bits, além desse cuidado, recomenda-se também ficar atento para que o nível de entrada não se mantenha muito baixo.

O motivo é que, como não há resolução suficiente para registrar com exatidão sinais extremamente fracos, esses sons podem soar distorcidos digitalmente ou serem acrescidos de ruídos, por meio de um processo chamado dithering, que busca mascarar essas falhas de quantização.

Desse modo, como o arquivo em 16 bits registra menos gradações de volume (48 dB a menos em relação ao 24 bits), teoricamente corre-se o risco de, ao subir o volume no software, você se deparar com uma maior dose desses “chiados”. Em 24 bits, tecnicamente já não há esse risco.

Qualidade do áudio - representação ilustrativa das zonas de um medidor gráfico de áudio

Representação ilustrativa das zonas de um medidor gráfico de áudio

Apesar disso que foi falado, você com certeza vai se deparar com uma quantidade de ruídos (noise floor) provenientes de diversas fontes muito mais prováveis como: cabos, rede elétrica, pré-amplificadores, microfones, componentes de baixa qualidade, ruídos do próprio ambiente (“ruído de sala”) e, até, decorrentes do funcionamento natural do equipamento utilizado (alguns fabricantes até especificam o valor no manual).

Assim, na prática, valores de bit depth provavelmente não influenciarão sua gravação de modo relevante. Então, se seu equipamento só suporta 16 bits, fique tranquilo, afinal é o mesmo valor de bit depth de um CD de áudio, que, como se sabe, pode apresentar som cristalino para a maior parte dos usos.

No entanto, como um arquivo 24 bits não fica muito mais pesado do que um em 16 bits, vale a pena gravar nessa resolução mais alta sempre que possível. Além de se garantir uma margem de segurança maior ao processar o arquivo digitalmente, 24 bits é o padrão do DVD e Blue-Ray. Desse modo, evitam-se conversões desnecessárias, caso o áudio final vá para uma dessas mídias físicas.

Hoje em dia, já existem até equipamentos que trabalham em 32 bits, mas, como vimos, dificilmente você se beneficiaria de algo do tipo, pois se trata de uma opção para casos específicos.

Por exemplo, quando o som é criado diretamente dentro do computador — sem passar por toda uma parafernália analógica, o que acaba adicionando diversos ruídos ao processo.

Taxa de amostragem: o que esse valor nos diz?

Outros valores com os quais você vai se deparar são relativos à taxa de amostragem (ou sample rate). Esses números dizem respeito à quantidade de vezes, por segundo, que o som analógico é “registrado”, para ser reconstruído digitalmente (44.1 kHz é igual a 44.100 amostras por segundo). É como se fosse a quantidade de quadros (frames) por segundo, em vídeo, necessários para que nossos olhos criem ilusão de movimento.

Esses valores também dizem respeito à frequência máxima (som mais agudo) possível de se reproduzir no arquivo.

Para deixar mais claro, convém lembrar que, quanto mais grave um som (baixa altura tonal), mais baixa é sua frequência (medida em Hertz). Quanto mais agudo (tom mais alto), maior o valor numérico em Hz.

Qualidade do áudio - Representação de frequência aguda e grave

Representação de frequência aguda e grave

Em geral, a frequência mais baixa que conseguimos ouvir — o som mais grave — é em torno de 20 Hz (ou 20 vinte oscilações de onda por segundo); e a mais alta — o som mais agudo —, em torno de 20 kHz (ou 20.000 oscilações por segundo).

Por questões técnicas (teorema de Nyquist), a mídia digital precisa comportar o dobro da capacidade da frequência que vai reproduzir. Assim, a taxa de amostragem de um CD (padrão da indústria por muito tempo) foi definida em 44.1 kHz.

Isso significa que, com esse valor, temos dados suficientes (por segundo) para representar frequências de até 22 kHz, aproximadamente. Em teoria, mais do que o necessário para reproduzir qualquer som audível para nós, sendo que muita gente nem consegue perceber frequências tão agudas, principalmente com o avançar da idade — boa parte dos adultos não ouve frequências acima de 17 kHz ou, mesmo, 16 kHz.

Então, em 1995, chega ao mercado o DVD, e o padrão escolhido passa a ser 48 kHz. Novamente, o número foi definido por uma questão técnica: basicamente, para arredondar valores em relação à quantidade de quadros por segundo (fps) em vídeo.

De acordo com o que vimos, fica claro que esse ligeiro aumento não altera nossa percepção do som reproduzido.

Apesar disso, alguns equipamentos permitem gravações em até 96 kHz ou mais. O único motivo para se trabalhar com valores tão elevados de sample rate é ter mais dados para manipular arquivos digitalmente (algo similar ao que vimos sobre trabalhar com WAV em relação ao MP3).

Porém, como isso implica mais espaço de armazenamento e maior exigência de processamento, não é uma recomendação nossa. Para vídeo online ou podcast, as vantagens provavelmente serão insignificantes. Além do mais, em alguns casos, valores muito elevados de sample rate podem gerar distorções harmônicas indesejáveis.

Por isso, recomendamos utilizar 48 kHz, especialmente para se trabalhar com vídeo. Por ainda ser valor padrão de mercado, você terá menos riscos de incompatibilidades ou erros de leitura.

Alguns dos possíveis erros de compatibilidade têm relação com a duração do áudio e altura tonal (pitch) reproduzida. Por exemplo, um arquivo de 44.1 kHz pode soar mais rápido e “agudo” em um projeto configurado para 48 kHz. Já um arquivo 48 kHz, caso lido como 44.1 kHz, soará mais lento e com os timbres mais “graves”.

Qualidade do áudio - Áudios em 44.1 kHz e 48 kHz em uma mesma timeline

Áudios em 44.1 kHz e 48 kHz em uma mesma timeline

Por sorte, a maior parte dos softwares atuais consegue identificar essas diferenças de taxas de amostragem e já interpretam automaticamente o arquivo da maneira correta, realizando uma conversão instantânea (geralmente seguida de um aviso) quando o valor não bate com o definido no software.

Em alguns casos, para quem trabalha exclusivamente com áudio (principalmente música), pode ser um boa se manter em 44.1 kHz, pois, apesar de o CD estar em desuso, ainda é a principal mídia física para consumo musical.

Na realidade, dificilmente você vai ter problemas convertendo de um padrão para outro. Como dissemos, hoje em dia, as plataformas e softwares leem e interpretam muito bem ambos os valores de taxas de amostragem.

Essas recomendações são apenas uma garantia para evitar possíveis e raros problemas, que podem gerar pequenos erros (artefatos digitais) decorrentes de falhas de conversões e afetar a qualidade de áudio.

Aplicando esse conhecimento no dia a dia: o que você deve considerar?

Falar sobre configurações de áudio, preferências e recomendações demanda algumas observações. Como o modo de consumo varia bastante, assim como a capacidade de audição das pessoas, o que pode ser uma ótima qualidade para alguns pode não ser para outros.

Além do mais, em uma cadeia de áudio, existe uma infinidade de elementos que podem alterar o som de maneira bem mais significativa do que os tópicos mencionados aqui.

Para um aficcionado do áudio — alguém com ouvidos apurados, que utiliza excelentes equipamentos de alta fidelidade — diferenças de parâmetros (como taxas de compressão) podem ser mais perceptíveis, dependendo dos sons em questão.

Há, ainda, o fato de que alguns sons muito graves, apesar de não audíveis para nós — por exemplo, infrassons entre 4 e 16 Hz —, podem ser percebidos de maneira tátil.

Alguns estudos (controversos) também levam a crer que frequências ultrassônicas (acima de 20 kHz), em alguns casos, podem ser percebidas pelo nosso organismo — não necessariamente por meio do sistema auditivo.

Por último, nossa audição não é tão desenvolvida quanto nossa visão. Por isso, fica bem mais difícil fazer avaliações de áudio. Assim, é comum o “efeito placebo” ao se analisar a qualidade.

Pela mesma razão, o mercado de eletrônicos pode, em alguns casos, aproveitar-se da evolução técnica de equipamentos (maiores valores de bit depth, sample rate, resposta de frequências) para vender produtos que, na prática, podem não fazer diferença alguma para o usuário.

VÍDEO: Como gravar vídeos com ÁUDIO de ótima qualidade – Hotmart Tips #52

Quais os melhores aparelhos/aplicativos para a gravação de áudio?

Se você deseja iniciar na gravação de áudio, recomendamos alguns dos melhores aparelhos e aplicativos, além de editores de áudio, para que possa executar essa atividade. Confira!

Aparelhos

Primeiro, é importante termos em mente sobre os aparelhos ideais para a gravação de áudio. Existem aqueles que são básicos. Ou seja, qualquer pessoa deve ter para utilizá-los na gravação de áudio. São eles: computador e placa de áudio.

A placa de áudio tem como objetivo captar o áudio que a pessoa deseja gravar. Já o computador vai processar esse áudio e permitir que o produtor possa fazer as edições necessárias de acordo com as suas necessidades.

Teoricamente, qualquer computador poderia ser utilizado para esse tipo de demanda. No entanto, é importante analisar quais são os seus objetivos e as máquinas que melhor comportam as suas necessidades. Assim, as chances de contar com um trabalho de qualidade aumentam consideravelmente.

Easy Voice Recorder Pro

Contar com os aparelhos certos para a gravação de áudio não é a dificuldade. O importante é encontrar no mercado aplicativos que atendam suas necessidades e possam comportar os diferentes objetivos.

No caso do Easy Voice Recorder Pro, o produtor tem como diferencial a possibilidade de organizar as suas gravações de forma simplificada. Nesse sentido, sempre que quiser consultar algum trabalho realizado ou retomar uma demanda que parou alguns dias atrás, facilmente há a possibilidade de abrir e editar.

No Easy Pro também há a oportunidade de gravar em stereo, bem como definir as gravações como toques de chamada.

Smart Recorder

Se você busca um gravador de alta qualidade, o Smart Recorder pode contribuir de forma significativa. Por meio desse aplicativo, há a possibilidade de contar com controle total sobre a gravação de áudio. Dessa forma, sempre que o produtor precisar fazer alguma alteração de uma passagem já realizada, facilmente há a oportunidade de executá-la, o que torna o processo menos oneroso.

Além disso, o Smart Recorder conta com a funcionalidade de Bloquear Onda, recurso que vai prevenir o dispositivo de entrar em modo de suspensão. Quem trabalha com áudio sabe, quando isso acontece, é uma dor de cabeça e tanto!

Por fim, você pode contar com um analisador em tempo real do espectro do áudio, o que contribui para que o trabalho seja concluído com maior precisão, dando mais credibilidade para o produtor.

Por onde um produtor iniciante pode começar?

Uma dúvida muito comum para quem está iniciando em qualquer atividade é: por onde devo começar?

No caso da produção de áudio, é preciso inicialmente buscar boas referências no mercado para capacitação. Elas vão contribuir para que o produtor possa identificar em qual área melhor se encaixa, além de ser uma oportunidade de se aperfeiçoar e adquirir mais credibilidade perante o seu público.

Também é importante contar com um canal de divulgação de seus materiais. Por meio deles, você vai ter um relacionamento próximo com a sua base de clientes e potenciais clientes, de modo que haja mais chances de fechar contratos que garantirão o sucesso do seu negócio.

Não deixe de fazer benchmarking com pessoas que já são reconhecidas na área. Certamente, elas terão muito a contribuir para você iniciar as suas atividades, em especial, considerando que o começo de qualquer trabalho gera muitas dúvidas (tanto técnicas quanto relacionadas ao fechamento de negócios).

E então, o que achou de conhecer um pouco mais sobre as melhores práticas para garantir a qualidade do áudio? Como vimos, existem diferentes recursos que contribuem para a edição, além de ser essencial um produtor iniciante buscar continuamente a capacitação para ter credibilidade no mercado. Assim, novos negócios se concretizam, de modo que consiga adquirir um nome relevante perante os concorrentes.

Que tal agora se aprofundar no audiovisual e conferir um blog post sobre como gravar vídeos caseiros com qualidade profissional? Até a próxima!