Profundidade de Bits e Taxa de Amostragem

(Post escrito em Co-autoria com Lela Lenz)

Ao pensar em som digital, uma das coisas que as pessoas primeiramente levam em consideração é o tamanho do arquivo (em kbps ou Mbps), apesar de que esse valor por si só não representa muito bem a qualidade do som. Na realidade, o que representa a qualidade do som é a qualidade da gravação e, logo depois, a qualidade da masterização. No caso, a função do arquivo é preservar a qualidade do que vem antes da formação dele. Uma gravação ruim pode ser colocada no arquivo menos compactado que existe e, mesmo assim, vai soar ruim.

Para pensar o som digital, vale lembrar que o som analógico ocorre de forma contínua enquanto o digital ocorre de forma fragmentada. Isso quer dizer que o digital pega uma grande informação e divide em milhões de pequenas informações para permitir a criação de um arquivo em código binário.

Porém, o que define o tamanho digital de um arquivo são os bytes (por isso megabytes ou kilobytes) e, considerando que 1 byte é igual 8 bits, a taxa de bits é o elemento básico que define esse tamanho. Calculamos a taxa de bits a partir de uma multiplicação de [profundidade de bits x taxa de amostragem]. Esses são respectivamente a resolução de uma informação sonora (o que define a sua latitude sonora) e a quantidade de informações por segundo.

Profundidade de Bits

Como já vimos anteriormente, a latitude sonora é a distância máxima entre a maior intensidade e a menor intensidade possível em um som, ou seja, entre o pico e o noise floor. Com isso, se o som tem uma latitude sonora menor, ele não consegue reproduzir tantos elementos, diminuindo a sua resolução. Em geral, teremos arquivos de som digital em 16 bits, 24 bits e, mais raramente, 32 bits. Nesse post focaremos somente em 16 e 24 bits.

O padrão que normalmente é um ponto de partida para entendermos esses aspectos é o do CD. Lançado em 1983, o CD é um exemplo de mídia digital, possuindo arquivos com 44.100 informações por segundo (ou seja, 44.1kHz de taxa de amostragem) e 16 bits de profundidade. Já na gravação para cinema, é mais comum gravarmos em 48kHz e 24 bits.

Mas o que são esses bits?

Explicando de uma forma simples, os bits são a resolução de um áudio que permitem capturar mais características intrínsecas àquele som. Ou seja, enquanto a taxa de amostragem captura os sons em determinado espaço de tempo, os bits mantém com melhor qualidade os detalhes desses sons.

Na prática, o que a maior presença de bits faz é aumentar a latitude sonora, tornando audível tanto sons mais altos quanto sons mais baixos. O cálculo é feito da seguinte maneira: a cada bit adicionado à profundidade sonora, a latitude sonora aumenta 6 decibéis. Isso significa que um som de 16 bit, como de um CD, possuí uma latitude sonora máxima de 96 decibéis. Já um arquivo em 24 bits, possuí uma latitude sonora máxima de 144 decibéis.

96 decibéis é coisa pra caramba. É a diferença entre o som do sangue correndo em nossas veias e uma motoca com o escapamento barulhento passando nas ruas. E, normalmente, nós não escutamos essa diferença no dia-a-dia. Precisaríamos estar em um lugar extremamente silencioso (por exemplo, uma estação espacial, ou uma câmara anecoica) para percebermos sons de 96 decibéis de diferença. Se lembrarmos que o limiar da audição está em 0 dB SPL, enquanto o limiar da dor inicia em torno de 120 dB SPL, a nossa variação comum diariamente de percepção sonora é, em geral, algo entre 40 dB SPL (som de um ar condicionado) e 105 dB SPL (sons de uma festa de arromba). Ou seja, 65 dB de variação, algo bastante inferior aos 96dB que os 16 bits que o CD oferece trazem e, normalmente, músicas não terão essa variação toda. Mesmo músicas clássicas vão ter uma latitude sonora de, no máximo, ~45dB (com algumas raras exceções).

Se 16 bits é suficiente, por que usamos 24 bits? Dois motivos: quantização e edição. Quando um áudio é codificado em digital, existem muitas imprecisões no momento de envelopar os arquivos nos códigos utilizados. Uma maior quantidade de bits permite que essas imprecisões não sejam tão recorrentes. Com relação à edição, é comum que se aumente muito, ou se diminua muito a intensidade sonora de determinadas gravações e uma taxa de bits menor pode significar um aumento no ruído da gravação. Ou seja, uma maior taxa de bits permite que a gente possa “bulir” mais no áudio sem perdas notáveis na qualidade de reprodução.

Taxa de Amostragem

A essa altura nesse post você já deve ter entendido o conceito básico de taxa de amostragem. A questão aqui é no que isso interfere na qualidade do som entre uma quantidade de amostras e outra. Iremos explorar esse assunto com mais profundidade futuramente, mas iremos aqui citar o teorema Nyquist, que basicamente diz que a taxa de amostragem deve ser no mínimo o dobro da quantidade de frequências que se deseja reproduzir. Como normalmente queremos reproduzir cerca de 20 mil frequências (20Hz a 20kHz, o espectro audível do som), a taxa de amostragem precisa ser no mínimo de 40kHz. Se a taxa de amostragem fosse inferior a isso, não teríamos reprodução precisa de agudos e seria recorrente um erro chamado Aliasing, um erro que faz com que algumas frequências sejam exibidas de forma imprecisa. Como disse, esses são pontos para um outro texto mais aprofundado.

Porém, uma maior taxa de amostragem, pode trazer ainda mais benefícios na reprodução dos agudos. Na gravação de grandes orquestras, com muitos instrumentos mais agudos, é comum a taxa de amostragem ser de 96kHz. Gravação de ambiências para filmes, por exemplo, também pode se beneficiar bastante de uma taxa de amostragem maior. Por fim, a questão da quantização também é aplicável aqui e uma maior taxa de amostragem também evita alguns erros intrínsecos ao arquivo digital.

Conclusão

Esse texto é uma introdução ao assunto, visto que futuramente abordaremos com mais profundidade alguns dos tópicos mencionados. Basta lembrar de alguns pontos-chave listados abaixo:

1) Tamanho do arquivo não necessariamente reflete a qualidade do som;
2) Não adianta ter um arquivo gigante se a qualidade da gravação foi pobre;
3) 16 bits é o suficiente para quase a totalidade das reproduções de áudio;
4) 24 bits é uma profundidade adequada para gravação;
5) Uma maior taxa de amostragem pode evitar erros de decodificação e dar uma maior qualidade aos agudos.

Profundidade de Bits

Taxa de Amostragem

Conclusão

Deixe um comentário Cancelar resposta