Аудио кодеки

Аудио кодеки

Кодеки сыграли в свое время если не ключевую, то очень существенную роль в дальнейщим развитии технологий в области цифрового звука. Стремительное распространение мобильной связи, интернет-телефония, портативные проигрыватели - все это примеры применения кодеков. Только благодаря их изобретению и внедрению стало возможно передавать аудио информацию по каналам, имевшим тогда очень ограниченную пропускную способность. Решить эту проблему можно было либо увеличив пропускную способность всех каналов передачи, что означало бы невероятные материальные инвестиции, связанные с переоборудованием и заменой большинства элементов существующей инфраструктуры, либо разработав алгоритм, позволяющиий существенно уменьшить объем данных, результируемых из аналогово-цифрового преобразования и тем самым получить возможность использовать уже существующую инфраструктуру. Второй путь был гораздо более разумным.

Что такое кодеки?

Кодек представляет собой алгоритм, базирующийся как правило на той или иной психоакустической модели, речь о которых пойдет ниже, и включает в себя два модуля - кодер и декодер.

Кодер (Encoder) производит кодирование цифрового аудио в поток данных, объем которых, по сравнению с изначальным объемом сырого материала, значительно меньше. В зависимости от применяемого кодека и параметров кодирования, возможно добиться оптимального соотношения качества звука и желаемого объема данных.

Однако для воспроизведения закодированного таким образом звука, необходим декодер (Decoder), задачей которого является декодирование цифрового аудио потока обратно в стандартный формат (PCM).

Кодеки и их семейства

В общем и целом все кодеки, которых на данный момент существует великое множество, можно разделить на две категории:

Lossy (с потерями)

Как было сказано выше, в основном кодеки работают на основе той или иной психоакустической модели, определяющей какая аудио информация не является ключевой для нашего мозга и ей можно было бы пожертвовать и отбросить, уменьшив тем самым объем данных. Недостаток этого метода состоит в том, что при декодировании такого потока обратно, утеряная аудио информация востановлению не подлежит. Степень сжатия может достигать до 90% от исходного объема данных, при сохранении удовлетворительного для большинства рядовых пользователей качества звучания. Наиболее яркими представителями этого семейства являются всем хорошо знакомые и пожалуй самые распространенные MP3 и WMA.

Lossless (без потерь)

В данном случае, кодирование происходит без потери данных, что делает возможным полностью восстановить всю информацию оригинального аудио сигнала после процесса декодирования. Однако степень сжатия данных, которую можно достигнуть используя эти кодеки, сильно уступает кодекам из семейства Lossy. Обычно, в зависимости от параметров кодирования, можно достичь сжатия до 60% от оригинального объема. К наиболее популярными среди кодеков семейства Lossless можно отнести FLAC, APE и Apple Lossless на платформе Apple.

Стоит отметить, что абсолютное большинство видео форматов, также содержат сжатое видео и аудио. Такие форматы как Dolby Digital, DTS  и их разновидности являются не чем инным, как кодеками. Не имея соответствующего декодера, прочесть аудио данные не представляется возможным. В таком случае это звучит как белый шум максимального уровня. Так что стоит быть осторожным, дабы не навредить собственным ушам и оборудованию.

Параметры кодирования

Параметры кодирования определяют результируемое качество звучания и объем данных полученного файла. Более агрессивное сжатие понижает качество звучания и уменьшает объем данных, то есть повышает степень сжатия. В зависимости от используемого алгоритма, результат, а точнее качество его звучания, может существенно отличаться, даже при использовании одних и тех же параметров кодирования.

Одним из наиболее существенных при этом считается скорость потока данных в единицу времени - kbps (kilobits per second - количество киллобит в секунду). Чем выше этот параметр, тем менее агрессивным будет сжатие данных. Как правило, для кодеков семейства Lossy, оптимальными являются значения от 192 до 320 kbps. При использовании более низких значений, потери качества становятся более существеными и отмечаются даже рядовыми пользователями, не имеющих особых притязаний к качеству звука.

Кодеки и психоакустические модели

В  абсолютном большинстве аудио кодеки базируются на психоакустических алгоритмах, использующих ограничения человеческой слуховой системы. В основе этих принципов лежат иследования в области психоакустики, к наиболее существенным выводам которых можно отнести эффект маскирования.

Подпишись на E-mail рассылку

и получи эксклюзивную возможность прочесть краткое руководство на тему "Основы акустики, психоакустики и акустической оптимизации помещений" 

Я никогда и никому не передам и не продам адрес вашей электронной почты. Вы можете отписаться в любое время.

Похожие статьи

  • Аудио кодеки
    Кодеки сыграли в свое время если не ключевую, то очень существенную роль в дальнейщим развитии технологий в области цифрового звука....
  • Цифровое представление сигналов – общие сведения
    Я думаю не для кого не секрет, что цифровой звук уже давно вошел в нашу повседневную жизнь. Будь то MP3...
  • Бинарная система
    Аналоговый сигнал представляет собой непрерывный сигнал, который теоретически может принимать бесконечное количество значений, поскольку, как известно, на непрерывной линии можно...
  • Aлиасинг и теорема Найквиста (Котельникова)
    Теорема Найквиста (известная также как теорема Котельникова) утверждает, что для корректной передачи и последующего воспроизведения всего спектра частот, содержащегося в...


No Comments Yet.

Leave a comment