- Максим Бабенков
- Сжатие без потерь качества
- FLAC
- Monkey’s Audio
- WavPack
- TTA
- Сжатие с потерями качества
- MPEG-1 Layer 3, или MP3
- MPEG-2/4 AAC
- Ogg Vorbis (OGG)
- Windows Media Audio (WMA)
- MusePack (MPC)
Прежде чем приступить к обзору наиболее распространенных аудиокодеков, поясним, что это такое и каково их назначение. Кодек, или, другими словами, кодировщик, — это программное либо аппаратное средство для кодирования и декодирования информации (в нашем случае — аудиоинформации) по определенному алгоритму. На рынке представлено огромное количество кодеков, мы же рассмотрим лишь некоторые из них — самые популярные и востребованные.
При кодировании информации без потерь сжатие данных не приводит к потере информации, а следовательно, декодируемый аудиофайл абсолютно идентичен оригиналу. При кодировании данным способом сокращение первоначального объема информации достигает 20-50%. Все чаще к такому способу прибегают не только аудиоманы, но и простые пользователи.
По мере роста дискового пространства и снижения цен на накопители все больше пользователей предпочитает хранить аудиоданные, закодировав их именно этим способом.
Сегодня алгоритмов, позволяющих выполнить данную операцию, существует довольно много, но самыми популярными являются те, что реализованы в кодеках FLAC, Monkey’s Audio, WavPack, и TTA.
Сжатие данных с потерями используется для получения файла минимального размера. Полного соответствия между оригиналом и его преобразованной копией при таком кодировании уже нет, и возможность восстановления потерянной информации тоже отсутствует.
Для достижения минимального объема файла применяются различные алгоритмы кодирования — от математических алгоритмов сжатия, при которых качество дорожки не страдает, до так называемой психоакустической модели, предусматривающей удаление из оригинала «ненужных» звуков и сужение частотного диапазона.
В связи с особенностями восприятия звука человеческим ухом «ненужными» звуками можно условно назвать те детали аудидорожки, удаление которых не будет сильно заметно. Сам процесс удаления «ненужных» звуков называется квантованием.
При кодировании данных с потерями размер оригинала удается уменьшить в несколько раз (в основном от 3 до 12 раз), при этом чем выше степень сжатия, тем меньше соответствие между оригиналом и получаемым аудиофайлом.
Методов сжатия с потерями существует достаточно много, наиболее известные из них — MPEG-1 Layer 3, MPEG-2/4 AAC, Ogg Vorbis, Windows Media Audio, MusePaсk и др.
Сжатие без потерь качества
FLAC
Одним из наиболее популярных форматов для сжатия звука без потерь качества является кодек FLAC.
Основными достоинствами этого аудиокодека являются его постоянное обновление и, конечно же, многоплатформенность: FLAC компилируется на множестве платформ — Unixes (Linux, BSD, Solaris, OS X), Windows, BeOS и OS/2.
Такая всеобъемлющая поддержка операционных систем способствует широкому использованию данного аудиокодера.
Еще одно достоинство аудиокодека FLAC — наличие (помимо базовых кодера и декодера в виде библиотек, которые входят в комплект инсталлятора) графической оболочки, позволяющей упростить процесс кодирования, а также внешних модулей (плагинов) для разных проигрывателей (включая Winamp разных версий, Foobar2000 и т.д.). В комплект также входят утилита командной строки, выполняющая сжатие и распаковку файлов, и утилита для редактирования метаданных в файлах.
Интересная отличительная особенность FLAC состоит в том, что он позволяет делать архивную копию аудиодиска, записываемую в один файл. В дальнейшем такая копия может быть легко записана на диск в случае утери оригинального диска или его повреждения.
FLAC использует восемь степеней сжатия. Как и в любом кодере, от степени сжатия зависит скорость кодирования и размер получаемого файла. К потоку FLAC могут быть добавлены тэги ID3v1 и ID3v2.
Эти данные не относятся к формату, однако декодер умеет их пропускать.
Monkey’s Audio
Пожалуй, самым популярным в настоящее время кодеком, сжимающим информацию без потерь, является Monkey’s Audio. Обусловлено это прежде всего бесплатностью данного кодека и достаточно качественным сжатием аудиопотока, которое он обеспечивает.
Единственным фактором, ограничивающим сферу его применения, является отсутствие поддержки мультиплатформенности — кодек Monkey’s Audio присутствует только на платформе Windows. Тем не менее поддержка данного формата реализована в ряде проигрывателей, а, например, плагин для проигрывателя Winamp поставляется вместе с Monkey’s Audio.
Кроме того, существует возможность установки DirectShow-фильтров для других совместимых плееров. Плагин для воспроизведения поддерживает все распространенные функции и ID3-тэги.
Кодек Monkey’s Audio, безусловно, оценят те, кому необходим максимально качественный звук. Кодек обеспечивает сжатие около 40-50%.
При кодировании данных доступны несколько различных степеней сжатия — от параметра, обеспечивающего быстрое кодирование, до параметра, осуществляющего более качественное сжатие с затратой большего процессорного времени.
Еще раз отметим, что пользователю при применении компрессии с наивысшей степенью сжатия стоит учитывать, что при проигрывании такого файла программным плеером потребуется больше процессорного времени для его декодирования.
По заверениям разработчика, Monkey’s Audio позволяет кодировать WAV-файлы с любой частотой дискретизации, с 8-, 16- или 24-битным динамическим диапазоном, в моно- или стереорежимах.
После установки дистрибутива Monkey’s Audio пользователь получает возможность кодировать аудиофайлы не только во внутренний формат Monkey’s Audio (*.ape), но и в некоторые другие форматы, которые осуществляют сжатие данных с потерями.
Все эти кодеки поддерживаются через графическую оболочку программы.
Отметим, правда, что в поставку входят только кодеки, осуществляющие компрессию без потери качества, а все остальные пользователю придется установить в систему самостоятельно.
Как уже подчеркивалось, при всех своих достоинствах Monkey’s Audio остается абсолютно бесплатным, а кроме того, открыт его исходный код, что позволяет разработчикам включать поддержку кодека в свои программы.
WavPack
WavPack — открытый кодек под платформу Windows.
При разработке данного формата предполагалось, что он будет использоваться для сжатия информации без потерь, и только впоследствии в него были добавлены функции кодирования с потерями.
Кодек является бесплатным, что повышает его привлекательность. Обладает он также и плагинами под более распространенные плееры, установка которых осуществляется пользователем вручную.
Основной особенностью WavPack является возможность создания сразу двух файлов, один из которых является файлом, полученным с потерей качества, а другой — корректирующим: с его помощью можно восстановить основной файл до оригинального состояния.
TTA
TTA (True Audio) — бесплатный мультиплатформенный аудиокодек для компрессии без потерь 8- ,16- или 24-битных аудиофайлов формата WAV. Создан он российскими разработчиками. Кодек TTA обеспечивает компрессию до 30% и способен работать в режиме реального времени.
Из достоинств данного кодека стоит отметить тот факт, что пакет TTA содержит DirectShow-кодеки (компрессор, декомпрессор, сплиттер), позволяющие другим приложениям легко работать с потоками True Audio.
С корректно установленными кодеками пользователь может проигрывать файлы формата TTA в таких плеерах, как RealOne, RadLight, Windows Media, и в других DirectShow-совместимых проигрывателях.
Сжатие с потерями качества
MPEG-1 Layer 3, или MP3
История формата MPEG началась еще 1988 году, когда был основан комитет Moving Pictures Expert Group. В этом же году была начата разработка формата MPEG-1, который является форматом видеосжатия. Завершение работы над форматом и его стандартизация произошли несколько позже.
К моменту окончательной стандартизации формата MPEG-1 было создано три звуковых кодера этого семейства — MPEG-1 Layer I, Layer II и Layer 3. Последний из них является в настоящее время самым популярным цифровым форматом аудиосжатия. Формат MPEG-1 Layer 3 (его более привычное название — MP3) был разработан немецким институтом Fraunhofer IIS совместно с университетом Erlangen.
Работа над ним была начата в 1987 году, но только в 1992-м формат приобрел официальный статус и стал неотъемлемой частью MPEG-1.
Продвижение формата MP3 происходило довольно медленно, что объясняется двумя причинами: платность формата и отсутствие проигрывателей музыки данного формата (кроме плеера от Fraunhofer IIS).
Формат MP3 разрабатывался специально для передачи звука по сети, при этом закодированный файл должен был обладать небольшим объемом при качественном звуке. Именно эти параметры (небольшой размер файла при битрейте 128 Кбит/с и достаточно качественное звучание по сравнению с оригиналом) стали в конечном счете главными факторами успеха формата.
Многие пользователи уже поняли, что данный формат не отвечает больше потребностям времени. На смену МР3 идут новые, улучшенные форматы, однако у него еще много приверженцев, и его отмирание, по нашему мнению, произойдет не скоро.
Этому тоже есть простое объяснение: если раньше MP3-файлы можно было слушать только на компьютере, то теперь появляется все больше различных аппаратных средств для их прослушивания — формат поддерживается бытовыми DVD-приводами, автомагнитолами, современными мобильными телефонами, карманными компьютерами и т.д.
MPEG-2/4 AAC
В 1994 году был утвержден новый стандарт MPEG-2, который получил продолжение в виде одного из достаточно известных аудиокодеков MPEG-2 AAC (MPEG-2 Advanced Audio Coding).
Чуть позже, после того как компания Apple лицензировала MPEG-4, формат стал называться MPEG-4 AAC.
Первоначальным разработчиком формата MPEG-2 AAC является все тот же институт Fraunhofer IIS, который совместно с компаниями AT&T, Sony, NEC и Dolby представил данный формат в начале 1998 года.
Сегодня это один из главных конкурентов формата MP3. Как и в MP3, в основе алгоритма AAC лежит психоакустическая модель кодирования. Однако MPEG-4 AAC обладает рядом достоинств по сравнению с MP3. Прежде всего это поддержка многоканального звука и большое количество усовершенствований, направленных на улучшение качества выходного аудиосигнала.
Формат, несомненно, стал бы популярным, если бы не одно обстоятельство, которое несколько приостановило его развитие. После окончания работ над MPEG-2 AAC некоторые из компаний-соучредителей забрали исходные коды стандарта и на их базе создали собственные форматы.
Получившиеся форматы не совместимы друг с другом, а кроме того, являются коммерческими. На данный момент существует несколько AAC-кодеков, среди которых наиболее известным является AAC LC, применяемый в технологии Apple QuickTime.
Также распространен Nero AAC, используемый в пакете Nero Burning Rom.
Достоинством кодека MPEG-2 AAC является то, что он поддерживается аппаратными плеерами, один из ярких представителей которых популярный плеер Apple iPod.
Кроме того, файлы данного формата доступны для покупки через Интернет-магазин компании Apple.
Столь широкая поддержка этого формата именитой компанией, а также его применение в промышленных масштабах вселяют в пользователей доверие к данному аудиокодеку.
Ogg Vorbis (OGG)
Аудиокодек Ogg Vorbis увидел свет в 2000 году. Он является открытым и свободным для распространения. Алгоритм Ogg Vorbis рассчитан на сжатие данных на всех возможных битрейтах без ограничений, то есть от 8 до 512 Кбит/с, но при этом только в режиме переменного битрейта (VBR).
Алгоритм предполагает хранение внутри файлов подробных комментариев об исполнителе и названии композиции. В алгоритме предусмотрена возможность кодирования нескольких аудиоканалов, а также редактирование содержимого файлов. Кодек поддерживает потоковое воспроизведение.
Для хранения данных используется собственный универсальный формат, рассчитанный на хранение любой мультимедийной информации системы Ogg Squish.
Аудиокодек лучше работает на низких битрейтах — до 128 Кбит/с, чем на высоких. В связи с этим существует альтернативный кодек, улучшающий работу кодека Ogg Vorbis на более высоких битрейтах.
В пользу формата Ogg Vorbis можно привести аргумент, который уже упоминался при описании формата MP3, — широкая аппаратная поддержка формата. Недостатком его является невозможность обработки многоканального звука.
Windows Media Audio (WMA)
Разработку аудиокодека, известного сейчас как Windows Media Audio (WMA), начала фирма Voxware, и тогда он назывался Voxware Audio Codec. Впоследствии компания отказалась от разработки данного продукта, а компания Microsoft купила его и доработала. Вследствие этого у кодека изменилось название — на Windows Media Audio — и он стал бесплатным.
В последнее время кодек WMA набирает популярность, поскольку компания Microsoft встроила его в свои операционные системы Windows 2000 и Windows XP.
Сейчас существует несколько версий WMA, которые отличаются друг от друга как поддержкой различных битрейтов, так и качеством кодирования.
На данный момент WMA9 является последней версией кодека и логическим продолжением WMA8.
Кодек WMA9 практически не отличим от старой версии, за исключением того, что в нем появилась поддержка переменного битрейта (VBR) и применяется технология Fast Streaming, призванная сократить время буферизации передаваемого конечному пользователю WMA-контента. Разработчики также заявляют о заметном повышении качества кодирования по сравнению с WMA8.
Отметим, правда, что теперь в комплект включены два кодека, один из которых осуществляет сжатие с потерей качества, а другой — без.
Среди основных преимуществ формата нужно упомянуть его достаточно широкую распространенность, возможность воспроизведения на любой Windows-системе и аппаратную поддержку большинством современных плееров. Но и недостатков, останавливающих пользователей от применения данного формата, довольно много.
Назовем лишь некоторые из них: формат является закрытым и разрабатывался в коммерческих целях; кодек обладает системой защиты от произвольного копирования (DRM) и различными несовместимыми версиями; имеет низкую скорость кодирования и автоматически добавляет незначительный участок тишины в конце аудиотрека во избежание щелчков.
MusePack (MPC)
Кодек MusePack (первоначальное название — Mpeg Plus) базируется на MPEG-1 Layer II, отсюда его направленность на кодирование преимущественно на более высоких битрейтах, нежели MP3. Данным аудиокодеком предусмотрено кодирование только в режиме переменного битрейта (VBR).
Скорость компрессии и декомпрессии в формат заметно выше скорости выполнения этих операций применительно к MP3-файлам. В среднем качество кодирования MPC на высоких битрейтах заметно выше качества, обеспечиваемого MP3, что прежде всего связано с различиями в механизмах кодирования.
Недостатком кодека является отсутствие поддержки многоканального звука и аппаратной поддержки.
В MusePack можно настроить качество кодирования, реализованное в виде нескольких встроенных настроек (presets), каждая из которых рассчитана на определенный диапазон.
Другой интересной особенностью MusePack является то, что он позволяет использовать в качестве исходного материала не только WAV-файлы, но и файлы, закодированные большинством популярных кодеков, которые выполняют сжатие без потери качества.
КомпьютерПресс 8'2005
Всё о встроенном звуке. Современные звуковые кодеки: описание, тесты, особенности моделей различных производителей
АрхивЗвук
автор : Макс Курмаз 14.10.2002
Обзор современных потребительских звуковых решений стандарта AC’97. Особенности выбора материнской платы со встроенным звуком.
Первые персональные компьютеры не имели звуковых возможностей. Да, у них были небольшие «пищалки», управляемые сигналами таймера, которые могли издавать звуковые сигналы заданной тональности. Они еще подходили для целей диагностики, но не более. А первые звуковые карты были достаточно дорогостоящими устройствами, не доступными рядовому пользователю ПК.
Росла вычислительная мощность процессоров, улучшались характеристики видеоподсистемы, росла емкость дисковой памяти.
Звуковые возможности постепенно стали требоваться каждому персональному компьютеру — для игр, прослушивания музыки, звуковой поддержки интерфейса операционной системы.
Возникла необходимость разработки максимально простой и недорогой звуковой подсистемы, которую можно было бы интегрировать в материнские платы.
Что такое AC’97
Большинство современных потребительских звуковых решений строится согласно стандарту AC’97, разработанному корпорацией Intel. Он предусматривает разделение звукового контроллера на две независимые части — цифровой контроллер (DC’97) и аналоговый кодек (AC’97), связанные между собой цифровым последовательным каналом AC-Link. Функции цифрового контроллера строго не регламентируются.
Он может содержать универсальный или специализированный DSP-процессор для обработки звука, табличный волновой синтезатор, модуль поддержки DOS-звука, кодер и декодер Dolby и DTS и т.п. А может быть и простым хост-контроллером, отвечающим только за обмен данными между системной шиной и кодеком.
Именно последний вариант хорошо подходит для интеграции, так как требует минимум аппаратных затрат.
Функциональная схема AC’97. |
Кодек AC’97 — это небольшой чип (4х4 см, корпус TSOP, 48 выводов), который отвечает за преобразование звука в аналоговую форму при выводе и в цифровую — при вводе. Спецификация AC’97, последняя версия которой — 2.3, описывает электрические, механические, функциональные параметры кодека. Функциональная схема представлена на рисунке. Согласно ей, современный AC’97-кодек должен: • содержать 16-разрядные ЦАП и АПЦ, аналоговый микшер; • иметь до четырех линейных стерео входов и до двух моно входов; • иметь один или два микрофонных входа с возможностью усиления (+20 дБ); • иметь один линейный стерео выход; • иметь дополнительные линейные выходы — для наушников, 4- и 6-канальной акустики;
- • иметь расширенные возможности управления питанием.
- Необязательные требования к кодекам включают: • увеличение разрядности ЦАП и АЦП до 18 или 20 бит; • аппаратное преобразование частоты дискретизации; • управление громкостью (не уровнем) и тембром (отдельная настройка низких и высоких частот); • расширение стереобазы (3D Enhancement); • отдельный вход для записи голоса; • наличие трасмиттера для цифрового интерфейса S/PDIF, поддержка независимого вывода S/PDIF (требование спецификации 2.2);
• определение типа подключенного к каждому входу или выходу устройства по его сопротивлению (требование спецификации 2.3).
Перечисленные необязательные требования могут быть реализованы программно, на уровне драйверов AC’97-звука. Так, кодеки, обрабатывающие данные только с фиксированной частотой дискретизации требуют, чтобы преобразования выполнялись на стороне хоста. То же самое касается эквалайзеров, разрядности данных (18- и 20-разрядный звук), расширения стереобазы.
Таким образом, от самого аудиокодека зависят такие параметры звука, как соотношение «сигнал/шум», уровень сигнала на выходе, нелинейные искажения, передача различных частот, поддержка нескольких аналоговых и цифровых входов и выходов.
Различные звуковые эффекты (позиционирование, реверберация), поддержка нескольких потоков, соответствие требованиям различных API, работа с MIDI, общая устойчивость работы зависят от возможностей цифрового контроллера и его драйверов.
Особенности встроенного звука
Большинство интегрированных звуковых решений, встречающихся на современных материнских платах, состоят из встроенного в южный мост чипсета хост-контроллера и расположенного на плате аудиокодека.
Размещение кодека или нескольких кодеков на специальной плате — райзере AMR (или более функциональных его разновидностях — CNR, ACR) тоже возможно, однако это решение не стало популярным, и потому слоты райзеров постепенно исчезают с материнских плат.
Причина заключается в том, что встроенный звук имеется у каждой платы, а реализация с помощью райзера модема или сетевой карты получается не настолько дешевой, насколько малофункциональной и недостаточно качественной.
Хост-контроллер чипсета удовлетворяет спецификации AC’97 2.2 или 2.3, поддерживает двух- или многоканальные кодеки, а также независимую выдачу отдельного цифрового потока в формате PCM, AC-3, DTS и т.д. для интерфейса S/PDIF.
Функции обработки звука зачастую целиком возлагаются на драйверы, которые пишут и разработчики чипсетов, и разработчики кодеков (у последних это получается лучше). Некоторые драйверы поддерживают и позиционируемый 3D-звук, и имитацию звуковой среды, и многополосный эквалайзер — мощности современных процессоров позволяют это.
Иногда встроенный в чипсет контроллер аппаратно реализует поддержку DirectSound, табличного синтеза MIDI, а также позиционируемый звук, аппаратное кодирование звука в формат AC-3 (чипсеты NVIDIA).
Современные звуковые кодеки поддерживают практически все не только обязательные, но и опциональные требования. Нормой стало наличие трасмиттера S/PDIF для подключения цифровой акустики или других устройств с цифровым входом, встроенного усилителя, который активируется при подключении наушников.
Есть кодеки с поддержкой многоканальной акустики, с 20-разрядными ЦАП и АЦП. Существенно улучшилось качество работы кодеков, производители плат научились грамотно проектировать обвязку, уменьшая тем самым наводки.
Полностью аппаратные решения для шины PCI встречаются все реже и реже, так как они заметно дороже, а существенных преимуществ уже не имеют.
На сегодня встроенный звук уже практически избавился от таких типичных проблем, как повышенная шумность, искажения и наводки, низкий выходной уровень. Исчезли проблемы с поддержкой игр, недостаточной стабильностью, пропаданием звука при разгоне.
Тем не менее, не все хорошо с воспроизведением низких и высоких частот, по-прежнему не всегда работает MIDI, часто отсутствуют какие-либо настройки, нет поддержки DOS (или она ограничена).
У одних кодеков качество звучания и поддержка различных API лучше, у других — хуже, но производители материнских плат практически никогда не указывают, какие кодеки они используют.
В этой статье можно рассказать об особенностях кодеков различных производителей, но привести перечень всех материнских плат с указанием, какой кодек установлен на каждой, невозможно по понятным причинам. Поэтому если вы планируете пользоваться встроенным звуком, обращайтесь к обзорам материнских плат.
Распространенные модели AC’97-кодеков
Год назад на материнских платах устанавливались в основном кодеки Analog Devices и SigmaTel. Они были реализованы лучше аналогов — имели более высокое качество звука, хорошие драйверы, часто использовались и для дорогостоящих звуковых карт.
Более дешевые кодеки Avance Logic и Cirrus Logic/Crystal встречались реже, в основном на дешевых моделях материнских плат.
Однако из-за того, что разработчики кодеков не заметили, как возросли требования к функциональности встроенного звука, и не успели подготовить новые модели, быстро приобрел популярность дешевый звуковой контроллер CMedia CMI8738.
АЧХ | Шум |
Динамический диапазон | Нелинейные искажения |
Интермодуляционные искажения | Взаимопроникновение каналов |
Да, он не соответствует принципам AC’97 и не дает качественного звука, но поддерживает 3D-позиционирование, шестиканальную акустику, цифровой выход и вход, переменную частоту дискретизации.
Этот чип стал появляться на платах не только производителей дешевых плат (EliteGroup, Chaintech), но и на платах ASUS.
Однако его время прошло, и сегодня наиболее популярным производителем кодеков является небезызвестная фирма Realtek.
Наиболее важные параметры аудиокодеков сведены в одну таблицу. При описании моделей аудиокодеков будут использоваться результаты тестирования встроенного звука с помощью программы Rightmark Audio Analyzer.
Прогоняя тестовые образцы звука через линейный выход и записывая его на линейном входе (вход и выход соединены), программа сравнивает полученный результат с эталоном и вычисляет параметры звукового решения.
Таким образом, можно получить достаточно объективную оценку качества звука, не прибегая к прослушиванию музыкальных композиций на качественной акустике и другим видам экспертной оценки.
Realtek/Avance Logic (сайт, драйверы)
Тайваньская фирма Realtek известна как производитель дешевых сетевых контроллеров и тактовых генераторов. Кодеки ALC, разработанные ее подразделением, Avance Logic, широко используют все производители материнских плат.
Сегодня они встречаются на 90% моделей, хотя год назад из хорошо известных производителей только ABIT регулярно пользовался кодеками ALC. Очевидно, что причина этого — улучшение соотношения «цена/качество» этих кодеков.
Старые модели кодеков Realtek, ALC100 и его модификация со встроенным усилителем ALC101, работают только с фиксированной частотой дискретизации — 48 КГц, поэтому при воспроизведении звука со стандартной дискретизацией 44 КГц появляется много дополнительных гармоник, что делает звук менее чистым. Кроме того, они не отличаются низким уровнем шума (-65 дБ) и широким динамическим диапазоном (65-68 дБ). Их использование на современных платах ограничено, встречаются они только на самых дешевых из них.
АЧХ | Шум |
Динамический диапазон | Нелинейные искажения |
Интермодуляционные искажения | Взаимопроникновение каналов |
На современных материнских платах чаще всего устанавливаются кодеки ALС201A (двухканальный) и ALC650 (шестиканальный). Первый слабовато воспроизводит низкие (
Все о встроенном звуке
Год назад, летом 2001 года, в №24 «КВ»
была опубликована небольшая статья
об особенностях AC'97-звука, в которой
я рассматривал некоторые
распространенные на тот момент
решения.
С тех пор на рынке
интегрированного звука ситуация
изменилась. Новые, более
функциональные и качественные
кодеки полностью заменили старые,
одни участники рынка не выдержали
конкуренции и ушли в тень, другие
значительно укрепили свои позиции.
Стандарт AC'97 развивался, возрастали
требования как к аппаратной, так и к
программной частям
интегрированного звука. Я тоже не
сидел сложа руки, тестируя
материнские платы.
Я собрал
информацию по производителям,
кодекам, драйверам, получил данные
по качеству звучания большинства
представленных на рынке решений. В
итоге получилась эта статья.
Что такое AC'97
Большинство современных
потребительских звуковых решений
строится согласно стандарту AC'97,
разработанному корпорацией Intel. Он
предусматривает разделение
звукового контроллера на две части
— цифровой контроллер (DC'97) и
аналоговый кодек (AC'97).
Функции
цифрового контроллера строго не
регламентируются. Кодек AC'97 — это
небольшой чип (4х4 см, корпус TSOP, 48
выводов), который отвечает за
преобразование звука в аналоговую
форму при выводе и в цифровую — при
вводе.
Он соединяется с
контроллером DC'97 посредством
стандартного цифрового интерфейса
AC-Link.
От самого аудиокодека зависят
такие параметры звука, как
соотношение «сигнал/шум»,
уровень сигнала на выходе,
нелинейные искажения, передача
различных частот, поддержка
нескольких аналоговых и цифровых
входов и выходов.
Различные
звуковые эффекты
(позиционирование, реверберация),
поддержка нескольких потоков,
соответствие требованиям
различных API, работа с MIDI, общая
устойчивость работы зависят от
возможностей цифрового
контроллера и его драйверов.
Большинство интегрированных
звуковых решений, встречающихся на
современных материнских платах,
базируются на самом простом
варианте AC'97. В южный мост чипсета
встраивается хост-контроллер,
удовлетворяющий спецификации 2.2
или 2.
3, который поддерживает двух-
или многоканальные кодеки, а также
независимую выдачу отдельного
цифрового потока в формате PCM, AC-3, DTS
и т.д. для интерфейса S/PDIF. Функции
обработки звука целиком
возлагаются на драйверы, которые
пишут и разработчики чипсетов, и
разработчики кодеков (у последних
это получается лучше).
Некоторые
драйверы поддерживают и
позиционируемый 3D-звук, и имитацию
звуковой среды, и многополосный
эквалайзер — мощности современных
процессоров позволяют это.
Современный встроенный звук уже
практически избавился от таких
типичных проблем, как повышенная
шумность, искажения и наводки,
низкий выходной уровень. Исчезли
проблемы с поддержкой игр,
недостаточной стабильностью,
пропаданием звука при разгоне.
Тем не менее, не все хорошо с
воспроизведением низких и высоких
частот, по-прежнему не всегда
работает MIDI, часто отсутствуют
какие-либо настройки, нет поддержки
DOS (или она ограничена).
У одних кодеков качество звучания
и поддержка различных API лучше, у
других — хуже, но производители
материнских плат практически
никогда не указывают, какие кодеки
они используют.
Я расскажу об
особенностях кодеков различных
производителей, но привести
перечень всех материнских плат с
указанием, какой кодек установлен
на каждой, не могу по понятным
причинам.
Поэтому если вы
планируете пользоваться
встроенным звуком, обращайтесь к
обзорам материнских плат.
Распространенные модели
AC'97-кодеков
Realtek/Avance Logic
Кодеки ALC, разработанные
подразделением известной
тайваньской фирмы Realtek, Avance Logic,
широко используют все
производители материнских плат.
Сегодня они встречаются на 90%
моделей, хотя год назад из хорошо
известных производителей только ABIT
регулярно пользовался кодеками ALC.
Очевидно, что причина этого —
улучшение соотношения
«цена/качество» этих кодеков.
На современных материнских
платах чаще всего устанавливаются
кодеки ACL201A (двухканальный) и ALC650
(шестиканальный). Первый имеет
средние шумовые характеристики
(-75-80 дБ), слабовато воспроизводит
низкие (
Профессиональная оценка качества звукозаписей
- Если инструменты используют для измерения точности, то применяют объективные измерения. Субъективные относятся к мнениям – люди прослушивают звуки и сравнивают их, определяя качество.
- Качество звука живой музыки именуется тоном. Когда вы улавливаете тон, то настраиваетесь на главную частоту. Однако есть и побочные гармоники – обертоны.
- Качество звука основывается на множестве факторов: записывающее оборудование, обработка, способ воспроизведения и среда прослушивания.
Сам факт, что качество звучания записанной музыки можно оценивать как-то иначе, чем по принципу «нравится — не нравится», порой вызывает у аудиофилов недоумение.
Многие считают, что это не более чем дело вкуса и здесь не может быть никаких объективных критериев, параметров и характеристик. Вот колонки, усилители и т. п. — дело другое, там можно замерить герцы и децибелы, а как измерить качество звука, да еще записанного? Тем не менее профессионалы выработали методы оценки качества фонограмм. О них и пойдет речь в этой статье.
(От редакции) Несомненно, что, когда мы выносим суждения о звучании аппаратуры при воспроизведении тех или иных записей и произносим слова «тональный баланс», «детализация», «пространственная локализация» и др., всем нам — и аудиофилам, и экспертам — очень полезно знать, какой смысл вкладывают в эти понятия профессионалы, которые создавали прослушиваемые записи.
И выходит, что субъективные впечатления от звучания музыкальных фонограмм — не такие уж субъективные.
Необходимость такой оценки возникла с развитием радиовещания и звукозаписи, когда специалисты отрасли пришли к выводу, что только технической оценки записи на предмет наличия или отсутствия искажений и помех недостаточно.
Ведь бывает, что шумов, искажений, модуляций в фонограмме нет, и в этом смысле придраться не к чему, но она не нравится по чисто звуковым и музыкальным соображениям.
Поэтому после прохождения ОТК записи стали прослушиваться на особом экспертном совете, причем специалисты обращали внимание не на сугубо музыкальные, а прежде всего на художественно-звуковые аспекты.
Анатолий Иванович Вейценфельд — основатель журнала «Звукорежиссер», главный редактор интернет-портала ProSound.iXBT.com, член Ассоциации джазовых журналистов Москвы, американской Ассоциации джазовых журналистов JJA, международной Ассоциации музыкальной прессы MIPA.
В 1960-е при Государственном доме радиовещания и звукозаписи по инициативе главного технолога ГДРЗ легендарного Бориса Меерзона была сформирована экспертная группа квалифицированных и прошедших специальную подготовку людей из числа звукорежиссеров, музыкантов, инженеров звукозаписи, акустиков, работников отдела технического контроля.
Группа подвергалась жесткой тренировке на одинаковое восприятие различных звуковых явлений.
Как писал Борис Яковлевич, «опыт показал, что специалисты по звукозаписи, обладающие хорошим слухом и большим опытом работы, после нескольких совместных прослушиваний и обсуждений качества звучания записанных музыкальных произведений приобретают умение оценить записи так, что их субъективные мнения практически совпадают.
Таким образом, усредненные оценки подготовленных экспертов (если в прослушивании принимают участие несколько человек) можно в известной степени считать условно-объективными». Здесь же надо отметить, что в музыкальных вузах в программу обучения по специальности «звукорежиссура» включается в качестве обязательного предмет «анализ звукозаписей и их оценка».
Для оценки записей был разработан протокол OIRT (Ассоциация вещательных организаций стран СЭВ), аналогичный оценочным протоколам CCIR (ныне ITU) и Международного звукотехнического общества AES. По этому протоколу и производилась оценка качества фонограмм — сначала по 10-балльной шкале, позже по 5-балльной.
Аналогичная методика оценки качества фонограмм применяется и на Всероссийском конкурсе творческих работ студентов-звукорежиссеров им. Виктора Бабушкина, который автор настоящей статьи проводит с 2000 года.
Какие же параметры оценки входили в этот протокол? Разберем их подробно и по порядку.
Как мы понимаем, откуда пришел звук
Ответ простой: потому, что у нас есть голова и два уха! Если одно ухо вдруг не работает, это можно частично компенсировать быстрым поворотом головы. Слух при наличии двух ушей называется бинауральным. Он позволяет нам локализовать источник звука.
Это происходит потому, что звук приходит к правому и левому уху с небольшой задержкой или, если выразиться точнее, со сдвигом по фазе. Так как длина звуковой волны достаточно большая, в оба уха обычно поступает одна волна, но разные ее участки — фазы.
Этот сдвиг анализируется нашим мозгом, легкий поворот головы — и мы уже готовы приблизительно указать на какой ветке сидит птица, хотя разглядеть ее все равно не получится.
И чем выше звук, то есть, чем больше его частота, тем легче определить направление на его источник — сильнее проявляется фазовый сдвиг. А вот на низких частотах длина волны становится больше, чем расстояние между ушами, поэтому определить источник звука гораздо сложнее.
Почему одни звуки красивые, а другие нет?
Здесь почему-то тянет взять серый том Фейнмановских лекций и освежить воспоминания о рядах Фурье — но будем проще: любое колебание можно разложить на несколько колебаний с меньшей длиной волн.
Эти меньшие волны — и есть гармоники, и сколько их укладывается в длине основной волны — две, три и т.д. — определяет их четность или нечетность. Как оказалось, нечетные гармоники воспринимаются нашим слухом дискомфортно.
Причем вроде все играет правильно, но дискомфорт остается.
https://www.youtube.com/watch?v=bk8eKccQ-YI\u0026t=102s
Более явный неприятный звук — диссонанс, две частоты, работающие одновременно и вызывающие редкие биения. Если хотите еще наглядней, то нажмите близлежащие черную и белую клавиши на пианино.
Есть и противоположность диссонанса — консонанс. Это сама благозвучность, например, — такой интервал, как октава (удвоение частоты), квинта или кварта. Кроме того, комфортности звучания мешают маскирующие его шумы различной природы, искажения и призвуки.
Ясно, что шум — то, что мешает в принципе. Звуковой мусор. Впрочем, есть и белый шум, этакий эталон шума, в котором присутствуют равномерно все частоты (точнее — спектральные составляющие).
Если вы хотите уйти от источника белого шума, то по ходу удаления он будет розоветь. Это происходит потому, что воздух сильнее ослабляет верхние частоты слышимого спектра.
Когда их меньше, тогда говорят о розовом шуме.
Чем громче шум по отношению к полезному звуку, тем больше этот звук маскируется шумом. Падает комфортность, а затем — и разборчивость звучания. Это же относится и к нечетным гармоникам, и к нелинейным искажениям, о которых мы еще поговорим более подробно. Все эти явления взаимосвязаны и, самое главное, — все они мешают нам слушать.
Нота — высота звука и его частота — зависит от специальности
В понимании звука, судя по всему, есть две крайности — понимание звукоинженера и музыканта. Первый говорит «440 Гц!» второй — «нота Ля!». И оба правы.
Первый говорит «частота», второй — «высота звука». Впрочем, известно немало отличных музыкантов, которые вовсе не знали нот.
При этом специалистов в области акустики, не знающих физических основ в этой области, еще никому не удавалось встретить.
Важно понимать, что оба этих специалиста по-своему занимаются комфортным звучанием.
Автор музыкального произведения, инстинктивно, или опираясь на консерваторские знания, строит звук на принципах гармонии, не допуская диссонансов или искажений.
Конструктор, создающий колонки, изначально не допускает посторонних призвуков, минимизирует искажения, заботится о равномерности амплитудно-частотной характеристики, динамике и многом, многом другом.
Что такое частота звука?
Частота — это количество колебаний за единицу времени. Конкретней — число колебаний в секунду. Измеряется в герцах. Одно колебание в секунду — один герц (Гц).
Если еще вспомнить, что звук распространяется в воздухе со скоростью около 350 метров в секунду или около 1250 км/ч, то достаточно легко понять, что частота и скорость связаны между собой.
И эта связь дает нам возможность определить длину звуковой волны: чем больше частота, тем меньше длина волны — и наоборот.
Почти традиционно считается, что человеческий слух позволяет услышать диапазон частот «20–20» — от 20 Гц до 20 кГц, другими словами, от 20 колебаний в секунду до 20 000.
Не все частоты одинаково громкие
При этом матушка-природа наделила нас с вами достаточно избирательным слухом. Психоакустические исследования показывают, что лучше всего человек слышит самое для себя важное — человеческую речь. Эти звуки располагаются в диапазоне частот в районе 3000 Гц. Где-то в этом районе и находится максимальная чувствительность наших с вами ушей.
На других частотах она уменьшается, изменяясь в виде плавных кривых. Эти кривые показывают, с какой громкостью человек воспринимает звуковые колебания равной амплитуды. Эти данные важны не только для расчета акустических систем, но и для правильного понимания природы восприятия звука.
Они были получены статистическим способом, когда в субъективном оценивании громкости звучания на разных частотах принимало участие большое количество людей. В честь авторов этой научной разработки линии равной громкости называются кривыми Флетчера-Мэнсона.
Что такое звук?
В учебнике сказано: «Колебательные движения частиц, которое распространяется в виде волн в газообразной, жидкой или твердой средах». Давайте отбросим лишнее и поговорим только о слышимом звуке (кроме него ведь еще существуют ультразвук, инфразвук и т.д.).
Звук — это, на самом деле, не движение воздуха (газа) в пространстве, а волновые, периодические изменения давления этого самого газа.
Звук является волновым излучением, подчиняется соответствующим физическим законам, которые описывают его распространение и взаимодействия.
Согласно этим законам мы можем описать звук по нескольким характеристикам. Возьмем основные: частота, амплитуда (форма колебаний) и скорость.
Громкость, звуковое давление — пределы и ориентиры
С громкостью все не так просто. Она относительна. Подумайте сами, ведь абсолютной тишины не существует. То есть, она в природе есть, но попадание в такое место превращается в пытку — вы начинаете слышать стук своего сердца, звон в ушах — все равно тишина исчезает.
Поэтому звуковое давление измеряется относительно некоего нулевого уровня в децибелах (дБ). Это логарифмические единицы, ведь логарифмическая шкала наиболее точно соответствует природе слуха.
Если немного углубиться в теорию, нужно вспомнить эмпирически установленный закон психофизиологии Вебера-Фехнера, который описывает работу органов чувств.
Согласно этому закону, интенсивность ощущения чего-либо прямо пропорциональна логарифму интенсивности раздражителя. В случае звука, это — амплитуда (размах) колебаний.
И если за ноль децибел принять порог слышимости (а это, повторимся, не тишина!), то шелест листьев дает 10 дБ, поезд метро — 100 дБ, истребитель на форсаже — 125 дБ, и ненамного меньше, кстати, выдала одна девчушка, призер соревнований по громкости крика в США. В дискотечном зале громкость может достигать 130 дБ. Это при том, что 120 дБ — уже больно, а 180 — могут убить.
Разница приблизительно в шесть децибел воспринимается нами, как удвоение громкости. Добавление трех децибел на низкой частоте требует удвоения амплитуды колебаний источника звука, но на слух это замечает не каждый слушатель! Такие вот парадоксальные, на первый взгляд, данные.