Технология создания 3D звука

         

"Хорошо"



"Хорошо"

Сверхвысокий битрейт дает великолепное качество звучания, однако не он является преобладающим среди высоких битрейтов, т.к. объем файла при потоке 2,5 Мб в минуту многие пользователи считают чрезмерно большим. Как правило, они предпочитают использовать в своих личных фонотеках файлы с битрейтом 256 кбит, считая это разумным компромиссом между хорошим качеством и размером файлов. Поэтому будем подходить к тестированию именно с такой точки зрения, т.е. сравним качество обоих кодеров и оценим потери относительно большего битрейта. Как и для режима 320 кбит, в данном случае считаю оправданным подавление высоких частот до 20 кГц для улучшения передачи основного слышимого частотного диапазона. Тестирование LAME проведем в двух режимах: с постоянной скоростью потока и с переменной.

Для начала посмотрим на частотную динамику получившихся семплов (изменение АЧХ во времени с усреднением по небольшим интервалам - от 20 до 100 миллисекунд). Тенденция к потере высоких частот подтверждается. Как и в предыдущем тесте, OGG срезает высокие частоты (выше 18 кГц) значительно больше, чем LAME. Взгляните сами:



Однако, несмотря на это, кодер OGG значительно лучше передает частоты в диапазоне от 15 до 18 кГц, в то время как LAME начинает их срезание в паузах между большими всплесками амплитуды сигнала и на более низких частотах. Но даже на этой диаграмме хорошо видно, что частотная передача у LAME в режиме ABR значительно превосходит стандартный режим постоянного битрейта, что позволяет подтвердить описанное выше высказывание разработчиков и сделать вывод о более высоком качестве кодирования в режиме ABR. Теперь давайте послушаем, что же у нас получилось.

Разработчики LAME серьезно изменили кодер: той разницы в звучании высоких частот, что раньше была заметна сразу, больше нет. Звучание семплов, закодированных в ABR, действительно лучше стандартного, поэтому рекомендую отказаться от использования постоянного битрейта в пользу ABR. Как бы это ни казалось вам странным, но срезание кодером OGG частот выше 18 кГц сильно не сказывается на общем звучании семплов, разница c LAME также оказалась минимальной. Понимаю, в это будет сложно поверить, но кроме небольшого "металлизирования" высоких частот и слабенького провала глубины звучания я ничего не смог обнаружить. То, что я услышал, не было похоже на то, как раньше звучали LAME и OGG! Поэтому тем, кто предпочитает 256 кбит, рекомендую и впредь им пользоваться, только нужно обязательно перейти на новую версию LAME.

А что же нам скажут дельта-сигналы? На слух их звучание подобно полученному при рассмотрении режима 320 кбит. Для семплов OGG можно отметить появление в сигнале хрипящих звуков в диапазоне высоких частот, а для семплов LAME - только общее увеличение уровня шума, какого-либо серьезного изменения в частотах не замечено.

Думаю, достаточно наглядная демонстрация. Вот вам и объяснение, почему при почти одинаковом битрейте OGG сильно срезает частоты выше 18 кГц. Это делается для того, чтобы лучше передать все остальные. Вы только посмотрите! Практически на всем звуковом диапазоне семплы OGG значительно ближе к оригиналу, чем семплы LAME. Поэтому, если вы готовы пожертвовать тем, что лежит за пределами 18 кГц, ради лучшего качества, вам стоит подумать о переходе на OGG. Однако столь ощутимая разница в звучании проявляется не на всех семплах. Возьмем, например, старого знакомого - семпл Richard Clayderman, на котором все огрехи передачи высоких частот слышны сразу.

В данном случае LAME показал немного лучший результат, но, тем не менее, высокое качество передачи частот выше 2 кГц кодером OGG очевидно. В то же время в очередной раз продемонстрировано значительно лучшее качество при ABR кодировании LAME, разница составляет от 1 до 2 дБ.

Попробую пояснить обнаруженное несоответствие между двумя приведенными сравнениями. Первый проиллюстрированный семпл представляет собой очень громкий и плотный звук, нормализованный почти под 0 дБ. В то время как второй семпл - это оркестровая композиция, записанная со средним уровнем порядка -3 дБ, то есть без какого-либо уплотнения динамического диапазона. Проверив ряд других семплов, можно сделать вывод о том, что чем плотнее запись, тем выше качество при кодировании OGG в сравнении с LAME. Однако не стоит забывать об эффекте "металлизирования" высоких частот у LAME и срезании частот выше 18 кГц у OGG. Для полноты картины приведу сравнение АЧХ дельта-сигналов для семпла средней плотности.

Как мы видим, картина сильно не изменилась, закономерности остались теми же.

Таким образом, при выборе кодера для работы в режиме 256 кбит вам предстоит определить, что для вас важнее: средние частоты или частоты выше 17-18 кГц? Ответив на этот вопрос, вы сразу же ответите на вопрос о предпочтительном кодировщике. Отмечу только еще раз, что в режиме ABR качество кодирования у LAME намного лучше, чем при использовании постоянного битрейта. Это бесспорный факт. А если вам интересно мое собственное мнение, то я бы назвал лидером кодер OGG.



Содержание раздела