Технология создания 3D звука

         

Прослушивание



Прослушивание

Для тщательного прослушивания я взял самый сложный для сжатия фрагмент из файла №2: участок длиной около минуты, начиная со второй минуты звучания композиции.

Прослушивание велось слепым методом: автоматически генерируется порядок воспроизведения файлов (на этом этапе я порядка не знаю), слушаются все файлы один за другим, оценивается их звучание по пятибалльной шкале, результаты записываются, по окончании результаты накладываются на сгенерированный на первом шаге список воспроизведения. Процесс повторяется несколько раз для набора статистики (я повторял процесс пятикратно).

Я выставил две оценки. Первая - за передачу высоких частот, что включает в себя временнУю четкость ВЧ сигналов (отсутствие эхо и пре-эхо) и субъективную "прозрачность" звучания тарелок и подобных инструментов. Вторая - четкость передачи стереопанорамы, что включает четкое и верное позиционирование всех инструментов, четкая "ширина" инструмента в стереопанораме.

Оценки выставлены по пятибалльной шкале: 1 - обращающие на себя внимание огрехи, 2 - легко заметные несовпадения, 3 - немного заметные несоответствия, 4 - чтобы заметить разницу, нужно прислушиваться и искать дефекты, 5 - разница практически не слышна и появляется редко. Единица по этой шкале совсем не означает, что такой результат нельзя слушать: просто он содержит заметные на слух дефекты сжатия. Если продолжить эту шкалу, то большинство пиратских CD со сборниками mp3 (CBR 128 kbps, иногда Xing) получили бы от -4 до -2. А звуковые дорожки к фильмам на пиратских CD с DivX редко поднимутся выше -5…

Битрейт указан средний по всему фрагменту. Как уже упоминалось, он не может быть использован для сравнения как критерий качества (что легко увидеть, сравнив его с субъективными оценками). Также указана частота среза для фильтра ВЧ в килогерцах.

Параметры LAME Передача ВЧ Передача стерео-панорамы Битрейт Частота среза ВЧ

--preset r3mix 3 3 166 19,6
--alt-preset standard 4 4 193 18,9
--alt-preset extreme 5 5 221 19,6
--alt-preset insane 5 4 320 20,3
--alt-preset 192 4 2 193 19,6
--abr 192 -q0 2 3 197 18,9
--preset hifi -v 3 2 160 17,7
--preset cd -v 2 1 187 -
--preset studio -v 2 1 206 -

В первую очередь я был удивлен тем, что звучание audio CD четко отличается от звучания любого mp3, даже на моей не самой лучшей аппаратуре (см. Железо). Главное - знать, где искать. В первую очередь audio CD блещет отсутствием пост-эхо и четкостью стереопозиционирования.

Обращает на себя внимание полная и безоговорочная победа режима VBR над режимом ABR. CBR режимы со сравнимыми битрейтами даже не тестировались: они заведомо не лучше ABR.

Пресет --alt-preset standard просто восхитителен, и отличить его звучание от --alt-preset extreme можно только на сложном, аккуратно изученном звуковом материале, с использованием неплохой аппаратуры и явно придираясь к мелочам. Для повседневного использования, даже при наличии ушей, аппаратуры и прочая, пресета standard более чем достаточно.

Любопытно отметить то, что --alt-preset insane мне понравился меньше, чем --alt-preset extreme. Кажется, что во втором случае передача стереоэффектов более корректная. Есть мысль, что такое происходит из-за того, что insane очень редко использует mid-side stereo, в итоге у extreme с его joint stereo битрейт для кодирования центрального канала получается больше, чем у insane.

Пресет r3mix показал себя как отличная рабочая лошадка: вдвое быстрее, чем --alt-preset, получает результат меньшего размера и вполне достойного качества.

Битрейта в 192 kbps в режиме ABR маловато для передачи сложного стерео: --alt-preset 192 (использует joint stereo) явно не справился с задачей, а --abr 192 (использует stereo) задрал битрейт и даже при этом напортачил с тарелками и хай-хетами.

В этом тесте участвовали и самые лучшие из основных пресетов в режиме VBR (см. Основные пресеты). Хочу отметить, что эти пресеты делались давно, причем для режима CBR. Именно в таком режиме результат работы этих пресетов соответствует их названию. Параметры для режима VBR также были подобраны давно, причем создается впечатление, что подобраны они чисто теоретически. По словам одного активного участника проекта LAME эти параметры давно никто не изменял, никаких прослушиваний никто не проводил, потому использовать их крайне не рекомендуется. Тем более, что есть отличная аккуратно отточенная альтернатива в виде альтернативных пресетов (см.Альтернативные пресеты).

Из основных пресетов отмечу неплохой результат у hifi (соответствует CBR 160 kbps, средний битрейт при VBR - около 160 kbps) - в основном за счет использования режима joint stereo и низкой частоты среза ВЧ фильтра. Пресет cd (соответствует CBR 192 kbps, средний битрейт при VBR - около 190 kbps) и пресет studio (соответствует CBR 256 kbps, средний битрейт при VBR - около 210 kbps) используют режим stereo и совсем не используют ВЧ фильтра, что все вместе стало для них приговором при таком низком битрейте.

Еще раз оговорюсь - использовать основные пресеты настоятельно не рекомендуется. Они ориентированы под режим CBR и в этом режиме они хоть как-то оправдывают свое назначение. Для работы в режиме VBR эти пресеты не предназначены.



Содержание раздела