Больше битрейт, качественнее трек?
|
Автор |
Сообщение |
Выразили согласие: | |
|
Black_Jack
Ветеран
Откуда: Хмельницький
Сообщений: 4 690
Репутация: 306
|
|
|
|
Выразили согласие: | |
|
Luzer
Пользователь
Откуда: Россия
Сообщений: 8
Репутация: 0
|
|
|
|
Выразили согласие: | |
|
Коллайдер
Ветеран
Откуда: LHC
Сообщений: 2 055
Репутация: 41
|
|
|
|
Выразили согласие: | |
|
sda79
Ветеран
Откуда: निर्वाण
Сообщений: 228
Репутация: 91
|
RE: Больше битрейт, качественнее трек? / 11-10-2017 22:18
Продублирую еще раз.. ВНИМАТЕЛЬНО ПРОЧИТАННОЕ.
Повторюсь, хотелось бы слышать мнение тех кто понимает о чем это.
Цитата:Прежде всего, плохие новости
В последние две недели я имел удовольствие пообщаться с людьми образованными — учеными умами, которые верили в резонность загрузок формата 24/192 и никак не могли понять: как вообще можно с этим не согласиться? Ими были заданы хорошие вопросы, заслуживающие детального рассмотрения и подробных ответов.
Меня также заинтересовало, чем мотивируется пропаганда аудио с высоким разрешением. Опрос показал, что очень немногие люди понимают Теорему Котельникова хотя бы на базовом уровне, и это не удивительно. Отсутствие понимания математики, технологии и психологии имело место в большинстве дискуссий и часто демонстрировалось даже профессионалами с богатым опытом. Некоторые из них даже возразили, что теорема Найквиста не объясняет, как на самом деле работает цифровой звук.
Дезинформация и суеверия на руку лишь шарлатанам. Так что давайте для начала рассмотрим некоторые теоретические основы, объясняющие, почему распространение в 24/192 не имеет смысла — прежде чем предложим некоторые улучшения, которые бы действительно имели смысл.
Джентльмены, встречайте: ваши уши
Уши слышат за счет волосковых клеток, находящихся на резонансной основной мембране, в улитке. Каждая волосковая клетка тщательно настроена на узкую полосу частот, определяемую её позицией на мембране. На графике чувствительность имеет зависимость от частоты с пиком в середине и спадами в обе стороны в форме конуса, с перекрытием диапазонов соседних волосков. Звук не слышен, если отсутствуют волоски, настроенные на его частотные составляющие.
Слева: изображение анатомического разреза улитки с основной (базилярной) мембраной, окрашенной в бежевый. Мембрана настроена на различную резонансную частоту вдоль всей её длины — от наиболее высоких частот у основания, к наиболее низким у вершины. Отмечены приблизительные точки резонанса некоторых частот.
Справа: схематическая диаграмма, изображающая амплитудно-частотные характеристики волосковых клеток, расположенных вдоль мембраны, в виде банка перекрывающихся фильтров.
Это похоже на аналоговое радио, улавливающее станцию с хорошим уровнем сигнала, имеющую частоту вблизи той, на которую оно настроено. По мере того, как различия между частотой станции и частотой, установленной на приемнике, увеличиваются, уровень сигнала становится ниже, а количество помех увеличивается — и так, пока полезный сигнал не исчезает вовсе (вне зависимости от мощности передатчика). Существует верхний и нижний граничные пределы диапазона слышимых частот, по достижению которого чувствительность последних волосковых клеток достигает нуля, и данная частота уже оказывается не слышна.
Частота дискретизации и слышимый спектр
Я уверен, вы слышали это много-много раз: Человеческий слух покрывает диапазон от 20 Гц до 20 кГц. Важно понимать, каким образом в ходе исследований получились именно эти значения.
Прежде всего мы измеряем порог слышимости во всем звуковом диапазоне для группы слушателей-испытуемых. В результате мы получаем график, демонстрирующий минимальный уровень звука, который может воспринимать здоровое человеческое ухо для каждой из заданных частот в нормальных условиях. Безэховая камера, точно откалиброванное оборудование и жесткий статистический анализ — это еще на самое сложное. Как сами уши, так и общая внимательность человека подвержены скорой усталости, которая может негативно сказаться на результатах тестирования. Потому требуется значительное количество перерывов и пауз в прослушивании. Тестирование может занимать от часов до многих дней, в зависимости от методики.
Затем мы проводим сбор данных для определения противоположного порога — болевого. Это настолько высокое значение амплитуды колебаний, при котором механические и нейронные элементы уха оказываются не только перегружены, но также ощущают физическую боль. Собрать такие данные весьма непросто. Ведь в процессе тестирования вы должны исключить нанесение необратимого ущерба слуху испытуемых.
Усредненные кривые равной громкости, полученные Флетчером и Мансоном (1993 г.), расширенные в диапазон >16 kHz по результатам современных исследований. Порог слышимости и болевой порог изображены красным. Последующие исследователи уточнили эти данные, что позволило создать шкалу Фон и привело к появлению международного стандарта кривых равной громкости (ISO 226). Современные исследования показали, что ухо значительно менее чувствительно к низким частотам, чем показали результаты Флетчера и Мансона.
Верхним пределом воспринимаемого человеком диапазона является частота, на которой кривые порога слышимости и болевого порога пересекаются. Чтобы хоть немного услышать звук, имеющий эту частоту, он должен быть невыносимо громким.
На низких частотах улитка работает подобно фазоинверторной трубке. Геликотрема представляет собой отверстие в вершине основной мембраны и работает в качестве порта, настроенного на частоту а районе 40-65 Гц, в зависимости от конкретного человека. Ниже этой частоты характеристика чувствительности быстро спадает.
Таким образом диапазон 20 Гц — 20 кГц полностью покрывает слышимый спектр частот, это утверждение базируется на чуть ли не вековом опыте.
Генетические подарки и золотые уши
По моим данным многие люди свято верят в свою уникальность и одаренность необычайными слуховыми способностями. Так существуют ли такие «золотые уши» на самом деле?
Это зависит от того, что именно вы называете золотыми ушами.
Здоровые уши молодого человека слышат лучше, чем больные, или чем уши человека в возрасте. Некоторые люди исключительно хорошо натренированы и улавливают в музыке такие нюансы, о существовании которых другие и не догадываются. Одно время, в 90-х, я мог определить любой популярный MP3 кодер по звучанию (хотя тогда все они были не лучшего качества), и мог легко продемонстрировать это в двойном слепом тесте.
Сочетание здорового и хорошо натренированного слуха я бы вполне мог назвать золотыми ушами. Более того, даже человек со слухом ниже среднего может после тренировок различать детали, не воспринимаемые большинством слушателей. Так что термин «золотые уши» больше относится к уровню подготовки, чем к восприятию за пределами возможностей простых смертных.
Исследователи слуха были бы очень рады найти, протестировать и задокументировать индивидов с действительно исключительными слуховыми способностям, вроде значительного расширения слышимого диапазона частот. Да, любой рад бы найти подобного «генетического урода», ведь это может стать сенсацией. Но, увы, за последние 100 лет мы не нашли ни одного такого человека, так что, возможно, его и вовсе не существует. Что ж, будем продолжать наши поиски.
Спектрофилы
Возможно, вы скептически отнеслись ко всему, что я только что написал. Конечно, ведь это совершенно не согласуется с нынешней политикой маркетинга. Теперь же давайте оставим аудиофилию и рассмотрим гипотетическое повальное увлечение видеоматериалом с широким спектром частот.
Графики чувствительности колбочек и палочек человеческого глаза, размещенные на логарифмической шкале видимого человеком спектра. Эти органы чувствительны к свету в перекрывающихся диапазонах частот — так же, как и волосковые клетки, рассмотренные нами ранее.
Человеческий глаз видит ограниченный диапазон частот светового излучения, т.е. лишь видимый спектр. Это в точности аналогично слышимому спектру звуковых волн. Так же, как и уши, глаза имеют чувствительные клетки (палочки и колбочки), которые реагируют на свет в различных, но перекрывающихся диапазонах частот.
Видимый спектр простирается примерно от 400 ТГц (темно-красный) до 850 ТГц (темно-фиолетовый). У краёв чувствительность круто спадает. Для хоть какого-то восприятия частот лишь немного выходящих за данный диапазон потребуется такая сила света, которая запросто может сжечь вашу сетчатку. И то, как и в случае с аудио, этот диапазон справедлив лишь в отношении молодых здоровых людей.
В случае с нашим повальным увлечением Широкополосным Видео, рассмотрим группу аудиофилов, не считающих, что вышеописанные данные отражают реальную действительность. Они предлагают закодировать в видео не только видимый спектр, но также инфракрасные и ультрафиолетовые частоты. Пойдем дальше: представим, что есть еще более хардкорная (причем гордящаяся этим) группировка, утверждающая, что и этого недостаточно, и видео выглядит куда более натуральным, когда включает в себя также элементы микроволнового и даже рентгеновского излучения. Для Золотого Глаза, — утверждают они, — различия при этом — просто небо и земля!
Никто не видит рентгеновские лучи (или инфракрасные, или ультрафиолетовые, или микроволновое излучение). И неважно, насколько человек верит в свои возможности. Сетчатка просто-напросто не имеет датчиков для этих частот. Статья _https://audiophilesoft.ru/publ/theory/24_192_downloads/6-1-0-236
Первоисточник _https://audiophilesoft.ru/publ/theory/24_192_downloads/6-1-0-236
(Отредактировал 11-10-2017 в 22:23 sda79.)
|
|
|
|
Выразили согласие: | |
|
Коллайдер
Ветеран
Откуда: LHC
Сообщений: 2 055
Репутация: 41
|
|
|
|
Выразили согласие: | |
|
sda79
Ветеран
Откуда: निर्वाण
Сообщений: 228
Репутация: 91
|
RE: Больше битрейт, качественнее трек? / 11-10-2017 22:30
Дезинформация и суеверия на руку лишь шарлатанам.
Тема не только для новичка, тех кто хочет разобраться. Но и для тех кто хочет помочь ему в этом.
Цитата:Заблуждения насчет семплирования
Теорему отсчетов (Котельникова / Найквиста — Шеннона) далеко не просто понять, не имея представления об обработке сигналов. Совсем не удивительно, что большинство людей, даже доктора наук, довольно часто имеют о ней ошибочное представление. Также не новость, что многие люди и представить себе не могут, что ошибаются.
Квантованный сигнал довольно часто представляется в виде ступенек (изображены красным), которые с виду весьма далеки от исходной формы сигнала. Однако, на самом деле, цифровое представление такого сигнала является математически совершенным и после восстановления обратно в аналоговый вид мы получим такую же гладкую синусоиду, какая была на входе (исходный сигнал изображен голубым цветом).
Самое распространенное заблуждение: квантование является заведомо грубым приближением с потерями. Квантованный сигнал часто представляется в виде угловатых ступенек — в противоположность исходной, совершенно гладкой кривой. Если вы представляете себе семплирование именно так, скорее всего вы также убеждены, что чем больше частота семплирования (и разрядность квантования), тем более цифровой ступенчатый сигнал будет совпадать по форме с исходным. Цифровой сигнал будет звучать всё ближе и ближе к аналоговому по мере того, как частота семплирования будет стремиться к бесконечности.
Также, если человеку далекому от DSP технологий (digital sound processing) показать следующее:
он воскликнет: «Ох!». Похоже, что цифровой сигнал плохо годится для представления сигналов с высокой частотой. Или по мере увеличения частоты качество семплирования стремительно падает, а частотная характеристика спадает или становится чувствительной к фазе.
Внешность обманчива. Эти утверждения ошибочны!
Сигналы, все частотные составляющие которых находятся ниже частоты Найквиста (половина частоты дискретизации), преобразовываются в цифровой вид с абсолютной точностью; бесконечная частота семплирования не нужна. Также квантование совершенно не влияет на АЧХ и ФЧХ. Аналоговый сигнал может быть без потерь восстановлен, причем будет иметь гладкую форму и в точности совпадать по фазе с исходным сигналом.
Что ж, матчасть безупречна, но как насчет неидеальности мира? Наибольшей сложностью является удовлетворение требованиям ограниченности частотной полосы. Сигналы с составляющими выше частоты Найквиста должны предварительно пройти через НЧ фильтр, дабы предотвратить шумы отражения (алиазинг); этот аналоговый ФНЧ — печально известный анти-алиазинговый фильтр. На практике антиалиазинг не может быть совершенным, но современные технологии максимально приблизили его к идеалу. ...а мы тем временем переходим к оверсемплингу.
Оверсемплинг
Семплирование на частотах более 48 кГц не является необходимостью для хранения высококачественных аудиоданных, но в то же время высокая частота семплирования лежит в основе принципа работы некоторых технологий цифрового звука. Наиболее значимой из них является оверсемплинг.
Оверсемплинг — технология крайне простая, но эффективная. Вы можете помнить из видео A Digital Media Primer For Geeks, что высокие частоты семплирования обеспечивают гораздо больший промежуток между желаемой граничной частотой сигнала и частотой Найквиста. Это позволяет использовать более простые, гладкие, легко реализуемые аналоговые анти-алиазинговые фильтры, а следовательно, позволяет получить более высокое качество. Этот дополнительный промежуток между 20 кГц и частотой Найквиста фактически является спектральным зазором аналогового фильтра.
Графики из вышеупомянутого видео, иллюстрирующие доступную ширину спада АЧХ для 48- и 96-килогерцовых АЦП/ЦАП соответственно.
И это только начало. Поскольку цифровые фильтры имеют гораздо меньше ограничений, чем аналоговые, мы можем произвести анти-алиазинг более точно и эффективно в цифровом виде. Аудиоданные с очень высокой частотой семплирования проходят через цифровой анти-алиазинговый фильтр, который без каких-либо проблем жестко ограничивает полосу частот до заданного значения, после чего дополнительные семплы (кодировавшие сверхвысокие частоты) просто отбрасываются. Воспроизведение с оверсемплингом работает примерно таким же образом, но в обратной последовательности.
Это означает, что мы можем использовать невысокие частоты — 44.1 или 48 кГц — и при этом пользоваться всеми преимуществами семплирования с частотой 192 кГц и выше (ровная АЧХ, отсутствие алиазинга), без каких-либо побочных эффектов (вроде ультразвуковых модуляций, лишних затрат места на жестком диске). Практически все АЦП и ЦАП сегодня используют оверсемплинг с очень высокой частотой. Мало кто знает об этом, так как обработка производится независимо от пользователя и полностью автоматизирована.
АЦП и ЦАП производили оверсемплинг не всегда. Тридцать лет назад некоторые записывающие устройства использовали только аналоговые фильтры в сочетании с высокими частотами, и такую же частоту приходилось использовать при сведении/мастеринге. Цифровой анти-алиазинг и децимация (понижение частоты дискретизации для записи на CD или DAT) выполнялся на финальной стадии мастеринга. Это было одной из причин, почему форматы 96 кГц и 192 кГц стали ассоциироваться с профессиональной звукозаписью.
16 бит против 24 бит
Хорошо, значит, в 192 кГц для музыки смысла нет, разобрались. А что насчет 16- и 24-битного аудио?
Это правда, что 16-битная ИКМ (импульсно-кодовая модуляция) не полностью покрывает весь динамический диапазон, теоретически доступный человеческому слуху в идеальных условиях. Кроме того, существуют (и всегда будут существовать) причины, по которым лучше использовать более 16 бит при записи и обработке музыки.
Но ни одна из этих причин не относится к воспроизведению; здесь 24 бита также бесполезны, как и частота 192 кГц. Хорошая новость заключается в том, что 24-битный формат отрицательно повлиять на качество не может. Просто в нем нет нужды, но при этом он расходует лишнее дисковое пространство.
И снова ваши уши
Выше мы обсудили частотный диапазон человеческого слуха, что же насчет динамического диапазона, т.е. разницы между самым тихим слышимым сигналом и самым громким?
Как вариант, для определение максимального динамического диапазона наших ушей, можно воспользоваться теми же кривыми порога слышимости и болевого порога. Промежуток между самой верхней точкой болевого порога и самой нижней точкой порога слышимости составляет 140 децибел (для молодого, здорового человека). Хотя это справедливо лишь для коротких промежутков времени — 130 дБ достаточно чтобы нанести необратимый ущерб слуху менее чем за минуту. Для справки: отбойный молоток на расстоянии одного метра создает звуковое давление лишь в 100-110 дБ.
Порог слышимости повышается по мере старения и ухудшения слуха. Что интересно: болевой порог, напротив, с возрастом уменьшается. Волосковые клетки улитки сами по себе обеспечивают лишь часть вышеупомянутого динамического диапазона в 140 дБ; в ухе имеются специальные мышцы, постоянно регулирующие поток воздуха, достигающий улитки, путем сдвига специальных косточек — подобно радужной оболочке, регулирующей количество света, поступающего внутрь глаза. Этот механизм с возрастом изнашивается, динамический диапазон слуха сужается, а эффективность защитных механизмов уменьшается.
Окружающие шумы
Мало кто знает, на каком низком уровне в действительности находится порог слышимости.
Самый тихий слышимый звук соответствует звуковому давлению около -8 dBSPL. При использовании весового фильтра типа А гул от 100-ваттной лампы накаливания на расстоянии одного метра составляет 10 dBSPL, т.е. на 18 дБ громче. Лампа с диммером будет гудеть еще громче.
Значение 20 dBSPL (на 28 дБ громче порога слышимости) обычно соответствует пустой звукозаписывающей студии или же звукоизолированной комнате. Именно поэтому вы скорей всего никогда не слышали гудение лампочки.
Динамический диапазон 16 бит
16-битная линейная импульсно-кодовая модуляция (LPCM), в соответствии с наиболее распространенным способом подсчета (ДД=6*[количество бит]), обеспечивает динамический диапазон в 96 дБ. Многие думают, что 16-битный формат не способен описать произвольный сигнал с уровне ниже -96 dBFS. Это не так.
Ниже я привожу ссылки на два 16-битных аудиофайла: один содержит тон с частотой 1 кГц и уровнем 0 dBFS (максимальный уровень), а другой 1 кГц тон с уровнем -105 dBFS.
Sample 1: 1kHz tone at 0 dB (16 bit / 48kHz WAV)
Sample 2: 1kHz tone at -105 dB (16 bit / 48kHz WAV)
Спектральная диаграмма тона с уровнем -105 дБ, закодированного в формате ИКМ 16 бит/48 кГц. 16 бит обеспечивают диапазон куда больше, чем 96 дБ, иначе тон с уровнем -105 дБ был бы невиден и неслышен.
Каким же образом можно закодировать подобный сигнал, причем с уровнем намного выше шумового порога, в то время как его его амплитуда составляет 1/3 бита?
Отчасти это достигается с помощью дизеринга, который оказывает влияние на шум квантования и не влияет на полезный сигнал. Фактически это означает, что квантование с дизерингом не вносит искажений, лишь случайный (некоррелированный) шум. Таким образом мы можем кодировать сигналы произвольного уровня, даже с пиковой амплитудой намного меньше одного бита. Однако, дизеринг не отменяет принципа, согласно которому сигнал исчезает, как только опускается ниже уровня шума. Как же так, что сигнал -105 dBFS слышен при шумовой полке -96 dBFS?
Ответ: наше представление о шумовой полке в -96 dBFS неверно: мы используем неподходящий метод описания динамического диапазона. Коэффициент 6, умноженный на количество бит, даёт нам среднеквадратичное (т.н. «действующее») значение уровня шумов, с учетом всего диапазона частот, но, то же время, отдельные волосковые клетки в наших ушах воспринимают лишь узкую полосу частотного диапазона, т.е. на них перепадает лишь часть полной мощности фонового шума. Это значит, что шумовой порог для отдельно взятой волосковой клетки будет значительно ниже, чем суммарное значение для всей полосы частот (-96 dBFS).
Таким образом 16-битное аудио обеспечивает диапазон куда больше 96 дБ. В случае использования дизеринга в сочетании с формовкой шума, обеспечивающей смещение спектра шума в в диапазон частот, к которым ухо менее чувствительно, эффективный динамический диапазон 16 бит фактически достигает 120 дБ — это более, чем в 15 раз превышает заявленные 96 дБ.
120 дБ — это больше, чем разница между писком комара, летающего где-то по комнате, и звуком отбойного молотка, находящегося от вас в двух шагах... или разница между уровнем звукового давления в пустой звукоизоляционной камере и звуком, по громкости достаточным, чтобы повредить ваш слух за какие-то секунды.
16 бит вполне достаточно (и будет достаточно всегда), чтобы закодировать абсолютно любой воспринимаемый человеческим ухом звук.
Соотношение сигнал/шум
Стоит вкратце упомянуть, что соотношение сигнал/шум для ушей меньше, чем их абсолютный динамический диапазон. В заданной узкой полосе типичное значение составляет всего лишь ~30 дБ. Относительное значение сигнал/шум не достигает полного динамического диапазона, даже если рассматривать широкую полосу частот. Это гарантирует, что 16-битная ИКМ обеспечивает даже большее разрешение, чем это необходимо.
Примечание переводчика: под динамическим диапазоном подразумевается разница между самым громким и самым тихим воспринимаемым звуком. Соотношение же сигнал/шум характеризует разницу между воспринимаемым сигналом и сопутствующим ему шумом. Таким образом, по видимому, орган слуха в процессе восприятия вносит свои шумы, которые по уровню находятся примерно на 30 дБ ниже воспринимаемого сигнала.
Также надо сказать, что увеличение разрядности аудио с 16 до 24 бит никоим образом не влияет на «прозрачность» его звучания. Это лишь увеличит динамический диапазон, т.е. разницу между самым тихим и самым громким звуком, за счет снижения шумовой полки. Причем шумовая полка 16 бит — уже за пределами возможностей нашего слуха.
Когда 24 бита имеют смысл?
Профессионалы используют 24-битные семплы в процессе записи и обработки, руководствуясь целями улучшения динамики, занижения шумовой полки, а также просто из-за удобства.
16 бит достаточно, чтобы охватить реальный слышимый диапазон, и в то же время сэкономить. Но их оказывается недостаточно, чтобы покрыть диапазон доступный для звукового оборудования. Основной целью использования 24-х бит в процессе записи является предотвращение ошибок. В то время, как, используя 16-битный формат, вы рискуете получить клиппинг при слишком высоком уровне записи и высокий уровень шумов при низком, 24 бита позволяют установить лишь примерный, заведомо достаточно низкий для предотвращения клиппинга уровень, особо не беспокоясь при этом о шумах. Потеря нескольких бит в случае установки неоптимального уровня записи не играет никакой, и в итоге уровень шумов будет всё еще достаточно низким, чтобы эффектам динамической компрессии было где разгуляться.
Кроме того, более высокое разрешение (более 16 бит) необходимо в процессе микширования (сведения) и мастеринга. Сегодня музыкальные работы могут включать в себя тысячи эффектов и обработок. Шумы квантования 16-битного сигнала могут быть не слышны в процессе воспроизведения, однако если их тысячу раз перемножить, в конце концов они станут заметны. 24 бита позволяют сохранять накопившийся суммарный шум на очень низком уровне. Как только музыкальный материал готов к распространению, нет никаких причин оставлять его в разрешении превышающем 16 бит.
Статья _https://audiophilesoft.ru/publ/theory/24_192_downloads/6-1-0-236
Первоисточник _https://audiophilesoft.ru/publ/theory/24_192_downloads/6-1-0-236
(Отредактировал 11-10-2017 в 22:45 sda79.)
|
|
|
|
Выразили согласие: | |
|
Выразили согласие: | |
|
Выразили согласие: | |
|
Выразили согласие: | |
|
Выразили согласие: | |
|
Выразили согласие: | |
|
Коллайдер
Ветеран
Откуда: LHC
Сообщений: 2 055
Репутация: 41
|
|
|
|
Выразили согласие: | |
|
sda79
Ветеран
Откуда: निर्वाण
Сообщений: 228
Репутация: 91
|
RE: Больше битрейт, качественнее трек? / 11-10-2017 23:18
Цитата:Слуховые тесты
Понимание приходит лишь тогда, когда теория сочетается с практикой. Вопрос считается решенным лишь тогда, когда между теорией и практикой отсутствуют какие-либо расхождения.
Эмпирические данные, полученные в результате слуховых тестов подтверждают, что формат 44.1 кГц / 16 бит обеспечивает наивысшую возможную точность воспроизведения. Есть несколько контролируемых тестов, подтверждающих этот факт, но я приведу последние результаты — Audibility of a CD-Standard A/D/A Loop Inserted into High-Resolution Audio Playback — полученные нашими учеными, членами сообщества Boston Audio Society. _http://www.bostonaudiosociety.org/
К сожалению, для скачивания полного отчета требуется членство AES. Тем не менее, результаты неоднократно упоминались в статьях, а также обсуждались на форумах непосредственно с членами AES. Вот несколько ссылок:
Hydrogen Audio forum discussion thread _https://hydrogenaud.io/index.php/topic,57406.0.html
Supplemental information page at the Boston Audio Society, including the equipment and sample lists _http://www.bostonaudiosociety.org/explanation.htm
В отчете говорится о слушателях, которые производили выбор между высококачественным DVD-A/SACD контентом, подобранным сторонниками high-res для демонстрации возможностей данных форматов, и тем же самым материалом, прошедшим преобразование в формат 16 бит / 44.1 кГц. Слушателям предлагалось определить какие бы то ни было различия между этими двумя форматами по методике слепого ABX теста. Сообщество BAS проводило данный тест с использованием профессионального high-end оборудования, в звукоизолированных студийных помещениях, с участием в качестве слушателей как новичков, так и хорошо натренированных профессионалов.
В результате 554 проходов правильные ответы слушателей составили 49.8 %. Иными словами, выбор делался наугад. Ни один слушатель, на протяжении всего теста, не смог определить, где 16/44.1, а где материал с более высоким разрешением. И это при том, что для 16 бит даже не был выполнен дезеринг!
Другое недавнее исследование было проведено с целью определить возможность восприятия ультразвука, что было предложено в ходе более ранних исследований. Текст был организован таким образом, чтобы максимизировать вероятность обнаружения, путем помещения продуктов интермодуляции в наиболее слышимый диапазон. Было доказано, что ультразвуковые частоты не воспринимаются... но интермодуляционные искажения вносимые динамиками, могут быть слышны.
Эта статья вдохновила многих на последующие испытания, результаты которых были различными. Некоторые расхождения объясняются тем, что, как оказалось, ультразвук может вызвать большие интермодуляционные искажения в усилителях, чем ожидалось. К примеру, Дэвид Гресингер воспроизвел данный эксперимент и обнаружил, что его громкоговорители не дают слышимых интермодуляций от ультразвука, в отличие от усилителя.
Caveat Lector
Очень важно не вырывать отдельные фразы, в частности комментарии «экспертов» из контекста, особенно из заинтересованных источников. Не все работы согласуются с вышеприведенными результатами (некоторые даже во многом несогласны), так что всегда можно найти мнение какой-нибудь кучки людей, оправдывающее любые мыслимые выводы. Напротив, ссылки и документы, представленные выше, являются примером наиболее компетентного и независимого источника, и вообще довольно весомыми результатами в исследовательской сфере. На данный момент нет проверенных временем документов, которые бы противоречили этим результатам. Разногласия же существуют исключительно в сфере любителей-аудиофилов.
Во всяком случае, количество неоднозначных, необоснованных и откровенно ошибочных экспериментальных результатов, которые можно найти в Google, подтверждает, что организовать точную и объективную проверку далеко не просто. Ученые требуют проведения максимально детальных исследований, со строгим статистическим анализом, исключающим предвзятость и сознательный выбор испытуемых. В ходе экспериментов мы часто пытаемся доказать, что чего-то не существует, и это делает исследования еще более сложными. Доказательство подобных «нулевых гипотез» сродни доказательству «проблемы остановки»; то есть это практически невозможно. Вы можете лишь собирать доказательства того, что имеет место в большинстве случаев.
Тем не менее, документы, подтверждающие нулевую гипотезу являются очень весомым доказательством; подтверждение неслышимости чего-либо на практике куда сложнее, чем её опровержение. Неучтенные ошибки в методике тестирования и оборудовании практически всегда приводят к ошибочному позитивному результату (внося случайные слышимые различия), а не к ложному негативному.
Если даже профессиональные исследователи тратят такое большое количество времени на детальные исследования единичных слышимых отличий, можете себе представить, как сложно это для любителей.
Как [случайно] испортить слуховое сравнение
Комментарий номер один, который я слышу от верующих в аудио сверх высокого разрешения (перефразирую): «Я лично слушал аудио с высоким разрешением — улучшение очевидно. Вы действительно хотите убедить меня не верить собственным ушам?»
Конечно, можете верить своим ушам. Ох уж эти доверчивые умы... Нет, я не имею ввиду легкомыслие отдельных личностей, в конце концов мы все подвержены подобному.
Предвзятость подтверждения, эффект пустышки и двойной слепой
В любом тесте, где слушатель производит выбор иначе, чем с использованием слепого прослушивания, результат, как правило, будет зависеть от его ожиданий; это явление называется предвзятостью подтверждения и очень схоже с эффектом пустышки. Это значит, что люди «слышат» различия из-за подсознательных сигналов, а также благодаря предпочтениям, не имеющим ничего общего со звуком (например когда человек предпочитает более дорогой усилитель).
Человеческий мозг устроен таким образом, что может обнаруживать детали и различия даже там, где на самом деле их нет. И этот момент нельзя исключить, лишь попросив человека сделать объективное решение; это явление относится исключительно к подсознанию. Влияния предубеждений не поможет избежать и скептицизм. Контролируемые тесты показали, что опасение предвзятости подтверждения в большинстве случае увеличивает, а не уменьшает её влияние. Тесту, в ходе которого не была тщательно исключена предвзятость подтверждения — грош цена.
В одинарном слепом тестировании (single-blind) слушатель ничего не знает об объектах выбора, а также не осведомляется о результатах на протяжении всего тестирования. Одинарное слепое тестирование лучше, чем произвольное сравнение, но оно не исключает влияние предвзятости экспериментатора. Руководитель теста вполне может, сам того не ведая, повлиять на результаты теста, если его собственные подсознательные убеждения повлияют на слушателя посредством непреднамеренных подсказок (вроде «Вы уверены, что слышите именно это?», в т.ч. невербальных знаков, сопровождающих «неверный выбор», и т.д.). Влияние предвзятости экспериментатора на результаты субъектов тестирования также было подтверждено на практике.
Двойной слепой слуховой тест является золотым стандартом; в нем ни руководитель, ни испытуемые не имеют никакой информации о содержимом теста или текущих результатах. Наиболее распространенным примером является компьютерное ABX тестирование. В сети есть несколько свободно распространяемых программ для проведения ABX тестирования на ПК. ABX является тем минимумом, при котором результаты прослушивания начинают иметь какое-либо значение. На авторитетных форумах по теме звука, вроде Hydrogen Audio зачастую даже запрещено обсуждение результатов прослушивания, пока не выполнены эти минимальные требования.
Squishyball, простейшая консольная программа для проведения ABX теста, запущенная через xterm.
Даже я в ходе разработки не провел ни одного сравнения качества без использования ABX. Наука есть наука, никаких поблажек.
Трюки с громкостью
Человеческое ухо способно уверенно и сознательно выявлять различия амплитуды с точностью до ~1 дБ, эксперименты же показывают, что бессознательно человек способен улавливать различия до 0.2 дБ. Практически всегда людям кажется, что лучше звучит то, что громче, и 0.2 дБ для этого может быть достаточно. В ходе любого сравнения, где объекты тестирования тщательно не выравнялись по громкости, выбор скорее всего падет на объект с большей громкостью, даже если осознанно эти различия не улавливаются. В области аудио маркетинга этот трюк известен давно.
Профессиональный стандарт тестирования требует соответствие громкости с точностью до 0.1 дБ или выше. Для этого часто требуется осциллограф или анализатор сигналов. Повертеть ручки громкости до тех пор, пока два источника будут звучать примерно с одинаковой громкостью — отнюдь не достаточно.
Клиппинг
Клиппинг является еще одной причиной ошибок, зачастую обнаруживаемых только впоследствии. Даже два клиппированных семпла (или их продукты) могут привести к слышимым отличиям от исходного сигнала без срезов.
Опасность клиппинга особенно высока во время испытаний, в которых используется генерация, ресемплинг или другие манипуляции с сигналом в режиме реального времени. Скажем, мы хотим сравнить качество семплирования с частотой 48 кГц с исходными 192 кГц. Простейшим способом будет даунсемплинг 192->48, апсемплинг обратно в 192 кГц, а затем сравнение с оригиналом в ABX тесте. Это решение позволяет исключить любую возможность влияния специфики работы оборудования с различными частотами дискретизации, переключения опорной частоты и т.п.; то есть мы можем использовать один и тот же ЦАП для воспроизведения обоих семплов, переключаясь между ними без изменения режима работы оборудования.
К сожалению, мастеринг большинства записей выполнен с использованием всего динамического диапазона цифрового сигнала. Обычный ресемплинг в таком случае может привести (и практически всегда приводит) к срезам. Потому необходимо также отслеживать клиппинг (исключая клиппированное аудио) или же определенным образом предотвращать его, например используя занижение уровня.
Разные источники, разный мастеринг
Мне встречалось несколько статей и записей в блогах, где авторы утверждали о преимущества 24 бит или 96/192 кГц, основываясь на сравнении CD и DVD/SACD изданий «той же самой записи». Такое сравнение не имеет смысла, так как для разных изданий обычно используется различный мастеринг.
Случайные «подсказки»
Случайные слышимые «подсказки» зачастую неизбежны при использовании устаревших аналоговых или гибридных цифро-аналоговых установок. Использование полностью цифровых установок может совершенно исключить эту проблему в некоторых формах испытаний, но в то же время увеличивает возможность программных ошибок. Подобные ограничения и баги имеют долгую историю появления ошибочных позитивных результатов в процессе тестирования.
В статье The Digital Challenge - More on ABX Testing описана замечательная история одного слухового теста, проведенного в 1984, который был призван опровергнуть утверждение авторитетных аудиофилов о том, что Audio CD значительно уступает винилу. Статья не столько о результатах теста (о которых, я думаю, Вы и сами догадываетесь), сколько о некоторых особенностях его проведения, и вообще, «неидеальности мира», повлиявшей на тест. Например, в результате ошибки со стороны тестирующих вдруг оказалось, что приглашенные эксперты-аудиофилы производили выбор не на основе качества звучания, а прислушиваясь к немного отличающимся звукам коммутирующего реле (!), используемого для переключения в ходе ABX теста.
Анекдоты не заменят данных, но история эта весьма поучительна — она показывает, насколько легко скрытые недостатки методики могут повлиять на результаты тестирования. Некоторые убеждения аудиофилов также весьма забавны: кое-кто из них верит, что современные результаты через лет эдак 20 будут выглядеть глупо (т.е. не будут соответствовать действительности). Статья _https://audiophilesoft.ru/publ/theory/24_192_downloads/6-1-0-236
Первоисточник _https://audiophilesoft.ru/publ/theory/24_192_downloads/6-1-0-236
(Отредактировал 11-10-2017 в 23:25 sda79.)
|
|
|
|
Выразили согласие: | |
|
Коллайдер
Ветеран
Откуда: LHC
Сообщений: 2 055
Репутация: 41
|
|
|
|
Выразили согласие: | |
|
Пользователи просматривают эту тему: 1 Гость(ей)
|
|