Цифровой звук
Многие думают, что цифровой звук почти идеальный, имеет низкие искажения, сотые или даже тысячные проценты искажений, на самом же деле это не так, такой звук имеет ограничения и недостатки, которые, конечно, можно минимизировать, но это только если правильно оценивать проблемы. Например, если мы посмотрим импульсную характеристику, то увидим следующую картину. Для примера использовался USB ЦАП Shanling UA3.
Где мы видим наложенные на импульс колебания с частотой 22,05 кГц (от частоты дискретизации 44.1 кГц отличается в два раза в меньшую сторону), которые возникают как до импульса, так и после импульса. И эти искажения не сотые проценты, а много больше! Так получается при передискретизации, когда берут исходную запись с отсчетами (частота выборки, в CD принята 44,1 кГц), повышают частоту математически кратно в несколько раз (в 4…8 раз обычно), выставляют промежуточные отсчеты (интерполируют) и тем самым сглаживают ступеньки квантования, получают на выходе почти аналоговый сигнал, который сглаживается на выходе простыми фильтрами. И результат цифрового сглаживания зависит от используемого алгоритма, обычно принимают инерционный алгоритм, отсюда происходят колебания на импульсе.
На самом же деле, звук или волна в природе имеет три вида формы при движении, о чем наука скромно умалчивает, волна бывает: обычная, ударная и скалярная, в зависимости от соотношения частот, волна работает, то как инерционный (индуктивный) элемент, то как емкостный или упругость образует, создавая опережающий эффект и есть волна сбалансированная, скалярная, где волна имеет безреактивную форму движения.
Стандартный алгоритм передискретизации искажает сигнал на уровне микродинамики, в деталях конечно, к чему наше ухо очень чувствительно, так же как к резкости на фотографии, где картинка замыливается или возникают артефакты из-за избыточного повышения резкости, где так же на результат влияют применяемые алгоритмы интерполяции, а также шумы сказываются, точно тоже самое и в звукотехнике.
И сначала кажется, глядя на импульс, показанный на рис.1, ну и что, эти ВЧ вибрации переменные, но это не совсем так, ведь одна полуволна всегда меньше или больше следом идущей, поэтому возникает НЧ гармоника, которая находится ниже 22,05 кГц, т.е. находится в звуковом спектре, но она относительно не велика, из-за того, что колебания сбалансированы. Этот параметр отражается при измерении гармонических искажений, когда подают сигнал одной частоты и измеряют наличие новых гармоник. Но есть нюанс, что искажения при стандартном измерении указываются в диапазоне частоты до 20 кГц, для сигнала с записью 44,1 кГц, т.е. частота 22,05 в график измерения просто не попадает, иначе там были бы куда, как большие значения, в разы больше!
Но всё меняется, если импульс накладывается на более НЧ сигнал, тогда ВЧ пульсация становится однонаправленной и это усиливает возникающую гармонику, поэтому говорят, что возникают интермодуляционные искажения, которые измеряют при подаче двух сигналов разной частоты и на выходе измеряют новые гармоники, ниже показан график такого измерения для того же Shanling UA3.
Как видим, берется частота 7кГц и 60 Гц, но заметьте, 7 кГц это не 22,05 кГц, если бы взяли частоту 22,05 кГц и 60 Гц, где большие ВЧ колебания возникают, то интермодуляционные искажения были бы на порядок больше! И это дело пытаются компенсировать на практике, применяя разные сглаживающие фильтры передискретизации, минимизирующие ВЧ колебания на частоте 22,05 кГц (для записи с частотой 44,1 кГц).
Ниже на рис.3 и рис.4 показаны два варианта фильтров, применяемых в Shanling UA3, где ВЧ колебания хорошо гасятся.
И есть даже фильтр, который дает почти чистый прямоугольный импульс, какой бывает в мультибитных ЦАП без передискретизации (nos-режим), что показано на рис.5.
Но у этого режима появляются ступенька на записи, что видно хорошо на синусе 1кГц.
Как видим, производители работают для совершенствования цифровой фильтрации, делают разные фильтры, все фильтры не стал указывать для данного ЦАП, на них есть ВЧ колебания, считаю, что использовать лучше фильтры, где ВЧ вибрация минимизирована. Это имеет смысл на технике с низкими искажениями и на наушниках, на колонках, в обычном помещении, с бюджетными устройствами разница вряд ли будет заметна, искажения техники их перекроют.
Стоит также учитывать, что если запись идет с частотой 44,1 кГц, а в системе установлена частота 48 кГц, т.е. не совпадает с записью, то тогда тоже возникают ВЧ колебания и ещё биения, импульс дышит, как это показано на рис.7 для фильтра 2, показанного на рис. 3. Для устранения проблем с передискретизацией сигнала сегодня используют в Windows режимы ASIO и WASAPI.
Как видим, даже при «правильной» фильтрации появляется ВЧ звон на импульсе до и после и это подкрашивает звук, это хорошо слышно, что иногда даже может быть приятно при прослушивании, звук кажется более богатым, благодаря возникающим искажениям и биениям, которые обогащают звук, создают эффект ревербераций, атмосферу записи усиливают.
Но не всегда это сказывается положительно, так как есть еще одна большая проблема и она не касается на прямую цифрового звука, а как раз следствие работы аналоговых усилителей, конденсаторов, блоков питания и линий, где возникает ВЧ вибрация, только более высокой частоты, ведь усилители, когда регулируют напряжение делают это с помощью обратной связи и поэтому возникает ВЧ вибрация, притом волновой природы, которая при наложении на НЧ сигнал записи создает гармоники, которые на катушке индуктивности усиливаются, за счет сложение пульсаций, где катушка выступает как инерционный накопитель, а значит усилитель энергии. При этом кабели, линии выделяют из шума одну гармонику, поэтому кабеля влияют на звучание. И кроме того, затухание волновой энергии происходит значительно медленнее из-за низких потерь в линии, поэтому ВЧ вибрация создает гармоники в слышимой области.
И поэтому на звук влияют провода, питание, конденсаторы и конечно, ВЧ импульсные помехи с ЦАП хорошо возбуждают эти вибрации. И поэтому звучание определяется аналоговой частью, её резонансами и её реакцией на цифровые помехи. Именно поэтому однобитные (дельта-сигма) преобразователи меломаны недолюбливают, мало того, что цифровая фильтрация на звук влияет, алгоритм сглаживания сказывается, так ещё такой ЦАП генерирует ВЧ импульсные помехи на выходе из-за принципа работы такого ЦАП, провоцирующие аналоговые цепи, где возникает волновая энергия в линии, именно поэтому такая энергия усиливается в катушке, в инерционном накопителе.
И поэтому на цифровой звук оказывают влияние много параметров, отсюда требуется понимание проблемы, чтобы согласовать все элементы так, чтобы это давало красивое и естественное звучание, где влияет даже программное обеспечение, цифровая обработка при регулировании громкости, которая также вносит искажения, при пересчете уровня сигнала и все это накладывается на передискретизацию и усиливается аналоговыми цепями. Да и сами плееры, воспроизводящие аудиоданные создают искажения, это при измерении параметров видно, подавая при измерении звук через разные плееры меняются нелинейные искажение, как это показано ниже.
Где мы в первом столбце видим, как программа RMAA сама подает сигнал напрямую в ЦАП и измеряет гармонические и интермодуляционные искажения (THD и IMD+Noise), где они растут во втором и третьем столбце, где делал 4-х кратную передискретизацию в плеере Roon 1.8, дающую больше искажений и даже без передискретизации, в 4-ом столбце, мы видим, что искажения в плеере Roon чуть выше (0.0032% против 0.0030%, это не погрешность, проверил несколько раз), что связано с обработкой сигнала в плеере. Поэтому разный звук плееров это не кажется.
При этом фильтрация влияет на АЧХ, что показано ниже на рис.9.
Как видим, фильтр 2 в ЦАП дает сглаживание на ВЧ, белый график на рис.9 совпадает с фиолетовым, где спад на ВЧ начинается уже с 7 кГц, но при этом импульс получается без колебаний, что для уха более важно. На рис.10 показан импульс для фильтра 2 в ЦАП. Он такой же, как на рис.3, просто масштаб меньше по амплитуде.
И ниже для сравнения показан фильтр 3, применяемый в Roon при программной передискретизации (4-х кратной, т.е. 176,4 кГц).
Как видим, ВЧ вибрации в импульсе через Roon-передискретизацию чуть выше получаются, чем делает ЦАП на фильтре 2 и искажения нелинейные при этом растут в 2 раза в таблице измерений (рис. 8), т.е. алгоритм Roon подбрасывает искажений, хотя можно сказать добавляет гармоники, которые были в записи потеряны при дискретизации. Искажения являются платой за расширение АЧХ в области ВЧ, при ограничении ВЧ колебаний.
И ниже показан импульс при применении фильтра 1 в Roon, близкого к стандартному фильтру, где АЧХ на ВЧ максимально протяженная, что видно по рис.9.
Как видим, производители изощряются по разному, чтобы обеспечить приятный звук слушателю и это только на уровне программного обеспечения, а на уровне железа, т.е. усилителей, ЦАП, конденсаторов, питания, кабелей и пр. еще больше вариаций, поэтому сегодня делают ЦАП и усилители с возможностью замены операционных усилителей без пайки и даже замена ЦАП в топовых решениях имеется.
Моё же мнение, что для прослушивания звука не обязательно брать всё топовое и дорогое. Достаточно брать технику с хорошими техническими параметрами (на нагрузке), единственное, что не отображают измерения и обзоры в интернете, это ВЧ шумы усилителей, которые окрашивают звук не хуже эквалайзера, поэтому тут только на слух ориентироваться и если есть осциллограф с частотой хотя бы до 100 мГц, чтобы оценить уровень ВЧ фона усилителя, на который провода могут реагировать (усиливать), но это уже можно сделать после покупки.
На мой взгляд, ЦАП-усилители (для наушников) с повышенными шумами на выходе усилителя будут проигрывать аппаратам с низкими ВЧ шумами на выходе, при одинаковых измеренных параметрах (на нагрузку, на наушники), хотя, по началу, может показаться, что мощный аппарат играет круто. Но при долгом прослушивании слух может притупляться, как бы глохнуть, вызывая усталость, из-за однообразия звука. Поэтому большая мощность усилителя может сработать в обратную сторону, где шумы будут выше, при работе на наушники в реальных условиях, где мощность большая обычно и не требуется, для накладных динамических наушников достаточно обычно 10 мВт, никакие сотни мили ват или даже ват не требуется, это маркетинг, на который ведется потребитель.
И повышенные шумы будут окрашивать звучание, играть однообразно. Хотя, при стечении обстоятельства окрас может формировать прозрачность, сцену, но я считаю, что лучше это делать цифровой обработкой, подбором фильтров, плееров, изменяя тип вывода звука и пр. И многое при восприятии, конечно, зависит от психики, от того как мы себя настраиваем. Тут сильно влияет принятые убеждения, поэтому лучше меньше слушать обзорщиков и «специалистов» на форуме в интернете, обычно легко управляемых производителем через маркетинг, когда покупают одного обзорщика и он внушает доверчивым, что пришло время сменить технику, раскошелиться но новое… И на этом ничего не заканчивается).