Как сделать нормализацию аудиосигнала. MP3Gain - утилита для выравнивания громкости аудиофайлов. На аудио компакт-дисках звуковые файлы хранятся с расширением. При записи на жёсткий диск они при помощи специальной программы риппера или грабера преобразую

32044

Л юбителям музыки, полагаем, не раз приходилось сталкиваться с ситуацией, когда одни композиции одной подборки звучат слишком громко, а другие, напротив, слишком тихо. Такое бывает, когда пользователи скачивают музыку из разных источников, а ещё композиции с разной громкостью звучания часто встречаются в миксах, где собраны песни разных исполнителей. Ну, это понятно, только как вот в таких случаях поступать, не регулировать же громкость каждый раз, как только песня зазвучит громче или тише?

Нет, конечно, потому что громкость можно выровнять, причём очень просто. Для этого вам понадобится маленькая бесплатная утилита . Эта программка позволяет обрабатывать аудиофайлы популярных форматов в пакетном режиме в соответствии с заданным параметром громкости.

Итак, идем на страничку разработчика и скачиваем последнюю полную(!) версию . По умолчанию программа устанавливается на английском языке и, если вас это не смущает, устанавливайте её в обычном режиме, чтобы сразу получить интерфейс на русском языке, на втором шаге инсталляции необходимо установить галочку «Russian» в меню «Language files» .

В меню жмём кнопку «Добавить файлы» и загружаем в окно утилиты аудиофайлы , над громкостью которых нужно поработать. Далее нажимаем «Анализ трек» и ждём пока программа не завершит анализ файлов с целью выявления их громкости. Процедура эта может занять несколько минут, всё зависит от общего размера анализируемых файлов. На обработку сборки объёмом 1 Гб уходит примерно 10 минут.

После нужно установить желаемую громкость (по умолчанию это 89 Db) и нажать кнопку «Тип трек» . В результате обработки громкость всех аудиофайлов будет приведена к единому указанному значению. Изменение уровня громкости занимает меньше времени, чем анализ. Также стоит обратить внимание, что все файлы в процессе обработки и сохранения будут перезаписаны.

И напоследок пару слов о том, что означают параметры напротив каждого файла.

  • Уровень - текущая громкость.
  • Клиппинг - установленная напротив птичка Y указывает, что при текущей громкости на фоне трека имеются шумы (будете ли вы их слышать или нет, зависит от остроты вашего слуха).
  • Трек - показывает разницу в децибелах между текущим и установленным пользователем параметром громкости.
  • Наличие отметки в колонке «Клип (Т)» указывает, что фоновые шумы останутся и после обработки.

Чтобы этих шумов было как можно меньше, не рекомендуется выставлять громкость слишком высокую или слишком низкую. Оптимальным значением для параметра «Норма громкости» является примерно 85-95 децибел .

Так и со звуковыми файлами, только они не слышат, а хранят. Одни файлы хранят звук с уровнем громкости соответствующим норме . Другие же хранят звук с уровнем громкости, отклоняющимся от нормы . Однако уровень громкости исходного звукового сигнала от этого не меняется. Всё определяется только уровнем записи звукового сигнала. А уровень записи в целях не допущения искажений устанавливают таким образом, чтобы звуковой сигнал, подаваемый на вход аналого-цифрового преобразователя (АЦП) был немного ниже своего максимально возможного уровня при максимальных значениях (пиках) громкости. Иначе искажений не избежать и звук приобретает неестественный искажённый характер.. К тому же уровень записи может быть ниже ещё и по самым разным техническим причинам .

Для человека норма чувствительности слуха определяется диапазоном или двумя позициями соответствующими нижнему и верхнему уровню звука - это так называемый динамический диапазон или область слышимости. Одна позиция соответствует самому слабому уровню громкости звука (порогу чувствительности) ещё различимому человеком. Другая позиция соответствует самому сильному уровню громкости звука (болевому порогу) ещё воспринимаемому человеком.

Для звуковых файлов также существует норма, но это норма уровня записи громкости . Определяется она диапазоном или двумя позициями соответствующими нижнему и верхнему уровню записи громкости звука и это также так называемый динамический диапазон . Поскольку компьютер понимает и обрабатывает звук в цифровом виде то и хранит он его в файлах также в цифровом виде. И поэтому диапазон определяют два числа соответствующие верхней и нижней границе динамического диапазона . В зависимости от качества хранимого звука диапазон будет иметь разную ширину.

Говоря в дальнейшем о звуковых файлах мы будем иметь ввиду файлы с расширением .WAV , то есть wav-файлы . Поскольку это именно те файлы, которые используют для записи аудио компакт-дисков .

На аудио компакт-дисках звуковые файлы хранятся с расширением .RAW . При записи на жёсткий диск они при помощи специальной программы риппера или грабера преобразуются в wav-файлы . При записи на аудио компакт-диск звуковые файлы с расширением .WAV преобразуются в файлы с расширением .RAW .

Довольно часто уровень записи громкости звука на аудио компакт-дисках для разных музыкальных композиций оказывается неравным или ниже нормы , что создает неприятное ощущение при переходе от одной музыкальной композиции к другой. Также часто, оказывается неравными и значения по уровню записи громкости звука у двух стереоканалов одной музыкальной композиции. Для устранения этих недостатков необходимо выполнить нормализацию . Которую и придумали для этого.

Если не выполнить нормализацию , то низкий уровень громкости записи звука музыкальной композиции при воспроизведении аудио компакт-диска потребует компенсации в виде большего усиления со стороны звуковоспроизводящей аппаратуры. Что довольно неудобно и ведёт к возникновению совсем не обязательных искажений со стороны звуковоспроизводящей аппаратуры. Которые можно было бы избежать, воспользовавшись неискажающей обработкой звука в виде нормализации.

В качестве возможного инструмента для выполнения нормализации wav-файлов хотелось бы порекомендовать Вам условно-бесплатную (shareware) программу . Эта программа позволяет обрабатывать wav-файлы с обычным 8 и 16-битным цифровым форматом и одним или двумя стереоканалами. Открывая и обрабатывая звуковые wav-файлы программа Sound Normalizer 2.2 создаёт копию оригинального звукового файла, с которым она и работает. Позволяя тем самым в критических ситуациях избежать необратимого изменения оригинального файла. Также одним из достоинств программы является возможность независимой регулировки уровня нормализации звука по каждому каналу. В отличие от других подобных программ Sound Normalizer 2.2 обладает простым и понятным интерфейсом .

Нормализация осуществляется по пиковым или максимальным уровням звука. А это означает, что каждое значение уровня звука подвергнется пропорциональному изменению и тем самым сохранится естественное звучание всей музыкальной композиции.

Однако бывает и так что звук для двух стереоканалов после нормализации по максимальному уровню будет восприниматься как имеющий различные уровни громкости . Это объясняется тем, что восприятие громкости имеет ещё динамическую и частотную составляющие, которые могут настолько сильно отличатся в двух каналах, что вызывают сильный перекос среднего значения уровня громкости для каждого канала. В этом случае можно порекомендовать выполнить методом проб и ошибок ручную регулировку уровня нормализации для каждого канала.

Нормализация аудиосигналов по пикам приводила к значительным различиям в громкости между каналами вещания;

Показания стандартизованного в европейских странах документом EBU Tech Doc 3205-E и обычно использующегося измерителя квазипиковых значений уровня QPPM не отражает громкость сигнала, т.к. это прибор изначально не предназначался для регистрации среднего значения сигнала;

При быстром росте цифрового производства фонограмм и цифровой дистрибуции аудиоконтента нормирование разрешённого максимального уровня аудиосигнала, определённое документом ITU-R BS. 645, не соответствует современным требованиям и изжило себя;

Документом ITU-R BS. 1770 определён международный стандарт измерения громкости аудиопрограмм, вводящий новый параметр аудиосигнала – единицу громкости.

В соответствии с вышеизложенным, Европейский вещательный союз рекомендует при измерениях аудиосигнала пользоваться новой единицей уровня LU (Loudness Unit) и LUFS (единицей громкости относительно полной шкалы). (Наименование “LUFS”, соответствует международной конвенции по терминологии и эквивалентно наименованию LKFS, которое используется ITU-R BS.1770-2).
Рекомендуется для полной характеристики передачи производить измерения по трём основным параметрам:

- Громкости программы (Program Loudness);
- Диапазону громкости (Loudness Range);
- Максимальному мгновенному уровню (Maximum True Peak Level).

Основные правила измерений этих параметров сводятся к следующим пунктам:

За номинальное значение громкости программы документом EBU R 128 рекомендуется принимать уровень равный -23 LUFS, а в случаях, когда точное поддержание номинального уровня недостижимо (например, при живой трансляции), допустимое отклонение от номинального уровня не должно превышать ± 1,0 LU.

Аудиосигнал передачи должен быть, как правило, измерен как единое целое без выделения отдельных специфических фрагментов, таких, как речь, музыка или звуковые эффекты.

Максимально допустимый мгновенный уровень передачи должен быть равен -1 dBTP (децибелы истинного пика).

Все измерения должны производиться измерителями, специфицированными соответствующими документами: ITU-R BS.1770, EBU Tech Doc 3341 и EBU Tech Doc 3342.

*EBU - European Broadcasting Union (Европейский вещательный союз)

Для справки, членами EBU (EBC) в России являются только "Первый канал", "ВГТРК", "Радио Маяк", "Орфей", "Голос России". Какими стандартами пользуются остальные вещательные компании остается только гадать.

Во вложении архив с документами EBU на русском языке, а именно:

EBU Tech 3341 ;
EBU Tech 3342 ;
EBU Tech 3343 ;
EBU Tech 3344 ;
Эссе_625в2 - эссе Анатолия Соколина: "Революция, которая потрясла мир аудио";
R68_2000_EBU - техническая рекомендация EBU R68-2000. Установочный уровень в оборудовании производства цифрового аудио и цифровых аудиорекордерах;
EBU R1771 - требования к приборам, измеряющим громкость и истинный пиковый уровень;
EBU R1770-1 - рекомендация МСЭ-R BS.1770-1. Алгоритмы измерения громкости звуковых программ и истинного пикового уровня звукового сигнала;

Здесь всегда можно получить актуальные оригиналы документов.

Совсем недавно я набрёл на замечательный ресурс независимого звукоинженера Des McKinney . Это просто кладезь полезных статей по современной звукозаписи и сведению! И вот одна из них (вольный перевод by ):

Процесс нормализации часто смущает новичков в цифровой звукозаписи. Откровенно говоря, “нормализация” имеет различные значения, что, естественно, сбивает с толку. Однако новички и специалисты могут быть сбиты с толку мифами и дезинформацией, которых достаточно на эту тему.
Я расскажу о 10 распространённых заблуждений и том, что же происходит на самом деле.

Пиковая Нормализация

Для начала, некоторые пояснения: Так как “нормализация”, может означать несколько вещей (см. ниже), мифы ниже прежде всего относятся к пиковой нормализации.

Пиковая нормализация - это автоматизированный процесс, который изменяет уровень каждого сэмпла в сигнале цифровой звукозаписи равным количеством, таким образом, что самый громкий сэмпл достигает указанного уровня. Обычно, процесс используется для того чтобы сигнал достигал максимума в 0dB - самого громкого уровня, допустимого в цифровом звуке.
Процесс нормализации похож на перемещение ручки громкости или фейдера: весь сигнал изменяется тем же самым «неподвижным» количеством, вверх или вниз. При нормализации, система находит самый громкий пик и по нему уже выстраивает общий уровень.

Некоторые из мифов ниже отражают не что иное, как недопонимание этого процесса, как бывает с распространенными заблуждениями, но тем не менее, некоторые из мифов происходят от более фундаментального недопонимания - в данном случае в звуке, микшировании и цифровой звукозаписи.

Мифы и дезинформация.

Миф #1: После нормализации нескольких треков, они звучат с одинаковой громкостью.

Нормализация нескольких треков к общему уровню гарантирована только при условии, что треки идентичны. Однако, наше восприятие громкости зависит от многих факторов, включая интенсивность звука, длительность и частоту. Пиковый уровень сигнала важен, но он не имеет прямого отношения к полной громкости трека.

Миф #2: Нормализация делает трек настолько громким, насколько это возможно.

Послушайте эти два mp3 файла, каждый нормализован к уровню -3dB:

Когда уровень трека настолько низок, что вы уже не можете использовать регуляторы гейна (Gain) и громкости, чтобы сделать трек достаточно громким. Это указывает на проблему с записью, в идеале вы можете переписать трек с необходимым уровнем… Но когда это не возможно, нормализация может спасти неудачный дубль.

Когда нужно установить пиковый уровень трека без изменения его воспринимаемой громкости. Например, работая с испытательным сигналом, белым шумом и другим немузыкальным контентом. Конечно же, вы можете установить пиковый уровень вручную – прослушивая трек и отмечая пики… но эту работу за вас может сделать функция нормализации.

Миф #9: Нормализация гарантирует, что трек не будет перегружен (clipping).

Одиночный трек, нормализованный к 0dB, не будет перегружаться. Однако, если трек будет обработан или фильтрован с повышением громкости (например, при эквализации) появятся искажения. И если трек - часть микса, который включает другие треки, нормализованные к 0dB, есть гарантия, что сумма всех треков превысит самый громкий пик любого из одиночных. Другими словами, нормализация защищает вас от перегрузки только в самом простом случае.

Миф #10: Нормализация требует дополнительную операцию дизеринга (dither).

Этот последний миф является слегка эзотерическим, но он изредка появляется в сетевых обсуждениях записи. Обычно, в форме заявления: “это хорошо нормализовать в 24 битах, но не в 16 битах, потому что …”, сопровождаемый объяснением, которое передает неправильное понимание цифровой звукозаписи.

Просто скажу: дизеринг применяется при изменении разрядности. (например, преобразование с 24 бит до 16 бит). Нормализация же, работает независимо от битовой глубины, изменяя только уровень каждого сэмпла. Поскольку, никакого изменения разрядности не происходит, дизеринг не требуется.

Другие Определения.

Нормализация может означать несколько других вещей. В контексте мастеринга альбома инженеры часто нормализуют треки альбома одному уровню. Это относится к воспринимаемой громкости и не имеет отношения к пиковому уровню каждого трека.

Некоторые системы (например SoundForge) предлагают «Нормализацию по RMS», действие которой основано на вычислении среднеквадратического уровня громкости. Это приблизительно соответствует воспринимаемой громкости и также не зависит от пикового уровня. Однако, как и с пиковой нормализацией, его применение также требует осмысленного подхода.