BitTorrentTracker PerecTracker.org
BitTorrentTracker PerecTracker.org
    
Регистрация  ·  Вход
 
 · 
Забыли пароль?

  • Обработка и пересжатие звуковых дорожек [инструкция]

    Ответить на тему
     
    Автор Сообщение

    -sasha2006

    Создавать темы 02-Май-2011 14:54

           

    [Цитировать]

    В ПРОЦЕССЕ...
    Для любых операций со звуком надо сначала конвертировать звук в несжатый формат WAV!
    Аудиоредакторы работают только с несжатым звуком.
    ЛЮБЫЕ ОПЕРАЦИИ ПЕРЕСЖАТИЯ ВЕДУТ К ПОНИЖЕНИЮ КАЧЕСТВА ИСХОДНОГО МАТЕРИАЛА!
    СТАРАЙТЕСЬ ИЗБЕГАТЬ ЛИШНИХ ОПЕРАЦИЙ ПЕРЕСЖАТИЯ.

    Описание форматов

    WAV
    Несжатый звук. Именно с ним работают профессиональные аудио редакторы. Никаких потерь качества. Занимает кучу места.
    AC3
    Dolby Digital (AC-3, ATSC A/52) — система пространственного звуковоспроизведения, разработанная фирмой «Dolby Laboratories, Inc.» («Dolby Labs»), руководимой Реем Долби, пионером аудио- и видеопромышленности.
    Формат стандартизирован Advanced Television Systems Committee, ему присвоен код A/52, Dolby Digital (DD) является торговой маркой.
    Современные системы Dolby Digital предоставляют шесть каналов объёмного цифрового звука. Левый, центральный и правый фронтальные каналы позволяют точно определить позицию источника звука на экране. Отдельные «разделённые» левый и правый задние боковые каналы усиливают ощущение присутствия, создавая объём. А дополнительный низкочастотный канал добавляет накал действию на экране.
    В киноиндустрии звуковая дорожка Dolby Digital кодируется оптически прямо на киноленту в промежутках между перфорационными отверстиями. Размещение цифровой звуковой дорожки на том же носителе что и фильм позволяет ей сосуществовать вместе с аналоговой дорожкой без привлечения дополнительных носителей данных, а так же обеспечивает абсолютную синхронность изображения и звука.
    DTS
    DTS — формат звука, созданный Digital Theater System, конкурирующий, но схожий с Dolby Digital. Формат DTS использует меньший уровень сжатия, чем Dolby, так что теоретически он звучит лучше, что доказывают на практике диски, на которых записаны дорожки и в DD, и в DTS. Формат DTS Stereo практически идентичен Dolby Surround. DTS поддерживает как 5.1-канальный, так и 7.1-канальный варианты звука. Также называется DTS Surround Sound.
    DTS в домашних театрах допускает полный битрейт full bitrate (1,536 kbit/s) при этом эксперты отмечают большую прозрачность и естественность звука, чем у AC-3 (Dolby Digital).
    DTS — алгоритм кодирования, изначально предназначенный исключительно для многоканального звука в формате 5.1. В отличие от Dolby Digital, где в потоке некоторые каналы могут отсутствовать вообще, в потоке DTS место для всех шести каналов всегда зарезервировано, и, при отсутствии реальной информации в них, это место просто пропадает. То есть при одинаковом битрейте в DTS запись 4.0 будет того же объема, как и 5.1.
    MP3
    MP3 (более точно, англ. MPEG-1/2/2.5 Layer 3 (но не MPEG-3) — третий формат кодирования звуковой дорожки MPEG) — лицензируемый формат файла для хранения аудио-информации.
    На данный момент MP3 является самым известным и популярным из распространённых форматов цифрового кодирования звуковой информации с потерями. Он широко используется в файлообменных сетях для оценочной передачи музыкальных произведений. Формат может проигрываться практически в любой популярной операционной системе, на практически любом портативном аудио-плеере, а также поддерживается всеми современными моделями музыкальных центров и DVD-плееров.
    В формате MP3 используется алгоритм сжатия с потерями, разработанный для существенного уменьшения размера данных, необходимых для воспроизведения записи и обеспечения качества воспроизведения очень близкого к оригинальному (по мнению большинства слушателей), хотя меломаны говорят об ощутимом различии. При создании MP3 со средним битрейтом 128 кбит/с в результате получается файл, размер которого примерно равен 1/10 от оригинального файла с аудио CD. MP3 файлы могут создаваться с высоким или низким битрейтом, который влияет на качество файла-результата. Принцип сжатия заключается в снижении точности некоторых частей звукового потока, что практически неразличимо для слуха большинства людей. Данный метод называют кодированием восприятия.[1] При этом на первом этапе строится диаграмма звука в виде последовательности коротких промежутков времени, затем на ней удаляется информация не различимая человеческим ухом, а оставшаяся информация сохраняется в компактном виде. Данный подход похож на метод сжатия, используемый при сжатии картинок в формат JPEG.
    AAC
    AAC (англ. Advanced Audio Coding) — собственнический (патентованный) формат аудиофайла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Формат также позволяет сжимать без потери качества исходника (профиль ALAC AAC).
    Также AAC — это широкополосный алгоритм кодирования аудио, который использует два основных принципа кодирования для сильного уменьшения количества данных, требуемых для передачи высококачественного цифрового аудио. Данный формат является одним из наиболее качественных, использующих сжатие с потерями, поддерживаемый большинством современного оборудования, в том числе портативного.

    Редактирование ac3/dts без пересжатия

    Сдвинуть/обрезать

    Для того чтобы сдвинуть/обрезать дорожку или вставить тишины в начале/конце дорожки нужно воспользоваться программой delaycut.
    Резать ac3 и dts без редактирования можно только на величины кратные 32мс для ac3 и 10.(6)мс для dts.
    Программу не рекомендуется применять для DTS являющихся ядром DTS-HD.

    Склеить

    Склеить две и более дорожек можно при помощи командной строки ("Пуск->Выполнить", ввести "cmd", нажать "enter"):Код:
    copy /b "c:\file1.ac3" + "c:\file2.ac3" "c:\result.ac3"
    Склеивать желательно только звук с идентичными параметрами. Иначе можно получить файл, который будет не корректно воспроизводиться. Например, если склеить 2.0 (стерео) с 5.1 звуком, то большинство программ и проигрывателей будут видеть всю дорожку как стерео.
    Если очень нужно такое сделать, то можно 2.0 преобразовать в 5.1 заменив отсутствующие каналы пустотой. В итоге получим идентичный по заголовку фремов файл для склеивания с полноценной дорожкой 5.1

    Распаковка звука в формат WAV

    Надо учитывать, что для дальнейшей обработки аудио редактор может не корректно открывать файлы больше 2 гигабайт. Выражаться это может в том, что продолжительность дорожки будет раза в два длиннее, чем она есть на самом деле. Так же на графике звуковой волны это будет хорошо видно: нормальная первая половина звука, а вторая половина трека как периодическое повторение какой-то звуковой последовательности.

    BeSweet (AC3, VORBIS, MP2, MP3, WAV)

    Для работы нужно скачать связку по отдельности BeSweet и BeLight с сайта (Doom9 со странички "Downloads". BeLight является графической оболочкой для BeSweet и их надо распаковать в одну папку.

    AC3

    Запускаем и по шагам выполняем указанные на скрине операции.
    Все остальные галочки должны быть сняты, чтобы звук не искажался.

    Иллюстрация

    1. Открываем исходный файл.
    2. Указываем куда сохранять результат.
    3. Выбираем вкладку с нужным форматом назначения.
    4. Указываем формат назначения - wav.
      5. Выбираем сколько каналов хотим получить на выходе.
    • 16 Bits 5.1. Wave - единый 16 битный многоканальный файл
    • 16 Bits Stereo Wave - единый 16 битный стерео файл
    • 16 Bits (Six) Mono Waves - шесть 16 битных моно-дорожек, по одной на каждый канал
    • 32 Bits (Six) Mono Waves - шесть 32 битных моно-дорожек, по одной на каждый канал
    6. Запускаем.

    Tranzcode (AC3, WAV, DTS)

    (ссылка на официальном сайте умерла)
    Встроенный декодер DTS искажает спектр сигнала. По этой причине при подготовке раздач лучше использовать декодирование DTS другими программами.
    Программа Tranzcode является консольной, т.е. запускать её нужно через командную строку. Внутри есть описание как пользоваться и какие ключи использовать в командной строке.
    Для ленивых есть вариант Tranzcode 0.40 с графическим интерфейсом.

    Иллюстрация

    Картинку не надо воспринимать буквально, на ней лишь отражены возможности.
    Разумеется, чтобы вытащить все каналы надо либо не указывать ни одной галки, либо все.
    Предыдущая версия Tranzcode 0.30 с графическим интерфейсом также умеет сохранять многоканальный DTS в стерео-WAV.

    Eac3to (DTS, DTS-HD)

    Официальная страничка: Тут.
    Утилита является консольной, но для неё существуют графические оболочки.
    Можно порекомендовать UsEac3to.
    Для декодирования DTS потребуется дополнительный декодер.
    Для DVD-шного DTS Рекомендуется использовать декодер ArcSoft 1.1.0.0 (более поздние версии могут приводить к проблемам).
    Ccылку на данную версию декодера (как и дополнительную информацию по установке и настройке) можно найти тут.Разбираем DTS
    Для начала убедимся в работоспособности программ - выберем режим test и нажмем кнопку RUN (поз. 1).
    Результаты теста появятся в центральном окне - видим работоспособность нужной версии декодера (поз. 2).
    Далее указываем путь к исходной DTS-дорожке (поз. 3).
    Выбираем выходной формат wavs (6 отдельных wav-файлов) и кнопкой Add (поз. 4) добавляем этот параметр.
    Аналогично (поз. 5) добавляем флаг отключения второго прохода.
    Для надежности можно вручную в соответсвующей строке (поз. 6) вбить параметр подключения декодера Арксофт, но это делать не обязательно - этот декодер используется по умолчанию.
    Нажимаем кнопку RUN Command Line (поз. 7).
    Если всё проходит успешно, то видим картину:

    В ценратльном окне (поз. 1) имеем лог успешного завершения операции, который можно сохранить в папке установки UsEac3to при помощи кнопки "Save log" (поз. 2). Папку сохранения лога можно переназначить через меню Settings...
    По поводу декодеров и настроек для других вариантов DTS (с блюрэй дисков, например) следует изучить статью уважаемого TDiTP_.

    FAAD (AAC)

    Для распаковки AAC поможет декодер FAAD. Утилита распространяется в виде исходных кодов, поэтому скомпилированную версию взять можно здесь.
    Далее в коммандной строке, либо в файле с расширением *.bat пишем следующую команду:Код:
    faad.exe input.aac -o output.wav
    Для особо ленивых есть вариант с графическим интерфейсом.

    Иллюстрация

    Устранение рассинхронизации

    Поиск причины

    Для того, чтобы корректно устранить рассинхронизацию нужно точно знать причину рассинхрона. Самый простой способ - определить по видео. В качестве инструмента предлагаю использовать опять же VirtualDubMod. Программа открывает конечно не каждый формат, но победить эту проблему нам поможет AviSynth - многофункциональный фрейм-сервер.
    1. Сравниваются оба видеопотока на предмет присутствия отличий в разных местах по несколько кадров. Поэтому подгонять чисто дорожку можно только в самом крайнем случае. Если есть видео, то подгон чисто дорожки - ересь.
    2. Если различий нет, то все супер. Достаточно определить сдвиг (задержку). Если видео и дорожка принадлежат разным системам строчности , то сначала (перед сдвигом) понадобиться выровнять их скорости воспроизведения, т.е. применить операцию сжатия PAL-NTSC (с коэффициентами либо 25/23.976 либо 23.976/25, других не бывает, 29.970 - это тоже самое что и 23.976). Эти моменты подробно описаны в этой инструкции.
    3. Если таки различия есть, то делаем все то же самое, но придется еще и кромсать дорожку при подгоне согласно временным меткам определенным при сравнении видеопотоков. В итоге может понадобиться либо удалить часть дорожки, либо что то вставить (иногда и тишина сойдет, обычно это соответствующий кусок другой - исходной для видео - дорожки). Так же не забываем что преобразование PAL/NTSC можно применять не обязательно сразу, а делать в самом конце. Например, редактировать PAL дорожку удобнее, т.к. продолжительность кадра там ровно 40мс и все расчеты имеют так же четкие цифры. Устранять несовпадения в видеопотоках у аудиодорожки удобно с конца, чтобы не нужно было постоянно пересчитывать время других подобных мест.

    Преобразование NTSC <-> PAL (прогрессирующая рассинхронизация)

    Если точно известно, что аудиодорожки отличаются лишь скоростью воспроизведения (связанной с различием стандартов PAL и NTSC), то для устранения такого рассинхрона сначала дорожку надо либо растянуть по времени (если эта дорожка от PAL-версии фильма, которую хочется приделать к NTSC), либо ужать (если дорожку от NTSC требуется приделать к изданию PAL).

    Adobe Audition

    1. Открываем исходную дорожку.
    2. Открываем пункт меню "Эффекты -> Время/Тон -> Stretch".

    Иллюстрация

    3. Выставляем коэффициент: (fps конечное / fps начальное) * 100

    Иллюстрация

    В большинстве случаев растягивать звук с сохранением тона не нужно! Т.е. выбираем режим "Resample"!
    В этом случае коэффициент:
    (fps начальное / fps конечное) * 100
    Отличие режимов состоит в следующем:
    Resample - это просто пересчет под новый темп (скорость воспроизведения). Аналогия с видео заключается в простом изменении частоты кадров. Т.е. чем больше/меньше кадров в секунду отображается, тем короче/длиннее становится запись. Т.е. исходный материал не страдает. Но в результате у нас запись ускоряется или замедляется. На звуковую дорожку это оказывает следующее влияние: при ускорении - голоса становятся выше (писклявее), при замедлении - ниже. Т.е. слышимый звук в итоге искажается.
    Stretch - это пересчет под новый темп с учетом сохранения тона. Здесь можно провести аналогию с обычной картинкой. Имеем изображение 130 пикселей в ширину (исходный темп звучания дорожки), нам надо их запихнуть в 120 (темп звучания под новую продолжительность). В результате придется как то решать проблему "как три пикселя засунуть в два" и не исказить при этом общую картинку. В итоге чем качественнее работает алгоритм, тем меньше искажений мы получим в результате.
    4. Нажимаем кнопку "OK".
    5. Сохраняем результат.

    Sound Forge (не рекомендуется, т.к. точность растяжения недостаточна)

    1. Открываем исходную дорожку.
    2. Открываем пункт меню "Process -> Time Stretch".

    Иллюстрация

    3. Выбираем в выпадающем списке "Input format":Time (hr:mn:sc.xxx) - растяжение по конечному времени.
    Percentage - растяжение по коэффициенту (в процентном отношении).4. Выставляем коэффициент: (fps начальное / fps конечное) * 100

    Иллюстрация

    5. Нажимаем кнопку "OK".
    6. Сохраняем результат.
    Для решения поставленной задачи также отлично подходит Sony Vegas - загляните под спойлер "Произвольная синхронизация", идущий чуть ниже.Для NTSC точное значение fps высчитывается как 24 / 1.001.

    Произвольная синхронизация (прогрессирующая рассинхронизация)

    Если в наличие имеются только сами аудио дорожки и точно известно, что соответствующее им видео не отличается по содержанию, то синхронизировать можно визуально по виду звуковой волны.

    Adobe Audition

    1. Открываем обе дорожки.

    Иллюстрация

    2. С помощью колеса прокрутки мышки увеличиваем масштаб и в начале дорожки-образца ищем фрагмент с выделяющимися пиками.

    Иллюстрация

    3. Наводим курсор на этот фрагмент, увеличиваем масштаб так, чтобы видно было форму волны и снова выбираем какой либо выделяющийся фрагмент.

    Иллюстрация

    4. Фиксируем курсор на пике этого фрагмента и записываем время.

    Иллюстрация

    5. Переключаемся на синхронизируемую аудио дорожку двойным кликом мышки по ней.
    6. Находим тот же характерный фрагмент.

    Иллюстрация

    7. Фиксируем время характерного пика фрагмента.

    Иллюстрация

    8. Находим фрагмент с выделяющимимя пиками ближе к концу дорожки-образца.

    Иллюстрация

    9. Фиксируем время характерного пика.

    Иллюстрация

    10. Находим тот же фрагмент на синхронизируемой аудио дорожке.

    Иллюстрация

    11. Фиксируем время характерного пика.

    Иллюстрация

    В результате имеем:
    Дорожка образец: 00:00:28.086 -> 01:29:00.298 (продолжительность - 01:28:32.212 или 5312.212 секунд)
    Синхронизируемая дорожка: 00:00:22.150 -> 01:25:16.899 (продолжительность - 01:24:54.749 или 5094.749 секунд)
    Вычисляем коэффициент сжатия:
    (продолжительность синхронизируемой дорожки / продолжительность дорожки-образца) х 100
    (5094.749 / 5312.212) х 100 = 95.90635
    14. Выставляем коэффициент сжатия и изменяем продолжительность синхронизируемой аудио дорожки.

    Иллюстрация

    15. Сохраняем результат.

    Sound Forge

    1. Открываем обе дорожки и выбираем пункт меню "Window -> Title Horizontally". Оба графика растянутся на всю свободную площадь в равном объеме, что даст возможность удобно с ними работать.

    Иллюстрация

    2. Ищем на одной дорожке ближе к началу какой либо резкий всплеск/пик. При необходимости можно увеличивать масштаб при помощи клавиши-стрелки "вверх" или колеса прокрутки мышки вперед. Такой же пик ищем на второй дорожке.

    Иллюстрация

    3. Ставим курсор на пик и увеличиваем до масштаба, когда четко видна волна. Аналогично увеличиваем масштаб и на второй дорожке. При необходимости в процессе увеличения масштаба корректируем положение курсора.
    4. Выбираем любой четко идентифицируемый пик на обеих дорожках и ставим/фиксируем на них курсор.

    Иллюстрация

    5. Аналогично ищем идентичный пик ближе к концу дорожки.

    Иллюстрация

    6. Увеличиваем масштаб фрагментов и фиксируем значения.

    Иллюстрация

    В результате имеем:
    Дорожка образец (NTSC): 00:01:11.925 -> 02:31:46.816 (продолжительность - 02:30:34.109 или 9034.109 секунд)
    Синхронизируемая дорожка (PAL): 00:01:12.957 -> 02:31:47.922 (продолжительность - 02:30:34.035 или 9034.035 секунд)
    Вычисляем коэффициент сжатия:
    (продолжительность дорожки-образца / продолжительность синхронизируемой дорожки) х 100
    (9094.109 / 9094.035) х 100 = 100.00081 (примером послужили две дорожки, где pal уже была растянута под ntsc)
    7. Выставляем коэффициент сжатия и изменяем продолжительность синхронизируемой аудио дорожки. Чтобы перейти в режим сжатия по коэффициенту (в процентном отношении) нужно в выпадающем списке "Input format" выбрать "Percentage".

    Иллюстрация

    8. Сохраняем результат.

    Vegas (by Mikky72)

    1) В настройках отключаем привязку к кадрам видео:

    2) Отправляемся в Options-Preferences:

    2) Отключаем режим "сохранение тона":

    3) Вычисления удобнее проводить в десятичном масштабе. По этой причине советую изменить временную шкалу. Щелкаем правой кнопкой мышки по шкале времени (я щелкаю слева - там, где показана длительность дорожки) и выбираем масштаб "секунды":

    4) Правой кнопкой мышки щелкаем на одной дорожке. Появится меню. Нам нужны Properties:

    5) Выбираем в середине окна "Classic". Тогда снизу появятся дополнительные поля. Вводим новую длину звука (в секундах, с точностью до тысячных):

    Новая длина определяется по формуле:
    новая = старая * K, где K = 1001*25/24000 при перегоне из PAL в NTSC и K=24000/(1001*25) при перегоне NTSC->PAL.
    В данном примере идет перегон PAL->NTSC, т.е. новая длительность больше старой.
    6) Теперь одна дорожка длиннее остальных. Выделяем щелчками мыши при нажатом Ctrl оставшиеся 5 коротких дорожек и нажимаем клавишу "G" на клавиатуре (они привязываются друг к другу):

    7) Подводим мышку к правому краю любой из этих 5-ти дорожек. Нажимаем и не отпускаем Сtrl. Курсор примет особый вид (квадратик с волной). И тянем вправо аккуратно. Когда 5 дорожек сравняются с первой произойдет "привязка" - появится вертикальная синяя полоса (смотрите - не проскочите).

    Теперь все дорожки приобрели нужную продолжительность.
    P.S. Если нужно разрезать все 6 дорожек одновременно (например, для удаления лишнего куска), то надо их выделить (щелкаем с нажатым Ctrl), поместить вертикальную черту в нужную позицию и нажать "S".

    Сдвиг (постоянная рассинхронизация)

    Adobe Audition

    1. Открываем обе дорожки.

    Иллюстрация

    2. С помощью колеса прокрутки мышки увеличиваем масштаб и в начале дорожки-образца ищем фрагмент с выделяющимися пиками.

    Иллюстрация

    3. Наводим курсор на этот фрагмент, увеличиваем масштаб так, чтобы видно было форму волны и снова выбираем какой либо выделяющийся фрагмент.

    Иллюстрация

    4. Фиксируем курсор на пике этого фрагмента и записываем время.

    Иллюстрация

    5. Переключаемся на синхронизируемую аудио дорожку двойным кликом мышки по ней.
    6. Находим тот же характериный фрагмент.

    Иллюстрация

    7. Фиксируем время характерного пика фрагмента.

    Иллюстрация

    В результате имеем синхронизируемые моменты:
    Дорожка образец: 00:00:28.086
    Синхронизируемая дорожка: 00:00:22.150
    Вычисляем сдвиг:
    дорожка-образец - синхронизируемая дорожка = 00:00:28.086 - 00:00:22.150 = 00:00:05.936

    Sound Forge

    1. Открываем обе дорожки и выбираем пункт меню "Window -> Title Horizontally". Оба графика растянутся на всю свободную площадь в равном объеме, что даст возможность удобно с ними работать.

    Иллюстрация

    2. Ищем на одной дорожке какой либо резкий всплеск/пик. При необходимости можно увеличивать масштаб при помощи клавиши-стрелки "вверх" или колеса прокрутки мышки вперед. Такой же пик ищем на второй дорожке.

    Иллюстрация

    3. Ставим курсор на пик и увеличиваем до масштаба, когда четко видна волна. Аналогично увеличиваем масштаб и на второй дорожке. При необходимости в процессе увеличения масштаба корректируем положение курсора.
    4. Выбираем любой четко идентифицируемый пик на обеих дорожках и ставим/фиксируем на них курсор.

    Иллюстрация

    В результате имеем синхронизируемые моменты:
    Дорожка образец (NTSC): 00:01:11.925
    Синхронизируемая дорожка (PAL): 00:01:12.957
    Вычисляем сдвиг:
    дорожка-образец - синхронизируемая дорожка = 00:01:11.925 - 00:01:12.957 = - 00:00:01.032
    Желательно сделать замеры в начале и конце дорожки (примерно), потому как вряд ли дорожки будут совпадать сэмпл в сэмпл. Тогда высчитываем разницу между сдвигом в начальных точках и сдвигом в конечных точках. Допустим в начале получился сдвиг "- 00:00:01.032", а в конце "- 00:00:01.106", тогда разница между сдвигом конечных точек и сдвигом начальных точек получится "- 0.074". Делим пополам и прибавляем к сдвигу в начальных точек, т.е. "- 00:00:01.032 + (- 0.074 / 2)" и получаем "- 00:00:01.069". Это имеет смысл делать для того чтобы сбалансировать отклонение дорожки, т.е. в начале фильма она будет чуть отставать от видео, а в конце опережать на ту же величину относительно середины фильма. Это всяко лучше, чем синхронизировать по точкам в начале дорожки, а потом наблюдать весь рассинхрон в конце вместо половинного рассинхрона. Можно и чуть проще - определять сдвиг по точкам в середине дорожки, если там найдется подходящая.
    Возможны следующие варианты сдвига:отрезать лишнее
    задать сдвиг при конечной сборке видео с аудиодобавить тишины

    Иллюстрация


    добавить фрагменты соответствующей длины из дорожки-образца (например звук для заставки студии-производителя)
    задать сдвиг при конечной сборке видео с аудио

    Локализация

    Наложение перевода

    Озвучку можно накладывать либо на центральный канал многоканальной дорожки, либо на оба канала стереодорожки.

    Способ попроще

    Sound Forge

    Открываем моно дорожку и дорожку с озвучкой. Чтобы было удобно в меню выбираем "Window -> Tile Horizontally" и обе дорожки встанут друг под другом.

    Иллюстрация

    Теперь надо проверить, чтобы частота дискретизации дорожек была одинаковой. Кликаем правой кнопкой мыши по дорожке.

    Иллюстрация

    В появившемся контекстном меню выбираем "Properties".

    Иллюстрация

    Если частота дискретизации разная, то надо привести частоту дискретизации озвучки к частоте дискретизации дорожки. Вызываем опцию в меню "Process -> Resample"

    Иллюстрация

    Выставляем значение к которому нужно привести частоту дискретизации, ставим "Interpolation Accuracy" в максимальное значение, ставим галку "Apply an anti-alias filter during resample" и жмем "OK". После завершения процесса рекомендую дорожку сохранить в другой файл.
    Теперь находим на дорожке к фильму первую произнесенную фразу. Её же надо найти и на дорожке с озвучкой. Замеряем положение одинаковых пиков этих мест на обоих дорожках. Точность тут не нужна, поскольку понятие идеала в данном случае отсутствует в принципе. Теперь из зафиксированного времени дорожки к фильму вычитаем зафикисированное время дорожки с озвучкой. Добавляем еще ~200 миллисекунд и получаем смещение, которое надо либо отрезать в начале дорожки с озвучкой (результат со знаком минус), либо добавить тишины в начале её же.
    Чтобы отрезать лишнее вызываем опцию из меню "Edit -> Selection -> Set...".

    Иллюстрация

    Иллюстрация

    В поле "Start" ставим ноль, в поле "End" посчитанное значение, жмем "ОК", окно закроется, а нужный кусок выделится. Теперь жмем кнопочку "Delete" на клавиатуре и сохраняем файл.

    Иллюстрация

    Чтобы вставить фрагменты тишины нужно вызвать опцию в меню "Process -> Insert Silence..."

    Иллюстрация

    Иллюстрация

    Здесь указываем посчитанную величину, выбраем позицию вставки "Start of file" и жмем "OK". Сохраняем дорожку.
    А теперь переходим непосредственно к наложению озвучки. Выделяем всю дорожку с озвучкой и вызываем опцию меню "Edit - > Copy". Ставим курсор в начало дорожки от фильма и вызываем опцию меню "Edit -> Paste Special -> Mix...".

    Иллюстрация

    Иллюстрация

    При необходимости можно понизить или повысить громкость озвучки при микшировании. Слева - громкость исходной дорожки, справа - накладываемой. Запускаем процесс. Дальше слушаем что получили и в случае неудовлетворительного результата делаем отмену операции микширования "Edit -> Undo", корректируем сдвиг дорожки с озвучкой (в зависимости от того опережает или запаздывает озвучка относительно дорожки фильма) и уровень громкости, если озвучку плохо слышно или наоборот, слышно слишком горомко.
    Это частный случай рассинхрона. Разница лишь в том, что к синхронизации предъявляются очень строгие условия. Для объемного звука (включая стерео) точность синхронизации между каналами должна быть равна обратной верхней частоте слышимого звука, т.е. порядка 1/20кГц = 0.05 мс. При стандартной частоте выборки в 48 Кгц это 1-2 выборки. Так что использовать сей метод не рекомендуется, потому как синхронизировать дорожки с такой точностью просто не реально. Использовать сей способ можно только при условии, что центральный канал надо лишь сдвинуть. Т.е. исходная дорожка и дорожка-донор от видео в одной системе строчности PAL-PAL или NTSC-NTSC. И то рекомендуется проверить совпадение сэмпл в сэмпл, иначе результат будет кошмарным - неприятный эффект эхо как минимум.
    Заменять центральный канал в нормальной 5.1 дорожке крайне не рекомендуется т.к.Нужно идеально подогнать центральный канал, т.к. будет эхо.
    Нарушается пространственная картина звучания, а к этому ведет даже малейшее несовпадение по громкости с оригинальным центральным каналом. К этому же эффекту ведет и вставка вместо центрального канала микса из каналов стереодорожки, только в этом случае все будет еще хуже, т.к. из центрального канала будут идти все звуки со всех направлений.

    Использование фильтров

    Удаление щелчков

    Sound Forge

    В меню выбираем "Tools -> Audio Restoration"

    Иллюстрация

    Click removal amount - уровень чувствительности фильтра. Чем выше значение, тем более тихие щечки будут удаляться.
    Reduce noise by - уровень подавления шумов. При максимальном значении будет максимальное шумоподавление.
    Affect frequencies above - нижняя граница частот на которые будет действовать шумоподавление, т.е. частоты ниже указанного значения подавляться не будут.
    Attack speed - скорость реакции программы на изменение уровня шума.
    Release speed - скорость реакции программы на изменение уровня шума.
    Noise floor - пороговое значение уровня шума, т.е. все что ниже указанного значения будет восприниматься как шум.
    Нажимаем "ОК" и слушаем результат. Если результат не устраивает, то делаем откат изменений "Edit -> Undo Sony ExpressFX Audio Restoration" и пробуем все заново, но уже изменив параметры. В основном нужно регулировать первые два параметра.

    Удаление шума по шаблону

    Часто при записи звука с аналоговых источников так же записывается и шум.
    В аудио редакторах есть возможность чистить звук по шаблону.

    Adobe Audition

    Открываем дорожку и увеличиваем масштаб так, чтобы четко было видно отрезки с шумом.

    Иллюстрация

    Выделяем кусок с шумом чтобы зафиксировать шаблон для последующей чистки.
    Вызываем диалоговое окно для работы с шумодавом ("Эффекты -> Удаление шума").

    Иллюстрация

    Иллюстрация

    Нажимаем кнопку "Захват профиля" чтобы зафиксировать выделенный фрагмент как шаблон для чистки.

    Иллюстрация

    Дальше это окно можно закрыть и выделить ту часть дорожки, которую нужно очистить от шума.
    Всю дорожку можно выделить не закрывая окно шумодава. Для этого есть кнопка "Выбр. весь файл".
    Основной регулятор степени очистки - это шкала "Уровень удаления шума". Подбирать это значение придется исключительно на слух. Главное не перестараться, чтобы не отфильтровать так же и полезный сигнал и избежать появления металлических звуков. Для оценки своих действий есть кнопка "Просмотр" для прослушивания выделенного фрагмента с начала с учетом действия фильтра. Чтобы применить фильтр жмем кнопку "Ok". Теперь нужно более детально оценить результаты работы фильтра прослушав дорожку в разных местах. Если результат не устравивает, то отменяем измения ("Редактирование -> Отменить Удаление шума") и пробуем снова.

    Sound Forge

    Здесь ничего нет.

    Иллюстрация

    Нижеописанное требуется в случае, если надо подать на вход кодировщика многоканальный звук из отдельных каналов. Например, для сжатия в AAC через MeGUI. Если же надо сжать звук в AC3 или DTS, то правильно это делается по инструкции в следующем разделе "Конвертация из формата WAV".
    Скачиваем последнюю версию фреймсервера AviSynth.
    Скачиваем NicAudio и копируем из архива файл NicAudio.dll в папку "C:\Program Files\AviSynth 2.5\plugins".
    Создаем текстовый файл с расширением "*.avs" и следующим содержимым:Код:
    LoadPlugin("C:\Program Files\AviSynth 2.5\plugins\NicAudio.dll")
    global OPT_AllowFloatAudio=True
    fl = RaWavSource("C:\test-FL.wav")
    fr = RaWavSource("C:\test-FR.wav")
    fc = RaWavSource("C:\test-C.wav")
    lfe = RaWavSource("C:\test-LFE.wav")
    rl = RaWavSource("C:\test-SL.wav")
    rr = RaWavSource("C:\test-SR.wav")
    MergeChannels(fl,fr,fc,lfe,rl,rr).ConvertAudioToFloat()
    Этот файл можно подавать на вход кодировщику, например MeGUI.

    BeHappy

    Скачиваем BeHappy.

    Иллюстрация

    Запускаем BeHappy и выбираем:
    1. Источник. Например мультиканальный *.wav или *.avs скрипт, который может быть полезен в случае, если мультиканальный *.wav превышает размер в 4Gb и источником служит набор моно каналов. Этот способ описан разделом выше - "Сведение моно дорожек в один файл". Хотя BeHappy сам понимает WAV размером более 4Gb.
    2. Сначала тип получаемого файла - "Wav Writer" или "WavSplit @ Mono wav's" (чтобы получить каждый канал в отдельном файле, что удобно когда суммарный результат может превысить размер 2Gb), затем имя получаемого файла.
    3. В списке фильтров выбираем "Downmix".
    4. Под списком фильтров появится кнопка "Configure", которая дает возможность выбрать схему микширования в стерео. Через знак дефис будет указан режим работы фильтра.

    Иллюстрация

    Stereo - микширование в стерео.
    DPL I - микширование в стерео по схеме Pro Logic (получаем псевдо 3.1, т.к. при воспроизведении из стерео выделяются центральный и тыловой каналы).
    DPL II - микширование в стерео по схеме Pro Logic II (получаем псевдо 5.0 (3/1), т.к. при воспроизведении из стерео выделяются центральный, тыловой стерео и LFE каналы).
    DPL II (LFE) - микширование в стерео по схеме Pro Logic II с учетом низкочастотного канала LFE (получаем псевдо 5.1 (3/2), т.к. при воспроизведении из стерео выделяются центральный, тыловой стерео и LFE каналы).5. Нажимаем кнопку "Enqueue" и добавляем задачу в очередь.
    6. Программа автоматически переходит на вкладку "Queue".

    Иллюстрация

    1. Видим нашу задачу в очереди.
    2. Запускаем процесс обработки кнопкой "Start".

    Иллюстрация

    Начнется процесс микширования в стерео по указанной схеме.
    Дополнение №1: Если все же хочется на вход подать сразу AC3, то нужно скачать вот это и положить в папку "plugins" фреймсервера AviSynth.
    Дополнение №2: Для уменьшения объема результирующего файла можно понизить разрядность с выдаваемых по умолчанию 32bit float до 24bit int путем активирования в разделе "Digital Signal Procesing" опции "Convert Sample To...". После чего станет доступна настройка фильтра (кнопка "Configure"), где можно выбрать желаемую разрядность. Главное не нарушать порядок использования фильтров. Изменение разрядности должно идти после микширования в стерео. Т.е. так как фильтры стоят по-умолчанию.

    Иллюстрация

    Конвертация из формата WAV (сжатие в другие форматы)

    AC3

    Для качественного сжатия в AC3 следует использовать только официальные кодировщики от Dolby, которые описаны ниже. Всякие поделки вроде aften, кодировщика ac3 в ffmpeg и прочих - это "вариации на тему". Их авторам никто не давал точные алгоритмы сжатия. Поэтому результат будет заведомо ниже качеством.

    Теория

    Для получения качественного результата при перекодировке многоканальной AC3 надо выполнить следующие настройки:
    1. Снять галки опций: "Input filtering", "90-degree phase shift", "3 db attenuation".

    Пояснения

    Эти опции нужно включать только в случае, если исходник является дорожкой собственного производства. При пересжатии звука AC3 эти опции уже применялись при изначальном сжатии и применять их еще раз не нужно. Исключение составляет случай когда исходником является дорожка любого другого формата (например, DTS, DTS-HD MA или TrueHD). В этом случае можно (т.е. не обязательно) задействовать опцию "90-degree phase shift" для поддержки формата Dolby ProLogic, если для прослушивания планируется использовать стереосистему. Т.е. эту опцию следует использовать в очень редких случаях (например, при создании липовых дорожек 5.1 из 2.0 когда тыловые каналы получены из фронтальных), в остальных же стоит её отключать.

    Input filtering (предобработка)

    Digital deemphasis: фильтр цифровых предыскажений.
    DC high-pass filter: убирает смещение волны относительно среднего уровня.
    Bandwidth low-pass filter: убирает высокие частоты, выходящие за пределы частотного диапазона закодированного сигнала.
    LFE low-pass filter: удаляет все частоты выше 120 Гц из низкочастотного канала

    Surround channel processing (обработка тыловых каналов)

    90 degree phase shift: 90-градусный сдвиг фазы левого и правого тыловых каналов для качественного даунмикса в формат Dolby ProLogic при прослушивании звука через стерео систему.
    3 db attenuation: ослабление на 3 дБ уровеня тыловых каналов для лучшей совместимости с домашними декодерами Dolby Digital.
    2. Снять галку "RF overmodulation protection".

    Пояснения

    Опция определяет, использовать ли цифровой фильтр в алгоритме защиты звукового канала от перегрузки по уровню. Т.е. предназначена для гашения каких либо всплесков.
    3. Выставить "Dinamic range compression" в "Film: Standart"

    Пояснения

    Компрессия динамического диапазона, характеристика компрессии звука для оптимального воспроизведения конечного материала.
    4. Выставить "Dialog normalization", "Mix level", "Center mix level", "Surround mix level", "Room type" в соответствии с параметрами исходной дорожки.

    Пояснения

    Эти параметры являются по сути метаданными, т.е. никак не влияют на кодировку (пишутся в дополнение к кодированному звуку - как "ц.у." для плеера). Поэтому и на распаковку никак повлиять не могут - если в распаковщике все улучшизмы отключены. Но для нормального звучания на бытовом плеере это важные вещи - самая сердцевина философии Dolby в отношении AC3.
    Dialog normalization: определяет уровень громкости центрального канала.
    Center mix level: определяет уровень центрального канала относительно левого и правого при микшировании этих трех каналов в два в системах, не имеющих центрального канала.
    Surround mix level: определяет уровень громкости тыловых каналов относительно левого и правого при микшировании в системах, не имеющих тыловых динамиков.
    Copyright bit: при желании можно задать защиту от копирования.
    Original bit stream: определяет, является ли закодированный файл оригинальным или копией.
    Mix level: параметр говорит об уровне звукового давления при финальном микшировании.
    Room type: параметр говорит о типе помещения, в котором это микширование происходило.
    Эти данные можно посмотреть в Sonic Foundry Soft Encode: пункт меню "File -> Verify File".

    Иллюстрация

    5. Выставить битрейт в поле "Data rate"

    Пояснения

    Стандартом является 448 kbps.
    6. Отметка в поле "Save frames in Intel byte order" определяет, в каком формате будут сохранены файлы - Motorola или Intel. Стандартом является формат от Motorola, поэтому ставить галку не надо.

    Sonic Foundry Soft Encode (1.0 / 2.0 / 3.0 / 2.1 / 3.1 / 2.2 / 3.2)

    1. Открываем все моно-дорожки.
    2. Выставляем их положение звучания.

    Иллюстрация (5.1)

    3. Выставляем необходимые настройки в пункте меню "Options -> Encode Settings...".

    Иллюстрация (5.1)

    Настройки должны быть такими как указано ниже.
    Выделенные настройки либо оставляем как они стоят по умолчанию, либо как у исходной дорожки.


    Опции

    - DC high-pass filter
    - Bandwidth low-pass filter
    - LFE low-pass filter

    надо оставлять включенными всегда, т.к. при перекодировании дорожки AC3 они ничем помешать не могут, а в остальных случаях необходимы.
    Опцию

    - 90-degree phase shift

    нужно отключать практически всегда. Особенно в случае, если исходником является звук формата AC3 (т.к. при изначальном сжатии эта опция уже применялась) и можно (т.е. не обязательно) включать для чуть более улучшенной поддержки воспроизведения на стереосистеме, если исходник является дорожкой собственного производства (например, при создании липовых дорожек 5.1 из 2.0 когда тыловые каналы получены из фронтальных) или же любого другого формата (например, DTS, DTS-HD MA или TrueHD).... но в этих случаях лучше не включать.
    4. Сохраняем результат через пукнт меню "File -> Encode...".

    Sonic Audio Transcoder (1+1 / 1.0 / 2.0 / 3.0 / 2.1 / 3.1 / 2.2 / 3.2)

    Этот конвертер идет вместе с Sonic Scenarist Pro.
    У него есть один существенный недостаток - не берет звук с битностью более 16, что не соответствует стандарту AC3. Поэтому его использование запрещено для изготовления раздач на форуме.

    Иллюстрация (5.1)


    Настройки "Advanced" должны быть такими как указано ниже.
    Выделенные настройки либо оставляем как они стоят по умолчанию, либо как у исходной дорожки.

    Опции

    - DC high-pass filter
    - Bandwidth low-pass filter
    - LFE low-pass filter

    надо оставлять включенными всегда, т.к. при перекодировании дорожки AC3 они ничем помешать не могут, а в остальных случаях необходимы.
    Опцию

    - 90-degree phase shift

    нужно отключать практически всегда. Особенно в случае, если исходником является звук формата AC3 (т.к. при изначальном сжатии эта опция уже применялась) и можно (т.е. не обязательно) включать для чуть более улучшенной поддержки воспроизведения на стереосистеме, если исходник является дорожкой собственного производства (например, при создании липовых дорожек 5.1 из 2.0 когда тыловые каналы получены из фронтальных) или же любого другого формата (например, DTS, DTS-HD MA или TrueHD).... но в этих случаях лучше не включать.
    1. Выставляем "Audio coding mode" и активируем при необходимости "Low frequency effects".
    2. Загружаем дорожки соответственно их положению звучания.
    3. Выставляем "Audio bit rate".
    4. Указываем имя выходного файла в "Save encoded file to".
    5. Жмем "Start".

    Sony Vegas (2.0 / 3.2)

    1. Создаем проект с многоканальным звуком. Пункт меню "File -> New".

    Иллюстрация (5.1)

    2. Загружаем дорожки и выставляем их положение звучания.

    Иллюстрация (5.1)

    Внимание! По умолчанию все динамики в панораме звучания каналов включены (они подсвечены голубым), а надо оставить всего лишь один, т.е надо отлючить все кроме обведенного кружочком. Иначе звук размажется по всем активным (подсвеченным) динамикам. Центральную оранжевую точку в данном случае двигать никуда не надо.
    3. В меню "File -> Render As" выбираем вариант Ac3 Pro , выставляем необходимые настройки и битрейт, сохраняем результат.

    Иллюстрация (5.1)

    Настройки должны быть такими как указано ниже.
    Выделенные настройки либо оставляем как они стоят по умолчанию, либо как у исходной дорожки.



    Опции

    - DC high-pass filter
    - Bandwidth low-pass filter
    - LFE low-pass filter

    надо оставлять включенными всегда, т.к. при перекодировании дорожки AC3 они ничем помешать не могут, а в остальных случаях необходимы.
    Опцию

    - 90-degree phase shift

    нужно отключать практически всегда. Особенно в случае, если исходником является звук формата AC3 (т.к. при изначальном сжатии эта опция уже применялась) и можно (т.е. не обязательно) включать для чуть более улучшенной поддержки воспроизведения на стереосистеме, если исходник является дорожкой собственного производства (например, при создании липовых дорожек 5.1 из 2.0 когда тыловые каналы получены из фронтальных) или же любого другого формата (например, DTS, DTS-HD MA или TrueHD).... но в этих случаях лучше не включать.

    DTS

    Minnetonka SurCode

    Пожалуй, это единственный из доступных кодеров в DTS.

    Иллюстрация

    1. Загружаем моно треки соответственно их положению звучания.
    2. Указываем куда сохранять результат.По умолчанию при любом выборе битрейта программа кодирует с битрейтом 1536kbps. Если хотим получить результат с битрейтом 768kbps, то при сохранении надо выбрать тип файла "DTS Compact (*.cpt)". Потом достаточно просто переименовать файл и сменить расширение на "*.dts".
    3. Переходим в меню "Options -> Encoder Options...".

    Иллюстрация

    4. Выставляем битрейт.
    5. Выставляем частоту дискретизации
    6. Жмем "Encode".
    NeroAAC - бесплатный и качественный кодировщик от компании Nero.
    Устанавливаем MeGUI. Из архива NeroAACCodec\win32" копируем neroAacEnc.exe в папку MeGUI.

    Иллюстрация

    Запускаем MeGUI и выбираем:
    1. Источник. Например мультиканальный *.wav или *.avs скрипт, который может быть полезен в случае, если мультиканальный *.wav превышает размер в 4Гб и источником служит набор моно каналов. Этот способ описан разделом выше - "Сведение моно дорожек в один файл".
    2. Имя получаемого файла.
    3. Кодировщик и его настройки. Выбираем шаблон "Nero AAC: *scratchpad*".

    Иллюстрация

    1. Лучше оставить как показано на скрине. Таким образом будут сохранены исходные параметры аудиодорожки - количество каналов и частота дискретизации. При желании можно поменять значение "Output Channels":Keep Original Channels - сохранение каналов источника.
    Downmix multichannel to Stereo - микширование в стерео.
    Downmix multichannel to Dolby Pro Logic - микширование в стерео по схеме Pro Logic (получаем псевдо 4.0 (3/1), т.к. при воспроизведении из стерео выделяются центральный и тыловой каналы).
    Downmix multichannel to Dolby Pro Logic II - микширование в стерео по схеме Pro Logic II (получаем псевдо 5.0 (3/2), т.к. при воспроизведении из стерео выделяются центральный и тыловой стерео каналы).
    Convert to mono - микширование в один моно канал.2. Снимаем галку с "Normalize Peaks to", если нет необходимости нормализовать громкость звука.
    3. Выбираем профиль сжатия "AAC-LC" как наиболее качественный.
    4. Выбираем пункт "Variable Bitrate" и выставляем желаемое качество (от 0 до 1). Обычно хватает 0.4-0.5. Так же можно задать желаемый битрейт выбрав опции "Adaptive Bitrate" или "Constant Bitrate".
    5. Завершаем установку настроек кнопкой "OK".4. Контейнер, в который будет упакован звук. Выбираем "MP4-AAC".
    5. При необходимости можно сдвинуть дорожку указав нужное значение сдвига в поле "Delay" в миллисекундах. Положительное значение - задержка звука. Отрицательное значение - опережение звука.
    6. Нажимаем кнопку "Enqueue" чтобы поставить задачу сжатия в очередь.
    7. Переходим на вкладку с очередью заданий.

    Иллюстрация

    1. Видим нашу задачу в очереди.
    2. Запускаем процесс сжатия кнопкой "Start".

    Иллюстрация

    Должно появиться окно отображения процесса сжатия. По окончании процесса получим звук в формате AAC-LC в контейнере MP4-AAC.
    Если ничего не происходит, а в поле "Status" отображается значение "error", то надо перейти на вкладку "Log", развернуть последнюю ветку "Error starting job". Там будет строка "Exсeption message", в которой описывается причина ошибки. В данном случае - отсутствие файла кодировщика в папке MeGUI.

    Иллюстрация



    _________________

    ░▒▓█▀▄▀▄▀▄█▓▒░
    [Профиль] [ЛС]
    Показать сообщения:    
    Ответить на тему

    Текущее время: Сегодня, в 14:29

    Часовой пояс: GMT + 2



    Вы не можете начинать темы
    Вы не можете отвечать на сообщения
    Вы не можете редактировать свои сообщения
    Вы не можете удалять свои сообщения
    Вы не можете голосовать в опросах
    Вы не можете прикреплять файлы к сообщениям
    Вы не можете скачивать файлы