Аналоговый сигнал является непрерывным, любое моментальное значение может оказаться и дробным, поэтому оно округляется до ближайшего целого. Точность измерения или грубость округления зависит от того, какая задана разрядность (bit depth, буквально – глубина битов). Если оцифровка производится с разрядностью 8 бит, то доступно всего 28 = 256 различных значений уровня, а при разрядности 16 бит число может принимать уже одно из 28 = 65 536 значений. Чем выше разрядность, тем ближе оказываются округленные значения к реальным, физическим значениям. В конечной частоте дискретизации и округлении полученных значений уровня сигнала кроется причина неизбежной потери информации и возникновения искажений при оцифровке.
Оба взаимосвязанных действия – дискретизацию и квантование – выполняет микропроцессор звуковой карты, точнее, его часть, являющаяся аналого-цифровым преобразователем (АЦП). Возможности звуковой карты выражаются максимальными значениями частоты дискретизации и разрядности и зависят от ее класса. Встроенные в материнскую плату или распространенные недорогие звуковые карты способны оцифровывать сигнал с частотой дискретизации до 48 кГц и разрядностью 8 или 16 бит. Дорогие полупрофессиональные или профессиональные карты поддерживают частоту дискретизации до 192 кГц и разрядность 24, 32, вплоть до 64 бит.
Перед записью или оцифровкой сигнала звуковая карта настраивается через свой драйвер, а пользовательский интерфейс для настройки предоставляет операционная система (так задаются настройки по умолчанию) или та программа, с помощью которой управляют записью. В частности, при создании нового файла Sound Forge каждый раз запрашивает частоту дискретизации и разрядность. Следует учитывать, что при оцифровке звукового сигнала нельзя «перепрыгнуть» действительные аппаратные возможности звуковой карты пользовательского компьютера.
Таким образом, аналоговый сигнал превращается в последовательность чисел, которая является почти готовым файлом. Файл формата WAVE (несжатый звуковой поток), помимо такой последовательности, содержит также сведения о том, с какой частотой и разрядностью оцифровывался сигнал, и некоторую другую служебную информацию. Легко рассчитать, какой объем информации занимают данные о звуке. Если, например, в секунду производилось 44 000 замеров уровня сигнала, а каждый замер занимает 16 бит, то для хранения одной секунды фонограммы нужно 44000 × 16 = 704 000 бит, то есть примерно 690 Кбит, или 86 Кбайт.
Примечание
1 байт = 8 бит, 1 Кбит = 1024 бит, а 1 Кбайт = 1024 байт. Эти соотношения позволят сориентироваться в приводимых числах: объем данных принято измерять в байтах, а скорость передачи данных выражают и в битах в секунду, и в байтах в секунду.
Вся обработка и преобразования оцифрованного звука сводятся к математическим действиям над этими потоковыми данными. Иногда формулы преобразования бывают очень сложны, но программы, подобные рассматриваемой в этой книге, позволяют задавать параметры обработки простым и наглядным образом.
Сжатие звука
Формат WAVE достаточно точно сохраняет данные исходного аналогового сигнала, но является очень расточительным в отношении объема, занимаемого информацией. Тем не менее этот формат предпочтителен для первоначальной записи звуковых данных, которые впоследствии нужно будет обрабатывать. На практике обычно прибегают к сжатию звукового потока, которое почти всегда сопряжено с потерей части информации, а иногда и с появлением дополнительных искажений.
Не вдаваясь в подробности алгоритмов сжатия, скажем, что в основе их лежит обман слуха, связанный с особенностями субъективного восприятия звука человеком. Психоакустическая модель позволяет упростить оригинальный сигнал так, чтобы объем данных уменьшился существенно, а качество звучания оставалось на приемлемом для большинства слушателей уровне. В частности, применяется удаление из сигнала наименее заметных частотных составляющих, искусственное сужение динамического диапазона и другие хитрые приемы.
Среди алгоритмов сжатия широко известны MPEG-1 Layer I, II, III (последний также называют MP3), MPEG-2 AAC (Advanced Audio Coding), Ogg Vorbis, Windows Media Audio (WMA). Сжатие оцифрованного звука по этим методам позволяет уменьшить объем данных в десять и более раз. Применительно к сжатому звуку, помимо частоты дискретизации и разрядности, используют третье понятие – битрейт – объем данных, соответствующий одной секунде звучания и измеряющийся в килобитах в секунду (Кбит/с, kilobits per second). При прочих равных параметрах, чем ниже битрейт, тем больше степень сжатия и, соответственно, ниже качество.
На практике нужно стараться по возможности обрабатывать звуковые данные в несжатом виде, а сжимать их уже на завершающем этапе. Каждая последующая перекодировка неизбежно только ухудшает качество: сжатие – процесс односторонний и необратимый. Точно так же ресэмплинг (от англ. resampling – изменение частоты дискретизации оцифрованных аудиоданных) не способен восстановить в сигнале изначально отсутствующие в нем данные!
Синтез звука и формат MIDI
До настоящего момента речь шла об оцифровке и обработке реального звука, получаемого и записываемого с различных источников. Существует и совершенно иная задача – создание (синтез) звука на компьютере. Синтезатор – это набор управляемых генераторов, способный выдавать звуки с заданными характеристиками по командам исполнителя-музыканта.
Известно всего два метода синтеза звука: FM (Frequency modulation – частотная модуляция) и WT (Wave Table – таблично-волновой). В основе FM-синтеза лежит идея, что любое колебание является суммой простейших синусоид. Таким образом, можно наложить друг на друга сигналы от конечного числа генераторов синусоид и путем манипуляций с их частотами и амплитудами извлечь звуки, похожие на настоящие, полученные физическими методами.
Таблично-волновой WT-синтез основан на преобразовании заранее записанных (оцифрованных) образцов звуков реальных музыкальных инструментов. Эти образцы (сэмплы) хранятся в постоянной памяти синтезатора и составляют таблицу (sample table), из которой выбираются нужные звуки.
Синоним слова «синтезатор» – секвенсор (от англ. sequence – последовательность). Музыкальный синтезатор – это устройство, работающее с последовательностью команд или описаний. Нередко синтезаторы выполняются в виде самостоятельных электронных устройств, снабженных собственной клавиатурой и интерфейсами вывода звука, и являются полноценными музыкальными инструментами. Роль синтезатора может играть и обычный персональный компьютер, в котором синтезатор представлен двумя способами.
• Аппаратный синтезатор является частью звуковой карты. Действия выполняет собственный микропроцессор звуковой карты, с его же помощью звук выводится в виде цифровой последовательности или WAVE-файла.
• Программный синтезатор – программа, способная эмулировать работу аппаратного синтезатора. Она выполняется центральным процессором компьютера. Первоначально звук выводится в цифровую последовательность (WAVE-файл). Примеры программных синтезаторов – виртуальные устройства, входящие в состав операционной системы Microsoft Windows: Microsoft MIDI Mapper и Microsoft Wavetable Synth.
В обоих случаях синтезатор получает от управляющего устройства или программы последовательность команд, а выдает оцифрованный звук – последовательность мгновенных значений сигнала, сгенерированного им самим. Команды или данные, передаваемые любому синтезатору, описываются спецификацией MIDI (Musical Instrument Digital Interface – цифровой интерфейс музыкальных инструментов). Эта спецификация, или стандарт, включает в себя и требования к аппаратным средствам, например кабелям и разъемам, и договоренности о способах кодирования данных. Для нас существенно последнее. Устройство управления, например подключенная к компьютеру внешняя MIDI-клавиатура, или программа, например Sound Forge, отправляет синтезатору команды MIDI.
MIDI-последовательность очень похожа на партитуру или нотную запись вообще – это последовательность команд: какую ноту взять, на каком инструменте, какова продолжительность и тональность ее звучания и т. д. Знакомые многим MIDI-файлы (MID) – не что иное, как последовательность таких команд, записанных в виде файла.
Звучать один и тот же MIDI-файл может на разных синтезаторах по-разному, точно так же, как отличается исполнение одних и тех же нот разными музыкантами: все зависит от умения исполнителя и качества инструмента, на котором он играет. Работа с MIDI не является прямой задачей Sound Forge: основное назначение этой программы – обработка оцифрованного звука. Для создания композиций с использованием звукового синтеза специально предназначены такие приложения, как Cubase, Logic Audio или Cakewalk. Программа Sound Forge располагает базовыми возможностями управления MIDI-синтезатором и в основном может быть полезна при создании и редактировании сэмплов для синтезатора.
Воспроизведение звука на компьютере
Воспроизведение цифрового звука – процесс, обратный оцифровке. Устройство, входящее в состав звуковой карты компьютера, – цифроаналоговый преобразователь (ЦАП) получает от программы-проигрывателя последовательность записей моментального уровня сигнала и выдает на выходе последовательность электрических импульсов соответствующей величины. Данный процесс также иллюстрирует рис. 1.5, но теперь из отдельных дискретных величин строится непрерывный аналоговый сигнал. Строго говоря, сначала сигнал, выдаваемый ЦАП, обладает выраженными «ступеньками». Благодаря устройству выходных каскадов звуковой карты и инерционности динамиков эта неравномерность сигнала сглаживается и приближается по форме к тому сигналу, который ранее оцифровывался. Таким образом, из цифрового образа достаточно точно восстанавливается исходный аналоговый звук.
Как правило, для хранения цифровой звук дополнительно сжимается, поэтому при воспроизведении сжатый файл предварительно декомпрессируется. Это происходит совершенно незаметно для пользователя – достаточно, чтобы в системе были установлены соответствующие программные компоненты – кодеки. Слово «кодек» – сокращение от «кодер – декодер», так как обычно и программа кодирования, и программа декодирования устанавливаются вместе. Среди наиболее популярных кодеков можно назвать MP3, Lime, AAC, Ogg Vorbis, Windows Media Audio.
При открытии и редактировании файлов, записанных в одном из сжатых форматов, программой Sound Forge данные также предварительно декодируются (декомпрессируются) в формат WAVE: программа работает именно с несжатыми данными. При окончательном сохранении файла данные снова компрессируются в тот же сжатый формат, и этот процесс также бывает полностью скрыт от пользователя.
Схема на рис. 1.6 поясняет последовательность преобразований данных при оцифровке аналогового сигнала и сохранения данных в одном из сжатых форматов и наоборот. Отметим, что компрессия и декомпрессия происходят программно, а за оцифровку и воспроизведение отвечают аппаратные компоненты звуковой карты.
Рис. 1.6. Преобразование звука в компьютере
Из представленной схемы также видно, что последовательности MIDI обрабатываются «в стороне» от основного потока, и в большинстве случаев возможен лишь вывод синтезированного звука на выход звуковой карты. Лишь некоторые достаточно дорогие звуковые карты способны перенаправлять синтезированный звук и захватывать его без дополнительных ухищрений, к которым относятся соединение выхода и входа звуковой карты или установка виртуального устройства – перенаправителя.
Требования к системе
Sound Forge 9.0 – довольно ресурсоемкое приложение. Процесс обработки звука, особенно нелинейные преобразования, серьезно нагружает центральный процессор, и от его производительности напрямую зависит скорость работы программы. Обрабатываемые данные находятся в оперативной памяти. Чем больше размер фрагмента обрабатываемых данных, который может в каждый момент времени находиться в физической оперативной памяти, тем реже компьютер обращается к файлу подкачки (виртуальной памяти). Это, опять же, способствует реальному быстродействию.
Аппаратные требования
Минимальные системные требования приводятся в официальной документации к программе, но это действительно минимальные требования. Очевидно, что чем выше быстродействие всех компонентов машины, тем быстрее работают на ней любые приложения, в том числе и рассматриваемая программа. Аппаратные требования, предъявляемые к компьютеру и желательные для комфортной работы, следующие.
• Центральный процессор с частотой не менее 800 МГц. Для комфортной работы желателен компьютер на современном процессоре с частотой 2,4–3 ГГц, а лучшие результаты достигаются при использовании двухядерных процессоров.
• 256 Мбайт оперативной памяти. Это даже меньше, чем минимальные системные требования для установки операционной системы Windows Vista. Типичный объем оперативной памяти современного компьютера составляет от 1 до 2 Гбайт, на такой объем и желательно ориентироваться.
• Звуковая карта. При работе с готовыми записями для прослушивания обрабатываемого звука подойдет практически любая звуковая карта, поддерживаемая операционной системой. Если планируется записывать звук с аналогового источника, например линейного или микрофонного входа, то от звуковой карты зависит, с какой максимальной частотой дискретизации и разрядностью удастся оцифровать сигнал. Если нужно использовать функции MIDI, то желательна звуковая карта с полноценным аппаратным синтезатором.
• Записывающий привод лазерных перезаписываемых CD и DVD потребуется для записи звуковых дорожек на компакт-диски.
• На винчестере для установки программы нужно около 150 Мбайт. При работе приложение создает временные файлы, объем которых зависит от выполняемых задач и может доходить до нескольких гигабайт. Записываются временные файлы в папку TEMP, расположенную на системном диске (обычно это диск C:). Целесообразно убедиться, что на этом диске достаточно свободного места.
Программная конфигурация
Для полноценной работы программы Sound Forge 9.0 желательно иметь следующую программную конфигурацию.
• Операционная система Microsoft Windows 2000 SP4, XP или Windows Vista. Версия Sound Forge, рассматриваемая в этой книге, официально сертифицирована на совместимость с операционной системой (ОС) Windows Vista.
• Для корректной работы со звуковой картой рекомендуется установить последние версии драйверов изготовителя этого устройства.
• Microsoft DirectX 9.0c или более поздней версии. По умолчанию этот компонент указанной версии уже присутствует в операционных системах, начиная с Microsoft Windows XP SP2. Может потребоваться обновление DirectX, если на компьютере установлена одна из более ранних версий ОС Windows.
• Microsoft .NET Framework 2.0 или 3.0 – компонент, требующийся для установки и работы многих современных приложений. Дистрибутив этой платформы доступен на оригинальном установочном диске ОС Windows в папке DOTNETFX, а также на установочном диске «коробочной» версии программы Sound Forge.
• Обозреватель Internet Explorer 5.1 или более поздней версии нужен для работы справочной системы программы. По умолчанию он уже установлен в ОС Windows.
Установка программы
Установка Sound Forge требует минимального вмешательства пользователя – все происходит автоматически. Какого-либо выбора компонентов в процессе установки не предусмотрено. Дистрибутив программы может быть приобретен на компакт-диске («коробочная» версия) или загружен с сайта http://www.sonycreativesoftware.com/products/soundforgefamily.asp в виде самораспаковывающегося архива soundforge90x_enu.exe.
Чтобы установить программу с компакт-диска («коробочной» версии), нужно вставить диск в дисковод. Появится окно автозапуска установки, в котором следует выбрать пункт Install Sound Forge 9 (Установить программу Sound Forge 9) и далее следовать указаниям программы установки.
Если функция автозапуска компакт-дисков на компьютере отключена, то нужно открыть компакт-диск в Проводнике Windows и запустить файл Setup.exe, находящийся на этом диске. Будет задействована та же программа установки.
При установке из дистрибутива – самораспаковывающегося архива – следует дважды щелкнуть кнопкой мыши на файле дистрибутива. Сначала файлы, необходимые для установки программы, будут извлечены в папку на винчестере, а затем установка продолжится автоматически.
В ходе установки будет предложено ознакомиться с лицензионным соглашением и выбрать папку для установки программы. По умолчанию предлагается установить программу и ее плагины в папку C:\Program Files\ (рис. 1.7). С этим желательно согласиться и следовать указаниям программы установки, каждый раз нажимая кнопку Next (Далее).
Рис. 1.7. Выбор папки для установки программы и плагинов
Работа со справочной системой
Справочная система программы Sound Forge (на английском языке) содержит все необходимые сведения для работы с ней. Для вызова справки нужно нажать клавишу F1 или выполнить в главном окне программы команду Help → Contents and Index (Помощь → Содержание и указатель). Откроется окно помощи, устроенное по общим принципам, принятым в приложениях операционной системы Windows (рис. 1.8).
Рис. 1.8. Окно помощи программы Sound Forge
В левой части данного окна находится древовидная структура оглавления. Щелчок кнопкой мыши на любом из пунктов оглавления открывает в правой части окна справку по данной теме. Некоторые разделы в правой части окна программы при открытии справки свернуты, на что указывает значок
стоящий в начале строки. Чтобы развернуть и полностью просмотреть такой раздел, нужно щелкнуть на этом значке.