Управление звуковой картой компьютера

ВВЕДЕНИЕ

Взаимодействие человека с ЭВМ должно быть прежде всего взаимным ( на то
оно и общение ). Взаимность, в свою очередь, предуcматривает
возможность общения как человека с ЭВМ, так и ЭВМ с человеком. Сама
схема взаимодействия крайне проста :

+——–+ +——–+

¦ ¦ +——————–+ ¦ C ¦

¦ H +—-+ input devices +—> O ¦

¦ U ¦ +——————–+ ¦ M ¦

¦ M ¦ ¦ P ¦

¦ A
¦††???????????†?†?††??†?†????†???????†???†?††??†††?††???????????†?†?††??
†††?††††††††††††††?†?††??????††††††††††††††??????

где

HUMAN – человек;

COMPUTER – компьтер;

input devices – устройства, с помощью которых ЭВМ получает

информацию от человека;

output devices – устройства, с помощью которых ЭВМ передает

информацию человеку.

Обычно, при традиционном подходе input devices = keborad & mouse, а
output devices = monitor & printer. В ряде случаев возможно добавление
других устройств, таких как сканеры, дигитайзеры, плоттеры, графические
планшеты, но при всем своем разнообразии до последнего времени все
output devices были спроектированы для использования в качестве
информационного канала зрительную систему человека. Другим чувствам
отводилась в лучшем случае роль

сигнализаторов ( принтер пищал, когда кончалась бумага, а блок
питания неприятно пах, когда горел ). Конечно, более 90% информации из
окружающей среды человек получает из зрительного канала, но он не должен
получать информацию только этим путем. Глухонемой человек – это инвалид,
глухонемая ЭВМ – неполноценный компьютер. Неоспоримый факт, что
визуальная информация, дополненная звуковой гораздо эффективнее
простого зрительного воздействия. Попробуйте, заткнув уши, пообщаться
с кем-нибудь хотя бы минуту сомневаюсь, что Вы получите большое
удовольствие, равно как и ваш собеседник. Характерно и то, что мы уже
достигли того времени, когда даже самые ортодоксально настроенные
программисты и проектировщики до недавнего времени не хотевшие
признавать, что звуковое воздействие может играть роль не только
сигнализатора, но информационного канала, и соответственно от неумения
или нежелания не использовавшие в своих проектах возможность
не-визуального общения человека с ЭВМ, осозналинали свою ошибку и
всячески стремятся исправить свое положение, внедряя в свои творения
все новые и новые средства multimedia. Ведь сейчас, любой крупный
проект, не оснощенный этими технологиями обречен на провал.

Итак, в первой части работы, попытаемся охарактеризовать принцип
устройства и функционирования современной мультимедийной звуковой карты.
Выявить основные ее элементы и особенности взамосвязи между ними.

Во второй части, постараемся выяснить какие форматы музыкальных файлов,
в основном, используются на РС. Раскроем понятия и особенности каждого
из них. В разделе о формате MIDI, затронем его актуальность, поговорим о
новых устройствах, появившихся в этой сфере. В разделе о формате MP3
постараемся подробно охактеризовать процесс кодирования (сжатия), а так
же выявить, какие новые мультимедийные технологии позволят завоевать
этому формату все большую популярность.

В третьей части, попытаемся классифицировать основные программы для
работы со звуком и музыкой, а так же подробно охарактеризовать каждый
класс с приведением соответствующих примеров.

В четвертой части работы узнаем, что компьютер музыканту нужен не только
для игры в “DOOM” или “преферанс”, но и для создания музыки. А именно,
постараемся выявить те основные моменты, которые необходимы для этого.

В пятой главе, затронем теоретические аспекты технологии создания
позиционного 3D-звука, как неотъемлемого элемента звукового
сопровождения компьютера. А так же попытаемся рассказать о текущем
состоянии звуковой компьютерной индустрии и о перспективах ее развития.

I Устройство и функционирование звуковых плат

Когда-то из динамика РС доносилось только малоприятное скрипение. А
понятие компьютерной музыки ассоциировалось лишь с компьютером Atari
Macintosh. Такое положение изменилось с появлением звуковой карты,
впервые выпущенной фирмой Creative Labs. А еще и с внедрением
операционной системы MS Windows 95 стало возможно пользование звуковой
платой любой программой. Для этого достаточна лишь совместимость карты с
так называемой звуковой системой Windows (Windows Sound System):

Любая программа

|| ||

Windows Sound System

|| ||

Sound Card

Изначально, звуковые карты разрабатывались лишь для озвучивания
компьютерных игр, хотя этим они занимаются и по сей день. Однако,
теперь, работы у звуковых плат прибавилось гораздо больше: это
озвучивание презентаций, звуковые письма, звук и музыка в студии и
дома…

Сейчас есть множество типов звуковых карт: универсальные,
карты-синтезаторы, оцифровщики звука, многоканальные аудиоинтерфейсы,
MIDI-интерфейсы, семплеры и др. Мы займемся именно универсальными
мультимедийными платами, так как они наиболее распространены среди
музыкантов-любителей и небогатых профессионалов. “Прародителями” таких
плат были Sound Blaster и Ad Lib, поэтому “в народе” их нередко называют
“саунд бластерами” (на самом деле, это справедливо ровно настолько,
насколько любой копировальный аппарат справедливо называть “ксероксом”).

Рис.1. Схема мультимедийной звуковой карты

Итак, звуковая карта “начинается” со входов (Рис.1.), которые
расположены на металлической панели, выходящей на заднюю стенку
системного блока. Ко входам подключаются внешние аудиоустройства –
микрофоны, магнитофоны, электрогитары и т.д. На нашем рисунке показаны 4
входа. Начнем наше знакомство с Line In и Mic In – линейных и
микрофонных входов. Они обычно выполнены на разъемах типа “мини-джек”
(такие разъемы используются для подключения наушников в портативных
плейерах). Отдельный вход Mic In предусмотрен из-за того, что у
микрофонов сигнал имеет низкий уровень и его нужно усиливать до
нормального уровня (0 дБ), перед тем, как направлять на преобразователь.
Поэтому на микрофонных входах звуковой карты всегда установлен
предусилитель – небольшая схема, повышающая уровень сигнала но
нормального (линейного) уровня.

На некоторых типах звуковых плат установлен дополнительный вход Aux In.
Если мы посмотрим на Рис. 1, то увидим, что сигнал с этого входа минует
основные устройства звуковой платы и поступает на выходной микшер, а
оттуда – сразу на выход. Этот вход позволяет упростить коммутацию
внешних устройств и использовать внутренний микшер звуковой платы для
смешивания сигналов со внешнего и внутренних источников. Например, если
у нас есть автономный синтезатор, то можно его выход подключить в Aux In
и все, что мы играем будет слышно в колонках, подключенных к звуковой
карте. Aux In тоже обычно делается на разъеме типа “мини джек”.

Вход проигрывателя компакт-дисков как правило расположен не на задней
панели звуковой платы, а прямо на ней, среди микросхем и других
радиодеталей. Если у нас есть привод CD-ROM, то можно связать его выход
с этим входом звуковой карты. Такое соединение позволит слушать аудио
компакт-диски и оцифровывать звук прямо с привода. Чтобы обнаружить на
звуковой карте вход CD-ROM надо всего лишь прочитать руководство
пользователя.

Кроме всех перечисленных входов, на задней панели звуковой карты обычно
есть 15-пиновый разъем MIDI/джойстик порта, который служит для
подключения любых внешних MIDI-устройств (синтезаторов, MIDI-клавиатур и
т.д.) или джойстика, если карта используется для игр. На
специализированных звуковых картах MIDI-порт может иметь не стандартный
15-пиновый разъем, а любой другой. Но в этих случаях всегда прилагается
особый переходник. А для подключения внешних MIDI-устройств к
стандартному порту практически во всех магазинах, торгующих
мультимедийной техникой продается стандартный-же переходник.

Все сигналы с внешних аудиоустройств поступают на входной микшер
звуковой платы (Рис. 1). Он работает точно так же, как и обычные пульты,
с той только разницей, что все управление происходит программно. В
комплект служебных программ любой звуковой карты входит программа
микшера. Она есть и в стандартных комплектах поставки Windows 95 и 98.

Входной микшер нужен для того, чтобы установить оптимальный уровень
записи. Следует помнить, что цифровая техника очень чувствительна к
превышению уровня 0 дБ – при этом возникают неприятные искажения. А
слишком же низкий уровень записи не позволит передать весь динамический
диапазон записываемого музыкального инструмента. То есть любая работа по
записи “живого” звука в домашней студии будет начинаться именно с
регулировки уровня сигнала при помощи входного микшера звуковой карты.

Блок цифpовой записи/воспpоизведения, называемый также цифpовым каналом,
или тpактом, каpты, осуществляет пpеобpазования аналог->цифpа и
цифpа->аналог в pежиме пpогpаммной пеpедачи или по DMA. Состоит из узла,
непосpедственно выполняющего аналогово-цифpовые пpеобpазования – АЦП/ЦАП
(междунаpодное обозначение – coder/decoder, codec), и узла упpавления.
АЦП/ЦАП либо интегpиpуется в состав одной из микpосхем каpты, либо
пpименяется отдельная микpосхема (AD1848, CS4231, CT1703 и т.п.). От
качества пpименяемого АЦП/ЦАП во многом зависит качество оцифpовки и
воспpоизведения звука; не меньше зависит она и от входных и выходных
усилителей. Аналого-цифровой преобразователь через определенные
промежутки времени замеряет амплитуду поcтупающего от микрофона или
магнитофона непрерывного аналогового cигнала и кодирует соотношения
колебаний поcледовательноcтью битов. Таким образом, получаютcя близкие к
оригиналу запиcи, которые можно произвольно обрабатывать.

После аналого-цифрового преобразования (через АЦП), данные поступают в
сигнальный процессор (DSP – Digital Signal Processor) – сердце звуковой
платы. Этот процессор управляет обменом данными со всеми остальными
устройствами компьютера через шину ISA или PCI. Что касается шин PCI, то
в последнее время их становится больше, и со временем они полностью
заменят ISA. Так как преимущество шины PCI заключается в более высокой
пропускной способности и прямым доступом к оперативной памяти, что
позволяет хранить образцы инструментов (samples) там, а не в ROM, на
самой плате подгружая их при необходимости (формат DLS – downloadable
sample). Тем самым, теоретически снимается ограничение по объему
инструментов. Так же значительно снижается загрузка процессора. Все это
должно сказаться на качестве звука очень даже положительно.

Если центральный процессор выполняет программу записи звука, то цифровые
данные поступают либо прямо на жесткий диск, либо в оперативную память
компьютера (это зависит от выполняемой программы). Если в дальнейшем
присвоить этим данным любое имя – получится звуковой файл. Следует также
отметить, что существуют и специализиpованные DSP:

ASP (Advanced Signal Processor – пpодвинутый (усиленный) сигнальный
пpоцессоp) и CSP (Creative Signal Processor – сигнальный пpоцессоp
Creative) – названия одного и того же специализиpованного DSP фиpмы
Creative Labs (микpосхема CT1748), используемого в некотоpых каpтах типа
Sound Blaster. Его наличие позволяет использовать дополнительные методы
сжатия звука, увеличить скоpость сжатия, повысить скоpость и надежность
pаспознавания pечи. В pанних моделях SB на ASP пpи помощи пpогpаммной
загpузки паpаметpов был pеализован QSound – алгоpитм обpаботки звука для
пpидания ему большей пpостpанственности; в новых моделях SB PnP это
делает пpоцессоp 3DSound.

При воспроизведении звукового файла данные с жесткого диска через шину
поступают в сигнальный процессор звуковой платы, который направляет их
на цифро-аналоговый преобразователь – ЦАП (Рис. 1). Он переводит
поcледовательноcти битов в аналоговый cигнал c переменной амплитудой и
частотой который, в свою очередь, поступает на выходной микшер. Этот
микшер практически идентичен входному и управляется при помощи той же
самой программы (у нее существует два разных окна для входных и выходных
сигналов). Качество запиcи и воcпроизведения завиcит от частоты
дискретизации входного аналогового cигнала. Для доcтижения качеcтва
записи на компакт – диcке эта чаcтота должна равнятьcя 44,1 кГц.

Чтобы работать с современными музыкальными программами звуковая карта
должна поддерживать запись в режиме full duplex [фулл дуплекс]. При
записи в этом режиме сигнальный процессор одновременно может работать с
двумя потоками цифровых аудиоданных: идущих с АЦП через шину к другим
устройствам компьютера, и поступающих с жесткого диска на ЦАП. То есть
режим full duplex – это запись одновременно с воспроизведением.
Благодаря этому режиму можно использовать звуковую карту как
многоканальный магнитофон.

На любой универсальной мультимедийной звуковой карте есть синтезатор.
Последнее время практически на всех картах устанавливается не один, а
два синтезатора: FM (Frequency Modulation – частотная модуляция) –
для сохранения совместимости с Sound Blaster и Ad Lib, и WT (WaveTable –
таблица волн)- для получения качественного звука. Именно эти синтезаторы
показаны на рисунке.

Исторически так сложилось, что FM-синтезаторы звуковых плат звучат не
очень хорошо. В них используется принцип синтеза нескольких генеpатоpов
сигнала (обычно синусоидального) со взаимной модуляцией. Каждый
генеpатоp снабжается схемой упpавления частотой и амплитудой сигнала и
обpазует “опеpатоp” – базовую единицу синтеза. Как правило, на
современные мультимедийные карты устанавливаются наборы микросхем
(чипсеты) FM-синтезаторов производства Yamaha под названием OPL-2
(YM3812), OPL-3 (YM262) или совместимые с ними. (Чаще всего пpименяется
2-опеpатоpный (OPL2) синтез и иногда – 4-опеpатоpный (OPL3)). Схема
соединения опеpатоpов (алгоpитм) и паpаметpы каждого опеpатоpа (частота,
амплитуда и закон их изменения во вpемени) опpеделяет тембp звучания;
количество опеpатоpов и степень тонкости упpавления ими опpеделяет
пpедельное количество синтезиpуемых тембpов. В музыкальных приложениях
такие синтезаторы не применяются – они нужны исключительно для звукового
сопровождения игр. Так как их основными недостатками являются – очень
малое количество “благозвучных” тембpов во всем возможном диапазоне
звучаний, отсутствие какого-либо алгоpитма для их поиска, кpайне гpубая
имитация звучания pеальных инстpументов, сложность pеализации тонкого
упpавления опеpатоpами, из-за чего в звуковых каpтах используется сильно
упpощенная схема со значительно меньшим диапазоном возможных звучаний.

Мультимедийные Wave Table синтезаторы (GF1, WaveFront, EMU8000 и т.п.),
позволяют получить уже более приличный звук. Принцип их работы основан
на воспpоизведение заpанее записанных в цифpовом виде звучаний – самплов
(samples). Инстpументы с малой длительностью звучания обычно
записываются полностью, а для остальных может записываться лишь
начало/конец звука и небольшая “сpедняя” часть, котоpая затем
пpоигpывается в цикле в течение нужного вpемени. Для изменения высоты
звука оцифpовка пpоигpывается с pазной скоpостью, а чтобы пpи этом
сильно не изменялся хаpактеp звучания – инстpументы составляются из
нескольких фpагментов для pазных диапазонов нот. В сложных синтезатоpах
используется паpаллельное пpоигpывание нескольких самплов на одну ноту и
дополнительная обpаботка звука (модуляция, фильтpование, pазличные
“оживляющие” эффекты и т.п.). Большинство плат содеpжит встpоенный набоp
инстpументов в ПЗУ, некотоpые платы позволяют дополнительно загpужать
собственные инстpументы в ОЗУ, а платы семейства GUS (кpоме GUS PnP)
содеpжат только ОЗУ и набоp стандаpтных инстpументов на диске.

На Рис.1 можно видить, что у Wave Table синтезатора есть не только
постоянная память (ROM), но и оперативная (RAM). Оперативной памятью
обладают семплеры, и используется она для загрузки любых звуковых
файлов, которые проигрываются с разной высотой при нажатии клавиш на
подключенной клавиатуре или поступлении команд от секвенсера. То есть
Wave Table синтезатор, имеющий оперативную память помимо постоянной –
это ни что иное, как комбинация синтезатора и семплера, которая может
выполнять функции обоих устройств. Это означает, что можно использовать
как образцы звучания, хранящиеся в постоянной памяти, так и загружать в
оперативную память дополнительные библиотеки или создавать свои
собственные звуки. Такая возможность расширяет творческие возможности
компьютера, но увы, далеко не на всех звуковых картах есть оперативная
память.

Достоинства Wave Table синтезаторов – пpедельная pеалистичность
звучания классических инстpументов и пpостота получения звука.
Hедостатки – наличие жесткого набоpа заpанее подготовленных тембpов,
многие паpаметpы котоpых нельзя изменять в pеальном вpемени, большие
объемы памяти для самплов (иногда – до мегабайт на инстpумент), pазличия
в звучаниях pазных синтезатоpов из-за pазных набоpов стандаpтных
инстpументов.

Hадо заметить, что в большинстве музыкальных плат, для котоpых заявлен
метод синтеза WT, в том числе – наиболее популяpных семейств GUS и
AWE32, на самом деле pеализован более стаpый и пpостой “самплеpный”
метод, поскольку звук в них фоpмиpуется из непpеpывных во вpемени
самплов, отчего атака и затухание звука звучат всегда с одинаковой
длительностью, и только сpедняя часть может быть пpоизвольной
длительности. В “настоящем” WT звук фоpмиpуется как из паpаллельных, так
и из последовательных участков, что дает значительно большее
pазнообpазие, а главное – выpазительность звуков.

Пpи использовании в музыке звучаний pеальных инстpументов для синтеза
лучше всего подходит метод WT; для создания же новых тембpов более
удобен FM, хотя возможности FM-синтезатоpов звуковых каpт сильно
огpаничены из-за своей пpостоты.

Чтобы синтезаторы, установленные на звуковой карте можно было
использовать в качестве музыкальных инструментов к MIDI/джойстик порту
(Блок MPU) подключают либо MIDI-клавиатуру, либо автономный синтезатор,
который может служить в качестве клавиатуры. Сигналы, поступающие с
клавиатуры, подаются в процессор (Рис.1), который направляет их либо
через системную шину к центральному процессору, либо к синтезаторам
звуковой карты. Путь MIDI-сигнала зависит от выполняющихся программ – в
любом развитом программном секвенсере можно коммутировать MIDI порты и
устройства произвольным образом.

Каждый из синтезаторов, установленных на звуковой карте имеет свой
собственный ЦАП. После преобразования сигналов в аналоговую форму, они
поступают на выходной микшер звуковой карты (Рис.1). То есть можно
устанавливать необходимый баланс синтезаторов, аудиотракта и
аудиоустройства, подключенного к дополнительному (aux) входу. Такая
возможность оказывается крайне полезной при окончательном микшировании
композиций, записанных при помощи компьютера. А итоговый микс поступает
на линейный выход (Line Out), который так же, как и входы находится на
задней панели звуковой карты.

Несколько лет назад на универсальных звуковых картах появились
специальные разъемы, предназначенные для установки “дочерних”
карт-синтезаторов. Дочерняя карта просто “надевается” сверху на основную
и использует ее аудиотракт для вывода сигнала. Первоначально такое
решение предназначалось для улучшения звучания карт, не имеющих Wave
Table синтезатора “на борту”. По названию первой “дочерней” карты эти
разъемы стали называться “разъем Wave Blaster”. Сейчас все больше
универсальных карт уже имеют вполне приемлемые синтезаторы и “дочерние”
карты используются, в основном, для расширения функциональных
возможностей студии. Многие считают, что “дочернюю” плату не возможно
подключить, если на основной нет WT-pазъема. Оказывается, что это не
так. “Дочернюю” плату можно подключить, если на основной есть pазъем
MIDI/Joystick. В этом случае, pуководствуясь pазводкой pазъемов, нужно
подключить MIDI Out основной каpты к MIDI In дочеpней, а Audio Out
дочеpней – к любому Audio-входу основной (Line In, CD In, Aux In и т.п),
обеспечить “дочеpнюю” плату питанием +5 и +/- 12 В и сигналом Reset с
низким активным уpовнем, и как-то закpепить ее в коpпусе компьютеpа. Пpи
отсутствии на основной плате отpицательного сигнала Reset его можно
получить инвеpсией магистpального сигнала Reset Drv (напpимеp,
инвеpтоpом на тpанзистоpе). Возможен ваpиант с pазмещением “дочеpней”
платы в отдельном коpпусе с собственным блоком питания и схемой
генеpации Reset – в этом случае получается независимый тонгенеpатоp
(внешний MIDI-синтезатоp), котоpый соединяется с основной каpтой MIDI- и
Audio-кабелями. Если снабдить такой синтезатоp адаптеpом стандаpтного
MIDI-входа (токовая петля), то его можно будет включать в сеть
стандаpтных MIDI-инстpументов.

Вот, вкратце, все устройство универсальной мультимедийной звуковой
карты. Все специализированные музыкальные платы работают точно таким же
образом, только на них нет тех или иных элементов. Например, на
картах-синтезаторах установлен только MIDI-интерфейс и качественный Wave
Table синтезатор. Карты-оцифровщики имеют хорошие АЦП и ЦАП, сигнальный
процессор и ничего больше и т.д.

II Основные форматы музыкальных файлов на РС

1. MIDI

Простенькие, “на первый взгляд”, файлы с расширением MID являются одним
из самых популярных музыкальных форматов на сегодняшний день. Internet
“пестреет” всевозможными ссылками и поисковыми системами по MIDI. Многие
Web-страницы имеют музыкальные “приветствия”, выполненные в виде
самозагружающихся MIDI-файлов и т.д. Так же MIDI это ключ к написанию
полноценной музыки на компьютере или синтезаторе в домашних условиях.
Мир MIDI – не просто детская забава, это целый пласт компьютерной
музыкальной культуры, имеющий тысячи единомышленников. Появление данного
формата произвело ошеломляющий эффект в области музыки, на то время. Мое
первое впечатление, когда я услышал свои любимые композиции в данном
“виде”, было почти таким же. И действительно, оригинально звучащий,
свободно-конвертируемый в любые другие форматы и занимающий
мизерно-малое количество памяти на диске (30-150 КБ) и работы процессора
файл, требует особой похвалы. Так давайте же выясним, что представляет
собой формат MIDI.

Musical Instrument Digital Interface (сокращенно MIDI) – цифровой
интерфейс музыкальных инструментов. Создан в 1982 году ведущими
производителями электронных музыкальных инструментов – Yamaha, Roland,
Korg, E-mu и др. Изначально был предназначен для замены принятого в то
время управления музыкальными инструментами при помощи аналоговых
сигналов управлением при помощи информационных сообщений, передаваемых
по цифровому интерфейсу. Впоследствии стал стандартом де-факто в области
электронных музыкальных инструментов и компьютерных модулей синтеза.

MIDI представляет собой так называемый событийно-ориентированный
протокол связи между инструментами. Всякий раз, когда исполнитель
производит какое-либо воздействие на органы управления
(нажатие/отпускание клавиш, педалей, изменение положений регуляторов и
т.п.), инструмент формирует соответствующее MIDI-сообщение, в тот же
момент посылаемое по интерфейсу. Другие инструменты, получая сообщения,
отрабатывают их так же, как и при воздействии на их собственные органы
управления. Таким образом, поток MIDI-сообщений представляет собой как
бы слепок с действий исполнителя, сохраняя присущий ему стиль исполнения
– динамику, технические приемы и т.п. При записи на устройства хранения
информации MIDI-сообщения снабжаются временными метками, образуя
своеобразный способ представления партитуры. При воспроизведении по этим
меткам полностью и однозначно восстанавливается исходный MIDI-поток.

Спецификация MIDI состоит из аппаратной спецификации самого интерфейса и
спецификации формата данных – описания системы передаваемых сообщений.
Соответственно, различается аппаратный MIDI-интерфейс и формат
MIDI-данных (так называемая MIDI-партитура); интерфейс используется для
физического соединения источника и приемника сообщений, формат данных –
для создания, хранения и передачи MIDI-сообщений. В настоящее время эти
понятия стали самостоятельными и обычно используются отдельно друг от
друга – по MIDI-интерфейсу могут передаваться данные любого другого
формата, а MIDI-формат может использоваться только для обработки
партитур, без вывода на устройство синтеза.

Спецификация формата данных MIDI

MIDI-данные представляют собой сообщения, или события (events), каждое
из которых является командой для музыкального инструмента. Стандарт
предусматривает 16 независимых и равноправных логических каналов, внутри
каждого из которых действуют свои режимы работы; изначально это было
предназначено для одно-тембровых инструментов, способных в каждый момент
времени воспроизводить звук только одного тембра – каждому инструменту
присваивался свой номер канала, что давало возможность многотембрового
исполнения. С появлением многотембровых (multi-timbral) инструментов они
стали поддерживать несколько каналов (современные инструменты
поддерживают все 16 каналов и могут иметь более одного MIDI-интерфейса),
поэтому сейчас каждому каналу обычно назначается свой тембр, называемый
по традиции инструментом, хотя возможна комбинация нескольких тембров в
одном канале. Канал 10 по традиции используется для ударных инструментов
– различные ноты в нем соответствуют различным ударным звукам
фиксированной высоты; остальные каналы используются для мелодических
инструментов, когда различные ноты, как обычно, соответствуют различной
высоте тона одного и того же инструмента.

Поскольку MIDI-сообщения представляют собой поток данных в реальном
времени, их кодировка разработана для облегчения синхронизации в случае
потери соединения. Для этого первый байт каждого сообщения, называемый
также байтом состояния (status byte), содержит “1” в старшем разряде, а
все остальные байты содержат в нем “0” и называются байтами данных (data
bytes). Если после получения всех байтов данных последнего сообщения на
вход приемника поступает байт, не содержащий “1” в старшем разряде – это
трактуется как повторение информационной части сообщения
(подразумевается такой же первый байт). Такой метод передачи носит
название “Running Status” и широко используется для уменьшения объема
передаваемых данных – например, передается один байт команды “Controller
Change” с нужным номером канала, а затем – серия байтов данных с
номерами и значениями контроллеров для этого канала.

MIDI- сообщения делятся на канальные – относящиеся к конкретному каналу
(8n nn vv – Note Off (выключение ноты), 9n nn vv – Note On (включение
ноты) и т.д.) , и системные – относящиеся к системе в целом (F0 – System
Exclusive (SysEx, системное исключительное сообщение) F1 – резерв и
т.д.)

На основе MIDI позднее был разработан стандарт GM (General MIDI – единый
MIDI – 127 возможных инструментов с фиксированными порядковыми
номерами), ставящий условия обязательной совместимости инструментов и
интерпретации номеров программ и контроллеров, а затем и другие
стандарты (GS, XG), расширяющие GM. Однако общность инструментов внутри
каждого стандарта подразумевает только основные звуковые характеристики.
“Одинаковые” тембры на различных инструментах почти всегда имеют
различную окраску, динамику, яркость, громкость по умолчанию и другие
особенности, а “синтетические” тембры могут совершенно отличаться друг
от друга. Кроме этого, у разных инструментов различается зависимость
характера звука от силы удара по клавише, динамика работы
MIDI-контроллеров, положения контроллеров по умолчанию и прочие “тонкие”
параметры. Поэтому MIDI-партитура, подготовленная для конкретного
инструмента, на других инструментах (даже внутри стандарта) часто звучит
совершенно по-другому, и это необходимо учитывать при переносе партитур
с между инструментами различных моделей.

Инструменты, поддерживающие стандарты GM и GS, почти всегда имеют
дополнительные средства управления синтезом и обработкой звука,
расширяющие рамки стандарта. При этом используемые способы управления,
как правило, сохраняются внутри одной линии инструментов и внутри
инструментов одного производителя.

Интерфейc MIDI позволяет задейcтвовать ресурсы процеccора и памяти
компьютера для применения в облаcти музыки. Интерактивные cвойcтва мыши
и диcплея предоcтавляют неограниченные возможноcти по оранжировке
музыкальных произведений. Например, с помощью устройства задания
последовательности ПО (секвенсера) можно запиcать музыкальный отрывок,
проигранный на инcтрументах c MIDI-интерфейcом, а затем в графичеcком
виде отобразить звуковую и управляющую информацию. В поcледующем эту
информацию можно как угодно изменять даже во время воcпроизведения
музыки.

Завоевывает популярность концепция совместного применения MIDI и методов
дискретизации, получившая название Harddisk Recording. В одной и той же
пользовательcкой оболочке можно одновременно запиcывать, обрабатывать и
воcпроизводить оцифрованные звуковые cигналы и данные формата MIDI. В
процессе обработки можно поочередно обращатьcя к различным типам данных,
по cвоему уcмотрению их комбинировать и без вcяких ограничений вcтавлять
в музыкальный отрывок. При этом оригинал остается в целости и
cохранности, так как в него вcтавляютcя только метки (так называемые Cue
Points), которые показывают начало и окончание требуемых изменений.
Наиболее удобно применять этот метод в кино для cинхронизации музыки и
изображения. Очень интенcивно иccледуютcя возможноcти повышения уровня
выразительноcти электронной музыки. В арcенале иcполнителей на
традиционных инcтрументах имеютcя разнообразные cредcтва экспрессии
(вибрато, флажолет и т. п.), которые невозможно реализовать на
клавиатуре cинтезатора.

Применения MIDI

Основное применение MIDI – хранение и передача музыкальной информации.
Это может быть управление электронными музыкальными инструментами в
реальном времени, запись MIDI-потока, формируемого при игре исполнителя,
на носитель данных с последующим редактированием и воспроизведением (так
называемый MIDI-секвенсор), синхронизация различной аппаратуры
(синтезаторы, ритм-машины, магнитофоны, блоки обработки звука, световая
аппаратура, дымогенераторы и т.п.).

Устройства, предназначенные только для создания звука по MIDI-командам,
не имеющие собственных исполнительских органов, называются
тонгенераторами. Многие тон-генераторы имеют панель управления и
индикации для установки основных режимов работы и наблюдения за ними,
однако создание звука идет под управлением поступающих MIDI-команд.

Устройства, предназначенные только для формирования MIDI-сообщений, не
содержащие средств синтеза звука, называются MIDI-контроллерами. Это
может быть клавиатура, педаль, рукоятка с несколькими степенями свободы,
ударная установка с датчиками способа и силы удара, а также – струнный
или духовой инструмент с датчиками и анализаторами способов воздействия
и приемов игры. Тонгенератор с достаточными возможностями по управлению
может весьма точно воспроизвести оттенки звучания инструмента по
сформированному контроллером MIDI-потоку.

Для хранения MIDI-партитур на носителях данных разработаны форматы SMF
(Standard MIDI File – стандартный MIDI-файл) трех типов:

0 – непосредственно MIDI-поток в том виде, в каком он передается по
интерфейсу.

1 – совокупность параллельных “дорожек”, каждая из которых обыч- но
представляет собой отдельную партию произведения, исполняемую на одном
MIDI-канале.

2 – совокупность нескольких произведений, каждое из которых состоит из
нескольких дорожек.

В основном применяется формат 1, позволяющий хранить одно произведение в
файле.

Кроме MIDI-событий, файл содержит также “фиктивные события” (Meta
Events), используемые только для оформления файла и не передаваемые по
интерфейсу – информация о метрике и темпе, описание произведения,
названия партий, слова песни и т.п.

Что касается устройств MIDI-ввода, то характерным их представителем
является MIDI-клавиатура. Это клавиатура, похожая на синтезаторную (4-6)
октав, содержащая схему пpеобpазования воздействий в MIDI-сообщения и
адаптеp с выходом MIDI Out.

MIDI-клавиатура не способна звучать самостоятельно, она использует в
качестве синтезатора звуковую карту компьютера. Иногда на
MIDI-клавиатуре размещены некоторые дополнительные переключатели,
например, глиссандо или вибрато. Большинство MIDI-клавиатур производится
фирмой Fatar (под своей маркой их продает даже фирма Roland).
Клавиатура, правило, работает от электрической сети или от батареек.
Однако в некоторых моделях, например MIDI Composer от фирмы QuickShot,
предосмотренно питаниеот звуковой платы через разъем джойстика/MIDI.
Многие сегодняшние клавиатуры – динамические, т.е. громкость
производимого звука зависит от силы удара по клавише. Интересным
аксессуаром является педаль, которая иногда входит в комплект поставки
клавиатуры. Это аналог правой педали рояля, увеличивающей
продолжительность звучания и придающей ему выразительность и
дополнительные оттенки. Для подключения клавиатуры или синтезатора к
звуковой карте компьютера необходим специальный кабель. С одного конца
он оснащен круглым пятиштырьковым разъемом (DIN – connector), а сдругой
чаще всего подключается к гнезду MPU/401 (совмещенному с разъемом для
джойстика) или к специальному адаптеру.

Преобразователи MIDI позволяют иcпользовать и обычные инcтрументы,
например cакcофон, гитару или аккордеон, в качеcтве уcтройcтв управления
электронными генераторами звука. Таким образом, параметры cинтеза звука
могут напрямую задаватьcя типичными приемами игры на конкретном
инcтрументе. Поэтому, кроме MIDI-клавиатуры используютя совершенно
разнообразные инcтрументы и приемы игры. Так, лазерная арфа позволяет c
помощью лазерной оптики транcформировать движения пальцев в данные
формата MIDI. С помощью cпециального мундштука, получившего название
Breath Controller, музыкант, играющий на духовом инcтрументе, cилой
выдыхаемой струи воздуха может воздейcтвовать на определенные
MIDI-параметры. Сущеcтвует уcтройcтво, транcформирующее в команды
управления жеcты. Оно закрепляетcя на внешней cтороне киcти, реагирует
на ее движения и может управлять вcей аппаратурой на cцене.

Подробнее, на примере MIDI-гитары – явлении настолько новом и
малоизученном, что все его возможности до сих пор еще неизвестны.
Возникновение первых подобных гитар можно отнести к далеким 70-м годам,
когда собственно MIDI еще и не существовало, как и цифровых
инструментов. Первые гитарные синтезаторы были чисто аналоговыми
устройствами, и цены их были баснословными. Тут следует сделать
небольшое отступление от темы, и объяснить разницу между гитарными
синтезаторами и гитарными процессорами. Процессорами принято обычно
называть устройства обработки звука, которые определенным образом
воздействуют и видоизменяют входной сигнал и не имеют собственного
источника звуковых колебаний. Под синтезаторами подразумеваются
устройства, имеющие внутри источник звука, который управляется внешним
контроллером. Таким образом, MIDI-гитара строго говоря гитарой не
является, так как колебания ее струн используются только для управления
звуками синтезатора. Скорее это некий гитарообразный контроллер, имеющий
вид обычной гитары.

Современная MIDI-гитара представляет собой обычную гитару, на которой
установлен специальный полифонический звукосниматель, то есть
звукосниматель, передающий отдельный сигнал с каждой струны.
Одновременно на гитару устанавливается небольшой блок управления, с
которого можно управлять синтезатором; в этот же блок поступает сигнал с
обычного выхода гитары, что позволяет регулировать баланс между гитарным
и синтезаторным звуком В этом и заключается вся прелесть такой гитары-
она универсальна: при необходимости инструмент может работать как
обычная гитара, как MIDI-гитара или как обе одновременно при смешивании
двух сигналов. Используя вместе с гитарным синтезатором гитарный
процессор для обычного аналогового сигнала, можно добиться совершенно
удивительных звучаний.

Оба сигнала (с обычных и с полифонического звукоснимателей) передаются с
блока управления по одному многожильному кабелю в очень важное и
ответственное устройство- MIDI-конвертер. Этот прибор непосредственно
отвечает за распознавание нот и дальнейшее преобразование их в
MIDI-сигналы.

Непосредственно с MIDI-конвертера сигнал поступает на источник звука-
синтезатор или семплер. Конвертер и синтезатор могут быть как
совмещенными в одном корпусе, так и выполненными в виде самостоятельных
устройств.

Наличие на конвертере входов и выходов MIDI и дает то огромное
преимущество, с помощью которого становятся реальными фантастические
возможности, заложенные в MIDI-гитаре. Рассмотрим, что же это за такие
возможности.

Используя различные синтезаторы и семплеры, музыкант имеет доступ
практически ко всем звукам, существующим в настоящее время. Это может
пригодиться для создания необычных звучаний электрогитары как на
концерте, так и на студии. Для более естественного звучания инструмента
имеется возможность подмешивания синтетического сигнала к сигналу
гитарному. В таком случае возникает ощущение одновременной игры сразу
двух инструментов- гитары и синтезатора.

Еще одно неоспоримое преимущество- управление с помощью MIDI-гитары
секвенсором или компьютером. Наверняка многие гитаристы пользуются для
записи в секвенсор синтезаторными клавиатурами и испытывают при этом
определенные неудобства- гитара для них более привычный инструмент. С
появлением MIDI’фицированной гитары эти проблемы исчезли- теперь партии
различных инструментов, будь то медные духовые или ударные, записывать
стало гораздо легче (во всяком случае гитаристам, не особенно хорошо
владеющим фортепиано). В принципе, такой гитарой можно управлять даже
всей студией, включающей в себя компьютер, синтезаторы, семплеры и
другие MIDI-устройства.

Новые горизонты деятельности открывает MIDI-гитара и для преподавателей.
Любые партии, исполняемые учеником, записываются на компьютерный
секвенсор, после чего их можно распечатать, проанализировать, прослушать
в замедленном темпе и мгновенно найти допущенные при игре ошибки. В
принципе, возможно даже создание целых компьютерных гитарных классов.

Какое же будущее ждет MIDI-гитару? Вытеснит ли она обычную электрическую
гитару или так и останется на уровне экспериментального и экзотического
инструмента? Не надо забывать, что техника, в особенности цифровая,
движется вперед семимильными шагами, и те проблемы, которые сейчас
ограничивают повсеместное распространение MIDI-гитары, в ближайшем
будущем могут быть успешно решены. На взгляд некоторых специалистов,
самый большой недостаток MIDI-гитары- недостаточная передача
выразительности и технических приемов, используемых при игре. Впрочем,
это относится скорее ко всему MIDI-стандарту в целом- ведь он
задумывался прежде всего как стандарт для клавишных инструментов и не
учитывал специфики гитарной игры. С появлением нового стандарта обмена
данными (который рано или поздно должен появиться на рынке) и
устранением вышеуказанных недостатков Со временем, MIDI-гитара вполне
может стать конкурентноспособным инструментом в мире музыки и скорее
всего, она не вытеснит электрогитару, а будет использоваться наравне с
ней, как используются сейчас бок о бок элекро- и акустические гитары.

2. WAV

Формат аудио-файла, представляющий произвольный звук как он есть – в
виде цифрового представления исходного звукового колебания или звуковой
волны (wave), отчего в ряде случаев технология создания таких файлов,
именуется wave-технологией. Позволяет работать со звуками любого вида,
любой формы и длительности.

Рис.2. Графическое представление WAV-файла

Где: А – амплитуда звуковой волны,

Т – время ее распространения.

Графическое представление WAV-файла очень удобно и часто используется в
звуковых редакторах и программах-секвенсорах для работы с ними и
последующего преобразования (об этом речь пойдет в следующей главе).
Данный формат был разработан компанией Microsoft и немудрено, что все
стандартные звуки Windows имеют расширение WAV. Характерно еще и то, что
эти файлы являются, как бы “промежуточными результатом”, работы
программ-“грабберов” и пихоакустических процессоров, для оцифровки
треков СD и дальнейшего их сжатия. Но из-за того, что несжатые
“полнометражные” музыкальные композиции в формате WAV имеют огромные
размеры (30-50 МБ), они практически не используются. Их вытеснила
музыка в MP3.

3. MP3

MP3 – сокращение от MPEG Layer3. Это один из цифровых форматов хранения
аудио, разработанный Fraunhofer IIS и THOMPSON (1992г.), позднее
утвержденный как часть стандартов сжатого видео и аудио MPEG1 и MPEG2.
Данная схема является самой сложной из семейства MPEG Layer 1/2/3. Она
требует больших затрат машинного времени для кодирования по сравнению с
остальными и обеспечивает более высокое качество кодирования.
Используется главным образом для передачи аудио в реальном времени по
сетевым каналам и для кодирования CD Audio.

Компрессия достигается при активном использовании известных особенностей
человеческого слуха в плане восприятия аудиоинформации, что позволяет
экономить на наименее значимых с точки зрения человеческого слуха
деталях звучания. На проведенных тестах специально нанятые опытные
прослушиватели не смогли различить звучание оригинального трека на CD и
закодированного с коэффициентом сжатия 6:1.

Описание процесса кодирования

Подготовка к кодированию. Фреймовая структура

Перед кодированием исходный сигнал разбивается на участки, называемые
фреймами, каждый из которых кодируется отдельно и помещается к конечном
файле независимо от других. Последовательность воспроизведения
определяется порядком расположения фреймов. Каждый фрейм может
кодироваться с разными параметрами. Информация о них содержится в
заголовке фрейма.

Начало кодирования

Кодирование начинается с того, что исходный сигнал с помощью фильтров
разделяется на несколько, представляющих отдельные частотные диапазоны.

Работа психоакустической модели. Часть первая

Для каждого диапазона определяется величина маскирующего эффекта,
создаваемого сигналом соседних диапазонов и сигналом предыдущего фрейма.
Если она превышает мощность сигнала интересующего диапазона или мощность
сигнала в нем оказывается ниже определенного опытным путем для данного
диапазона порога слышимости, то данный диапазон не кодируется.

Работа психоакустической модели. Часть вторая

Для оставшихся данных для каждого диапазона определяется, сколькими
битами на сэмпл мы можем пожертвовать, чтобы потери от дополнительного
квантования были ниже величины маскирующего эффекта, соответственно чему
и производится пожертвование. При этом учитывается, что потеря одного
бита ведет к внесению шума квантования величиной порядка 6 dB.

Завершение кодирования

После завершения работы психоакустической модели формируется итоговый
поток, который дополнительно кодируется по Хаффману, на этом кодирование
завершается.

Замечание

На практике схема несколько сложнее, так как необходимо согласовываться
с требованиями битрейта. В зависимости от кодера это приводит к разного
рода релаксациям при повышении битрейта и ужесточению критериев при его
понижении. Суть в том, что даже после обработки с помощью
психоакустической модели оставшаяся аудиоинформация достаточно объемна,
приходится идти на потери.

Дополнение

Кроме того, кодирование стереосигнала допустимо четырьмя различными
методами:

Dual Channel

Каждый канал получает ровно половину потока и кодируется отдельно как
моно сигнал. Рекомендуется на битрейтах от 256kbs ( субъективно ).

Stereo

Каждый канал кодируется отдельно, но когда кодер умудряется отбросить
столько “лишнего” в одном канале, что код не заполняет полностью
выделенный для данного канала объем, то кодер может использовать это
место для кодирования другого канала. В документации говорится, что этим
избегается кодирование “тишины” в одном канале, когда в другом есть
сигнал.

Но документация, на мой взгляд, неясно объясняет, что именно происходит.
Отсюда и рекомендация в предыдущем пункте.

Режим установлен по умолчанию в большинстве ISO-based кодеров, а также
используется продукцией FhG IIS на битрейтах выше 192kbs. Применим и на
более низких битрейтах порядка 128kbs-160kbs.

Joint Stereo ( MS Stereo )

Стереосигнал раскладывается на средний между каналами и разностный. При
этом второй кодируется с меньшим битрейтом.

Это позволяет несколько увеличить качество кодирования в обычной
ситуации, когда каналы по фазе совпадают. Но приводит и к резкому его
ухудшению, если кодируются сигналы, по фазе не совпадающие. В частности,
фазовый сдвиг практически всегда присутствует в записях, оцифрованных с
аудиокассет, но встречается и на CD.

Режим выставлен по умолчанию продукцией FhG IIS для битрейтов от 112kbs
до 192kbs.

Joint Stereo ( MS/IS Stereo )

Вводит еще один метод упрощения стереосигнала, повышающий качество
кодирования на особо низких битрейтах. Состоит в том, что для некоторых
частотных диапазонов оставляется уже даже не разностный сигнал, а только
отношение мощностей сигнала в разных каналах. Понятно, для кодирования
этой информации употребляется еще меньший битрейт.

В отличие от предыдущего, этот метод приводит уже к прямой потере
информации, но выгоды в качестве от экономии места в пользу среднего
сигнала оказываются выше, если речь идет о очень низких битрейтах. Этот
режим по умолчанию используется продукцией FhG IIS для высоких частот на
битрейтах от 96kbs и ниже. В ISO-based кодерах возможен выбор диапазона.
Фактически, MS Stereo – частный случай MS/IS Stereo, когда переменная,
отвечающая за кодируемый таким образом диапазон, принимает нулевое
значение.

При применении данного режима происходит потеря фазовой информации, а
также имеет место меланхоличное превращение противофазного сигнала
кодером в полное отсутствие оного (сигнала).

Следует отметить, что сейчас успешно развивается новая технология LAVA!
(Live Audio Visual Animation), разрабатываемая компанией Creative
Technology. Которая будет ориентирована в основном на музыку в формате
MP3, благодаря ней пользователи смогут «смотреть» музыку в Internet в
режиме реального времени. То есть можно будет просмотреть интерактивный
логотип музыкальной группы и фотографии ее членов, а также элементы
художественного оформления альбома — все это теперь может быть
объединено в высококачественный трехмерный коллаж и отображено в режиме
реального времени параллельно с воспроизведением MP3-файла без
существенных дополнительных требований к пропускной способности сети.
Программный инструментарий позволяет создавать различные музыкальные
видеоролики, включающие любые графические и трехмерные элементы,
имеющиеся в среде Windows. Используя список сценарных LAVA!-шаблонов,
можно выполнять тонкую сценарную настройку различных параметров
(мощность освещения, скорость движения камеры и пр.). Созданную сцену
можно отправить вместе с MP3-музыкой по электронному адресу в Internet
или поместить на Web-узле, чтобы продемонстрировать свои творческие
успехи друзьям.

Исследование BMI Music Bot показало, что к апрелю 1999 г. 36% всех
аудиофайлов в Internet составляли MP3-файлы, а доля WAV-файлов снизилась
до 8%.

4. VQF – новый аудио формат!

Размер Файла:

VQF файлы – приблизительно 30-35 % меньше чем MP3 файлы.

Пример: Вы имеете песню 5 минут, на КОМПАКТ-ДИСКЕ. WAV файл, который Вы
сграбили бы, будет ~ 50МБ. MP3 файл, и 128kbps и 44kHz, был бы
приблизительно 4. 5МБ, с некоторой потерей звукового качества. VQF файл,
в 44kHz, и 96kbps (80kbps VQF – относительно тот же самый как 128kbps
MP3), – приблизительно 3. 5МБ!

Качество звука:

О качестве звука после сжатия можно сказать одно – хорошее. Нельзя
сказать, что звук остается абсолютно без изменений, человек даже с
неразвитым слухом заметит отличия. Если же говорить о VQF с точки зрения
обыкновенного пользователя, то качество вполне приличное для
использования в Internet. Ну а поскольку мы уже коснулись, качества
звука то VQF – намного лучше чем MP3. Они почти столь же хороши как
оригинал WAV файлы. 80kbps VQF столь же хорош как 128kbps MP3 файл.
96kbps VQF имеет качество, почти столь же хорошее как таковым 256kbps
MP3. Одним словом можно с точно сказать что использование VQF –
позволяет сэкономить до 25% дискового пространства без ощутимой потери
качества.

Использование процессора (CPU) :

Это – одна область, где VQF более тяжеловесен чем MP3. Он требует больше
ресурсов. Когда MP3 были развиты существовали только Pentium – ы. В
настоящее время, с Pentium II, и другими мультимедийными средствами
увеличились производительные возможностями системы. Этот не маловажный
который позволяет кодировать больше звуковых данных в 30 % меньшие
файлы!

Недостатки:

1. Этот формат достаточно новый и пока достаточно редкий, что нельзя
сказать об MP3!. Но это – только вопрос времени. Как только люди начнут
понимать, насколько он актуален на данный момент, их популярность
возрастёт.

2. Раскодирование – относительно медленно. Зависит от двух факторов:

a) Лучшее сжатие означает, что будет использованно большее количество
времени на “размышления” – кодирующего устройства. Оно работает по более
сложным алгоритмам, таким образом уходит большее количество времени.

b) Кодирующее устройство достаточно ново и очевидно, что Yamaha
потратила не достаточно времени для разработки кодирующего устройств,
обеспечивающего приемлимую производительность и качество. Но специалисты
считают, что этот недостаток со временем будет исправлен.

В завершении можно сказать, что новый формат сжатия VQF будет
популярным среди пользователей (если завтра не выйдет нового, сжимающего
в сто раз). VQF развивается, усовершенствуется и пройдет еще несколько
месяцев, и он будет сжимать файлы еще плотнее и качественнее.

Конечно же, это не все музыкальные форматы, используемые на РС. Помимо
вышеперечисленных, уже положительно проявивших себя форматов MIDI, WAV,
MP3 и только вышедшего VQF, сушествует еще множество типов музыкальных
файлов. Как, например, VOC – аналог формата WAV (разработанный компанией
Creative Labs), XM, IT – форматы для программ-трекеров, AU – для
программы Sound Gadged Pro и т.д. Но так как они используются не так
часто, мы их затрагивать не будем.

III Основные программы для работы со звуком

и музыкой

В последнее время наряду с термином “мультимедиа”, получил
распространение другой – “музыкальные программы”. Новый термин оказался
столь же многозначным, что и его родитель, – этим сочетанием стали
называть любые программы, имеющие дело с каким-либо звуком; при этом
нередко происходит смешение основных понятий и путаница в принципах
работы программ. В результате одни пользователи даже не догадываются о
некоторых доступных им возможностях, а другие ошибочно возлагают на
программу (и компьютер в целом) неоправданные надежды. Так постараемся
же классифицировать методы работы со звуком на PC и попытаемся сделать
обзор технологий и программных средств для этой цели.

Audio и MIDI

В современных компьютерах можно выделить две наиболее популярные
технологии, имеющие отношение к звуку и музыке:

* Audio (аудио) – наиболее универсальная технология, представляющая
произвольный звук как он есть – в виде цифрового представления исходного
звукового колебания или звуковой волны (wave), отчего в ряде случаев она
именуется wave-технологией. Позволяет работать со звуками любого вида,
любой формы и длительности. Звуковая информация обычно хранится в файлах
с расширением WAV.

* MIDI – нотно-музыкальная технология, основанная на регистрации
событий, происходящих при игре на электронном инструменте, – нажатий
клавиш, педалей, воздействий на регуляторы, тумблеры, кнопки и т.п.
Последовательность подобных событий образует “электронную партитуру”
музыкального произведения – как бы полную программу управления
“автоматическим оркестром”. Позволяет весьма точно записать достаточно
сложное музыкальное произведение, а затем любое число раз исполнить его
в точном соответствии с программой. Информация обычно хранится в файлах
с расширением MID.

Audio-технология обычно применяется там, где имеется исходный звуковой
сигнал, подлежащий обработке, – с ее помощью записывают, обрабатывают и
сводят “живые” акустические и голосовые партии, речь, шумы, специальные
сигналы и т.п. MIDI-технология снискала себе успех в создании
музыкальных произведений “с нуля”, посредством только электронных
инструментов. При помощи MIDI-системы может быть создан как некий
музыкальный каркас, к которому впоследствии будут добавлены голосовые
или акустические партии, так и полноценное, законченное музыкальное
произведение.

Для применения аудио-технологии достаточно простейшего звукового
адаптера, содержащего АЦП и ЦАП – аналого-цифровые и цифро-аналоговые
преобразователи. При этом сложность, качество и цена адаптера совершенно
не влияет на принципиальные возможности обработки звука- от адаптера
зависит лишь общее качество входного и выходного преобразования, а также
сервисные возможности (например, быстрое аппаратное сжатие или
фильтрование).

Для использования MIDI-технологии, прежде всего, нужен электронный
музыкальный инструмент, преобразующий последовательность нот и команд
управления в звук – обычный или сразу цифровой. Это может быть клавишный
синтезатор, звуковой модуль (тонгенератор, или синтезатор без
клавиатуры), музыкальная карта с аппаратным синтезатором или же
программный синтезатор – программа, имитирующая работу реального
синтезатора. Соответственно, все возможности, доступные в этой
технологии, целиком определяются имеющимся набором MIDI-инструментов.
(Подробнее об использовании MIDI в соответствующей главе).

В Windows каждая технология представлена своим типом звукового
устройства. Устройства могут быть реальными (аппаратные адаптеры) и
виртуальными (программы-имитаторы, генераторы, фильтры и т.п.). Общение
программ с устройствами происходит посредством аудио- и MIDI-портов,
которые появляются в системе после установки соответствующих устройств.

Отдельным случаем аудио-портов являются порты DirectSound. Классический
(Wave, MME) аудио-порт не гарантирует предельно быстрого вывода звука –
при обмене небольшими фрагментами, за счет буферизации и невысокой
частоты обращений к адаптеру, возникают значительные (относительно
времени звучания самих фрагментов) задержки. Интерфейс DirectSound,
входящий в комплект интерфейсов DirectX, дает возможность работать с
адаптером с минимальной буферизацией и накладными расходами, заметно
сокращая задержки. Кроме того, в DirectSound несколько программ могут
использовать один порт одновременно, что далеко не всегда возможно при
работе с Wave-портами.

Классификация программ

Любая программа для работы со звуком на PC использует в той или иной
форме одну из этих технологий либо обе сразу. Выделим следующие основные
классы программ:

* Звуковые процессоры (audio processors)

* Системы многоканальной записи и сведения (multitrack recorders)

* Звуковые редакторы (audio editors)

* Генераторы и анализаторы сигналов (audio generators/analysers)

* Виртуальные (программные) синтезаторы (virtual/software synthesizers)

* Музыкальные редакторы (music/MIDI editors)

– Секвенсоры (sequencers)

– Трекеры (trackers)

– Нотные редакторы (score editors)

* Музыкальные процессоры (music/MIDI processors)

* Автокомпозиторы (auto composers)

* Автоаккомпаниаторы (auto accompaniment generators, jammers)

* Распознаватели нот (score recognition software)

* Преобразователи форматов (format convertors)

* Считыватели звуковых дорожек с компакт-дисков (CD rippers/grabbers)

* Психоакустические компрессоры (psychoacoustic compressors)

* Проигрыватели (players)

* Системы для радиовещания и дискотек (delivery systems)

* Утилиты и управляющие программы (utility/control software)

Многие программы сочетают в себе функции из разных классов: например,
звуковые редакторы и секвенсоры нередко предоставляют также возможности
процессоров (обработка в реальном времени), а музыкальные процессоры и
автокомпозиторы часто имеют функции секвенсора.

1. Звуковые процессоры

Имитируют работу типовых устройств обработки звука,
применяемых в студийной работе -усилителей, ограничителей,
шумоподавителей, компандеров, эффект-блоков и т.п. Существует три
основных типа процессоров:

* Нелинейные (off-line) – получают сигнал в виде дискового файла,
предварительно записанного другими средствами, и записывают результат
обработки в другой дисковый файл.

* Сквозные реального времени – получают сигнал непосредственно с
аудиопорта и выводят результат в другой порт.

* Подключаемые модули (plugins) – получают сигнал от другой программы
при помощи специального программного интерфейса (API) и возвращают
результат обработки этой же программе. Фактическим стандартом такого
интерфейса стал Microsoft DirectX. Модули обычно поддерживают обработку
в реальном времени.

Процессоры первого типа разрабатывались достаточно давно, уступая место
процессорам второго типа по мере роста мощности компьютеров. После
появления системы DirectX популярные процессоры разрабатываются в этом
интерфейсе.

Подробнее с работой звуковых процессоров ознакомимся на примере
нескольких прграмм:

1. DSP/FX Virtual Pack

(Разработчик – Power Technology. Последняя выпущенная версия – 6.2.)

Программа имеет набор модулей обработки, которые могут использоваться
как посредством интерфейса DirectX, так и непосредственно обрабатывать
сигнал, полученный из Wave-файла или аудио-порта. Модули могут
использоваться также в качестве расширителей системы многоканальной
записи SAW и проигрывателя WinAMP.

Алгоритмы перенесены с аппаратной платы эффектов DSP/FX. При наличии в
системе плат DSP/FX модули могут использовать процессоры плат; в
противном случае вся обработка выполняется программно.

Каждый модуль поддерживает набор пресетов (предустановок) и управление
параметрами посредством MIDI-контроллеров.

В состав пакета входят следующие модули обработки:

StudioVerb – параметрический ревербератор с моделированием помещения.

AcousticVerb – еще один тип ревербератора.

Optimizer – мягкий пиковый ограничитель и сглаживатель цифровых шумов
(dithering).

Aural Activator – генератор гармоник для восстановления потерянных
высокочастотных составляющих.

Stereo Pitch Shifter – модуль стереофонического изменения высоты.
Изменяет высоту входного сигнала в соответствии с поступающими
MIDI-нотами и перемещением регулятора Pitch Bend. Может использоваться
для коррекции неточно выдержанных по высоте нот.

Multi-Tap Delay – имитатор множественных отражений внутри помещения, от
реверберации до длительных эхо.

Analog Tape Flanger – имитатор аналогового ленточного фленжера.

Multi-Element Chorus – имитатор хорового эффекта путем моделирования
пространственного разделения звука.

Parametric EQ – 8-полосный параметрический эквалайзер.

Auto-Panner – модуль автоматического позиционирования сигнала на
стереопанораме.

Tremolo – модуль внесения амплитудного вибрато (тремоло).

Widener – расширитель зоны стереоэффекта.

2. Cylonix Vocoder

(Разработчик – James J. Clark. Последняя выпущенная версия – 2.00).

18-полосный вокодер реального времени.

В основу многополосного вокодера положено то, что, речевой аппарат
человека работает по разностному принципу: исходный звук голосовых
связок, богатый гармониками, подвергается динамическому управлению –
резонансному усилению, амплитудной модуляции и фильтрованию – при
прохождении через речевой тракт. Принцип работы такого вокодера состоит
в разложении речевого управляющего сигнала (modulator) на заданное
количество частотных полос и анализе динамики в каждой полосе.
Полученные в результате анализа сигналы с определенной точностью
повторяют динамику работы речевого тракта. Эти сигналы управляют банком
частотных фильтров, через которые пропускается богатый гармониками
несущий сигнал (carrier); в результате на выходе банка образуется
“говорящий” несущий сигнал, как если бы звук подобного тембра издавали
сами голосовые связки.

Как несущий, так и управляющий сигнал может быть сгенерирован
несколькими способами – самой программой, введен с аудио-порта, либо
взят из готового Wave-файла.

Вокодер имеет множество параметров: ширина полосы фильтра, пропорции
смешивания входных и выходных сигналов, способы распознавания речевых
звуков, режим воспроизведения высоты управляющего сигнала, виды
отображения управляющих сигналов на банки фильтров. Различные способы
отображения – сдвиг на несколько полос, инверсия, перестановка соседних
полос и т.п. – позволяют в чрезвычайно широких пределах менять тембр
полученного сигнала.

Каждый канал вокодера имеет набор регуляторов – уровень, стереопанорама,
время затухания, задержка, время и интенсивность эха, уровень
дополнительных искажений.

Возможно также отключение анализа управляющего сигнала – тогда программа
работает, как обычный 18-полосный эквалайзер.

2. Системы многоканальной записи и сведения

Предназначены для многодорожечной записи и воспроизведения фонограмм
подобно многоканальному магнитофону, а также для оконечного сведения
(микширования) многодорожечной фонограммы. Основными функциями являются
монтажные операции на дорожках, совмещение звуковых фрагментов,
организация плавного перехода одних фрагментов в другие, регулировка
громкости и положения на стереопанораме для каждой дорожки, перезапись
всей дорожки или ее отдельных фрагментов.

Большинство систем многоканальной записи предназначено для работы в
серьезных студийных условиях, поэтому практически все они имеют
поддержку удаленного управления (MMC), синхронизации с внешними
устройствами (SMPTE). Ряд современных систем поддерживает также
синхронизацию с видеороликами.

В многоканальных системах используется преимущественно неразрушающий
(non-destructive) монтаж. Это означает, что программа оперирует на
многодорожечной панели не с самими звуковыми данными, а лишь со ссылками
на их фрагменты (clips). Это заметно уменьшает требования к памяти,
ускоряет доступ к данным и вдобавок защищает их от нежелательного
изменения.

Подробнее с работой систем многоканальной записи и сведения ознакомимся
на примере нескольких прграмм:

1. DDClip Pro

(Разработчик – SoftLab-NSK Последняя выпущенная версия – 3.01)

Новосибирская система многоканальной записи, монтажа, сведения и
компоновки с видеоданными.

Предоставляет до 32 аудиодорожек, одну MIDI-дорожку и две видеодорожки.
Каждая дорожка может содержать произвольное количество клипов – звуковых
или видеофрагментов, каждый из которых, в свою очередь, является ссылкой
на определенный участок исходных данных – аудио, MIDI или видео.

Технология работы в DDClip основана на подборе и совмещении клипов всех
трех видов. Для создаваемого ролика заготавливаются все необходимые
фрагменты, затем они в нужном порядке расставляются по дорожкам, после
чего выполняется точная подгонка, выравнивание, настройка уровней
громкости и панорамы, наложение эффектов и окончательное сведение.

На видеодорожках доступны простые операции видеообработки – обрезание
кадра, плавные переходы между кадрами. Видеоролики воспроизводятся на
любом устройстве с интерфейсом Video for Windows.

Поддерживается дополнительный монитор для вывода видеороликов.

На клипы могут накладываться профили – огибающие громкости и
стереобаланса. Также могут быть наложены эффекты реального времени –
delay, echo, chorus, phaser, flanger, графический/параметрический
эквалайзеры. Несколько эффектов могут быть связаны в цепочку. На весь
проект могут быть наложены глобальные (master) эффекты из этого же
набора.

Вспомогательное окно Clip Collection (коллекция клипов) является удобным
средством для быстрого выбора подходящих клипов и перетаскивания их в
нужные места дорожек.

2. n-Track Studio

(Разработчик – Flavio Antonioli Последняя выпущенная версия – 2.0.2).

Система записи, монтажа и сведения с некоторыми функциями
MIDI-секвенсора. Возможен разрушающий и неразрушающий монтаж. Количество
аудио- и MIDI-дорожек не ограничено. Поддерживаются работа с
DirectSound-портами и звуковые форматы до 24 разрядов и 96 кГц.

Имеет раздельные индикаторы уровня записи и воспроизведения, возможность
синхронизации с видеороликом (AVI/MPEG), огибающие громкости/панорамы в
режиме неразрушающего редактирования, метроном.

Для обработки применяются собственные и DirectX-модули, обработка
возможна как при воспроизведении, так и в режиме прямого ввода с порта
(live input). В состав встроенных модулей входят Chorus, Vol/Pitch
Shift, Echo, Compression, Reverb.

Для просмотра и редактирования MIDI-дорожек имеется окно Piano Roll с
несложным интерфейсом и возможностью квантования (quantize).

3. Звуковые редакторы

Объединяют функции цифрового магнитофона, звуковой монтажной станции и
набора устройств обработки звука (процессоров). Осуществляют запись,
воспроизведение и монтаж (вырезка, вклейка, замена фрагментов
фонограммы). Чаще всего имеют набор встроенных и/или подключаемых
звуковых процессоров, с помощью которых реализуется сложная обработка
записанной фонограммы. Редактор может быть многоканальным, допуская
раздельную запись и обработку нескольких звуковых дорожек с последующим
их сведением (микшированием). Ряд редакторов предоставляет звуковые
процессоры реального времени, а также средства для исследования сигнала
– спектроанализаторы, взвешивающие фильтры и статистические функции.

Среди типовых функций звуковых редакторов наиболее общими являются:

* Запись и воспроизведение звукового сигнала через аудиопорт звукового
адаптера (карты)

* Чтение и запись звуковых файлов, преимущественно формата RIFF PCM
(WAV), а также других распространенных форматов

* Возможность обработки моно- и стереосигнала с разрядностью 8 и 16 и
частотой дискретизации до 44 100 Гц (нередко – до 24 разрядов и 96 кГц)

* Монтаж сигнала (вырезка, вставка, удаление и размножение фрагментов)

* Различные способы выделения рабочего участка (selection) при монтаже с
выравниванием (snap) по точкам пересечения нуля (zero crossing), по
времени (time), по ритмическим долям (beats)

* Пометка точек и фрагментов фонограммы с ведением списка таких пометок,
из которого можно быстро перейти к помеченному участку, а также
поддержка списка участков проигрывания (play list), с помощью которого
можно заменить линейное проигрывание на “рваное”

* Основные операции обработки: усиление/ослабление, нормализация (такое
масшабирование сигнала, чтобы его амплитуда точно вписалась в заданный
диапазон), плавное увеличение/снижение уровня громкости (fade),
изменение стереобаланса (pan), сжатие/растяжение динамического диапазона
(compress/expand), пороговое пропускание (gate), наложение огибающей
(envelope)

* Основные виды эффект-обработки: phaser, flanger, reverb, delay, echo,
overdrive, distortion, fuzz и т.п.

* Специальные операции: частотное фильтрование (filter/EQ), изменение
высоты (pitch) сигнала или длительности (stretch) участка фонограммы,
ослабление шумов (noise, hiss) и щелчков (clicks, pops), формирование
музыкальных звуков из участков фонограммы, спектральный анализ всей
фонограммы или ее участка

* Преобразование формата сигналов – частоты дискретизации, разрядности
отсчета и количества каналов, смешивание стереоканалов в один

* Генерация сигналов различной формы и характеристик – как стационарных,
так и с изменяющимися во времени параметрами, а также шумов с различным
распределением

* Доступ к зарегистрированным в системе внешним модулям (plugins)
обработки звука в стандарте DirectX/ActiveMovie, которым передается для
обработки выделенный участок фонограммы

* Синхронизация записи/воспроизведения по MIDI – запуск записи или
воспроизведения по внешнему событию, посылка синхронизирующих сообщений
другим устройствам (ведущее устройство, master sync), синхронизация по
приходящим от других устройств сообщениям (ведомое устройство, slave
sync)

Подробнее с работой звуковых редакторов ознакомимся на примере
нескольких прграмм:

1. Sound Forge

(Разработчик – Sonic Foundry Последняя выпущенная версия – 4.5c).

Многооконный редактор с поддержкой OLE, видеороликов в формате AVI и
дополнительного монитора для их отображения в процессе работы.

При работе с файлами в 16-разрядном формате PCM (WAV) есть возможность
открыть файл в режиме непосредственного доступа (Direct mode), без
промежуточного копирования. Это заметно ускоряет работу, однако лишает
возможности сохранить прежнюю версию файла при аварийном завершении.

Максимально достижимое увеличение – одна точка экрана на один отсчет
оцифровки, чего в ряде случаев явно недостаточно для хорошего
рассмотрения формы волны.

Автоматическое выравнивание при выделении – по точкам пересечения нуля и
временным меткам.

При монтаже удобно пользоваться функциями Preview Cur/Cursor
(прослушивание, каким будет результат вырезки, до выполнения самой
вырезки) и Pre-roll to Cursor (прослушивание небольшого участка перед
курсором).

Поддерживается список помеченных участков (regions) и выборочного
проигрывания.

В режиме записи возможно создание “пульта дистанционного управления” –
Remote Control. При этом основное окно редактора заменяется на небольшое
окно “пульта”, находящееся поверх других окон. Эта функция удобна при
записи сигнала, формируемого другой программой, либо устройством,
управление которым производится из другой программы.

В режиме записи возможен также прямой сброс данных на диск, минуя
системный кэш с обратной записью. Это позволяет избавиться от долгих
пауз, когда Windows сбрасывает кэш на диск, останавливая при этом все
программы, однако работа диска в таком режиме становится весьма
напряженной за счет непрерывного позиционирования. Надо сказать, что и
при работе через кэш Sound Forge использует диск гораздо более
агрессивно, чем большинство других редакторов.

Редактор может работать с внешними семплерами (Akai, E-mu, Kurzweil,
Peavey), поддерживающими стандарты MIDI SDS и/или SCSI SMDI.
Поддерживается также подготовка семплов для ACID – другой программы
Sonic Foundry, предназначенной для создания музыки из готовых
фрагментов.

Генератор сигналов выдает простые периодические сигналы и серии DTMF, а
также имеет функцию FM Synthesis – частотно-модуляционный операторный
синтез, популярный в электронных синтезаторах начала 80-х.

Поддерживаются собственные подключаемые модули. При помощи модуля Batch
Converter можно создать последовательность операций обработки, которая
затем может быть автоматически применена к одному или нескольким файлам.
CD Architect предназначен для формирования и записи звуковых
компакт-дисков. Spectrum Analysis служит для спектрального анализа
фонограммы, Noise Reduction – для ослабления помех и шумов, Q-Sound –
для придания звуку эффекта объемности.

Синхронизация по MIDI возможна в обоих режимах – ведущем и ведомом.

Имеется любительская локализация SF 4.5 на русском языке (переведены
тексты меню и сообщений). Качество перевода среднее.

2. WaveLab

(Разработчик – Steinberg. Последняя выпущенная версия – 2.02).

Один из наиболее мощных и удобных современных редакторов. Поддерживает
форматы до 24 разрядов и 96 кГц.

Предоставляет все необходимые монтажные операции, нормализацию,
преобразования динамики, коррекцию высоты/времени звучания. Операции
сложной обработки немногочисленны: трехполосный эквалайзер, гармонайзер
на 16 голосов (создает дополнительные гармоники основного голоса),
качественный Chorus.

Основное внимание при обработке уделено поддержке модулей реального
времени – собственных, DirectX и VST (от Cubase VST). Для управления
модулями сделана специальная панель эффектов (Master Section), в которой
можно выбрать до шести модулей одновременно. Для модулей WaveLab/VST
изображаются панели управления, стилизованные под вид аппаратных
стоечных блоков. Панели модулей, а также панели инструментов WaveLab
(toolbars) могут находиться в любом месте экрана, а не только в окне
редактора.

Имеет функции сравнения двух файлов, генерации тестового сигнала с
огибающей, построения трехмерной спектрограммы с показом ее с различных
точек зрения.

Функция Batch Processor позволяет сформировать алгоритм пакетной
обработки набора файлов.

Поддерживает обмен данными с аппаратными семплерами AKAI, Ensoniq, E-mu,
Kurzweil, Roland в стандартах SDS/SMDI. Может считывать звуковые дорожки
с компакт-дисков. Содержит встроенный CD-рекордер с возможностью задания
длительности пауз между дорожками.

Имеет несколько стилей и цветовых палитр интерфейса. После выполнения
каждой операции отмечается время, затраченное на операцию, с точностью
до миллисекунды, что удобно для оценки эффективности.

4. Генераторы и анализаторы сигналов

Служат для создания и исследования звуковых сигналов. Генераторы создают
звуковые сигналы с заданными параметрами – формой, частотой, амплитудой,
спектром, динамикой; полученный сигнал может использоваться для проверки
и настройки звуковой аппаратуры, модификации музыкальных тембров путем
смешивания или модуляции исходного сигнала, создания новых тембров и
т.п. Анализаторы выделяют из входного сигнала различную информацию –
спектральный состав, соотношения гармоник, динамические характеристики,
статистические параметры. Сочетание генератора тестового сигнала,
подключенного ко входу звукового тракта, и анализатора, подключенного к
его выходу, позволяет изучать поведение тракта при прохождении различных
сигналов, а также снимать нужные виды характеристик –
амплитудно-частотную, фазо-частотную, динамическую, определять
коэффициенты гармоник и интермодуляции и т.п.

Подробнее с работой генераторов и анализаторов сигналов ознакомимся на
примере нескольких прграмм:

1. SpectraLab

(Разработчик – Sound Technology Последняя выпущенная версия – 4.32.13).

Чрезвычайно мощная система анализа звуковых сигналов – как в записи, так
и в реальном времени. Поддерживает форматы до 24 разрядов, 96 кГц.

Анализ ведется в трех основных режимах: Real Time – обработка и
построение графиков в реальном времени по данным, поступающим с
аудиопорта; Recorder – то же, с параллельной записью поступающего
сигнала; Post-Processing – анализ предварительно записанного Wave-файла.

Результаты анализа динамически представляются в окнах нескольких видов:

* Time Series – обычная осциллограмма

* Spectrum – спектральный график, непрерывный или полосовой

* Phase – изменения фазы сигнала

* Spectrogram – график изменения спектра во времени, в котором
мгновенные “снимки” спектра сигнала рисуются по вертикали цветными
линиями

* 3D Surface – трехмерная спектрограмма

Все виды окон могут открываться и динамически обновляться одновременно.

Отображаются также скалярные результаты – частота и амплитуда пиков,
мощность сигнала, коэффициент гармоник, коэффициент интермодуляции,
соотношение сигнал/шум.

Есть генератор тестовых сигналов, также работающий в реальном времени, с
помощью которого можно анализировать работу исследуемого звукового
тракта.

Программа имеет большое количество параметров, задающих полосы частот и
способы анализа, параметры преобразования Фурье, оконных функций,
отображаемых графиков и т.п. Вероятно, это – самая мощная система
анализа сигнала для PC.

2. Analyser

(Разработчик – Павел Сукорцев Последняя выпущенная версия – 1.1).

Маленькая простая программа для быстрой оценки качества тракта
записи-воспроизведения дуплексных звуковых карт. Содержит генератор
тестового сигнала и анализатор спектра. Выход карты подключается к ее
входу, задействуя ЦАП, АЦП и входные/выходные аналоговые цепи.
Отображает в окне график АЧХ тракта.

5. Виртуальные синтезаторы

Являются наиболее популярным у музыкантов видом программ. Имитируют
работу музыкального инструмента путем моделирования процессов,
происходящих при извлечении звука. Преимущественно используется три
основных метода синтеза звука:

* Семплерный (sample) или таблично-волновой (wavetable) – создание звука
из одного или нескольких заранее записанных фрагментов исходного
звучания, с возможной параллельной обработкой сигналов. Наиболее прост
технически, не требует больших вычислительных ресурсов, зато требует
большого объема памяти для хранения качественных образцов звучания.

* Аналоговое моделирование – имитация работы аналогового синтезатора
путем математического суммирования, вычитания, модуляции и фильтрации
сигналов различной формы, создаваемых также математическим путем.
Позволяет с хорошей точностью моделировать популярные клавишные
синтезаторы 60-70 годов, бас-станций и ритм-блоков. Не критичен к
объемам памяти, однако требует больших вычислительных затрат на
математические расчеты.

* Физическое моделирование – создание математической модели реального
акустического инструмента и получение на ее основе формул звуковых
колебаний, создаваемых инструментом. Для полной реализации требует
чрезвычайно больших вычислительных мощностей, из-за чего в реальном
времени реализуется лишь частично.

По способу функционирования виртуальные синтезаторы можно разделить на
две группы:

* Генераторы – предназначены главным образом для создания звучаний,
преимущественно не в реальном времени, с целью сохранения полученных
образцов и последующего использования посредством семплерных или
таблично-волновых синтезаторов.

* MIDI-синтезаторы – имитируют синтезатор с управлением по MIDI. Создают
собственный виртуальный MIDI-порт, отрабатывают получаемые через него
MIDI-команды, генерируя на выходе музыкальный звук подобно реальному
синтезатору. Работают либо в реальном времени, передавая сформированный
звуковой сигнал в аудиопорт, либо опосредованно, записывая его в
Wave-файл. Во втором случае называются MIDI Renderer – по аналогии с
системами построения движущихся изображений из серии неподвижных кадров.

Подробнее с работой виртуальных синтезаторов ознакомимся на примере
нескольких прграмм:

1. Generator

(Разработчик – Native Instruments. Последняя выпущенная версия – 2.0.4).

Чрезвычайно мощный модульный синтезатор. В спектр модулей помимо
типичных генераторов, усилителей и микшеров входят инверторы, сумматоры,
перемножители, несколько различных типов 1-, 2- и 4-полюсных фильтров,
дифференциатор/интегратор, логарифматор/экспоненциатор, ограничитель,
детектор пиков, делитель частоты, фиксатор уровней (sample + hold),
модуль квантования по уровню, модули логических операций над
управляющими сигналами, сглаживатель и еще несколько модулей со сложными
функциями.

Входы и выходы модулей обозначены различными значками, дающими
представление об их функциональном назначении. Связывание входов и
выходов выполняется простым движением мыши.

Составленная из модулей схема может быть объявлена как новый модуль
(макроблок). Структура схемы при этом скрыта, и макроблок изображается
лишь стандартным для модуля прямоугольником с названием и обозначениями
входов/выходов. Такой подход удобен для создания типовых блоков
синтезатора.

Модульная схема может быть снабжена панелью – совокупностью кнопок,
ручек, движков и индикаторов, стилизованных под привычные органы
управления. В конечном счете, после завершения создания структур, на
экране остаются одни панели, которые выглядят как реальные аппараты и
смотрятся очень красиво.

Структура с панелью управления называется инструментом. Инструмент опять
же может иметь входы и выходы и выступать в качестве модуля.
Совокупность инструментов называется ансамблем (ensemble). В комплекте с
программой поставляется большое количество схем, макроблоков, панелей,
инструментов и их ансамблей.

Всплывающие подсказки при наведении курсора мыши на изображение модуля
или панели кратко поясняют суть объекта и правила обращения с ним.

Частота дискретизации звукового сигнала может быть от 22 до 132 кГц.
Существует также понятие частоты управления (Control Rate) – с этой
частотой процессор синтезатора сканирует схемы, “проталкивая” по ним
сигналы. Частота управления задается в пределах от 25 до 1600 Гц.

Положения регуляторов могут быть сохранены (snapshot). Впоследствии
можно возвращаться к любому из сохраненных наборов положений, а также
восстанавливать нажатием кнопки последний набор.

При всей своей сложности Generator работает достаточно быстро,
обеспечивая хороший отклик и стабильность звука. При использовании
DirectSound-портов устойчивость повышается.

2. GigaSampler

(Разработчик – Nemesys . Последняя выпущенная версия – 1.6).

Революционная в своем роде программа, наделавшая своим появлением много
шума. MIDI-синтезатор реального времени, не требующий полного размещения
семплов в ОЗУ – считывание с диска (жесткого, магнитооптического, CD)
происходит прямо в процессе проигрывания, что снимает все ограничения на
объем инструментов, кроме объема самих дисков (объем одного семпла в
инструменте ограничен 4 Гбайт из-за 32-разрядной сетки).

Для достижения наилучших результатов выпущена спецификация GigaSampler
Interface (GSIF) – программного интерфейса с аудиопортом, через который
GigaSampler обеспечивает минимальные задержки. Этот интерфейс уже
реализован в драйверах карт Aardvark Aark, Soundscape Mixtreme, Echo
Darla/Gina/Layla, EgoSys WaveTermital, Frontier Dakota.

Благодаря снятию ограничений на объем инструментов и их банков большое
внимание уделено схеме отображения отдельных семплов на клавиатуру и
уровни интенсивности (sample map). Рекомендуется метод построения
инструмента без масштабирования высот семплов, то есть по отдельному
семплу на каждую клавишу. Вдобавок введено понятие измерений
(dimensions) – своеобразной координатной сетки из пяти различных
контроллеров, совокупность значений которых как бы выбирает нужный семпл
в пятимерном пространстве. Такая система введена для поддержки
инструментов, на которых играют разными способами.

Большие объемы звучаний располагают к тому, чтобы образцы записывались
полностью, без искусственного зацикливания и формирования фаз
атаки-затухания методом амплитудной модуляции.

Инструмент создается из семплов традиционным путем – раскладкой по
клавиатурным зонам (regions), интенсивности и измерениям, а также
наслоением друг на друга. Здесь имеются традиционные для аппаратных
самплеров средства – частотная и амплитудная модуляция посредством
огибающих (два генератора) и LFO (один генератор), фильтрование (срез,
полоса, пробка, резонанс).

Звук выводится в 16-, 20- и 24-разрядном формате с частотами
дискретизации 32, 44,1 и 48 кГц. Поддерживается до 16 выводных
аудиоканалов, между которыми заданным образом распределены входные
MIDI-каналы. Есть функция прямой записи звука на диск (Capture).

В комплект входят редакторы семплов (волновых форм и циклов в них) и
банков инструментов, а также преобразователь инструментов из формата
Akai S1000/S3000, способный считывать “родные” компакт-диски от
семплеров Akai.

6. Музыкальные редакторы

В эту группу входят программы, предназначенные для работы с музыкальными
партитурами, как правило – в технологии MIDI. Музыкальный редактор
обычно имеет дело не с конкретными звучаниями, а лишь с некоторой схемой
их создания, которая обычно базируется на различных видах нотной записи,
расширенной специфическими средствами управления инструментами.

Секвенсоры предназначены для записи, воспроизведения и редактирования
музыкальных MIDI-партитур в нотном и схематическом виде, осуществляют
типовые музыкальные операции – транспонирование, изменение темпа,
длительности и динамики нот, а также монтаж фрагментов партитуры. Всегда
многодорожечные – допускают формирование произведения из множества
независимых партий. Большинство современных секвенсоров имеет поддержку
аудиотехнологии, позволяя размещать на отдельных дорожках акустические
или голосовые партии; окончательное смешивание сигналов при этом
выполняется внешними аппаратными (звуковой адаптер, микшерный пульт) или
программными (виртуальный синтезатор, многоканальный рекордер)
средствами.

Название происходит от термина sequence – последовательность, поскольку
первые секвенсоры (тогда еще некомпьютерные) предназначались для записи
последовательности MIDI-событий и последующего ее воспроизведения в
неизменном виде, и лишь затем к этому добавились функции монтажа и
редактирования.

Подробнее с работой секвенсоров ознакомимся на примере следующей
прграммы:

Cakewalk Pro Audio

(Разработчик – Twelve Tone Systems. Последняя выпущенная версия – 9).

Наиболее массовый и популярный MIDI-секвенсор с поддержкой аудиодорожек.
Имеет удобный и интуитивно понятный интерфейс, широкий спектр
необходимых функций редактирования и обработки. Работает с различными
видами MIDI- и аудиооборудования, поддерживает частоты дискретизации до
96 кГц и разрядность оцифровки до 24 бит.

Поддерживает до 256 виртуальных дорожек, на каждой из которых может
располагаться одна или несколько MIDI-партий либо аудиофрагменты.
Секвенсор работает только с одноканальными (монофоническими)
аудиоданными, поэтому стереоданные размещаются на двух дорожках. Каждая
дорожка имеет набор свойств: название, ссылку на устройство вывода,
номер канала, начальную громкость и положение на стереопанораме, номера
MIDI-банка и инструмента и т.п.

Существует понятие clip – логически законченный фрагмент дорожки,
содержащий партию инструмента, ритмический рисунок или музыкальную
фразу; на панели проекта такие фрагменты отображаются различными цветами
и могут выбираться/перемещаться простым нажатием и перетаскиванием
мышью.

При копировании клипов они могут копироваться вместе со своим
содержимым, либо может копироваться только ссылка на исходный клип
(linked clips – связанные клипы). Все связанные клипы одной группы
ссылаются на один и тот же набор данных, и все изменения в любом из
клипов группы фактически происходят в этом наборе.

Система построения управляющих панелей StudioWare дает возможность
нарисовать панель нужного вида, снабдить ее органами управления и
индикации – кнопками, движками, ручками, переключателями, индикаторами и
шкалами, описав механизм действия каждого органа, чтобы затем в режиме
реального времени управлять работой секвенсора и синтезаторов при помощи
созданной панели. Динамика работы органов управления может быть записана
и многократно воспроизведена. В комплекте поставляется несколько готовых
панелей управления.

Поддерживается просмотр видеороликов в форматах AVI, MPEG и QuickTime и
синхронизация партитуры с кадрами ролика.

В режиме выбора банка и номера MIDI-инструментов работает удобная
система поиска.

Средства MIDI-редактирования включают сдвиг, выравнивание по ритмической
сетке (quantize), а также обратную операцию “разбрасывания” (groove
quantize), транспонирование, растяжение/сжатие времени и нот, мощную
операцию Interpolate для масштабирования и преобразования видов
MIDI-сообщений. Предусмотрена возможность подключения внешних модулей
MIDI-обработки (MIDI Effects, MIDI Plugins). В состав пакета входят
модули арпеджиатора, анализатора аккордов, имитатора эффектов echo и
delay.

Имеется встроенный редактор аудиофрагментов с возможностью монтажа,
усиления/ослабления, нормализации, смешивания, эквалайзера, поиска
переходов через нуль, определения темпа, распознавания высоты нот.
Поддерживаются подключамые модули в стандарте DirectX, в состав пакета
входит набор основных видов обработки.

Функция Mixdown Audio дает возможность свести несколько готовых
аудиодорожек в одну, после чего исходные дорожки можно заглушить – это
заметно снижает накладные расходы на смешивание в реальном времени.

Поддерживается синхронизация от собственного генератора, генераторов
звуковых адаптеров, внешнего источника (SMPTE), а также посылка и прием
команд MMC (MIDI Machine Control). Встроенный несложный язык
программирования CAL (Cakewalk Application Language) позволяет создавать
собственные программы для обработки звуковых данных.

При работе со звуковыми картами семейства AWE (AWE32, SB 32, AWE64, SB
Live!) доступно удобное управление банками SoundFont.

Имеется любительская локализация версии 8.01 на русском языке
(переведены тексты меню, сообщений и помощи). Качество перевода –
среднее.

Трекеры cочетают в себе виртуальный семплерный синтезатор, редактор его
инструментов и редактор партитур, позволяя обходиться единственной
программой на протяжении всего цикла изготовления композиции. Появились
в начале 80-х в любительской среде как альтернатива дорогим и сложным
профессиональным синтезаторам и секвенсорам. Благодаря этому имеют
специфический способ представления партитуры, основанный на кадрах
(pattern), каждый из которых имеет фиксированное количество командных
строк (стандартно 64). В каждой строке кадра располагается одна нота или
команда изменения параметров звука – высоты, громкости, глубины
модуляции, темпа, специфических режимов синтезатора, перехода к другой
позиции кадра или другому кадру и т.п. По вертикали кадр делится на
каналы, или голоса партитуры, – в каждом канале обычно записывается
отдельная партия, однако из-за традиционных особенностей структуры, не
допускающих совмещение разных нот в одной позиции, аккорды и
многоголосые партии приходится записывать сразу в нескольких каналах.

Композиция собирается из последовательности кадров, причем любой кадр
может встречаться произвольное количество раз. Способ представления
партитуры изначально был ориентирован на ритмичную музыку размера
4/4,что весьма затрудняет работу с “нечетными” размерами.

Композиции, сделанные в трекерах, сохраняются в файлах, называемых
модулями. Модуль содержит как партитуру – ноты и команды управления, так
и сами звучания инструментов. Это сильно увеличивает объем модуля по
сравнению с файлами MIDI-технологии, однако снимает аппаратную
зависимость – звучание модуля зависит только от верности его
интерпретации трекером или проигрывателем. Наиболее распространенные
типы модулей – MOD, STM, S3M, XM, IT, ULT.

Интерфейс большинства трекеров изобилует собственными терминами,
отличными от традиционно принятых в системах звукосинтеза,
шестнадцатеричными числами, техническими подробностями и прочей
неподходящей для обыкновенного музыканта атрибутикой. Трекеры весьма
популярны в среде молодежного музыкального андерграунда – на них легко,
быстро и практически без финансовых затрат получаются модные ритмичные
композиции в стилях techno, rave, trance, trip-hop и им подобных.

Большая часть трекеров сделана под DOS, для работы на маломощных
(286-486) компьютерах.

Подробнее с работой трекеров ознакомимся на примере нескольких прграмм:

1. Fast Tracker

(Разработчик – Triton (Vogue & Mr. H). Последняя выпущенная версия –
2.08).

Достаточно мощный трекер под DOS с красивым графическим интерфейсом и
управлением мышью. Собственный тип модулей – XM, воспринимает модули
типа MOD, STM, S3M и файлы описания инструментов Gravis Ultrasound
(PAT).

Инструменты FT могут быть многослойными, сочетая до 16 8- или
16-разрядных семплов с частотой дискретизации до 44,1 кГц, каждый из
которых имеет собственные огибающие амплитуды и панорамы, а также
частотный модулятор (вибрато). Каждая огибающая может быть зациклена,
образуя своеобразный амплитудный или панорамный LFO. Количество
инструментов – до 128. Редактор семплов и инструментов имеет удобный
интерфейс с графическим представлением огибающих.

В редакторе семплов есть интересная функция Morph, делающая плавный
переход от одного звучания к другому.

Трекер (как, впрочем, и большинство других) оптимизирован под звуковую
карту Gravis Ultrasound, однако неплохое звучание получается и на
SB16-совместимых картах. Остальные карты трекер может использовать
только в 8-разрядном режиме. Поддерживается также прямой ЦАП на
LPT-портах (Soundplayer, Covox) и традиционный PC Speaker.

При работе с картами GUS и SB16 поддерживается MIDI-клавиатура.

Звучание модуля может быть записано непосредственно в Wav-файл, без
передачи звуковому адаптеру и промежуточных преобразований.

2. Modplug Tracker

(Разработчик – Olivier Lapicque. Последняя выпущенная версия – 1.09).

Редактор семплов с функциями нормализации, усиления, передискретизации,
переворачивания. Редактор инструментов поддерживает все возможности
модулей MOD, S3M, XM и IT. В режиме IT доступны случайные вариации
громкости и панорамы, а также резонансные фильтры.

Встроенный проигрыватель, как в и Modplug Player, имеет функции Bass
Expand, Reverb, ProLogic Surround, 6-полосный эквалайзер.

Ноты вводятся либо с клавиатуры компьютера, как в традиционных трекерах,
либо со внешней MIDI-клавиатуры. Может быть загружен MIDI-файл с
заданным отображением раскладки его инструментов на инструменты трекера.
При помощи виртуального MIDI-кабеля трекер может быть использован в
качестве программного MIDI-синтезатора.

Нотный редактор подобен секвенсору – многие из них также могут
записывать и воспроизводить MIDI-партитуры, однако основной задачей
нотного редактора является подготовка партитуры к печати и изданию.
Благодаря этому в нотных редакторах существуют лишь минимальные средства
работы с MIDI-сообщениями, необходимые лишь для записи и
воспроизведения. Остальные функции ориентированы на работу с нотным
текстом – ввод нот, аккордов, расположение партий на нотных станах,
снабжение их нужными музыкальными знаками и т.п. Результатом работы в
нотном редакторе является правильно и красиво напечатанная нотная
партитура.

Подробнее с работой нотных редакторовров ознакомимся на примере
следующей прграммы:

Finale 2000

(Разработчик – Coda Music Technology. Последняя выпущенная версия –
2000).

Профессиональный нотный редактор. Предоставляет три способа ввода нот и
аккордов: Simple Entry – с клавиатуры компьютера или мышью, Speedy Entry
– с MIDI-клавиатуры с заданной постоянной ритмикой, HyperScribe – путем
игры на MIDI-клавиатуре в реальном времени или импорта MIDI-файла,
ритмические параметры определяются автоматически. Возможна запись игры
двумя руками с автоматическим разделением на партии левой/правой руки.
Введенные ноты могут быть квантованы (quantization).

Рядом с нотами могут быть помещены тексты вокальных партий (lyrics).

Нотный текст отображается в двух видах: Scroll – непрерывные партии
слева направо с прокруткой, и Page – заготовки страниц с указанным
расположением партий и возможностью его изменения. Расположение по
умолчанию определяется шаблоном; в поставке есть шаблоны партитур разных
стилей и применений (ансамблевые, оркестровые, церковные и т.п.).

Возможен импорт файлов Encore и MIDIScan.

Для удобства работы с данными введена слойная структура: на странице
может быть до 4 слоев по 2 голоса в каждом. При переключении слоев
панели инструментов ввода меняют цвет.

Специальные знаки – лиги, скобки, знаки крещендо/диминуендо, реприз и
т.п. – изображаются и перемещаются как графические объекты. Некоторые из
фигур снабжены манипуляторами (handles), которыми, зацепляя их мышью
можно менять размер и форму фигуры.

Для любого такта может быть создана копия со ссылкой (mirror). Подобная
копия не содержит данных, отображая содержимое основного такта. Можно
задать выборочный показ нот в копии такта.

Могут быть созданы “плавающие” пояснительные такты, не звучащие при
контрольном проигрывании. Такие такты могут быть помещены в любое место
страницы.

Возможна различная трансляция энгармонических тональностей – с выбором в
пользу диезов, бемолей либо заданным образом.

Большие партитуры могут печататься на несколько листов, которые затем
склеиваются в один большой лист (tiling pages).

Наряду с печатью партитуры возможно ее преобразование в PostScript –
кодированный “сценарий” построения изображения – наподобие компиляции
исходного текста компьютерной программы. Файлы PostScript предназначены
для распространения – их можно просмотреть и напечатать, однако из них
нельзя однозначно воссоздать структуру партитуры с разделением на
партии, знаки, текст, специальные пометки и т.п.

7. Музыкальные процессоры

Служат для обработки музыкальных партий в формате MIDI – внесения
исполнительских нюансов, изменения стиля исполнения, “оживления”
композиции. Обнаружено, что естественность имитации звучания
акустических инструментов зависит не столько от точности повторения
самого тембра, сколько от особенностей игры, присущей данному
инструменту: для гитары это способ щипка, подтяжка струн, пальцевое
вибрато, для скрипки – сила нажатия смычком на струны, динамика движения
смычка и то же пальцевое вибрато, для духовых – характерное изменение
громкости по ходу музыкальной фразы и т.п. Процессоры работают обычно с
готовой партитурой, построенной “математически точно” – все ноты стоят в
точности на своих местах, нюансы изменения высоты и громкости
отсутствуют.

Подробнее с работой музыкальных процессоров ознакомимся на примере
нескольких прграмм:

1. Style Enhancer

(Разработчик – NTONYX. Последняя выпущенная версия – 2.1).

Первый интеллектуальный MIDI-процессор, разработанный в Новосибирской
Государственной консерватории.

Фактически процессор выполняет моделирование исполнения (performance
modelling) – имитирует приемы, которыми музыкант воздействует на
реальный инструмент. Работа процессора основана на понятии стиля –
совокупности характерных приемов воздействия на инструмент, используемых
музыкантами в игре на различных инструментах. Каждый стиль характеризует
особенности исполнения различных музыкальных фраз, типичные акценты на
каких-либо элементах музыки, нюансы ритма, интенсивности, варьирования
различных параметров звука.

Просматривая исходный MIDI-файл, SE распознает в нем объекты (objects) –
аккорды, музыкальные фразы, ритмические рисунки, громкостные или
высотные ходы. К каждому объекту по заданной схеме применяется правило
(rule), описывающее параметры объекта, которые нужно изменить, и
величины этих изменений. Например, правило может указывать небольшое
смещение нот во времени относительно ритмических долей, изменение
интенсивности звучания по ходу фразы, вставку команд изменения высоты
(pitch bend) для имитации глиссандо, вибрато или подтяжек.

Совокупность правил, применимых к партии отдельного инструмента, и
образует стиль. В составе SE поставляется набор готовых стилей –
гитарные, скрипичные, фортепианные, духовые и т.п. Показательно, что при
обработке партии, скажем, скрипичным стилем и проигрывании ее звуком
другого инструмента, похожего по динамике, возникает ощущение, что
играет все-таки скрипка. Очевидно, для человеческого восприятия
особенности звучания инструмента оказываются важнее, нежели предельно
точное воссоздание его тембра.

Для наиболее эффективной работы процессора исходный файл может быть
“выровнен” или отквантован – все ноты выставлены по ритмической сетке и
их интенсивности (velocity) приведены в одинаковое значение. Это
позволит SE более точно распознать и правильно обработать объекты.

Процессор предоставляет ряд монтажных и управляющих функций секвенсора
для “тонких” манипуляций с исходными и результирующими MIDI-партитурами.

2. Pattern Variator

(Разработчик – NTONYX. Последняя выпущенная версия – 1.0).

Другой музыкальный процессор NTONYX. Предназначен для внесения в готовые
MIDI-композиции динамического изменения параметров звучания – громкости,
модуляции, панорамы, плавных и дискретных изменений высоты,
характеристик фильров и эффектов, и т.п. Особенно эффективен при
обработке музыки, в которой основную нагрузку несет
тембрально-динамическая, а не мелодико-гармоническая сторона.

Исходная композиция вводится (импортируется) в формате MIDI, результат
сохраняется в специфическом формате PV. Традиционные секвенсорные
операции редактирования самих MIDI-дорожек не поддерживаются – целью
процессора является только управление параметрами. Параметром может быть
любая MIDI-переменная – интенсивность ноты (velocity), темп,
длительность ноты, интервал между нотами, значение любого из
контроллеров. На каждую MIDI-дорожку может быть наложен собственный
набор изменяющихся параметров, который именуется моделью (pattern).

Способ внесения динамических параметров заключается в наложении на
композицию графика изменения каждого из них. Графики создаются из
участков, каждым из которых может быть либо прямая линия, либо гладкая
кривая заданной кривизны. График задает изменение параметра относительно
среднего значения, которое указывается в свойствах параметра. В
свойствах указывается также масштаб изменения, что усиливает или
ослабляет амплитуду изменения, заданную графиком.

Кроме изменяющихся параметров, имеются три функции трансформации нот:
переворот по вертикали (высоте), переворот по горизонтали (времени) и
подстановку, когда для каждой ноты октавы может быть задано повышение
или понижение.

Процессор предлагает очень интересную и чрезвычайно мощную функцию –
растягивание модели на несколько повторений (циклов) партии. Это
приводит к различному звучанию партии внутри каждого цикла. Убирание до
нуля параметра громкости эквивалентно глушению дорожки и пропаданию этой
партии из общего звучания. Таким образом, создавая заранее “болванку” с
различными партиями – вступления, проигрыша, различных ритмических и
басовых рисунков, а затем рисуя для них графики громкости и остальных
параметров, можно прямо в PV создавать различные композиции и
варьировать их звучание.

8. Автокомпозиторы

Пользуясь различными приемами, автоматически создают элементы
музыкального творчества – мелодический или гармонический рисунок, либо
готовую композицию, составленную из типовых схем и фрагментов. Служат
для быстрого создания заготовок композиций, а не особо требовательным
пользователям – и конечного продукта.

Подробнее с работой автокомпозиторов ознакомимся на примере следующей
прграммы:

Koan Pro

(Разработчик – SSEYO. Последняя выпущенная версия – 2.2).

Интересная программа для создания фоновой музыки. Идея заключается в
группировке голосов (voices) различных типов, каждый из которых либо
исполняет заданную партию, либо импровизирует под управлением программы
(иначе говоря, программа в некотором роде сочиняет музыкальные шаблоны).

Каждый тип голоса имеет свое назначение: Rhytmic – ритмический рисунок
заданного типа; Ambient – “тянущиеся” звуки, типичные для электронной
музыки (может быть подставлен Wave-файл); Follows – голос-повторитель,
повторяющий движение другого заданного голоса, с задержкой и смещением
по высоте; RepeatBar – голос, периодически играющий фразу на основе
прошлой сыгранной им же фразы; FixedPattern – фраза фиксированного вида;
Listening – голос, “слушающий” остальные голоса и играющий на этой
основе – например преобразующий ноты в аккорды.

Наличие “слушающего” голоса позволяет организовать на базе Koan систему
аккомпанемента реального времени, настроив эти голоса на MIDI-порт.

Голоса исполняются инструментами. Инструмент может быть инструментом
MIDI – GM/GUS/AWE SoundFont/XG либо файлом WAV/MP3. Для
MIDI-инструментов поддерживаются все необходимые параметры GM, AWE и XG.

Голоса и инструменты имеют наборы параметров – тип, громкость, панорама,
специфические параметры синтезатора, динамика голоса, зависимость от
других голосов и т.п. Начальные значения параметров устанавливаются в
основной панели, текущие значения могут изменяться на протяжении голоса.
Основные параметры – громкость, модуляция, панорама и т.п. – могут иметь
рисованные графики изменения (envelopes).

Группа параметров Voice Rules (голосовые правила) задает правила
поведения и движения голосов; с помощью этих параметров управляется
“автоматический композитор” Koan.

Имеются так называемые микропараметры – небольшие изменения громкости,
высоты, модуляции, отклонения нот от ритмической сетки, предназначенные
для оживления композиции.

Для каждого параметра поддерживается список значений, из которого при
каждом проигрывании композиции случайным образом выбирается значение.
Если параметр не имеет списка, каждый раз используется значение,
заданное в панели.

Функция Add Random добавляет в партитуру голос случайного типа и тембра.
Функции Randomize – Parameter, Column, Group/Row устанавливают случайные
значения единичного параметра голоса, колонки однотипных параметров всех
голосов или всех параметров одного голоса. Такие же функции Mutate
изменяют значения параметров на случайные величины.

9. Автоаккомпаниаторы

Служат для автоматической выдачи готового музыкального аккомпанемента –
в реальном времени либо в добавление к заданным сольным партиям подобно
популярным музыкальным клавишным инструментам Yamaha PSR/PSS, Casio и
др. В отличие от этих инструментов они редко способны динамически
изменять тональность и структуру аккомпанемента в зависимости от
движения солирующего голоса.

Аккомпаниаторы, как правило, ориентированы на технологию MIDI, позволяя
использовать внешние синтезаторы и назначить конкретные MIDI-инструменты
для различных партий аккомпанемента.

Работа аккомпаниатора основана на стиле. Стиль представляет собой
заготовку из нескольких инструментальных партий – ритмических, басовых,
аккордовых, вспомогательных. Как правило, партии записываются в стиль не
непосредственно, а в параметрическом виде, который описывает лишь схему
мелодического, гармонического или ритмического рисунка.

В процессе исполнения простой аккомпаниатор лишь постоянно повторяет
стилевой рисунок. Более сложный варьирует структуру аккомпанемента в
зависимости от предыстории или по случайному закону. Наиболее сложные
следят за солирующей партией и на ходу выполняют гармонизацию – подбор
подходящих аккордовых и басовых ходов – именно так организованы
“самоиграйки” типа Yamaha и Casio.

Подробнее с работой автоаккомпаниаторов ознакомимся на примере
нескольких прграмм:

1. Band-In-A-Box

(Разработчик – PG Music . Последняя выпущенная версия – 8.0).

Название переводится, как “ансамбль в одном ящике”.

В комплекте имеется ряд стандартных стилей. Новые стили могут
создаваться как на основе существующих, так и полностью с нуля.
Поддерживаются наборы инструментов и параметры Roland VSC-88 и Sound
Blaster AWE32.

Для создания композиции требуется ввести аккордовую последовательность,
на основе которой аккомпаниатор создает партии пяти сопровождающих
инструментов – ударных, баса, струнных, пианино и гитары. Для
редактирования введенных последовательностей имеется нотный редактор.

Нажатием специальных кнопок может быть запущено исполнение стандартного
проигрыша, как на “самоиграйках”. Возможна также смена стиля без
остановки исполнения.

При помощи блока Melodist возможно создавать композиции полностью с
нуля, указав лишь стиль, тональность и темп. Процесс композиции можно
контролировать путем задания различных параметров поведения
автокомпозитора.

Блок Soloist генерирует сольные партии в соответствии с выбранным
стилем.

Посредством блока StyleMaker могут создаваться стили из данных готового
MIDI-файла.

2. Jammer Professional

(Разработчик – SoundTrek . Последняя выпущенная версия – 4.0).

Генератор аккомпанемента, выполненный в стиле MIDI-секвенсора.
Поддерживает дорожки трех типов: MIDI – мелодическая, Drum Piece –
ритмическая, и Style – стилевая. На мелодических и ритмических дорожках
записываются исходные партии, стилевые служат для создания
аккомпанемента.

Различаются стили отдельных инструментов – ударных, гитары, пианино,
саксофона и т.п. – и ансамблевые (band). В ансамблевый стиль может
входить один или несколько инструментальных.

Процесс создания аккомпанемента состоит в создании стилевых дорожек,
назначении стилей мелодическим и ритмическим дорожкам и выполнении
команды “Compose”, по которой Jammer генерирует партии аккомпанемента и
записывает их на стилевых дорожках. Каждая команда Compose генерирует в
общем случае разный рисунок аккомпанемента.

10. Распознаватели нот

Достаточно узкий класс программ, пытающихся путем анализа звукового
сигнала или изображения выделить в нем отдельные музыкальные ноты
(звучащие, нарисованные или напечатанные) и выдать результат в формате
MIDI-партитуры. В связи с исключительной сложностью задача для звукового
сигнала пока имеет только частные решения – выделение нот из
одноголосого произведения, распознавание аккордов и ритмических долей. С
распознаванием изображения дело обстоит гораздо лучше – качественно
напечатанная партитура распознается в общем случае без ошибок.

Подробнее с работой распознавателей нот ознакомимся на примере следующей
прграммы:

SmartScore

(Разработчик – Musitek . Последняя выпущенная версия – 1.2.2)

Профессиональная система распознавания отсканированных нотных партитур,
редактирования, преобразования в MIDI-формат и печати. Разработана “по
следам” известной программы MIDIScan.

Исходное изображение может быть загружено из файла или введено со
сканера. Для доводки и подчистки изображения имеется несложный
графический редактор с набором основных функций – монтажа, поворота,
рисования линий, стирания участков. Есть эффективная функция устранения
перекоса (deskew): при помощи мыши изображается линия, параллельная
горизонтали на изображении, после чего нужный поворот выполняется
автоматически.

Функция Recognition запускает распознавание нотного текста. После ее
завершения исходное изображение и распознанные ноты отображаются в
смежных окнах с синхронной прокруткой, что облегчает внесение
исправлений.

Программа имеет достаточно богатый набор средств для расстановки
музыкальных обозначений в нотном тексте, а также для редактирования
MIDI-данных – Piano Roll и Event List. Поддерживаются наборы
инструментов GM, GS, MT-32 и XG.

MIDI-сообщения также могут быть записаны в реальном времени с
MIDI-порта.

11. Преобразователи форматов

Выполняют преобразование одного вида звуковой информации в другой без
изменения принципа представления данных. Служат для переноса данных
между системами, в которых приняты разные форматы и методы кодирования.

Преобразование формата может быть искажающим и неискажающим. При
неискажающем преобразовании никакая информация, содержащаяся в исходных
данных, не теряется, хотя в процессе может быть добавлена дополнительная
информация. При искажающем преобразовании происходит необратимая потеря
какой-либо части исходной информации, что нередко влечет за собой
ухудшение конечных параметров звука.

Для преобразований справедливо правило: если преобразование формата A в
формат B является неискажающим, то обязательно существует обратное
преобразование B в A, полностью восстанавливающее всю исходную
информацию формата A. Другими словами, преобразование набора данных из A
в B и сразу затем обратно в A дает в результате исходный набор данных,
если все операции выполнены корректно. Обратное преобразование из B в A
в общем случае может быть и искажающим.

Подробнее с работой преобразователей форматов ознакомимся на примере
следующей прграммы:

AWave

(Разработчик – FMJ-Software . Последняя выпущенная версия – 5.3).

Мощный конвертор с оконным интерфейсом под Win32. Поддерживается более
330 различных форматов звуковых файлов, инструментов и банков
синтезтаторов и трекеров.

Содержит встроенный редактор инструментов: раскладка по клавиатуре,
режимы звукоизвлечения, точки зацикливания семпла (loops), параметры
генераторов огибающих, LFO, фильтров и эффект-процессора, а также
простой встроенный редактор оцифровок с функциями монтажа и настройки
циклов. Звучание семплов может быть прослушано на выбранном
аудиоустройстве (поддерживается DirectSound).

Описания инструмента и оцифровки могут быть из синтезатора получены по
MIDI посредством SDS (Sample Dump Standard), а также переданы обратно в
синтезатор.

Предоставляется функция пакетной обработки (Batch Conversion) для
множественной обработки файлов без вмешательства пользователя.

12. Считыватели звуковых дорожек с компакт-дисков

Служат для прямого считывания звуковой информации с компакт-диска в
цифровом формате посредством привода CD-ROM. В отличие от записи
посредством звукового адаптера, при котором происходит двойное
промежуточное преобразование – в ЦАП проигрывателя и в АЦП адаптера,
переносят цифровое представление звука с дорожки на жесткий диск точно и
без потерь.

Для точного (без потери качества) чтения звуковых дорожек вся
компьютерная система должна удовлетворять ряду условий:

* Привод CD-ROM должен поддерживать функцию прямого чтения звуковых
дорожек (команды Read Long, Read Raw Sectors)

* Функция прямого чтения в приводе должна быть реализована корректно –
то есть без изменений передавать считанную с дорожки звуковую информацию
драйверу привода, а также обеспечивать точное позиционирование на нужный
звуковой кадр (сектор). Большинство приводов при чтении “промахивается”
мимо нужного кадра, что требует специальных программных мер
восстановления данных

* Драйвер привода и служба управления CD-ROM в операционной системе
должны поддерживать операции прямого чтения и буферизацию данных

* Программа считывания должна корректно выполнять все необходимые для
работы функции

Основной элемент правильной системы, пригодной для считывания звуковых
дорожек, – сам привод CD-ROM. При условии выбора подходящего привода
(Panasonic CR-584 и выше; Pioneer DR-511, 502S; Sony CDU-711, 811;
Samsung 2030, 2430, 3230; Teac 532) остальное обычно не представляет
особых проблем.

Программный метод корректной стыковки прочитанных участков с чьей-то
легкой руки получил название Jitter Correction, в то время как Jitter –
совершенно посторонний термин из области фазовых характеристик сигнала.
Более правильно было бы называть этот метод коррекцией ошибок
позиционирования.

Прямое чтение дорожек получило устоявшееся жаргонное название Grab
(grabbing).

Подробнее с работой считывателей звуковых дорожек с компакт-дисков
ознакомимся на примере следующей прграммы:

WinDAC

(Разработчик – Christoph Schmelnik . Последняя выпущенная версия –
1.49).

Удобная и надежная программа. Поддерживет несколько приводов CD-ROM, для
каждого из которых можно задать режимы работы.

Копирование может выполняться в трех режимах:

* Normal – чередующиеся чтение с CD и запись на HDD

* Burst – перекрывающиеся чтение и запись, приводит к ошибкам на
некорректных приводах и драйверах

* Sector Synchronisation – чтение с CD “внахлест”, когда очередная
операция читает несколько секторов, уже прочитанных предыдущей. Такой
режим позволяет правильно состыковать прочитанные порции секторов в том
случае, когда привод не может точно позиционироваться на заданный сектор

Поддерживается два вида операций копирования: Track – одна или несколько
дорожек целиком, и Range – заданный диапазон звуковых кадров в пределах
всего диска. Во втором случае предлагается удобная возможность
прослушивания фрагмента с коррекцией его начального и конечного
участков.

Программа умеет работать с файлом CDPLAYER.INI, в котором стандартный
Windows CD Player хранит названия и содержание дисков. При копировании
WinDAC может присваивать файлам названия дорожек диска, а также помещать
их в каталоги, соответствующие названиям дисков.

При создании файла может использоваться любой системный ACM Codec, так
что при использовании хорошего привода, не сбивающегося при прерывистом
чтении, возможно прямое преобразование в нужный формат – MP3, ADPCM и
др. Поддерживаются также подключаемые модули (plugins) для
преобразования выходных форматов и пакеты внешних команд (scripts) для
дополнительной обработки полученных файлов.

Дополнительно предоставляются функции простого CD-проигрывателя.

13. Психоакустические компрессоры

Сжимают цифровое представление звуковой фонограммы примерно на порядок
посредством так называемого кодирования воспринимаемого, или
распознаваемого (perceptual coding). Из психоакустических исследований
известно, что отчетливо слухом воспринимаются лишь достаточно яркие и
обособленные частотные компоненты, если же из нескольких тонов близкой
высоты один имеет значительно большую интенсивность, то он маскирует для
слуха менее интенсивные, находящиеся рядом с ним. При удалении
маскируемых компонентов подавляющее большинство слушателей, особенно при
воспроизведении на аппаратуре среднего класса, не замечает различий с
исходным сигналом. Объем маскируемых компонентов весьма значителен,
вдобавок при сжатии применяется адаптивное экономичное кодирование.
Благодаря всему этому современные компрессоры уменьшают объем звуковых
данных примерно на порядок без явно ощутимой потери качества звучания.

В отношении сжатых этими методами фонограмм применяется понятие скорости
битового потока (bitrate), достаточной для воспроизведения сжатой
фонограммы. Скорость потока является относительным показателем степени
сохранения качества звучания при сжатии – на высоких скоростях оно
обычно выше, чем на низких, однако во многом это зависит от глубины и
точности анализа исходной фонограммы.

Наибольшее распространение получил метод Audio MPEG-1 Layer 3, именуемый
чаще всего MPEG-3 или MP3. Менее популярны форматы MPEG-2 AAC (Advanced
Audio Coding), VQF (Vector Quantization Format) и MPEG-4.

Надо заметить, что при оценке качества сжатых фонограмм допустимо
исключительно тестовое прослушивание. Поскольку эти методы сжатия
ориентированы только на человеческое восприятие, никакие объективные
показатели – полоса частот, амплитудные, частотные, фазовые и иные
характеристики не могут служить критериями качества преобразования.

Подробнее с работой псиакустических компрессоров ознакомимся на примере
следующих прграмм:

1. BladeEnc

(Разработчик – Tord Jansson Последняя выпущенная версия – 0.82).

Небольшой и достаточно качественный компрессор с запуском из командной
строки, один из самых скоростных. Существует под множество платформ и
ОС: x86, Alpha, M68k, Windows 95/98/NT, Linux, Solaris, SCO и др.

Поддерживает скорости от 32 до 320 Кбит/с и частоты дискретизации 32,
44,1 и 48 кГц. Входной и выходной файлы могут быть стандартными потоками
StdIn и StdOut.

Для удобства использования BladeEnc создано несколько оконных
графических интерфейсов под Windows 95/NT – AutoBlade, BEShell, BFree,
BladeBatch и т.п. Процессор BladeEnc выпускается также в виде
независимого DLL-модуля (plugin), который может подключаться к другим
программам обработки звука.

Автор рекомендует применять BladeEnc при скоростях потока 160 Кбит/с и
выше, признавая, что при низких скоростях более высокое качество
обеспечивают продукты Fraunhofer IIS.

2. SoundVQ Encoder

(Разработчик – Yamaha . Последняя выпущенная версия – 2.54 b4).

Компрессор в формат VQF. При скорости потока 96 Кбит/с обеспечивает
качество звучания, примерно равное хорошему компрессору MP3 при скорости
потока 128 Кбит/с (степень сжатия около 1:14). При меньших скоростях
обеспечивается сжатие до 20 раз.

Поддерживаются входные форматы от 8 кГц/8 разрядов/моно до 44,1 кГц/16
разрядов/стерео.

В состав входит пакетный процессор SoundVQ Batch Encoder для групповой
обработки файлов.

14. Проигрыватели

Задачей проигрывателя является простое воспроизведение звукового или
музыкального потока. Можно выделить четыре основных класса
проигрывателей:

* Auduo – для воспроизведения аудиофайлов. Сюда относятся простые
проигрыватели форматов WAV, VOC, AU, а также сжатых потоковых форматов –
MP3/VQF/AAC, ADPCM, GSM и т.п.

* MIDI – для воспроизведения MIDI-файлов. В функцию проигрывателя входит
только объединение виртуальных “дорожек” файла и отправка MIDI-событий
на заданный MIDI-порт. Собственно интерпретацией данных занимается
MIDI-устройство – аппаратный или программный синтезатор.

* Трекерные – для воспроизведения трекерных модулей. Такой проигрыватель
фактически содержит в себе всю звуковую систему трекера для
интерпретации нот и команд модуля.

* Сетевые – для воспроизведения широковещательных сетевых потоков в
реальном времени. При помощи специальных протоколов (RealAudio,
AudioActive, StreamWorks, NetShow) организуются вещательные серверы,
которые в реальном времени передают звуковую и видеоинформацию всем
подключившимся к серверу клиентам. В задачу сетевого проигрывателя
входит расшифровка сжатого формата звука и его воспроизведение через
аудиопорт.

Существуют универсальные проигрыватели, сочетающие в себе свойства
нескольких классов.

Расшифровка и интерпретация проигрываемого файла может выполняться как
самим проигрывателем, так и системными службами или подключаемыми
модулями (plugins). Если результирующий звук создается и выводится самим
проигрывателем, возможна его обработка (акцентировка басов, расширение
стереоэффекта, эквалайзер) и индикация (осциллограмма, спектрограмма).

Многие проигрыватели поддерживают список проигрываемых файлов
(playlist).

Полезной функцией ряда MIDI-проигрывателей является посылка команды
инициализации синтезатора в режимах GM, GS или XG перед проигрыванием
файла, так как многие MIDI-файлы не содержат таких команд ни в начале,
ни в конце, из-за чего состояние синтезатора может стать неопределенным.

Подробнее с работой проигрывателей ознакомимся на примере следующих
прграмм:

1. WinAMP

(Разработчик – NullSoft Последняя выпущенная версия – 2.61c).

Очевидно, это самый популярный проигрыватель звуковых модулей.
Поддерживает форматы WAV, VOC, MP1, MP2, MP3, STM, S3M, XM, IT, DSM,
MED, FAR, ULT, MTM, а также звуковые компакт-диски (CD-DA).
Поддерживаются списки форматов M3U, PLS, случайное и циклическое
проигрывание.

Распространяется в двух вариантах: базовый – с поддержкой
вышеперечисленных форматов, и полный – с дополнительной поддержкой
форматов WMA и Mjuice.

Имеет открытую архитектуру, основанную на подключаемых и заменяемых
модулях (plugins). За расшифровку входных форматов отвечают
модули-декодеры, за вывод на конкретные устройства (Wave Out,
DirectSound) – модули вывода. Имеется модуль записи выходного сигнала на
диск в WAV-файл (Disk Writer). Большая коллекция модулей находится на
сайте WinAMP.

Для внутренней обработки сигнала (DSP/Effects), отображения динамики
воспроизведения (Visualization), а также изображения внешнего вида окна
проигрывателя (Skin) тоже используются подключаемые модули. В состав
входят два стандартных режима отображения динамики – осциллограмма и
спектрограмма.

Содержит встроенный 10-полосный эквалайзер с набором пресетов и
мини-браузер, через который могут автоматически формироваться запросы на
обновление проигрывателя с авторского сайта. Имеет возможность
проигрывать файл с удаленного сайта параллельно с его перекачкой.

2. RealPlayer G2

(Разработчик – Progressive Networks Последняя выпущенная версия –
6.06.99).

Сетевой проигрыватель в стандарте RealAudio. Воспроизводит звуковой
поток, получаемый с сервера, вместе с серией периодически сменяющихся
видеокадров (скорость передачи видео не позволяет передать непрерывный
поток по обычному модемному каналу). Позволяет также проигрывать
звуковые файлы форматов RealAudio, Audio MPEG, ShockWave и т.п., а также
просматривать изображения в форматах GIF и JPEG.

Расшифровка входных форматов выполняется подключаемыми модулями
(plugins), большинство которых устанавливается при установке
проигрывателя. Поддерживает работу через Proxy-серверы, автоматический
выбор наиболее эффективного протокола передачи данных.

Имеет большой список работающих RealAudio-каналов, может динамически
отображать новые зарегистрированные каналы. Ведет и отображает
статистику передачи, по которой можно судить о параметрах канала связи и
эффективности работы протоколов.

15. Системы для радиовещания и дискотек

Предназначены для ведения звуковых программ в реальном времени.
Предоставляют возможности оперативного выбора источников звука, заранее
заготовленных роликов, динамического управления их воспроизведением.

Подробнее на примере следующей программы:

Virtual Turntables

(Разработчик – Jeff Lee . Последняя выпущенная версия – 1.8).

Программа для диджеев, имитирующая специфический рабочий пульт с двумя
проигрывателями винилитовых или компакт-дисков. Позволяет в реальном
времени переключать, смешивать и плавно переводить один в другой
несколько источников сигнала, одновременно подготавливая следующий
номер.

Для прослушивания следующего по очереди звукового номера (обычно через
наушники – headphones) одновременно со звучанием основного сигнала через
громкоговорители (speaker) может быть использован дополнительный
звуковой адаптер. При наличии только одного адаптера стереоканалы
смешиваются, основной звук подается в один канал адаптера, а звук для
наушников – в другой. При помощи разветвителя эти сигналы разделяются на
два звуковых разъема.

Источниками сигнала служат аудиофайлы форматов WAV и MP3, вывод возможен
только через DirectSound-порты.

Имеются функции автоматической подстройки скорости воспроизведения одной
композиции к другой и их синхронизации, пометки определенных точек
внутри композиции и прямого доступа к ним, зацикливание участка
звучания, вставка заранее подготовленных звуковых эффектов по нажатию
назначенных им клавиш.

Для обработки звука применяется встроенный 10-полосный эквалайзер с
поддержкой пресетов и DSP-модули от проигрывателя WinAMP. Могут также
применяться модули декодирования от WinAMP, что дает возможность
проигрывать через VTT трекерные и другие модули. Поддерживаются модули
описания интерфейса (skins), позволяющие менять внешний вид панелей и
органов управления.

Поддерживается ведение списков проигрываемых файлов. Возможна прямая
запись результата в WAV- или MP3-файл.

16. Утилиты и управляющие программы

Примерами являются:

1. MIDI-Ox

(Разработчик – Jamie O’Connell, Jerry Jorgenrud . Последняя выпущенная
версия – 5.5.1).

Полезная программа для диагностики и отладки MIDI-оборудования, портов и
драйверов. Обеспечивает трассировку, фильтрование и формирование
MIDI-сообщений, а также ведение несложной библиотеки SysEx-банков.

Основные функции: выдача в окно MIDI-сообщений, приходящих с выбранных
портов; передача этих сообщений в выбранные выходные порты; запрет
приема определенных классов сообщений (фильтация); замена заданных
приходящих событий на другие при отправке в выходной порт (отображение);
посылка сформированных программой сообщений Control/Bank/Patch Change и
SysEx; имитация MIDI-клавиатуры на алфавитно-цифровой клавиатуре
компьютера; посылка команд сброса MIDI-устройства и включения режимов
GM/GS/XG. Есть простой MIDI-проигрыватель.

2. Hubi’s Loopback

(Разработчик – Hubert Winkler . Последняя выпущенная версия – 2.51).

Драйвер, создающий в системе несколько виртуальных MIDI-кабелей с
портами In и Out на каждом конце. К каждому порту может быть
одновременно подключено несколько программ (мультиклиентная технология).
Сообщения, посылаемые программами в Out-порт кабеля, смешиваются и
передаются в In-порт, откуда их могут извлекать другие программы. Таким
образом, результат работы одной программы может быть подан
непосредственно на вход другой, минуя какие-либо аппаратные
MIDI-средства.

Кроме этого, драйвер создает для каждого существующего MIDI-устройства
дополнительные мультиклиентные порты, позволяя использовать и эти
устройства нескольким программам сразу.

3. MIDI Keyboard Monitor

(Разработчик – Eugene Muzychenko . Последняя выпущенная версия – 1.0)

Простейший монитор MIDI-клавиатуры с разделением ее на два мануала.

Для каждого мануала задается диапазон клавиш (зона) мануала, входные и
выходные MIDI-устройства и каналы, номера банка и инструмента. Ноты,
принятые из приемного канала соответствующей зоны, переправляются в
выводной канал с заданным смещением по высоте. Таким образом,
реализуется одновременная игра двумя руками и различными инструментами.
При задании перекрывающихся зон нажатие клавиш вызывает одновременное
звучание обоих инструментов.

4. XG Edit

(Разработчик – Gary Gregson . Последняя выпущенная версия – 2.645).

Первый широко известный редактор параметров для синтезаторов стандарта
XG. Поддерживает популярные звуковые платы DB50, SW60, модули SW1000,
MU10, MU50, MU80, MU90, MU100 и сменные модули расширения (plugins) к
SW1000 и MU100. Поддерживается также управление дополнительным АЦП для
внешнего аналогового сигнала в SW60/1000 и MU10/80/100.

Предоставляет удобную панель управления всеми режимами синтезатора,
кроме TG300B. Трехуровневая группировка в окне выбора тембра: класс
(мелодические, ударные, эффекты), группа (фортепиано, органы, струнные,
духовые, народные) и название конкретного инструмента. По сравнению с
группировкой по номерам банков, как это было в ранних версиях, такая
структура гораздо более удобна.

Для карты SW60 имеется специальная панель микшера, схематично отражающая
функциональную структуру карты, где можно определить пути
распространения сигнала и установить его уровни.

Функция Merge MIDI загружает внешний MIDI-файл, объединяя его содержимое
с текущими параметрами синтезатора. Если файл содержит собственные
команды настройки синтезатора, они отображаются на панели управления.
Получившаяся “настроенная” партитура может быть прослушана собственными
средствами редактора, после чего сохранена обратно в файл с новыми
параметрами.

IV Музыкант и компьютер. Создание музыки на РС

Несомненно, компьютер является весьма удобным и мощным “инструментом” в
творческой жизни музыканта, или любого другого человека, занимающегося
созданием музыки. И однозначного ответа на вопрос, какой компьютер нужен
и для каких целей – не возможно. Ибо прежде всего он зависит от того, о
каком именно музыканте идет речь – композиторе, дирижере, музыковеде,
контрабасисте и т.д. Каждый из них решает свои задачи – а ведь именно
они определяют предназначение компьютера, одновременно расширяя круг
возможностей музыканта. Однако, попытаемся обобщить некоторые основные
направления деятельности музыкантов, в которых компьютер в последние
годы играет все большую и большую роль. Вначале, просто перечислим это:

нотно-издательская деятельность;

подготовка цифровых фонограмм (и видеоклипов);

реставрация старых записей;

звукорежиссерская работа;

создание аранжировок и оригинальных композиций с использованием
программ-секвенцеров;

синтез звука и электронная музыка;

интерактивные исполнительские системы;

системы алгоритмической музыки;

системы управления партитурой в реальном времени;

создание и использование музыковедческих баз данных;

обучение в музыкальных школах и училищах и т. д.

Конечно, отдельно взятый музыкант никогда не использует все
вышеперечисленное, ограничиваясь тем, что близко его специализации.
Кроме того, возможности музыкального софта сейчас стремительно
расширяются, так что приходится следить за новостями на этом фронте,
чтоб не пропустить появления того, чего не хватает именно сейчас.

1. Какой компьютер нужен музыканту?

Это больной вопрос для многих компьютеризующихся музыкантов, вызывающий
яростные споры и дискуссии. Еще лет пять тому назад считалось (да, в
общем, так оно и было), что PC – машина, для музыкальных задач абсолютно
неприспособленная. В некоторых странах до сих пор таково общее мнение.
Во Франции, например, до сих пор считают, что для создания музыки на
компьютере пригоден только Macintosh. Но в действительности, дело
обстоит далеко не так. Появилось много нового музыкального софта для PC,
и на нем музыканту вполне можно работать. Итак, какой же компьютер (в
среднем) нужен музыканту?

Это должен быть PC с процессором не ниже Pentium 90 и 24 Мбайт
оперативной памяти. Видеоадаптер и монитор здесь – вопрос вкуса, но если
речь идет об издании нот – то желательно иметь разрешение не менее
800х600 (а лучше – “двухстраничный” монитор) при 16- или 24-битной
цветовой палитре. Если предполагается работа со звуковыми файлами, то
объем винчестера должен быть не меньше 4 Гбайт. Важнейшую роль здесь
играет звуковая карта, ибо она в данном случае не просто средство “для
украшения”, а инструмент для профессиональной работы, объединяет в себе
средства для аудиозаписи и воспроизведения (в том числе ЦАП/АЦП),
сэмплер или синтезатор (иногда и то, и другое), MIDI-интерфейс,
эффект-процессор и некоторые другие устройства. Все это располагается на
плате, которая вставляется в слот ISA. Среди музыкантов заслуженным
успехом пользуются звуковые карты от компании Turtle Beach.

Кроме звуковой карты часто бывает необходима цифровая карта – то есть
интерфейс для ввода/вывода цифровых сигналов (например, для записи на
цифровые носители – DAT, MiniDisk). Но эти устройства достаточно дороги
и, кроме того, капризны в использовании прерываний и каналов прямого
доступа к памяти. Немаловажно также значение устройства, через которое
музыкант вводит и выводит свой рабочий материал. Здесь, разумеется, не
подойдут всякие “мультимедийные” микрофоны и активные колонки; нужно
воспользоваться хорошей аудиосистемой и/или качественными наушниками
(неплохие экземпляры выпускают Sony и Koss). Если предполагается работа
с MIDI, желательна MIDI-клавиатура фортепианного типа, оснащенная
педалью, колесом высоты (pitch wheel) и модуляции (вибрато), а также
устройством ввода другой MIDI-информации.

Все перечисленное, составляет базовый набор, и обычно количество
устройств, а также их качество возрастает по мере необходимости.

2. О нотном наборе

Как известно, написание любой музыкальной композиции начинается с
запечатления ее в нотном виде (для тех, кто знает ноты). А дело это
весьма крапотливое и трепетное. Благо, у нас есть компьютер и программ
для нотного набора сейчас существует великое множество. Некоторые из них
совсем простые и свободно представлены в Интернете на условиях shareware
(пример – MusicEase). Чем “проще” такая программа, тем менее удобно в
ней вводить нотный текст и тем меньше возможностей она предоставляет. В
упоминавшемся уже MusicEase лиги, например, получаются не в форме дуг, а
состоящими из трех прямых линий; а пока пытаешься стереть один из
неверно введенных символов, проходит около минуты. Профессиональные же
программы нотного набора, как правило, очень удобны, но при этом
сложные, разветвленные, с широким набором возможностей. И далеко не
простые в освоении.

Сейчас я для нотного набора, в основном пользуются программой Final
(последняя версия имеет номер 3.7.2). Она предоставляет необозримые
возможности и имеет удобный и дружелюбный интерфейс. Здесь предусмотрено
шесть способов ввода нотного текста в компьютер. Во-первых, обычный ввод
щелчком мыши в нужное место экрана (как в более простых программах типа
Encore). Во-вторых, “скоростной” ввод с помощью клавиатуры компьютера,
когда клавиши цифровой клавиатуры означают различные длительности нот.
В-третьих, пошаговый ввод с MIDI-клавиатуры. В-четвертых – транскрипция,
то есть запись сыгранной музыки в собственный мини-секвенцер и
последующее преобразование ее в нотный текст. В-пятых – так называемый
HyperScribe, то есть транскрипция в реальном времени, прямо в процессе
исполнения. И, наконец, в-шестых, возможна загрузка стандартного
MIDI-файла и его транскрипция. К каждой ноте можно “привязать”
артикуляционное обозначение (точка стаккато, акцент и т. п.), или же
какую-нибудь надпись, или рисунок; причем в Finale 3.7 появилась
возможность импорта (и экспорта) графики в форматах TIFF, WMF и EPS.
Надпись или рисунок могут быть также привязаны и ко всей партитуре.
Существуют удобные утилиты для группировки нотоносцев, смены размера и
тональности, создания подстрочного текста и независимых текстовых
блоков, а также независимой графики и “плавающих” тактов, для знаков
повторов и окончания, копирования отдельных элементов, поиска и замены
нот, транспозиции, редактирования “исполнительских” штрихов для
воспроизведения с помощью MIDI, и т. д. и т. п. – все перечислять очень
долго, да и нет особого смысла. Во многих американских издательствах
формат Finale стал уже стандартом de facto. Здесь важное значение имеет
также присутствующая в этой программе поддержка PostScript-формата.

Из других программ нотного набора следует отметить Encore (для Windows
или Macintosh), Mosaic и Nightingale (только для Macintosh), а также
Score Perfect Pro (не путать со Score для DOS) – очень милая и быстрая
программа, первоначально написанная для Atari, но сейчас представленная
также в версии для Windows.

3. Расширение композиторских возможностей

С появлением компьютерных технологий композитор получил возможность
создавать и использовать при желании (а также наличии необходимого
программного обеспечения) звук любого тембра. Современные технологии
снимают все принципиальные тембровые ограничения; ограничивающими
факторами теперь могут являться только возможности имеющихся в наличии
программ, умение композитора ими пользоваться, ну и, конечно, фантазия
композитора.

При создании музыкальных композиций с помощью компьютера композитор в
простейшем случае имеет в своем распоряжении набор тембров,
предоставляемый звуковой картой и/или внешним синтезатором (сэмплером).
Как правило, звуковая карта содержит не менее одного “банка” из 128
тембров, а довольно часто количество таких банков возрастает до 5-7 или
даже более10. Если композитору не хватает этих тембров, он может выбрать
“экстенсивный метод развития”: увеличивать число инструментов и звуковых
карт, загружать в существующие инструменты новые звуки и банки звуков, и
т. д. По сути, в этом еще нет ничего принципиально нового. Гораздо
интереснее тот факт, что композитор может редактировать имеющиеся у него
тембры, изменяя их спектральный состав по своему усмотрению, а также
синтезировать “с нуля” совершенно новые. Таким образом, сейчас можно
сочинить тембр, и показательно, что тембр в наше время начинает играть
все большую роль в качестве выразительного средства. Очевидно, что чем
сложнее тембр отдельно взятого звука, тем менее существенна роль
высотной и ритмической компоновки самих звуков. Звук отделяется от
понятия “ноты” как таковой и начинает жить собственной жизнью. Причем
изменяющийся во времени звуковой спектр может стать настолько сложным,
что для целой музыкальной композиции будет вполне достаточно взятия
одной “ноты” – звука с таким спектром.

Справедливости ради нужно отметить, что попытки редактирования и
создания тембров и целых “тембровых” композиций не раз предпринимались
еще до широкого развития компьютерных технологий. Создавались аналоговые
синтезаторы, использовались различные “трюки” с магнитофонной лентой и
т. п. Однако все это было довольно громоздко и неудобно в обращении,
зачастую композиции создавались исключительно ради того или иного
технологического фокуса, не оставляя места собственно творчеству. Так,
по признанию одного из “отцов” немецкой электронной музыки Карлхайнца
Штокхаузена (Karlheinz Stockhausen), во время создания “Электронного
Этюда #1” он часами резал и склеивал частички магнитофонной ленты,
совершенно при этом не представляя себе заранее звуковой результат.
Весьма показателен также тот факт, что авторами такой музыки нередко
становились инженеры, а не профессиональные музыканты. Для каждой
музыкальной задачи в процессе создания тембра сплошь и рядом могло
потребоваться разное оборудование, и это ограничивало творческий
процесс, пожалуй, даже в большей степени, чем необходимость пользоваться
заранее заданным набором тембров, что и отталкивало профессиональных
музыкантов.

В случае же работы с компьютером композитор может иметь под рукой все
необходимые средства для сочинения композиции, быстро переключаясь между
ними в случае надобности. А удобный пользовательский интерфейс позволяет
сосредоточиться на творчестве, не слишком отвлекаясь на чисто
технологические вопросы.

Даже если композитор не использует в своем творчестве возможность
сочинения тембров, все равно он имеет под рукой мультитембральный
инструмент, гибкий и удобный в управлении (в отличие от, например, того
же симфонического оркестра), способный справиться с любым, даже и
традиционно “неисполнимым” материалом.

Разумеется, для различных музыкальных задач необходимо специальное
программное обеспечение. Его можно разделить на:

секвенцерные программы;

системы многоканального сведения;

системы обработки звука;

системы синтеза звука;

системы интерактивной композиции;

программы алгоритмической композиции;

а также универсальные системы.

Рассмотрим их более подробно.

4. О программах-секвенцерах

О программах-секвенцерах (секвенсорах) и их работе мы уже достаточно
подробно поговорили в главе “Основные программых для работы со звуком и
музыкой”. Здесь следует всего лишь напомнить, что эти программы самый
популярный и распространенный тип музыкального программного обеспечения
среди профессионалов и любителей. Они, в сущности, выполняют всего три
задачи: запись MIDI-последовательности, ее редактирование и ее
воспроизведение. Причем с первой и третьей они все, как правило,
справляются одинаково хорошо (с поправкой на некоторые дополнительные
возможности). А вот возможности редактирования MIDI-партитуры могут
существенно отличаться, и именно они определяют класс той или иной
программы-секвенцера. В простейших программах они могут быть сведены к
назначению тембров на каждую дорожку и определению их относительной
громкости, а также пространственной локализации.

5. Компьютерная звуковая студия Pro Tools

Еще совсем недавно звуковая студия ассоциировалась у большинства
музыкантов прежде всего с многоканальным магнитофоном. Он был центром,
“сердцем” практически любой студии, и вокруг него группировались все
другие студийные устройства. С появлением компьютерных технологий
почетное место многоканального магнитофона все чаще занимает Pro Tools.

Pro Tools – это система многоканальной записи/воспроизведения/редакции
звука. То есть здесь прослеживается явная аналогия с секвенцерами, но
вместо MIDI-информации мы теперь записываем, редактируем и воспроизводим
одновременно с нескольких дорожек аудиоинформацию, то есть собственно
оцифрованный звук.

В действительности в лице Pro Tools мы имеем не только многоканальный
магнитофон, а полную звукорежиссерскую систему, включающую микшерский
пульт и устройства обработки, причем с функцией запоминания времени
изменения любых звуковых параметров. Представьте себе звукорежиссера с
двумя-тремя десятками рук, которыми он во время сведения одновременно
регулирует множество звуковых параметров, запоминая и повторяя все
найденные моменты их изменения с точностью до долей миллисекунды!

Работать в системе Pro Tools очень удобно. На экране мы одновременно
видим волновую форму всех звуковых отрезков, записанных в систему. С
помощью мыши можно графически изменять огибающие громкости и
пространственной локализации отдельно на каждой дорожке. Имеется
множество дополнительных функций, таких как эхо или реверберация. Ну и,
конечно, возможно простым “перетаскиванием” (drag-n-drop) скопировать
или же переместить звуковой фрагмент на другое место.

Однако не все так просто с Pro Tools. Это не только программа, для ее
работы необходимо соответствующее аппаратное обеспечение. Причем железо
для Pro Tools существует в нескольких модификациях, и от него зависит,
сколько же звуковых дорожек мы услышим на выходе.

Можно, конечно, работать с моделью Pro Tools, позволяющей прослушивать
одновременно 8 или 16 дорожек. Но: дорого. Цена такой модели выше 10
тыс. долларов. Кроме того, программное обеспечение написано только для
Macintosh. И для хорошей стабильной работы я бы рекомендовал Macintosh
не ниже, чем Quadra. Правда, кто-то мне говорил, что уже существует –
или разрабатывается? – система Pro Tools для Windows 95. Однако никакой
конкретной информации по этому вопросу я пока не нашел.

Но разве Pro Tools – это единственное решение? Многие музыканты считают,
что альтернативы нет, но это не так – альтернативные системы существуют
и успешно работают. Например, московский композитор Анатолий Киселев
пользуется системой Session 8 и SAW Plus 32 (на базе PC). Недавно
появилась информация о выпуске звуковой платы V5 для многоканальных
систем. Наконец, возможны и более дешевые решения, зачастую почти не
уступающие Pro Tools по своим возможностям.

6. Как обрабатывают звук

Допустим, с помощью секвенсора или нотного редактора мы воплотили нашу
музыкальную задумку. Теперь требуется обработать звучание по
собственному желанию. Программы для этой цели, называются звуковыми
редакторами (о них мы уже знаем из предыдущей главы): на экране мы
видим волновую форму сигнала в графическом представлении: по вертикали –
амплитуда, по горизонтали – время.

Из важнейших операций для данных програм, как мы помним, можно условно
выделить четыре группы:

простейшее редактирование (simple editing);

звуковые процессы (sound processing);

звуковые эффекты (sound effects);

дополнительные инструменты (arbitrary tools).

К группе простейшего редактирования относятся операции, которые не
затрагивают внутренней структуры звука – копирование, перемещение,
удаление звуковых фрагментов, реверс и т. д. Собственно говоря, такие
операции можно осуществить и с обычной магнитофонной записью, но с
потерей качества и гораздо меньшим удобством в работе.

К звуковым процессам относятся микширование или перекрестное слияние
(crossfade) двух волновых форм, инверсия, изменение амплитуды,
добавление (или вычитание, что одно и то же) постоянного смещения (DC
offset), нормализация (оптимизация), постепенное нарастание/затухание,
расширение панорамы и т. п.

Что касается звуковых эффектов, они добавляют звучанию особый колорит и
иногда могут изменить звук очень сильно. К ним относятся задержка,
реверберация, амплитудная модуляция (вибрато), эффект флэнджера, фазовые
сдвиги, изменение высоты и/или времени звучания, построение амплитудных
и/или высотных огибающих, особые эффекты (например, вставка в волновую
форму звука кратких зон молчания – gapper, или искажение, имитирующее
аналоговые перегрузки – distortion) и т. п. Дополнительные возможности
включают использование фильтров, спектральный анализ, систему обмена
данными с сэмплером, а также систему шумопонижения.

7. Формирование нового звучания

Итак, программы обработки звука предоставляют музыканту целый мир новых
возможностей. Однако все они предполагают, что имеется некий
звук-источник, который можно подвергать дальнейшей обработке. Откуда же
он берется?

Есть три различных способа получения такого источника. Во-первых, можно
записать с микрофона “живое” звучание какого-либо инструмента, голоса
или любой другой звук. Этот способ часто используется, если нужно
получить на MIDI-инструменте звучание реальных инструментов. Другой
способ заключается в “рисовании” волновой формы – программы обработки
часто позволяют это делать, переключившись в “карандашный” режим
(который так зовется потому, что курсор мыши принимает вид карандаша).
Этот способ иногда бывает хорош при создании звуков ударного характера,
в то время как периодический сигнал создать таким способом практически
невозможно. Но наиболее эффективным методом создания звука “с нуля”
является его синтез.

При синтезе звука программа использует математические функции,
генерирующие простейшие периодические сигналы – синусоидальные,
треугольные, пилообразные, импульсные, прямоугольные, а также шумы. Эти
простейшие сигналы могут тем или иным образом трансформироваться в
процессе синтеза. Синусоидальные сигналы (они же чистые тоны) имеют
особое значение, поскольку спектр такого сигнала содержит только одну
частоту.

При аддитивном синтезе используются синусоидальные сигналы с различной
частотой и амплитудой, из которых складывается сложный спектр.
Количество его составляющих будет в точности равно количеству исходных
чистых тонов.

При субтрактивном синтезе, напротив, используется шумовой сигнал, из
которого при помощи фильтров вычитаются ненужные частотные составляющие.
Как правило, звук, полученный в результате субтрактивного синтеза, имеет
ярко выраженный “шумовой” колорит.

FM cинтез звука, о котором мы говорили в первой главе, был разработан
Дж. Чоунингом в своей дипломной работе так же с успехом применялся и
применяется в синтезаторах.

При синтезе методом модуляции используется, как правило, небольшое
количество простейших сигналов, обычно синусоидальных, которые, влияя
друг на друга, могут дать в результате спектр с большим количеством
составляющих. Метод частотной модуляции (FM, то есть Frequency
Modulation) интересен тем, что с его помощью можно даже из двух
синусоидальных сигналов получить спектр с каким угодно количеством
составляющих. Амплитудная и кольцевая модуляция, а также нелинейное
изменение волновой формы хотя и не дают таких “сногсшибательных”
результатов, как FM, но тоже по-своему интересны. Существуют и другие
методы синтеза, на которых мы здесь, я думаю, останавливаться не будем.

В профессиональных программах обработки звука, таких, как Sound Forge
или Cool Edit, обычно имеются модули и для синтеза звука. В Sound Forge,
например, предусмотрена возможность “простого синтеза” основных
периодических сигналов, а также четырехоператорного FM-синтеза.

Но следует помнить, что синтез звука – мощное средство для создания,
“сочинения” собственных тембров. И для того чтобы быстро и эффективно
добиться реального воплощения тембрального замысла, нужно иметь, помимо
некоторого навыка работы с программами синтеза, четкое представление о
том, какие изменения в спектре звука вызовет изменение того или иного
параметра. Подробное теоретическое изложение различных методов синтеза
звука четко описано в книге Ч. Доджа и Т. Джерса “Компьютерная музыка:
синтез, композиция и исполнение”.

8. Об интерактивных исполнительских системах

Хотя, в электронной музыке нет разделения между функциями композитора и
исполнителя. Все таки, отсутствие необходимости в исполнителях, является
большим преимуществом, которое освобождает композиторов от многих
проблем. Например, нет необходимости искать и/или подбирать
исполнителей, платить им деньги (что бывает не всегда, но часто),
организовывать репетиции и т. п. Но, пожалуй, самое главное, что
композитор не имеет более нужды передать исполнителю авторский замысел,
собственную интерпретацию, – короче говоря, то, что не опишешь словами и
не обозначишь нотами.

Как следует из названия, интерактивная музыка предполагает
взаимодействие исполнителя и его “электронного партнера” в процессе
исполнения. Например, существует и широко используется такая схема:
исполнитель начинает играть на каком-либо инструменте; компьютер
“реагирует” на его исполнение, исполняя соответствующие звуки;
исполнитель, в свою очередь, отвечает на сыгранное компьютером и т. д.
Таким образом, имея возможность выбора первоначальных звуков пьесы
(которые могут быть, разумеется, до некоторой степени регламентированы
композитором), исполнитель фактически строит композицию в соответствии
со своим творческим видением. Каждый вариант исполнения такой пьесы
может сильно отличаться от остальных, причем не только традиционными
параметрами темпа, громкости отдельных звуков и т. п., но также и
расположением и количеством звуков. В этом случае “твердую основу”
композиции составляет не зафиксированный нотный текст, а алгоритм
взаимодействия компьютера и исполнителя. Точнее, это обычно даже
совокупность двух алгоритмов: одного для компьютера и одного для
исполнителя.

Алгоритм взаимодействия для исполнителя может быть написан обычным
“человеческим” языком, пояснен нотными фрагментами и т. д. А алгоритм
для компьютера составляется различными способами. Например, может быть
использована последовательность условных операций типа “если прозвучал
звук в диапазоне от 300 до 367 Гц с амплитудой от 7000 до 9500 условных
единиц20 во временном промежутке от 7 до 9 секунд от начала пьесы, то
исполнять звуки случайной частоты в диапазоне от 150 до 170 Гц длиной
0,02 секунды с частотой появления, линейно уменьшающейся от 47 до 6 Гц с
постоянным затуханием в течение 11,4 секунды”.

Для облегчения процесса создания таких интерактивных композиций были
разработаны различные программные средства. Например, в парижском центре
электронной музыки IRCAM была разработана программа MAX, коммерческую
версию которой (для Macintosh) выпускает американская компания Opcode.

Программа MAX – это, по сути, целый язык программирования,
предназначенный для создания алгоритмов интерактивного исполнения и
реализованный в виде программного приложения с объектно-ориентированным
интерфейсом пользователя. MAX работает на уровне MIDI-событий, так что
если композитор желает работать с акустическим инструментом, ему
необходимо использовать какие-либо конверторы (Pitch-to-MIDI21 и т. п.).

В MAX имеются объекты (операторы), обеспечивающие ввод/вывод
MIDI-информации. Между входными и выходными параметрами помещаются
модули преобразования. Возможно использовать арифметические и логические
операции, ветвления, различные специальные возможности и т. п. Всего в
программе более ста типов объектов. Имеется даже небольшой встроенный
секвенцер.

Программу MAX использовали многие крупные композиторы, такие, как Ричард
Буланже (Richard Boulanger) и Дрор Файлер (Dror Feiler).

Описанная концепция интерактивной исполнительской системы не является
единственно возможной. Существуют и другие концепции, и среди них
необходимо выделить концепцию системы управления партитурой.

Вначале американский инженер, программист и музыкант Макс Мэтьюз (Max
Matthews) заметил противоречие между “музыкантством” и “музыкальностью”.
Оно выражается в том, что зачастую музыкант-профессионал, вложивший уйму
времени и сил в овладение техникой исполнения на каком-либо инструменте
и действительно овладевший этой техникой в совершенстве, испытывает
затруднения в вопросе художественной интерпретации музыкального
произведения. И наоборот, человек, не владеющий тем или иным
инструментом в достаточной степени или вовсе не умеющий на нем играть,
иной раз способен на собственную интересную интерпретационную концепцию,
свое неординарное видение музыки. Только вот беда: донести свою
исполнительскую концепцию до слушателей он никак не может из-за
технических трудностей исполнения.

Макс Мэтьюз предложил решение, позволяющее такому музыкальному человеку,
не имеющему достаточной техники, реализовать себя как исполнителя.
(Именно как живого исполнителя, а не MIDI-аранжировщика.) Для этого
Мэтьюз создал специальное устройство, называющееся в последней
модификации “радиобатон”. Визуально радиобатон представляет собой
небольшой прямоугольный ящичек с MIDI-входом и выходом. Под верхней
крышкой этого “ящичка” находятся пять датчиков (четыре – по углам и один
в центре), которые следят за перемещением двух специальных палочек. С
компьютера в радиобатон загружается MIDI-партитура, в которой в особом
формате определены параметры, которыми можно будет управлять в реальном
времени. С помощью двух палочек можно произвольно изменять во время
исполнения шесть любых заранее заданных параметров: каждая палочка
регулирует одновременно три параметра, перемещаясь в пространстве по
трем осям, обозначаемым как x, y и z. Например, в многотембральном
произведении логично регулировать таким образом громкости различных
партий. Перемещения в плоскости поверхности радиобатона ограничены
размерами устройства; перемещение по оси z также имеет как нижнюю, так и
верхнюю границу: существует некоторое критическое расстояние, вне
пределов которого радиобатон вообще не распознает палочку. Темп
исполнения может регулироваться, помимо простого перемещения палочки
вдоль одной из осей, специальным образом – с помощью “дирижирования”
правой рукой.

Развитием идеи Мэтьюза является “управляющая перчатка” (PowerGlove)
Ричарда Буланже. Здесь параметры MIDI-партитур можно регулировать не
только перемещением руки в пространстве, но и сгибанием пальцев, причем
каждый палец может контролировать отдельный параметр.

И радиобатон, и управляющая перчатка, однако, не так просты в обращении,
как может показаться. Для полного использования их возможностей
необходимы определенные “исполнительские” навыки, как и при игре на
каком-либо традиционном инструменте. С другой стороны, эти навыки можно
приобрести довольно быстро (за 2-3 месяца регулярных занятий), что
делает его доступным для широкого круга музыкантов-любителей.

9. Компьютер “сочиняет” музыку

Конечно, для простых любителей и ленивых музыкантов, было бы весьма
удобно, чтобы компьютер сам “сочинял” музыку. Но строго говоря,
компьютеры сами никакой музыки до сих пор не сочинили. В основном,
используются уже с середины 50-х годов так называемые программы
алгоритмической композиции. При этом разрабатывались два в корне
различных метода. Первый метод – это анализ того или иного музыкального
стиля и составление композиции на основе полученных данных. Второй же
метод предполагает вероятностные распределения звуков в партитуре.

Сочинения, написанные с использованием обоих методов, как правило,
допускают “живое” исполнение – ведь результатом работы программ
алгоритмической композиции является обычно нотный текст (или, по крайней
мере, некоторые данные, подготовленные для последующего преобразования в
нотный текст.

Еще в 1956 году были опубликованы опыты Кляйна и Болито по
синтезированию песенных мелодий на компьютере Datatron. Мелодии носили
название “Push Button Bertha”. Они рассматривались, правда, скорее как
эксперимент, а не творчество. Однако уже в следующем, 1957 году была
опубликована (и впоследствии не раз исполнялась) сюита для струнного
квартета, “сочиненная” в лаборатории электронной музыки Иллинойского
университета с помощью компьютера “Иллиак” (ее так и назвали –
“Иллиак-сюита”). Кроме компьютера, ее “авторами” являлись Лейярен Хиллер
(Lejaren Hiller) и Леонард Айзексон (Leonard Isaacson).

Сюита состояла из четырех частей, причем первые две были написаны в
диатоническом до-мажоре по правилам, близким к правилам музыки строгого
стиля. Источником третьей части, напротив, была случайная хроматическая
музыка, “профильтрованная”, однако, по тем же правилам. Несмотря на
фильтрацию, ее музыка очень похожа на атональные композиции. В четвертой
же части авторы применили математические формулы, никак не связанные с
музыкальными стилями. По их замыслу, четвертая часть должна была быть
написана в совершенно особом, “машинном” стиле, хотя на слух, как ни
странно, этот стиль мало отличался от стиля третьей части.
“Иллиак-сюита” издавалась несколько раз и приобрела мировую известность.

В 1959 году Рудольф Зарипов, советский математик, “сочинял” одноголосные
музыкальные пьесы на машине “Урал” (опять-таки в до-мажоре). Они
назывались “Уральские напевы” и опять носили характер эксперимента. При
их сочинении использовались различные случайные процессы для различных
элементов музыкальной фактуры (форма, ритм, звуковысотность и т. д.). А
Р. Бухараев и М. Рытвинская на том же “Урале” программировали
“сочинение” алгоритмических мелодий на стихотворный текст.

Правда, “Урал” предоставил на выходе неуклюжую, абсолютно не вокальную
мелодию (даже с точки зрения авангарда нашего столетия). Виноват был,
конечно, не “Урал”, а очень несовершенные алгоритмы синтеза музыкальной
фактуры.

С тех пор появилось очень много программ для алгоритмической композиции.
Часто такие программы разрабатывались, что называется, “на один раз”,
для личного использования. В отличие от подобных программ 50-х годов
некоторые современные разработки позволяют достичь довольно хороших
результатов. В качестве примера можно привести программу, которую
разработал московский музыкант и программист Д. Жалнин.

Иногда средства алгоритмической композиции так или иначе смешиваются с
другими творческими направлениями. Например, Cubase существует
встроенное средство под названием “интерактивный синтезатор фраз”
(Interactive Phrase Synthesizer, IPS). Здесь смешиваются средства
интерактивной и алгоритмической систем. На вход системы подается некая
“фраза”, то есть последовательность MIDI-событий. Затем эта
последовательность проходит через специальные “алгоритмические
процессоры” – подпрограммы упорядоченного преобразования ритма,
громкости и звуковысотности. Таким образом, с одной стороны, исполнитель
имеет возможность все время взаимодействовать с системой, вводя
различные стартовые ноты и даже меняя саму исходную последовательность;
с другой стороны, для изменения звуковой ткани используются строгие
алгоритмы.

Еще один яркий пример интеграции алгоритмической музыки с другими
направлениями – класс программ перевода графики в звучание. Таких
программ тоже существует не одна и не две. Однако особо хочется отметить
программу Kandinsky Music Painter (KMP) для Atari, от компании Keys. Эта
программа предоставляет довольно-таки развитые средства для создания
рисунка. Отдельно можно создать рисунки для звуковысотной фактуры и для
громкости инструментов. В программе используется монохромная графика,
которая транслируется в MIDI-события. В начале проигрывания экран
очищается, и по ходу проигрывания рисунок постепенно прорисовывается по
горизонтали, что дает ощущение слияния звуковой и визуальной композиций.

Похожим образом, но не на уровне MIDI, а на уровне звука работает
система Яниса Ксенакиса U-Pic. А вообще-то эта идея уже была реализована
гораздо раньше аналоговыми методами.

Рождение компьютерной музыки

В 1957 году М. Мэтьюз и Н. Гутман посетили концерт одного малоизвестного
пианиста. Концерт им обоим не понравился, и, в процессе обмена
впечатлениями после концерта, М. Мэтьюз заявил, что компьютер может
сыграть лучше. Но поскольку на дворе был 1957 год, компьютеры еще не
умели играть музыку. Придя домой, М. Мэтьюз тут же стал писать
программу, играющую музыку. Первая компьютерная пьеса неизменно
производит на окружающих ужасающее впечатление. Но идея Мэтьюза,
развиваясь, породила целый класс музыкальных языков программирования,
которые вначале назывались “MUSIC” с номером версии. Язык C-Sound
произошел как раз из этих программ. А отделение Стэндфордского института
исследований, где работал тогда М. Мэтьюз, выросло в музыкальный
исследовательский центр под названием CCRMA (читается “карма”).

Конечно, программы алгоритмической композиции не способны заменить собой
творческий процесс сочинения музыки. Однако, в качестве вспомогательного
средства при создании музыкальных пьес они могут быть применены с
большим успехом.

10. Универсальная система “программирования” музыки

Компьютерная музыка как таковая начиналась когда-то с музыкальных языков
программирования. Несмотря на то, что с тех пор разработчики
музыкального программного обеспечения уделяли все большее и большее
внимание развитию пользовательского интерфейса, музыкальный язык
программирования в чистом виде – язык C-Sound – сохранился и успешно
применяется по сей день. Дело в том, что C-Sound, в отличие от других
музыкальных программ, является, по сути, универсальной системой,
позволяющей создавать любые звучания. Ведь развитый пользовательский
интерфейс при всех своих достоинствах обладает очень существенным
недостатком: он всегда ограничивает возможности.

Язык C-Sound свободен от этого. Он существует в виде компилятора,
который транслирует текст программы в звуковой файл. При этом основные
операторы его реализуют основные средства создания электронной музыки.
Если композитору не хватает операторов C-Sound (которые сами по себе
позволяют проделывать гораздо больше, чем все описанные выше программы,
вместе взятые [исключая, разумеется, нотную графику]), он может написать
нужные ему фрагменты текста программы на языке Си или Ассемблере.

C-Sound позволяет работать как с синтезированным звуком, так и со звуком
из внешнего источника. Широкий выбор операторов генерации и модификации
сигналов делает работу очень удобной, а система меток и ссылок на них –
привычной для хоть сколько-нибудь знакомого с программированием
человека. Поначалу, правда, некоторые мои знакомые (да и я тоже)
испытали некоторое разочарование при знакомстве с C-Sound, потому что
надеялись (а напрасно), что это просто что-то вроде расширения
классического Си или Си++. Но по мере знакомства с языком разочарование
довольно быстро сменилось признанием его широких возможностей, простоты
и удобства работы со звуком.

В любом синтезаторе содержится некоторый набор алгоритмов, реализующих
звуковой синтез. Иногда эти алгоритмы поддаются редактированию, но, как
правило, очень ограниченному. В сэмплерах также есть набор определенных
алгоритмов плюс записанные образцы волновых форм. Любое устройство для
обработки звука включает в себя алгоритмы обработки, и лишь немногие их
параметры открыты для редактирования. Это перечисление можно продолжить.
В C-Sound мы имеем такие же наборы алгоритмов, полностью открытые (ибо
они существуют в виде простого текста) для изменения по нашему вкусу.
Кроме того, можно самому создавать все эти алгоритмы “с нуля”.

В настоящее время C-Sound не может работать в реальном времени на
обычных компьютерах. Для компиляции звукового файла помимо описания
инструментов необходим еще файл партитуры (.sco), в котором расположены
звуки и их индивидуальные параметры. С одной стороны, это может
показаться неудобным, однако, с другой, – заставляет музыканта проявлять
большее внимание к каждому звуку в отдельности, что, несомненно,
способствует повышению качества результата.

Программа C-Sound распространяется свободно. Она существует в
модификациях для DOS, Windows, Macintosh, Atari и других платформ.
Компилятор C-Sound с полным описанием языка и учебными примерами
довольно легко можно найти в Сети.

11. Другие применения компьютера музыкантами

Все перечисленные выше музыкальные приложения компьютеров предполагают
работу с нотным либо звуковым материалом. Однако есть и другие
возможности применения компьютеров музыкантами.

Среди них следует выделить прежде всего организацию
музыкально-теоретического или исторического материала с помощью баз
данных. Такая система позволяет быстро и оперативно получать
музыковедческую информацию.

Другая интересная идея состоит в открытии электронных нотных библиотек,
как локальных, так и общедоступных (например, через тот же Интернет). О
преимуществах здесь говорить излишне, поскольку существующие виртуальные
книжные библиотеки иллюстрируют их лучше всяких объяснений. Правда, на
сегодняшний день не существует единого стандарта на формат нотного
текста, но имеющиеся форматы файлов программ профессионального нотного
набора (прежде всего, Enigma Binary File – .mus, использующийся в
программе Finale) уже становятся стандартом de facto. Тем не менее
многие нотные примеры в Интернете, выполнены в виде графических файлов.

Еще одна интересная область применения компьютеров музыкантами – это
использование обучающих программ в музыкальном образовании. В настоящее
время существует довольно много музыкальных обучающих программ, но, к
сожалению, они в большинстве своем достаточно примитивны и не могут
по-настоящему заинтересовать учащегося. Причиной этого является, как мне
кажется, вовсе не отсутствие специальных методик, а несколько формальный
подход к алгоритмизации педагогического процесса. Здесь довольно-таки
приятным исключением является симпатичная программка Play It By Ear,
которая, несмотря на внешнюю простоту, зачастую бывает способна
“завести” учащегося.

V Технология создания позиционируемого 3D звука

Звуковое сопровождение компьютера всегда находилось несколько на втором
плане. Большинство пользователей более охотно потратят деньги на
новейший акселератор 3D графики, нежели на новую звуковую карту. Однако
за последний год производители звуковых чипов и разработчики технологий
3D звука приложили немало усилий, чтобы убедить пользователей и
разработчиков приложений в том, что хороший 3D звук является
неотъемлемой частью современного мультимедиа компьютера. Пользователей
убедить в пользе 3D звука несколько легче, чем разработчиков приложений.
Достаточно расписать пользователю то, как источники звука будет
располагаться в пространстве вокруг него, т.е. звук будет окружать
слушателя со всех сторон и динамично изменяться, как многие потянутся за
кошельком. С разработчиками игр и приложений сложнее. Их надо убедить
потратить время и средства на реализацию качественного звука. А если
звуковых интерфейсов несколько, то перед разработчиком игры встает
проблема выбора. Сегодня есть два основных звуковых интерфейса, это
DirectSound3D от Microsoft и A3D от Aureal. При этом если разработчик
приложения предпочтет A3D, то на всем аппаратном обеспечении DS3D будет
воспроизводиться 3D позиционируемый звук, причем такой же, как если бы
изначально использовался интерфейс DS3D. Само понятие “трехмерный звук”
подразумевает, что источники звука располагаются в трехмерном
пространстве вокруг слушателя. Это основа. Далее, что бы придать
звуковой модели реализм и усилить восприятие звука слушателем,
используются различные технологии, обеспечивающие воспроизведение
реверберации, отраженных звуков, окклюзии (звук прошедший через
препятствие), обструкции (звук не прошел через препятствие),
дистанционное моделирование (вводится параметр удаленности источника
звука от слушателя) и масса других интересных эффектов. Цель всего
этого, создать у пользователя реальность звука и усилить впечатления от
видео ряда в игре или приложении. Не секрет, что слух это второстепенное
чувство человека, именно поэтому, каждый индивидуальный пользователь
воспринимает звук по-своему. Никогда не будет однозначного мнения о
звучании той или иной звуковой карты или эффективности той или иной
технологии 3D звука. Сколько будет слушателей, столько будет мнений. В
данной главе мы попытаемся собрать и обобщить информацию о принципах
создания 3D звука, а также рассказать о текущем состоянии звуковой
компьютерной индустрии и о перспективах развития. Мы уделим отдельное
внимание необходимым составляющим хорошего восприятия и воспроизведения
3D звука, а также расскажем о некоторых перспективных разработках.

Для позиционирования источников звука в виртуальном 3D пространстве
используются HRTF функции. Попробуем разобраться в том, что такое HRTF и
действительно ли их использование так эффективно.

Сколько раз происходило следующее: команда, отвечающая за звук, только
что закончила встраивание 3D звукового интерфейса на базе HRTF в
новейшую игру; все комфортно расселись, готовясь услышать “звук
окружающий вас со всех сторон” и “свист пуль над вашей головой”;
запускается демо версия игры и… и ничего подобного вы просто не
слышите!

HRTF (Head Related Transfer Function) это процесс посредством которого
наши два уха определяют слышимое местоположение источника звука; наши
голова и туловище являются в некоторой степени препятствием,
задерживающим и фильтрующим звук, поэтому ухо, скрытое от источника
звука головой воспринимает измененные звуковые сигналы, которые при
“декодировании” мозгом интерпретируются соответствующим образом для
правильного определения местоположения источника звука. Звук,
улавливаемый нашим ухом, создает давление на барабанную перепонку. Для
определения создаваемого звукового давления необходимо определить
характеристику импульса сигнала от источника звука, попадающего на
барабанную перепонку, т.е. силу, с которой звуковая волна от источника
звука воздействует на барабанную перепонку. Эту зависимость называют
Head Related Impulse Response (HRIR), а ее интегральное преобразование
по Фурье называется HRTF.

Правильнее характеризовать акустические источники скоростью
распространяемых ими звуковых волн V(t), нежели давлением P(t)
распространяемой звуковой волны. Теоретически, давление, создаваемой
идеальным точечным источником звука бесконечно, но ускорение
распространяемой звуковой волны есть конечная величина. Если вы
достаточно удалены от источника звука и если вы находитесь в состоянии
“free field” (что означает, что в окружающей среде нет ничего кроме,
источника звука и среды распространения звуковой волны), тогда давление
“free field” (ff) на расстоянии “r” от источника звука определяется по
формуле

Pff(t) = Zo V(t – r/c) / r

где Zo это постоянная называемая волновым сопротивлением среды
(characteristic impedance of the medium), а “c” это скорость
распространения звука в среде. Итак, давление ff пропорционально
скорости в начальный период времени (происход “сдвиг” по времени,
обусловленный конечной скоростью распространения сигнала. То есть
возмущение в этой точке описывается скоростью источника в момент времени
отстоящий на r/c – время которое затрачено на то, чтобы сигнал дошел до
наблюдателя. В принципе не зная V(t) нельзя утверждать характера
изменения скорости при сдвиге, т.е. произойдет замедление или ускорение)
и давление уменьшается обратно пропорционально расстоянию от источника
звука до пункта наблюдения.

С точки зрения частоты давление звуковой волны можно выразить так:

Pff(f) = Zo V(f) exp(- i 2 pi r/c) / r

где “f” это частота в герцах (Hz), i = sqrt(-1), а V(f) получается в
результате применения преобразования Фурье к скорости распространения
звуковой волны V(t). Таким образом, задержки при распространении
звуковой волны можно охарактеризовать “phase factor”, т.е. фазовым
коэффициентом exp(- i 2 pi r /c). Или, иначе, это означает, что функция
преобразования в “free field” Pff(f) просто является результатом
произведения масштабирующего коэффициента Zo, фазового коэффициента
exp(- i 2 pi r /c) и обратно пропорциональна расстоянию 1/r. Заметим,
что возможно более рационально использовать традиционную циклическую
частоту, равную 2*pi*f чем просто частоту.

Если поместить в среду распространения звуковых волн человека, тогда

звуковое поле вокруг человека искажается за счет дифракции (рассеивания
или иначе говоря различие скоростей распространения волн разной длины),
отражения и дисперсии (рассредоточения) при контакте человека со
звуковыми волнами. Теперь все тот же источник звука будет создавать
несколько другое давление звука P(t) на барабанную перепонку в ухе
человека. С точки зрения частоты это давление обозначим как P(f).
Теперь, P(f), как и Pff(f) также содержит фазовый коэффициент, чтобы
учесть задержки при распространении звуковой волны и вновь давление
ослабевает обратно пропорционально расстоянию. Для исключения этих
концептуально незначимых эффектов HRTF функция H определяется как
соотношение P(f) и Pff(f). Итак, строго говоря, H это функция,
определяющая коэффициент умножения для значение давления звука, которое
будет присутствовать в центре головы слушателя, если нет никаких
объектов на пути распространения волны, в давление на барабанную
перепонку в ухе слушателя.

Обратным преобразованием Фурье функции H(f) является функция H(t),
представляющая собой HRIR (Head-Related Impulse Response). Таким
образом, строго говоря, HRIR это коэффициент (он же есть отношение
давлений, т.е. безразмерен; это просто удобный способ загнать в одну
букву в формуле очень сложный параметр), который определяет воздействие
на барабанную перепонку, когда звуковой импульс испускается источником
звука, за исключением того, что мы сдвинули временную ось так, что t=0
соответствует времени, когда звуковая волна в “free field” достигнет
центра головы слушателя. Также мы масштабировали результаты таким
образом, что они не зависят от того, как далеко источник звука
расположен от человека, относительно которого производятся все
измерения.

Проще можно сказать, что HRIR это давление воздействующее на барабанную
перепонку, когда источник звука является импульсным.

Напомним, что интегральным преобразованием Фурье функции HRIR является
HRTF функция. Если известно значение HRTF для каждого уха, мы можем
точно синтезировать бинауральные сигналы от монофонического источника
звука (monaural sound source).

Соответственно, для разного положения головы относительно источника
звука задействуются разные HRTF фильтры. Библиотека HRTF фильтров
создается в результате лабораторных измерений, производимых с
использованием манекена, носящего название KEMAR (Knowles Electronics
Manikin for Auditory Research, т.е. манекен Knowles Electronics для
слуховых исследований) или с помощью специального “цифрового уха”
(digital ear), разработанного в лаборатории Sensaura, располагаемого на
голове манекена. Понятно, что измеряется именно HRIR, а значение HRTF
получается путем преобразования Фурье. На голове манекена располагаются
микрофоны, закрепленные в его ушах. Звуки воспроизводятся через
акустические колонки, расположенные вокруг манекена и происходит запись
того, что слышит каждое “ухо”.

HRTF представляет собой необычайно сложную функцию с четырьмя
переменными: три пространственных координаты и частота. При
использовании сферических координат для определения расстояния до
источников звука больших, чем один метр, считается, что источники звука
находятся в дальнем поле (far field) и значение HRTF уменьшается обратно
пропорционально расстоянию. Большинство измерений HRTF производится
именно в дальнем поле, что существенным образом упрощает HRTF до функции
азимута (azimuth), высоты (elevation) и частоты (frequency), т.е.
происходит упрощение, за счет избавления от четвертой переменной. Затем
при записи используются полученные значения измерений и в результате,
при проигрывании звук (например, оркестра) воспроизводится с таким же
пространственным расположением, как и при естественном прослушивании.
Техника HRTF используется уже несколько десятков лет для обеспечения
высокого качества стерео записей. Лучшие результаты получаются при
прослушивании записей одним слушателем в наушниках.

Наушники, конечно, упрощают решение проблемы доставки одного звука к
одному уху и другого звука к другому уху. Тем не менее, использование
наушников имеет и недостатки. Например:

* Многие люди просто не любят использовать наушники. Даже легкие
беспроводные наушники могут быть обременительны. Наушники,
обеспечивающие наилучшую акустику, могут быть чрезвычайно неудобными при
длительном прослушивании.

* Наушники могут иметь провалы и пики в своих частотных характеристиках,
которые соответствуют характеристикам ушной раковины. Если такого
соответствия нет, то восприятие звука, источник которого находится в
вертикальной плоскости, может быть ухудшено. Иначе говоря, мы будем
слышать преимущественно только звук, источники которого находится в
горизонтальной плоскости.

* При прослушивании в наушниках, создается ощущение, что источник звука
находится очень близко. И действительно, физический источник звука
находится очень близко к уху, поэтому необходимая компенсация для
избавления от акустических сигналов влияющих на определение
местоположения физических источников звука зависит от расположения самих
наушников.

Использование акустических колонок позволяет обойти большинство из этих
проблем, но при этом не совсем понятно, как можно использовать колонки
для воспроизведения бинаурального звука (т.е. звука, предназначенного
для прослушивания в наушниках, когда часть сигнала предназначена для
одного уха, а другая часть для другого уха). Как только мы подключим
вместо наушников колонки, наше правое ухо начнет слышать не только звук,
предназначенный для него, но и часть звука, предназначенную для левого
уха. Одним из решений такой проблемы является использование техники
cross-talk-cancelled stereo или transaural stereo, чаще называемой
просто алгоритм crosstalk cancellation (для краткости CC).

Идея CC просто выражается в терминах частот. На схемы выше сигналы S1 и

S2 воспроизводятся колонками. Сигнал Y1 достигающий левого уха
представляет собой смесь из S1 и “crosstalk” (части) сигнала S2. Чтобы
быть более точными, Y1=H11 S1 + H12 S2, где H11 является HRTF между
левой колонкой и левым ухом, а H12 это HRTF между правой колонкой и
левым ухом. Аналогично Y2=H21 S1 + H22 S2. Если мы решим использовать
наушники, то мы явно будем знать искомые сигналы Y1 и Y2 воспринимаемые
ушами. Проблема в том, что необходимо правильно определить сигналы S1 и
S2, чтобы получить искомый результат. Математически для этого просто
надо обратить уравнение:

На практике, обратное преобразование матрицы не является тривиальной
задачей.

* При очень низкой частоте звука, все функции HRTF одинаковы и поэтому
матрица является вырожденной, т.е. матрицей с нулевым детерминантом (это
единственная помеха для тривиального обращения любой квадратной
матрицы). На западе такие матрицы называют сингулярными. (К счастью, в
среде отражающей звук, т.е. где присутствует реверберация,
низкочастотная информация не являются важной для определения
местоположения источника звука).

* Точное решение стремиться к результату с очень длинными импульсными
характеристиками. Эта проблема становится все более и более сложной,
если в дальнейшем искомый источник звука располагается вне линии между
двумя колонками, т.е. так называемый фантомный источник звука.

* Результат будет зависеть от того, где находится слушатель по отношению
к колонкам. Правильное восприятие звучания достигается только в районе
так называемого “sweet spot”, предполагаемого месторасположения
слушателя при обращении уравнения. Поэтому, то, как мы слышим звук,
зависит не только от того, как была сделана запись, но и от того, из
какого места между колонками мы слушаем звук.

При грамотном использовании алгоритмов CC получаются весьма хорошие
результаты, обеспечивающие воспроизведение звука, источники которого
расположены в вертикальной и горизонтальной плоскости. Фантомный
источник звука может располагаться далеко вне пределов линейного
сегмента между двумя колонками.

Давно известно, что для создания убедительного 3D звучания достаточно
двух звуковых каналов. Главное это воссоздать давление звука на
барабанные перепонки в левом и правом ушах таким же, как если бы
слушатель находился в реальной звуковой среде.

Из-за того, что расчет HRTF функций сложная задача, во многих системах
пространственного звука (spatial audio systems) разработчики полагаются
на использование данных, полученных экспериментальным путем, например,
данные получаются с помощью KEMAR, о чем мы говорили выше. Тем не менее,
основной причиной использования HRTF является желание воспроизвести
эффект elevation (звук в вертикальной плоскости), наряду с азимутальными
звуковыми эффектами. При этом восприятие звуковых сигналов, источники
которых расположены в вертикальной плоскости, чрезвычайно чувствительно
к особенностям каждого конкретного слушателя. В результате сложились
четыре различных метода расчета HRTF:

* Использование компромиссных, стандартных HRTF функций. Такой метод
обеспечивает посредственные результаты при воспроизведении эффектов
elevation для некоторого процента слушателей, но это самый
распространенный метод в недорогих системах. На сегодня, ни IEEE, ни
ACM, ни AES не определили стандарт на HRTF, но похоже, что компании типа
Microsoft и Intel создадут стандарт де-факто.

* Использование одной типа HRTF функций из набора стандартных функций. В
этом случае необходимо определить HRTF для небольшого числа людей,
которые представляют все различные типы слушателей, и предоставить
пользователю простой способ выбрать именно тот набор HRTF функций,
который наилучшим образом соответствует ему (имеются в виду рост, форма
головы, расположение ушей и т.д.). Несмотря на то, что такой метод
предложен, пока никаких стандартных наборов HRTF функций не существует.

* Использование индивидуализированных HRTF функций. В этом случае
необходимо производить определение HRTF исходя из параметров конкретного
слушателя, что само по себе сложная и требующая массы времени процедура.
Тем не менее, эта процедура обеспечивает наилучшие результаты.

* Использование метода моделирования параметров определяющих HRTF,
которые могут быть адаптированы к каждому конкретному слушателю. Именно
этот метод сейчас применяется повсеместно в технологиях 3D звука.

На практике существуют некоторые проблемы, связанные с созданием базы
HRTF функций при помощи манекена. Результат будет соответствовать
ожиданиям, если манекен и слушатель имеют головы одинакового размера и
формы, а также ушные раковины одинакового размера и формы. Только при
этих условиях можно корректно воссоздать эффект звучания в вертикальной
плоскости и гарантировать правильное определение местоположения
источников звука в пространстве. Записи, сделанные с использованием HRTF
называются binaural recordings, и они обеспечивают высококачественный 3D
звук. Слушать такие записи надо в наушниках, причем желательно в
специальных наушниках. Компакт диски с такими записями стоят существенно
дороже стандартных музыкальных CD. Чтобы корректно воспроизводить такие
записи через колонки необходимо дополнительно использовать технику CC.
Но главный недостаток подобного метода – это отсутствие интерактивности.
Без дополнительных механизмов, отслеживающих положение головы
пользователя, обеспечить интерактивность при использовании HRTF нельзя.
Бытует даже поговорка, что использовать HRTF для интерактивного 3D
звука, это все равно, что использовать ложку вместо отвертки: инструмент
не соответствует задаче.

Sweet Spot

На самом деле значения HRTF можно получить не только с помощью
установленных в ушах манекена специальных внутриканальных микрофонов
(inter-canal microphones). Используется еще и так называемая
искусственная ушная раковина. В этом случае прослушивать записи нужно в
специальных внутриканальных (inter-canal) наушниках, которые
представляют собой маленькие шишечки, размещаемые в ушном канале, так
как искусственная ушная раковина уже перевела всю информацию о
позиционировании в волновую форму. Однако нам гораздо удобнее слушать
звук в наушниках или через колонки. При этом стоит помнить о том, что
при записи через inter-canal микрофоны вокруг них, над ними и под ними
происходит искажение звука. Аналогично, при прослушивании звук
искажается вокруг головы слушателя. Поэтому и появилось понятие sweet
spot, т.е. области, при расположении внутри которой слушатель будет
слышать все эффекты, которые он должен слышать. Соответственно, если
голова слушателя расположена в таком же положении, как и голова манекена
при записи (и на той же высоте), тогда будет получен лучший результат
при прослушивании. Во всех остальных случаях будут возникать искажения
звука, как между ушами, так и между колонками. Понятно, что
необходимость выбора правильного положения при прослушивании, т.е.
расположение слушателя в sweet spot, накладывает дополнительные
ограничения и создает новые проблемы. Понятно, что чем больше область
sweet spot, тем большую свободу действий имеет слушатель. Поэтому
разработчики постоянно ищут способы увеличить область действия sweet
spot.

Частотная характеристика

Действие HRTF зависит от частоты звука; только звуки со значениями
частотных компонентов в пределах от 3 kHz до 10 kHz могут успешно
интерпретироваться с помощью функций HRTF. Определение местоположения
источников звуков с частотой ниже 1 kHz основывается на определении
времени задержки прибытия разных по фазе сигналов до ушей, что дает
возможность определить только общее расположение слева/справа источников
звука и не помогает пространственному восприятию звучания. Восприятие
звука с частотой выше 10 kHz почти полностью зависит от ушной раковины,
поэтому далеко не каждый слушатель может различать звуки с такой
частотой. Определить местоположение источников звука с частотой от 1 kHz
до 3 kHz очень сложно. Число ошибок при определении местоположения
источников звука возрастает при снижении разницы между соотношениями
амплитуд (чем выше пиковое значение амплитуды звукового сигнала, тем
труднее определить местоположение источника). Это означает, что нужно
использовать частоту дискретизации (которая должна быть вдвое больше
значения частоты звука) соответствующей как минимум 22050 Hz при 16 бит
для реальной действенности HRTF. Дискретизация 8 бит не обеспечивает
достаточной разницы амплитуд (всего 256 вместо 65536), а частота 11025
Hz не обеспечивает достаточной частотной характеристики (так как при
этом максимальная частота звука соответствует 5512 Hz). Итак, чтобы
применение HRTF было эффективным, необходимо использовать частоту 22050
Hz при 16 битной дискретизации.

Ушная раковина (Pinna)

Мозг человека анализирует разницу амплитуд, как звука, достигшего
внешнего уха, так и разницу амплитуд в слуховом канале после ушной
раковины для определения местоположения источника звука. Ушная раковина
создает нулевую и пиковую модель звучания между ушами; эта модель
совершенно разная в каждом слуховом канале и эта разница между сигналами
в ушах представляет собой очень эффективную функцию

для определения, как частоты, так и местоположения источника звука. Но
это же явление является причиной того, что с помощью HRTF нельзя создать
корректного восприятия звука через колонки, так как по теории ни один из
звуков, предназначенный для одного уха не должен быть слышимым вторым
ухом.

Мы вновь вернулись к необходимости использования дополнительных
алгоритмов CC. Однако, даже при использовании кодирования звука с
помощью HRTF источники звука являются неподвижными (хотя при этом
амплитуда звука может увеличиваться). Это происходит из-за того, что
ушная раковина плохо воспринимает тыловой звук, т.е. когда источники
звука находятся за спиной слушателя. Определение местоположения
источника звука представляет собой процесс наложения звуковых сигналов с
частотой, отфильтрованной головой слушателя и ушными раковинами на мозг
с использованием соответствующих координат в пространстве. Так как
происходит наложение координат только известных характеристик, т.е.
слышимых сигналов, ассоциируемых с визуальным восприятием местоположения
источников звука, то с течением времени мозг “записывает” координаты
источников звука и в дальнейшем определение их местоположения может
происходить лишь на основе слышимых сигналов. Но видим мы только
впереди. Соответственно, мозг не может правильно расположить координаты
источников звука, расположенных за спиной слушателя при восприятии
слышимых сигналов ушной раковиной, так как эта характеристика является
неизвестной. В результате, мозг может располагать координаты источников
звука совсем не там, где они должны быть. Подобную проблему можно решить
только при использовании вспомогательных сигналов, которые бы помогли
мозгу правильно располагать в пространстве координаты источников звуков,
находящихся за спиной слушателя.

Неподвижные источники звука

Все выше сказанное подвело нас к еще одной проблеме:

Если источники звука неподвижны, они не могут быть точно локализованы,
как “статические” при моделировании, т.к. мозгу для определения
местоположения источника звука необходимо наличие перемещения (либо
самого источника звука, либо подсознательных микро перемещений головы
слушателя), которое помогает определить расположение источника звука в
геометрическом пространстве. Нет никаких оснований, ожидать, что
какая-либо система на базе HRTF функций будет корректно воспроизводить
звучание, если один из основных сигналов, используемый для определения
местоположения источника звука, отсутствует. Врожденной реакцией
человека на неожидаемый звук является повернуть голову в его сторону (за
счет движения головы мозг получает дополнительную информацию для
локализации в пространстве источника звука). Если сигнал от источника
звука не содержит особую частоту, влияющую на разницу между фронтальными
и тыловыми HRTF функциями, то такого сигнала для мозга просто не
существует; вместо него мозг использует данные из памяти и сопоставляет
информацию о местоположении известных источников звука в полусферической
области.

Каково же будет решение?

Лучший метод воссоздания настоящего 3D звука это использование
минимальной частоты дискретизации 22050 Hz при 16 битах и использования
дополнительных тыловых колонок при прослушивании. Такая платформа
обеспечит пользователю реалистичное воспроизведение звука за счет
воспроизведение через достаточное количество колонок (минимум три) для
создания настоящего surround звучания. Преимущество такой конфигурации
заключается в том, что когда слушатель поворачивает голову для
фокусировки на звуке какого-либо объекта, пространственное расположение
источников звука остается неизменным по отношению к окружающей среде,
т.е. отсутствует проблема sweet spot.

Есть и другой метод, более новый и судить о его эффективности пока
сложно. Суть метода, который разработан Sensaura и называется
MultiDrive, заключается в использовании HRTF функций на передней и на
тыловой паре колонок (и даже больше) с применением алгоритмов CC. На
самом деле Sensaura называет свои алгоритмы СС несколько иначе, а именно
Transaural Cross-talk cancellation (TCC), заявляя, что они обеспечивают
лучшие низкочастотные характеристики звука. Инженеры Sensaura взялись за
решение проблемы восприятия звучания от источников звука, которые
перемещаются по бокам от слушателя и по оси фронт/тыл. Заметим, что
Sensaura для вычисления HRTF функций использует так называемое “цифровое
ухо” (Digital Ear) и в их библиотеке уже хранится более 1100 функций.
Использование специального цифрового уха должно обеспечивать более
точное кодирование звука. Подчеркнем, что Sensaura создает технологии, а
использует интерфейс DS3D от Microsoft.

Технология MultiDrive воспроизводит звук с использованием HRTF функций
через четыре или более колонок. Каждая пара колонок создает фронтальную
и тыловую полусферу соответственно.

Фронтальные и тыловые звуковые поля специальным образом смещены с целью
взаимного дополнения друг друга и за счет применения специальных
алгоритмов улучшает ощущения фронтального/тылового расположения
источников звука. В каждом звуковом поле применяются собственный
алгоритм cross-talk cancellation (CC). Исходя из этого, есть все
основания предполагать, что вокруг слушателя будет плавное
воспроизведение звука от динамично перемещающихся источников и
эффективное расположение тыловых виртуальных источников звука. Так как
воспроизводимые звуковые поля основаны на применении HRTF функций,
каждое из создаваемых sweet spot (мест, с наилучшим восприятием
звучания) способствует хорошему восприятию звучания от источников по
сторонам от слушателя, а также от движущихся источников по оси
фронт/тыл. Благодаря большому углу перекрытия результирующее место с
наилучшим восприятием звука (sweet spot) покрывает область с гораздо
большей площадью, чем конкурирующие четырех колоночные системы
воспроизведения. В результате качество воспроизводимого 3D звука должно
существенно повысится.

Если бы не применялись алгоритмы cross-talk cancellation (CC) никакого
позиционирования источников звука не происходило бы. Вследствие
использования HRTF функций на четырех колонках для технологии MultiDrive
необходимо использовать алгоритмы CC для четырех колонок, требующие
чудовищных вычислительных ресурсов. Из-за того, что обеспечить работу
алгоритмов CC на всех частотах очень сложная задача, в некоторых
системах применяются высокочастотные фильтры, которые срезают компоненты
высокой частоты. В случае с технологией MultiDrive Sensaura заявляет,
что они применяют специальные фильтры собственной разработки, которые
позволяют обеспечить позиционирование источников звука, насыщенными
высокочастотными компонентами, в тыловой полусфере. Хотя sweet spot
должен расшириться и восприятие звука от источников в вертикальной
плоскости также улучшается, у такого подхода есть и минусы. Главный
минус это необходимость точного позиционирования тыловых колонок
относительно фронтальных. В противном случае никакого толка от HRTF на
четырех колонках не будет.

Стоит упомянуть и другие инновации Sensaura, а именно технологии ZoomFX
и MacroFX, которые призваны улучшить восприятие трехмерного звука.
Расскажем о них подробнее, тем более что это того стоит.

MacroFX

Как мы уже говорили выше, большинство измерений HRTF производятся в так
называемом дальнем поле (far field), что существенным образом упрощает
вычисления. Но при этом, если источники звука располагаются на
расстоянии до 1 метра от слушателя, т.е. в ближнем поле (near field),
тогда функции HRTF плохо справляются со своей работой. Именно для
воспроизведения звука от источников в ближнем поле с помощью HRTF
функций и создана технология MacroFX. Идея в том, что алгоритмы MacroFX
обеспечивают воспроизведение звуковых эффектов в near-field, в
результате можно создать ощущение, что источник звука расположен очень
близко к слушателю, так, будто источник звука перемещается от колонок
вплотную к голове слушателя, вплоть до шепота внутри уха слушателя.
Достигается такой эффект за счет очень точного моделирования
распространения звуковой энергии в трехмерном пространстве вокруг головы
слушателя из всех позиций в пространстве и преобразование этих данных с
помощью высокоэффективного алгоритма. Особое внимание при моделировании
уделяется управлению уровнями громкости и модифицированной системе
расчета задержек по времени при восприятии ушами человека звуковых волн
от одного источника звука (ITD, Interaural Time Delay). Для примера,
если источник звука находится примерно посередине между ушами слушателя,
то разница по времени при достижении звуковой волны обоих ушей будет
минимальна, а вот если источник звука сильно смещен вправо, эта разница
будет существенной. Только MacroFX принимает такую разницу во внимание
при расчете акустической модели. MacroFX предусматривает 6 зон, где зона
0 (это дистанция удаления) и зона 1 (режим удаления) будут работать
точно так же, как работает дистанционная модель DS3D. Другие 4 зоны это
и есть near field (ближнее поле), покрывающие левое ухо, правое ухо и
пространство внутри головы слушателя.

Этот алгоритм интегрирован в движок Sensaura и управляется
DirectSound3D, т.е. является прозрачным для разработчиков приложений,
которые теперь могут создавать массу новых эффектов. Например, в авиа
симуляторах можно создать эффект, когда пользователь в роли пилота будет
слышать переговоры авиа диспетчеров так, как если бы он слышал эти
переговоры в наушниках. В играх с боевыми действиями может потребоваться
воспроизвести звук пролетающих пуль и ракет очень близко от головы
слушателя. Такие эффекты, как писк комара рядом с ухом теперь вполне
реальны и доступны. Но самое интересное в том, что если у вас
установлена звуковая карта с поддержкой технологии Sensaura и с
драйверами, поддерживающими MacroFX, то пользователь получит возможность
слышать эффекты MacroFX даже в уже существующих DirectSound3D играх,
разумеется, в зависимости от игры эффект будет воспроизводиться лучше
или хуже. Зато в игре, созданной с учетом возможности использования
MacroFX. Можно добиться очень впечатляющих эффектов.

Поддержка MacroFX будет включена в драйверы для карт, которые
поддерживают технологию Sensaura.

ZoomFX

Современные системы воспроизведения позиционируемого 3D звука используют
HRTF функции для создания виртуальных источников звука, но эти
синтезированные виртуальные источники звука являются точечными. В
реальной жизни звук зачастую исходит от больших по размеру источников
или от композитных источников, которые могут состоять из нескольких
индивидуальных генераторов звука. Большие по размерам и композитные
источники звука позволяют использовать более реалистичные звуковые
эффекты, по сравнению с возможностями точечных источников звука. Так,
точечный источник звука хорошо применим при моделировании звука от
большого объекта удаленного на большое расстояние (например, движущийся
поезд). Но в реальной жизни, как только поезд приближается к слушателю,
он перестает быть точечным источником звука. Однако в модели DS3D поезд
все равно представляется, как точечный источник звука, а значит,
страдает реализм воспроизводимого звука (т.е. мы слышим звук скорее от
маленького поезда, нежели от огромного состава громыхающего рядом).
Технология ZoomFX решает эту проблему, а также вносит представление о
большом объекте, например поезде как собрание нескольких источников
звука (композитный источник, состоящий из шума колес, шума двигателя,
шума сцепок вагонов и т.д.).

Для технологии ZoomFX будет создано расширение для DirectSound3D,
подобно EAX, с помощью которого разработчики игр смогут воспроизводить
новые звуковые эффекты и использовать такой параметр источника звука,
как размер. Пока эта технология находится на стадии завершения.

Компания Creative реализовала аналогичный подход, как в MultiDrive от
Sensaura, в своей технологии CMSS (Creative Multispeaker Surround Sound)
для серии своих карт SB Live!. Поддержка этой версии технологии CMSS, с
реализацией HRTF и CC на четырех колонках, встроена в программу
обновления LiveWare 2.x. По своей сути, технология CMSS является
близнецом MultiDrive, хотя на уровне алгоритмов CC и библиотек HRTF
наверняка есть отличия. Главный недостаток CMSS такой же, как у
MultiDrive – необходимость расположения тыловых колонок в строго
определенном месте, а точнее параллельно фронтальным колонкам. В
результате возникает ограничение, которое может не устроить многих
пользователей. Не секрет, что место для фронтальных колонок давно
зарезервировано около монитора. Место для сабвуфера можно выбрать любым,
обычно это где-то в углу и на полу. А вот тыловые колонки пользователи
располагают там, где считают удобным для себя. Не каждый захочет
расположить их строго за спиной и далеко не у всех есть свободное место
для такого расположения.

Заметим, что главный конкурент Creative на рынке 3D звука, компания
Aureal, использует технику панорамирования на тыловых колонках.
Объясняется это именно отсутствием строгих ограничений на расположение
тыловых колонок в пространстве.

Не стоит забывать и о больших объемах вычислений при расчете HRTF и
Cross-talk Cancellation для четырех колонок.

Еще один игрок на рынке 3D звука – компания QSound пока имеет сильные
позиции только в области воспроизведения звука через наушники и две
колонки. При этом свои алгоритмы для воспроизведения 3D звука через две
колонки и наушники (в основе лежат HRTF) QSound создает исходя из
результатов тестирования при прослушивании реальными людьми, т.е. не
довольствуется математикой, а делает упор на восприятие звука
конкретными людьми. И таких прослушиваний было проведено более 550000!
Для воспроизведения звука через четыре колонки QSound использует
панорамирование, т.е. тоже, что было в первой версии CMSS. Такая техника
плохо показала себя в играх, обеспечивая слабое позиционирование
источников звука в вертикальной плоскости.

Компания Aureal привнесла в технологии воспроизведения 3D звука свою
технику Wavetracing. Мы уже писали об этой технологии, вкратце, это
расчет распространения отраженных и прошедших через препятствия звуковых
волн на основе геометрии среды. При этом обеспечивается полный динамизм
восприятия звука, т.е. полная интерактивность.

Итак, подведем итоги. Однозначный вывод состоит в том, что если вы
хотите получить наилучшее качество 3D звука, доступное на сегодняшний
день, вам придется использовать звуковые карты, поддерживающие
воспроизведение минимум через четыре колонки. Использование только двух
фронтальных колонок – это конфигурация вчерашнего дня. Далее, если вы
только собираетесь переходить на карты с поддержкой четырех и более
колонок, то перед вами встает классическая проблема выбора. Как всегда
единственная рекомендация состоит в том, чтобы вы основывали свой выбор
на собственных ощущениях. Послушайте максимально возможно число разных
систем и сделайте именно свой выбор.

Теперь посмотрим, с каким багажом подошли ведущие игроки 3D звукового
рынка к сегодняшнему дню и что нас ждет в ближайшем будущем.

EAR

EAR – в текущей версии IAS 1.0 реализована поддержка воспроизведения
DS3D, A3D 1.0 и EAX 1.0 через четыре и более колонок. За счет
воспроизведения через четыре и более колонок, мозг слушателя получает
дополнительные сигналы для правильного определения местоположения
источников звука в пространстве.

Этой осенью ожидается выход IAS 2.0 с поддержкой DirectMusic,
YellowBook, EAX 2.0

и A3D 2.0, force-feed back (мы сможем чувствовать звук, а именно
давление звука, громкость и т.д.), декодирование в реальном времени MP3
и Dolby/DTS, будет реализована поддержка “.1” канала (сабвуфера). Кроме
того, в IAS 2.0 будет реализовано звуковое решение, не требующее наличие
звуковой карты (cardless audio solution) для использования с полностью
цифровой системой воспроизведения звука, например с USB колонками или в
тандеме с домашней системой Dolby Digital.

Главные достоинства IAS от EAR:

* Один интерфейс для любой многоколоночной платформы, обеспечивающий
одинаковый результат вне зависимости от того, как воспроизводится звук
при использовании специального API.

* Имеется поддержка воспроизведения через две колонки (для старых
систем),

если многоколоночная конфигурация недоступна.

* Пользователь может подключить свой компьютер к домашней звуковой
системе (Dolby Digital и т.д.) и IAS будет воспроизводить звук без
необходимости какой-либо модернизации.

Итак, по сравнению с конкурентами, IAS работает на любой платформе и не

требует специального аппаратного обеспечения. При этом IAS использует
любое доступное аппаратное обеспечение и обеспечивает пользователю
наилучшее качество звука, которое доступно на его системе. Только вот
остановит ли свой выбор пользователь на этой технологии, это большой
вопрос. С другой стороны, для использования IAS не нужно покупать
специальных звуковых карт.

Sensaura

Sensaura – компания занимающаяся созданием технологий. Производители
звуковых чипов лицензируют разработки Sensaura и воплощают их в жизнь. В
чипе Canyon3D от ESS будет реализована поддержка современных технологий
Sensaura, которые должны обеспечить слушателем 3D звук на современном
уровне, т.е. позиционируемый в пространстве и с воспроизведением через
четыре и более колонок. За воспроизведение через четыре и более колонок
отвечает технология MultiDrive, которая реализует HRTF и алгоритмы
Cross-talk cancellation. Многообещающе выглядят технологии ZoomFX и
MacroFX. Кроме того, Sensaura поддерживает воспроизведение реверберации
через EAX от Creative, равно как и через I3DL2, а также эмулирует
поддержку A3D 1.х через DS3D.

Первым звуковым чипов, который реализует технологию MultiDrive на
практике, является Canyon3D от ESS Technology, Inc. Более подробную
информацию о чипе Canyon3D можно найти на официальном сайте
www.canyon3d.com.

Первая карта на базе чипа Canyon3D называется DMX и производит ее
компания Terratec.

Как только эта карта попадет к нам на испытания, мы представим на ваш
суд обзор. Заметим только, что на этой карте будут сразу оба типа
цифровых выходов S/PDIF коаксиальный (RCA) и оптический (Toslink), и
один цифровой вход. Так что продукт обещает быть очень интересным.

Creative

Creative – занимается совершенствованием своего движка реверберации. В
итоге в свет выйдет EAX 3.0, который должен добавить больше реализма в
воспроизводимый звук. Никто не спорит, что реверберация это хорошо, что
именно она обеспечивает насыщенное и живое звучание. При этом Creative
упорно не собирается вести разработки в области геометрии акустики.
Кстати, Microsoft объявила о намерении включить EAX в состав
DirectSound3D 8.0. С другой стороны, есть неподтвержденные слухи, что
EAX 3.0 будет закрытым стандартом. Интересно, изменит ли Creative свою
позицию со временем? Пока же в новых версиях EAX нам обещают больше
реализма и гибкости в настройках реверберации и моделировании звуковой
среды для конкретных объектов и помещений, плюс плавные переходы от
одной заранее созданной звуковой среды к другой при движении слушателя в
3D мире. Будут улучшения в области воспроизведения эффектов окклюзии и
обструкции. Обещают и поддержку отраженных звуков, но без учета
геометрии и более продвинутую дистанционную модель. Вообще, я не
удивительно, если Creative лицензирует MacroFX и ZoomFX у Sensaura. Что
касается моделирования звука на основе физической геометрии среды, то
Creative очень усиленно отрицает для себя возможность поддержки такого
метода. Хотя, если поднять архивы и посмотреть первый пресс-релиз о
будущем чипе Emu10k1, то вы будете удивлены. Там говорится именно об
использовании физической геометрии среды при моделировании звука. Потом
планы изменились. Кто помешает Creative вновь изменить планы? Особенно
если учесть появление в ближайшее время движка реверберации от Aureal.
Вряд ли Creative не сделает ответного хода.

QSound

QSound ведет работы по созданию новой технологии воспроизведения 3D
звука через четыре и более колонок. Зная пристрастия QSound, можно
предположить, что в основу новой технологии опять лягут результаты
реальных прослушиваний. QSound, как и Sensaura занимается именно
технологиями, которые воплощают в виде чипов другие компании. Так, чип
Thunderbird128 от VLSI воплощает в себе все последние достижения QSound
в области 3D звука, при этом Thunderbird128 это DSP, а значит, есть все
основания ожидать последующей модернизации. Стоит упомянуть, что QSound,
подобно Creative считает, что главное в 3D звуке это восприятие
слушателем окружающей атмосферы игры. Поэтому QEM (QSound Environmental
Modeling) совместима с EAX 1.0 от Creative. Следует ожидать, что QEM 2.0
будет совместима с EAX 2.0. Отметим, что QSound славится очень
эффективными алгоритмами и грамотным распределением доступных ресурсов,
неслучайно именно их менеджер ресурсов был лицензирован Microsoft и
включен в DirectX.

Aureal

С Aureal все более-менее понятно. В ближайшем будущем нам обещают
дальнейшее улучшение функциональности A3D, мощный движок реверберации,
поддержку HRTF на четырех и более колонках. Кроме того, есть
вероятность, что Aureal начнет продавать свои карты под своей маркой.
Кстати, осенью должны начаться продажи супер колонок под маркой Aureal.

Мы упомянули основные разработки в области 3D звука, которые применяются
в компьютерном мире. Есть еще ряд фирм с интересными решениями, но они
делают упор на рынок бытовой электроники, поэтому мы не стали в данном
главе рассказывать о них.

С развитием компьютерной индустрии звука, можно в дальнейшем
прогнозировать, что будущие звуковые карты и звуковые интерфейсы
позволят разработчикам игр создавать потрясающие своей реальностью и
производимым впечатлением эффекты. Библиотеки HRTF будут все дальше
совершенствоваться. Возможно, чипы звуковых карт будут поддерживать
декодирование AC-3 и других форматов цифрового звука. Звуковые карты
будут поддерживать подключение более четырех колонок. Широкое
распространение получат цифровые интерфейсы и цифровые подключения.
Отдельной веткой будут развиваться дешевые решения на базе AMR.
Пользователю лишь, остается самая сложная часть, выбрать именно тот
продукт, который устроит его по всем параметрам. Не следует забывать,
что звук каждый слышит по-своему, поэтому, только послушав
самостоятельно, человек составит правильное мнение о звуковой карте и
звуковых технологиях.

З А К Л Ю Ч Е Н И Е

Мы живем сейчас, именно в том времени, когда, ни одна прогрессивная
технология не останавливается на промежуточном результате, а продолжает
плодотворно развиваться. Особенно это касается разработки новых средств
multimedia. Ведь, как мы уже выяснили, без них нельзя представить ни
один крупный проэкт. Поэтому, разработчики, не боясь вкладывают свои
средства в их создание, а пользователи охотно преобретают,
руководствуясь красочными “плодами” рекламы.

Так например, развитие систем окружающего 3D-звука пока идет лишь по
пути создания красивой акустической иллюзии, за счет более или менее
удачного обмана физиологии нашего слуха. Следующим логическим шагом в
этом направлении может стать интерактивное аудио, в основу которого
положено адекватное реагирование на изменение акустических свойств
помещения с целью имитации акустики всемирно знаменитых концертных
залов. То есть, в будующем, неплохо будет иметь дома отдельную комнату
для аудиовидеоланча, скроенную по принципу срезов золотых сечений, с
натяжными звукокорректирующими гобеленами XVII века, скромными
персидскими коврами и парочкой древнеримских статуй в качестве дробилки
стоячих волн. Но подобное слегка не по карману странствующему по мукам
аудиофилу. Очевидно и то, что даже наличие идеальной звуковой камеры не
всегда помогает ощутить атмосферу зала, близкую к реальной, а
интерактивная цифровая модель (по крайней мере теоретически) это сделать
должна.

Что касается будущего цифровой музыки, то сейчас организация MPEG
работает над стандартом MPEG-4, в котором используется принципиально
новый подход как к аудио-, так и к видеокомпрессии. MPEG-4, как и MIDI ,
позволяет не просто воспроизводить, а синтезировать музыку. Но в отличае
от MIDI, звуки в программе MPEG-4 – не простые образцы. Этот способ
синтеза музыки получил название “метода Колмогорова”. Кроме того,
MPEG-4, будет сочетать два языка прграммирования, используемых в
цифровом аудио. Один из них SAOL, применяется для обычного компьютерного
аудио, а другой, SASIL, поддерживае MIDI. В своей простейшей форме

MPEG-4 генерирует звук как файлы WAV, но файл MPEG-4 будет гораздо
меньше.

Ну, и наконец, применение звуковой карты будет заключаться
не в обыденной записи/воспроизведении звука, а в чем нибудь более
оригинальном, как например, в использовании ее в качестве элемента
оптико-электронного измерительного прибора.

Звуковая карта, представляет собой высококачественный измеритель
переменного напряжения, сопряженный с аналого-цифровым преобразователем.
Игровой же порт, по определению, является устройством для измерения
сопротивления переменных резисторов, находящихся в джойстике. На этом
принципе и основано ее применение в качестве исследователя затвора
фотокамеры. То есть, следует подключить первый попавшийся фотодиод к
микрофонному входу звуковой карты и получится прибор для измерения
светового потока, падающего на чувствительный элемент. Теперь, направив
световой пучок, например, от проектора для диапозитивов, на объектив
фотокамеры, можно откинуть заднюю крышку и, расположив фотодиод в
фокальной плоскости объектива, измерить время срабатывания затвора. Для
шторно-шелевого затвора удобнее объектив снять и расположить фотодиод
вблизи шторки.

И, наверняка, таких моментов будет огромное множество. Нам остается
только подождать…

Используемая литература

1. Занимательное путешествие в мир MP3/ CD КОМПЬЮТЕР ПРЕСС 4’99.

2 Звуковые карты/ CD КОМПЬЮТЕР ПРЕСС 1’99.

3. Программы для работы со звуком и музыкой/ CD КОМПЬЮТЕР ПРЕСС 11’99.

4. Cakewalk Pro Audio 8/ INTERNET:http//www.cit.org.by/ musicwarez

5. Sound Forge 4.0/ INTERNET:http//www.cit.org.by/ musicwarez

6. Как самому написать музыку/ INTERNET:http//www.cit.org.by/
musicwarez

7. Может ли владелец ПК со звуковой платой считаться композитором? /

INTERNET:http//www.cit.org.by/ musicwarez

8. Создание MIDI/ INTERNET:http//www.cit.org.by/ musicwarez

9. Характеристики MIDI/ INTERNET:http//www.iXBT.ru

10.Звуковая карта как элемент оптико-электронного измерительного прибора
/

INTERNET:http//www.iXBT.ru

11.Описание интерфейса MIDI/ INTERNET:http//www.iXBT.ru

12.Тестирование программных MP3-проигрывателей /

INTERNET:http//www.iXBT.ru

13.Технология создания позиционируемого 3D звука/
INTERNET:http//www.iXBT.ru

14.Функционирование звуковых плат/ INTERNET:http//www.cit.org.by/
musicwarez

15.Вслушайтесь в завтрашний день// Компьютерра. 1999 №12.

16.Из аналога в цифру и обратно// Компьютерра. 1999 №30-31.

17.Цифра и звук// Компьютерра. 1999 №30-31.

18.Цифровая запись музыкальных CD// Компьютерра. 1999 №30-31.

19.Звуковое будущее// Компьютерра. 1999 №45.

20.Эффект виталия палыча или, первые миди впечатления// Компьютерра.
1997 №46.

21.MP3 – магия звуков//МИР ПК. 1999 №10

22.Музыкальные конструкторы// ПОДВОДНАЯ ЛОДКА. 1998 №12

23.Играй,музыкант!// Софт маркет. 1997 №23

24.Музыкальная шкатулка нашего времени// Софт маркет. 1997 №23

25.Фигурнов В.Э. IBM PC для пользователя. Изд.7-е, переработанное и
дополненное.-М.:ИНФРА-М, 1999.

PAGE

PAGE 50

Нашли опечатку? Выделите и нажмите CTRL+Enter