Доклад на тему «Работа со звуком» — КиберПедия 

Эмиссия газов от очистных сооружений канализации: В последние годы внимание мирового сообщества сосредоточено на экологических проблемах...

Архитектура электронного правительства: Единая архитектура – это методологический подход при создании системы управления государства, который строится...

Доклад на тему «Работа со звуком»

2019-09-04 184
Доклад на тему «Работа со звуком» 0.00 из 5.00 0 оценок
Заказать работу

Доклад на тему «Работа со звуком»

Основные свойства слуха

Слух – способность биологических организмов воспринимать звуки органами слуха; функция слухового аппарата, возбуждаемая звуковыми колебаниями окружающей среды. Это одно из биологических дистантных ощущений, называемое также акустическим восприятием. Обеспечивается слуховой сенсорной системой.

Восприятие по частоте

Диапазон частот, которые способен слышать человек, называется слуховым или звуковым диапазоном и находится в пределах от 20 Гц до 20 кГц; более высокие частоты называются ультразвуком, а более низкие инфразвуком. Верхний предел имеет тенденцию снижаться с возрастом. Колебания ниже 60 Гц воспринимаются благодаря вибрационному чувству, более того, ухо само по себе не реагирует на частоты ниже 20 Гц, и они могут ощущаться через органы осязания. Звуки частотой выше 20 000 Гц имеют малое практическое значение, так как быстро тормозятся.

Слышимую часть диапазона звуков разделяют на низкочастотные звуки – до 500 герц, среднечастотные – 500-10000 герц и высокочастотные – свыше 10000 герц. Такое подразделение очень важно, так как ухо человека неодинаково чувствительно к разным звукам. Наиболее чувствительно ухо к сравнительно узкому диапазону среднечастотных звуков от 1000 до 5000 герц. Это приводит к тому, что человек способен услышать в среднечастотном диапазоне звуки с энергией около 0 децибел и не слышать низкочастотные звуки в 20-40-60 децибел. То есть, звуки с одной и той же энергией в среднечастотном диапазоне могут восприниматься как громкие, а в низкочастотном как тихие или быть вовсе не слышны. Такая особенность слуха сформирована природой не случайно, так как звуки, необходимые для существования: речь, звуки природы, – находятся в основном в среднечастотном диапазоне.

Порог слышимости

Диапазон громкости воспринимаемых звуков огромен. Барабанная перепонка в ухе чувствительна только к изменению давления, измеряющегося в децибелах (дБ). Нижний порог слышимости определён как 0 дБ, что соответствует 20-ти микропаскалям на частоте 1кГц, а определение верхнего предела слышимости, определяемый пределом растяжимости барабанной перепонки, относится к порогу дискомфорта и далее к нарушению слуха, контузии и т. д. Этот предел зависит от того, как долго по времени на уши воздействует звук. Ухо способно переносить кратковременное повышение громкости до 120 дБ без последствий, но долговременное восприятие звуков громкостью более 80 дБ может вызвать потерю слуха.

Минимальный порог, при котором звук остаётся слышен, зависит от частоты. Наибольшая чувствительность находится в диапазоне от 1 кГц до 5 кГц, с возрастом чувствительность понижается в диапазоне выше 2 кГц.

Уровень громкости

Уровень громкости звука – относительная величина. Она выражается в фонах и численно равна уровню звукового давления в децибелах, создаваемого синусоидальным тоном частотой 1 кГц такой же громкости, как и измеряемый звук. На графике изображены кривые, представляющие собой зависимости уровня звукового давления от частоты при постоянном уровне громкости. С помощью этой диаграммы можно определить уровень громкости чистого тона какой-либо частоты, зная уровень создаваемого им звукового давления. Так, если синусоидальная волна частотой 5000 Гц создаёт звуковое давление уровнем 60 дБ, то в соответствие с диаграммой, этим значениям будет соответствовать уровень громкости 50 фон.

В свою очередь, уровень звукового давления – измеренное по относительной шкале значение звукового давления, отнесённое к опорному давлению 20 мкПа, соответствующему порогу слышимости синусоидальной звуковой волны частотой 1 кГц: Lp = 20 lg p/p0, где р0 – порог слышимости. Измерение звукового давления в уровнях целесообразно, поскольку человеческий слух различает огромный диапазон изменения звукового давления - разница между самым тихим и самым громким различимым звуком составляет 10⁶ паскаль. При измерениях такую большую шкалу неудобно, поэтому используется логарифмическая шкала, которая позволяет сжать масштаб измерения звукового давления.

Дискретизация

Процесс превращения непрерывного сигнала в цифровой, путем измерения числовых значений амплитуды сигнала через равные интервалы времени называется дискретизацией. В общем случае период времени от одной выборки до следующей может различаться для каждой пары соседних выборок, но обычно при обработке сигнала, выборки следуют через фиксированный и постоянный промежуток времени. Этот промежуток в таком случае называют периодом дискретизации или интервалом выборок. Величину обратную периоду дискретизации называют частотой выборок или частотой дискретизации.

Квантование

Дискретизация разбивает сигнал по временной составляющей, а квантование же приводит сигнал к заданным амплитудным значениям, то есть округляет сигнал до ближайших к нему уровней. Таким образом, квантование – разбиение диапазона отсчётных значений сигнала на конечное число уровней и округление этих значений до одного из двух ближайших к ним уровней. При этом значение сигнала может округляться либо до ближайшего уровня, либо до меньшего или большего из ближайших уровней в зависимости от способа кодирования. В АЦП округление может производится до ближайшего меньшего уровня.

Кодирование

Представление дискретных сигналов, передаваемых по цифровому каналу связи на расстояние по физическому каналу связи, называется кодированием. Оно также применяется для записи данных на цифровой носитель. Процесс кодирования заключается в представлении сообщений условными комбинациями, составленными из небольшого количества элементарных сигналов. В зависимости от целей кодирования различают следующие его виды:

• Кодирование по образцу – используется всякий раз при вводе информации в компьютер для ее внутреннего представления.

• Криптографическое кодирование (шифрование) – используется при необходимости защиты информации от несанкционированного доступа.

• Эффективное или оптимальное кодирование – используется для устранения избыточности информации, т.е. для снижения ее объема.

• Помехозащитное кодирование – используется для обеспечения заданной достоверности в случае, когда на сигнал накладывается помеха.

Аналого-цифровое преобразование

Операция восстановления аналогового сигнала из его дискретного представления обратна операции дискретизации и представляет, по существу, интерполяцию данных. Дискретизация сигналов может приводить к определенной потере информации о поведении сигналов в промежутках между отсчетами. Однако существуют условия, определенные теоремой Котельникова-Шеннона, согласно которым аналоговый сигнал с ограниченным частотным спектром может быть без потерь информации преобразован в дискретный сигнал, и затем абсолютно точно восстановлен по значениям своих дискретных отсчетов.

Во время цифро-аналогового преобразования цифровой сигнал, состоящий из дискретных отсчетов преобразуется в непрерывный сигнал ступенчатого вида, состоящий из прилегающих друг к другу прямоугольных импульсов. Для сглаживания выходного сигнала на выходе цифро – аналогового преобразователя ставится аналоговый фильтр, который так и называется сглаживающим. Сглаживающий фильтр также, как и аналоговый, вносит дополнительные искажения в полезный сигнал.

Сжатие звуковой информации

Сжатие аудиоданных представляет собой процесс уменьшения скорости цифрового потока за счет сокращения избыточности цифрового звукового сигнала. Различают статистическую и психоакустическую избыточность цифровых сигналов. Сокращение статистической избыточности базируется на учете свойств самих звуковых сигналов, а психоакустичсской – на учете свойств слухового восприятия. Методы сокращения статистической избыточности аудиоданных также называют сжатием без потерь, а методы сокращения психоакустической избыточности – сжатием с потерями.

Статистическая избыточность обусловлена наличием корреляционной связи между соседними отсчетами временной функции звукового сигнала при его дискретизации. Для ее уменьшения применяют достаточно сложные алгоритмы обработки. При их использовании потери информации нет, однако исходный сигнал оказывается представленным в более компактной форме, что требует меньшего количества бит при его кодировании. Важно, чтобы все эта алгоритмы позволяли бы при обратном преобразовании восстанавливать исходные сигналы без искажений.

Сжатие аудиоданных с потерями основывается на несовершенстве человеческого слуха при восприятии звуковой информации. Неспособность человека в определенных случаях различать тихие звуки в присутствии более громких, называемая эффектом маскировки, была использована в алгоритмах сокращения психоакустической избыточности. Эффекты слухового маскирования зависят от спектральных и временных характеристик маскируемого и маскирующего сигналов и могут быть разделены на две основные группы: частотное (одновременное) маскирование и временное (неодновременное) маскирование. Эффект маскирования в частотной области связан с тем, что в присутствии больших звуковых амплитуд человеческое ухо нечувствительно к малым амплитудам близких частот. То есть, когда два сигнала одновременно находятся в ограниченной частотной области, то более слабый сигнал становится неслышимым на фоне более сильного. Маскирование во временной области характеризует динамические свойства слуха, показывая изменение во времени относительного порога слышимости, когда маскирующий и маскируемый сигналы звучат не одновременно. При этом следует различать явления послемаскировки – изменение порога слышимости после сигнала высокого уровня – и предмаскировки – изменение порога слышимости перед приходом сигнала максимального уровня. Более слабый сигнал становится неслышимым за 5 − 20 мс до включения сигнала маскирования и становится слышимым через 50 − 200 мс после его включения. Очевидно, что после устранения психоакустической избыточности звуковых сигналов их точное восстановления при декодировании оказывается уже невозможным. Методами устранения психофизической избыточности можно обеспечить сжатие цифровых аудиоданных в 10 − 12 раз без существенных потерь в качестве.

Стандарты звуковых файлов

Цифровой аудиоформат — формат представления звуковых данных, используемый при цифровой звукозаписи, а также для дальнейшего хранения записанного материала на компьютере и других электронных носителях информации, так называемых звуковых носителях.

Стандарты MPEG

• MPEG-1 — группа стандартов цифрового сжатия аудио и видео, принятых MPEG (Moving Picture Experts Group — группой экспертов в области видео).

MPEG-1 состоит из нескольких частей: синхронизация и мультиплексирование аудио и видео (MPEG-1 Program Stream), кодек для видео с прогрессивной разверткой, кодек для звука.

Стандарт MPEG-1 определяет три уровня сжатия звука: MP1 или MPEG-1 часть 3 уровень 1 (MPEG-1 Audio Layer 1), MP2 или MPEG-1 часть 3 уровень 2 (MPEG-1 Audio Layer 2), MP3 или MPEG-1 часть 3 уровень 3 (MPEG-1 Audio Layer 3)

• MPEG-2 — название группы стандартов цифрового кодирования видео- и аудиосигналов, организации транспортных потоков видео и аудио информации, передачи сопутствующей информации. Стандарты MPEG выпускаются экспертной группой по движущемуся изображению (MPEG). Стандарт MPEG-2 получил распространение в цифровых видеодисках DVD, системах компрессии видеоизображений, цифровом телевидении DVB. В случае использования в цифровом телевидении MPEG-2 активно применяется как стандарт, определяющий структуру транспортных потоков и способы передачи данных. Стандарт содержит несколько подразделов. MPEG-2 part 1 определяет тип контейнера, part 2 — структуру компрессированного изображения. Стандарт MPEG-2 намеренно не определяет способы компрессии изображения (звука), он лишь указывает, как должно быть оформлено сжатое изображение (звук). Стандарт не определяет, каким образом должен быть реализован кодер или декодер MPEG-2, он определяет только структуру данных. Это даёт возможность участникам рынка конкурировать друг с другом за создание более качественных устройств и алгоритмов.

• MPEG-3 разрабатывался группой MPEG как стандарт кодирования аудио и видео для Телевидения высокой четкости, имеющего скорость передачи данных в диапазоне от 20 до 40 Mбит/с. MPEG-3 начал разрабатываться приблизительно в то же время, что и MPEG-2. Однако вскоре выяснилось, что те же задачи может выполнять немного модифицированная версия стандарта MPEG-2. Вскоре после этого работа по стандарту MPEG-3 была прекращена.

• MPEG-4 — международный стандарт, используемый преимущественно для сжатия цифрового аудио и видео. Он появился в 1998 году и включает в себя группу стандартов сжатия аудио и видео и смежные технологии. Стандарт MPEG-4 в основном используется для вещания, записи фильмов на компакт-диск и в видеотелефонии и широковещании, в которых активно используется сжатие цифровых видео и звука. MPEG-4 включает в себя многие функции MPEG-1, MPEG-2 и других подобных стандартов, добавляя такие функции, как поддержка языка виртуальной разметки VRML для показа 3D-объектов, объектно-ориентированные файлы, поддержка управления правами и разные типы интерактивного медиа. AAC, который был стандартизован как дополнение к MPEG-2 (уровень 3), был также расширен и включен в MPEG-4. MPEG-4 делится на несколько частей. Ключевыми частями стандарта MPEG-4 являются часть 2 (MPEG-4 part 2, включая Advanced Simple Profile, используемый такими кодеками как DivX, Xvid, Nero Digital и 3ivx, а также QuickTime 6) и часть 10 (MPEG-4 part 10/MPEG-4 AVC/H.264 или Advanced Video Coding, используемый такими кодеками, как x264, Nero Digital AVC, QuickTime 7, а также в цифровых дисках, таких как HD DVD и Blu-ray Disc). MPEG-4 предоставляет комплект технологий для разработчиков, для различных поставщиков услуг и для конечных пользователей. MPEG-4 позволяет различным разработчикам создавать объекты услуг и технологий, например, цифровое телевидение и мультипликацию, WWW и их расширения, обладающие лучшей адаптивностью и гибкостью при улучшении качества. Этот стандарт позволяет разработчикам более эффективно управлять контентом и бороться против пиратства. Формат MPEG-4 предоставляет конечным пользователям широкий спектр возможностей, позволяющих взаимодействовать с различными анимированными объектами. Существуют стандартизированные процедуры конвертации типов данных MPEG-4, что увеличивает гибкость формата и позволяет адаптировать содержимое для различных сервисов. MPEG-4 использует объектное представление мультимедиа-данных, в котором в роли объектов могут выступать как фрагменты видео и аудио данных, так и статичные изображения, двух- и трёхмерные объекты и текст. Это основное отличие стандарта от его предшественника MPEG-2, который представляет собой совокупность техник сжатия видео- и аудиоданных. Благодаря этой основе, формат MPEG-4 выполняет различные функции, среди которых следующие: Аудиопотоки, видео и аудиовизуальные данные могут быть как естественными, так и искусственно созданными. Это означает, что они могут быть как записаны на видеокамеру или микрофон, так и созданы с помощью компьютера и специального программного обеспечения. Мультиплексирование и синхронизация данных, связанных с аудиовизуальным объектом, в том смысле, что они могут быть переданы через сетевые каналы. Возможно взаимодействие с аудиовизуальной сценой, формируемой на стороне приемника.

• MPEG-7, в отличие от предыдущих MPEG стандартов, предназначенных для кодирования, стандартизирует некоторые элементы, которые должны поддерживаться как можно большим количеством приложений.

Ogg Vorbis

Vorbis — свободный формат сжатия звука с потерями, официально появившийся летом 2002 года. По функциональности и качеству аналогичен таким кодекам, как AAC, AC3 и VQF, превосходящим MP3. Психоакустическая модель, используемая в Vorbis, по принципам действия близка к MP3 и подобным, однако математическая обработка и практическая реализация этой модели существенно отличаются, что позволило авторам объявить свой формат совершенно независимым от всех предшественников. Для хранения аудиоданных в формате Vorbis чаще всего применяется медиаконтейнер Ogg, такой файл обычно имеет расширение.ogg и называется двойным именем Ogg Vorbis. Однако Ogg Vorbis называют и сам кодек без контейнера, так как он является частью проекта Ogg.

WMA

Windows Media Audio — лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудиоинформации. Изначально формат WMA рекламировался как альтернатива MP3, но на сегодняшний день Apple противопоставляет ему формат AAC (используется в популярном музыкальном магазине iTunes). Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему превосходить формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Большинство портативных аудиопроигрывателей поддерживает формат WMA наряду с MP3. Данный формат очень плохо поддерживается на альтернативных платформах вследствие его закрытости. Microsoft включила в WMA поддержку цифровой системы управления авторскими правами. Основным следствием её является невозможность прослушивать защищённые композиции на других компьютерах, кроме того, на котором композиция была загружена из музыкального магазина. В последних версиях формата, начиная с Windows Media Audio 9.1, предусмотрено кодирование без потери качества, многоканальное кодирование объёмного звука и кодирование голоса.

Qdesign AIF

Audio Interchange File Format — формат аудиофайлов, разработанный компанией Apple Computer в 1988 году на основе формата IFF компании Electronic Arts и чаще всего используемый в компьютерах Apple Macintosh. Звуковые данные в стандартном файле формата AIFF представляют собой несжатую импульсно-кодовую модуляцию. Также существует и сжатая версия формата AIFF, которую называют AIFC (иногда AIFF-C), в которой для сжатия могут быть использованы различные кодеки. AIFF, наряду с CDA и WAV, является одним из форматов, используемых в профессиональных аудио- и видеоприложениях, так как в отличие от более популярного формата MP3, звук в AIFF кодируется без потерь в качестве. Как и любые несжатые файлы, файлы AIFF занимают намного больше дискового пространства, чем их сжатые аналоги: одна минута стереозвука с частотой дискретизации 44,1 кГц и размером выборки 16 бит занимает около 10 МБ. Стандартное расширение файлов:.AIFF или.AIF, для сжатого варианта должно применяться расширение.AIFC. Формат сжатия звука QDesign AIF был разработан компанией QDesign и впоследствии был замечен и активно поддержан концерном Apple/Macintosh. QDesign AIF является доработкой семейства стандартов AIFF, которое представляет собой разновидность мультимедийных стандартов, используемых на платформе Apple/Macintosh. Пара Qdesign AIF-AIFF является полным аналогом пары WAV-MP3, используемой на платформе Wintel, за исключением степени сжатия.

Другие форматы

• MusePack — открытый формат для хранения цифрового звука. Musepack схож с форматами MP3, Vorbis, AAC, AC3, WMA, Opus, но не использует второе dct-преобразование повышающее эффективность на средних и низких битрейтах, отсутствие которого не мешает кодеку получить большее качество на битрейтах выше 180 кбит/с.

• PAC - Perceptive Audio Coding (перцептуальное аудио кодирование). Формат разрабатывается фирмой Celestial Technologies. Появилась, а затем исчезла пробная бета версия программы для работы с этим форматом. Это программа совмещала в себе енкодер, плеер, CD-риппер и каталогизатор дисков. Формат отличается хорошим качеством звука при низких битрейтах и высокой скоростью кодирования.

• Wav (Waveform Audio File Format) — формат файла-контейнера для хранения записи оцифрованного аудиопотока, подвид RIFF. Этот контейнер, как правило, используется для хранения несжатого звука в импульсно-кодовой модуляции. Однако контейнер не налагает каких-либо ограничений на используемый алгоритм кодирования.

• MOD — формат файлов, разработанный для создания, хранения и воспроизведения музыкальных композиций на ПК Amiga. Своё название получил от того, что стал первым форматом, хранящим свои фрагменты (например, семплы) в других файлах – принцип модульности. Файлы этого формата имеют, как правило, расширение.mod.

• RealAudio – стандарт на потоковое вещание и на формат медиафайлов, принадлежащий фирме «RealNetworksProductsandServices». Среди плюсов данного кодека — поддержка потокового вещания, очень быстрое декодирование.

Синтез звука и основы MIDI

Синтез звука

Синтез звука - процесс генерации звука, представленного в виде дискретного сигнала. Синтез преследует следующие цели: имитация различных естественных звуков или акустических музыкальных инструментов – имитационный синтез, и получение принципиально новых звуков, не встречающихся в природе – чистый синтез. Каждый из методов синтеза имеет свою математическую и алгоритмическую модель, что позволяет любой из них реализовать на компьютере. Однако, многие методы, будучи реализованы точно, требуют слишком большого объема вычислений, отчего их обычно реализуют с какой-либо степенью допущения. Существуют следующие основные методы синтеза звука:

• Аддитивный. Основан на утверждении Фурье о том, что любое периодическое колебание можно представить в виде суммы чистых тонов – синусоидальных колебаний с различными частотами и амплитудами. Для этого нужен набор из нескольких синусоидальных генераторов с независимым управлением, выходные сигналы которых суммируются для получения результирующего сигнала. На этом методе основан принцип создания звука в духовом органе.

• Разностный (Субтрактивный). В основу метода положена генерация звукового сигнала с богатым спектром с последующей фильтрацией. По этому принципу работает речевой аппарат человека. В качестве исходных сигналов обычно используются прямоугольный сигнал с переменной скважностью, пилообразный – прямой и обратный, также треугольный и различные виды шумов. Основным органом синтеза в этом методе служат управляемые фильтры: резонансный с изменяемым положением и шириной полосы пропускания и фильтр нижних частот с изменяемой частотой среза. Для каждого фильтра также регулируется добротность – крутизна подъема или спада на резонансной частоте.

• Частотно-модуляционный (FM-синтез). В основу положена взаимная модуляция по частоте между несколькими синусоидальными генераторами. Каждый из таких генераторов, снабженный собственными формирователем амплитудной огибающей, амплитудным и частотным вибрато, именуется оператором. Различные способы соединения нескольких операторов, когда сигналы с выходов одних управляют работой других, называются алгоритмами синтеза. Алгоритм может включать один или больше операторов, соединенных последовательно, параллельно, последовательно-параллельно, с обратными связями и в прочих сочетаниях – все это дает практически бесконечное множество возможных звуков. Практическое использование этого метода достаточно сложно из-за того, что большая часть звуков, получаемых с его помощью, представляет собой шумоподобные колебания, и достаточно лишь слегка изменить настройку одного из генераторов, чтобы чистый тембр превратился в шум. Однако метод дает широкие возможности по синтезу разного рода ударных звуков, а также – различных звуковых эффектов, недостижимых в других методах разумной сложности.

• Сэмплерный. В этом методе записывается реальное звучание, которое затем в нужный момент воспроизводится. Для получения звуков разной высоты воспроизведение ускоряется или замедляется. При неизменной скорости выборки применяется расчет промежуточных значений отсчетов – интерполяция. Чтобы тембр звука при сдвиге высоты не менялся слишком сильно, используется несколько записей звучания через определенные интервалы. Метод позволяет получить сколь угодно точное подобие звучания реального инструмента, однако для этого требуются достаточно большие объемы памяти. С другой стороны, запись звучит естественно только при тех же параметрах, при которых она была сделана – при попытке, например, придать ей другую амплитудную огибающую естественность резко падает. На самом деле этот метод нельзя с полным правом называть синтезом – это скорее метод записи-воспроизведения. Однако в современных синтезаторах на его основе воспроизводимый звук можно подвергать различной обработке – модуляции, фильтрованию, добавлению новых гармоник, звуковых эффектов, в результате чего звук может приобретать совершенно новый тембр, иногда совсем непохожий на первоначальный. По сути, получается комбинация трех основных методов синтеза, где в качестве основного сигнала используется исходное звучание.

• Таблично-волновой. Разновидность сэмплерного метода, когда записывается не все звучание целиком, а его отдельные фазы – атака, начальное затухание, средняя фаза и концевое затухание, что позволяет резко снизить объем памяти, требуемый для хранения сэмплов. Эти фазы записываются на различных частотах и при различных условиях, в результате чего получается семейство звучаний одного инструмента. При воспроизведении эти фазы нужным образом составляются, что дает возможность при относительно небольшом объеме самплов получить достаточно широкий спектр различных звучаний инструмента, а главное – заметно усилить выразительность звучания, выбирая, например, в зависимости от силы удара по клавише синтезатора не только нужную амплитудную огибающую, как делает любой синтезатор, но и нужную фазу атаки. Основная проблема этого метода – в сложности сопряжения различных фаз друг с другом, чтобы переходы не воспринимались на слух, и звучание было цельным и непрерывным. Поэтому синтезаторы этого класса достаточно редки и дороги.

• Метод физического моделирования. Состоит в моделировании физических процессов, определяющих звучание реального инструмента на основе его заданных параметров. В связи с крайней сложностью точного моделирования даже простых инструментов и огромным объемом вычислений метод пока развивается медленно, на уровне студийных и экспериментальных образцов синтезаторов. Ожидается, что с момента своего достаточного развития он заменит известные методы синтеза звучаний акустических инструментов, оставив им только задачу синтеза не встречающихся в природе тембров.

• WaveGuide. Технология синтеза, активно разрабатываемая в Стэнфордском Университете и применяемая уже в нескольких промышленных моделях электронных роялей. Представляет собой разновидность физического моделирования, при которой моделируется распространение колебаний, представленных дискретными отсчетами, по струне (одномерное моделирование) и по резонансным поверхностям (двумерное моделирование) или в объемном резонаторе (трёхмерное). При этом появляется возможность моделировать также нелинейные эффекты, например, удар молоточка и касание струны демпфером, а также взаимную связь струн и связь горизонтальной и вертикальной мод.

MIDI

MIDI (Musical Instrument Digital Interface – цифровой интерфейс музыкальных инструментов) — стандарт цифровой звукозаписи на формат обмена данными между электронными музыкальными инструментами. Интерфейс позволяет единообразно кодировать в цифровой форме такие данные как нажатие клавиш, настройку громкости и других акустических параметров, выбор тембра, темпа, тональности и др., с точной привязкой во времени. В системе кодировок присутствует множество свободных команд, которые производители, программисты и пользователи могут использовать по своему усмотрению. Поэтому интерфейс MIDI позволяет, помимо исполнения музыки, синхронизировать управление другим оборудованием, например, осветительным, пиротехническим и т. п. Последовательность MIDI-команд может быть записана на любой цифровой носитель в виде файла, передана по любым каналам связи. Воспроизводящее устройство или программа называется синтезатором MIDI и фактически является автоматическим музыкальным инструментом. Каждый инстpумент имеет тpи pазъема: вход, выход и повтоpитель входного сигнала, что позволяет объединить в сеть пpактически любое количество инстpументов. Способ пеpедачи - токовая петля (5 мА). Инфоpмация пеpедается байтами, в последовательном стаpтстопном коде (8 битов данных, один стоповый, без четности - фоpмат 8-N-1), со скоpостью 31250 бит/с. Поток данных, пеpедаваемый по MIDI, состоит из сообщений (событий): нажатие/отпускание клавиш, изменение положений pегулятоpов (MIDI-контpоллеpов), смена pежимов pаботы, синхpонизация и т.д. Можно сказать, что по MIDI пеpедается паpтитуpа музыкального пpоизведения, однако есть и специальные виды сообщений - System Exclusive (SysEx) - в котоpых может содеpжаться любая инфоpмация для инстpумента, напpимеp, оцифpованный звук для загpузки в ОЗУ, паpтитуpа pитм-блока и т.п. Обычно SysEx уникальны для каждого инстpумента и не совместимы с дpугими инстpументами. Большинство сообщений содеpжит в себе номеp канала от 1 до 16 - это чаще всего условный номеp инстpумента в сети, для котоpого они пpедназначены. Однако один инстpумент может "отзываться" и по нескольким каналам - именно так и pаботают звуковые каpты и многие внешние модули синтеза. Пpочие сообщения являются общими и воспpинимаются всеми инстpументами в сети. В сообщениях о нажатиях/отпусканиях клавиш пеpедается номеp ноты - число в диапазоне от 0 до 127. Пpи записи MIDI-потока в файл (.mid,.rmi), он офоpмляется в один из тpех стандаpтных фоpматов:

0 - обычный MIDI-поток

1 - несколько паpаллельных потоков (доpожек)

2 - несколько независимых последовательных потоков

Разбиение на доpожки удобно для выделения паpтий отдельных инстpументов - популяpные MIDI-секвенсоpы фоpмиpуют файлы именно фоpмата 1.

Частотная обработка звука

Частотная обработка проводиться над спектром сигнала, она позволяет изменять уровень различных частот сигнала, насыщать сигнал новыми гармониками, а также удалять различные частоты. На основе частотных преобразований спектра реализуются различные фильтры и эквалайзеры. Частотные преобразования применяются как для технических нужд (например, при очистке сигнала от ненужных постоянных шумов), так и для придания звучанию новой окраски. Все множество устройств, осуществляющих частотную обработку сигналов, по характеру их влияния на амплитудно-частотную характеристику (АЧХ) можно условно разделить на две основные группы.

Первая группа - устройства, предназначенные для ручного, оперативного изменения АЧХ звукового тракта. Эти устройства носят самые различные названия - эквалайзеры, темброблоки, усилители-корректоры, фильтры присутствия, и т.д. Отличительная их черта - все вышеперечисленные элементы трактов не имеют заранее заданной АЧХ. Их характеристики устанавливаются в процессе работы, причем вносимое ими в АЧХ изменение может быть как отрицательным – “завал”, так и положительным – “подъем” каких-либо полос частот звукового диапазона.

Вторая группа - предназначены только для ограничения диапазона звукового тракта, они не дают возможности осуществлять подъем или завал отдельных частот звукового спектра, и могут изменять АЧХ только на краях звукового диапазона. Эти устройства носят название обрезных фильтров.

Доклад на тему «Работа со звуком»

Основные свойства слуха

Слух – способность биологических организмов воспринимать звуки органами слуха; функция слухового аппарата, возбуждаемая звуковыми колебаниями окружающей среды. Это одно из биологических дистантных ощущений, называемое также акустическим восприятием. Обеспечивается слуховой сенсорной системой.

Восприятие по частоте

Диапазон частот, которые способен слышать человек, называется слуховым или звуковым диапазоном и находится в пределах от 20 Гц до 20 кГц; более высокие частоты называются ультразвуком, а более низкие инфразвуком. Верхний предел имеет тенденцию снижаться с возрастом. Колебания ниже 60 Гц воспринимаются благодаря вибрационному чувству, более того, ухо само по себе не реагирует на частоты ниже 20 Гц, и они могут ощущаться через органы осязания. Звуки частотой выше 20 000 Гц имеют малое практическое значение, так как быстро тормозятся.

Слышимую часть диапазона звуков разделяют на низкочастотные звуки – до 500 герц, среднечастотные – 500-10000 герц и высокочастотные – свыше 10000 герц. Такое подразделение очень важно, так как ухо человека неодинаково чувствительно к разным звукам. Наиболее чувствительно ухо к сравнительно узкому диапазону среднечастотных звуков от 1000 до 5000 герц. Это приводит к тому, что человек способен услышать в среднечастотном диапазоне звуки с энергией около 0 децибел и не слышать низкочастотные звуки в 20-40-60 децибел. То есть, звуки с одной и той же энергией в среднечастотном диапазоне могут восприниматься как громкие, а в низкочастотном как тихие или быть вовсе не слышны. Такая особенность слуха сформирована природой не случайно, так как звуки, необходимые для существования: речь, звуки природы, – находятся в основном в среднечастотном диапазоне.

Порог слышимости

Диапазон громкости воспринимаемых звуков огромен. Барабанная перепонка в ухе чувствительна только к изменению давления, измеряющегося в децибелах (дБ). Нижний порог слышимости определён как 0 дБ, что соответствует 20-ти микропаскалям на частоте 1кГц, а определение верхнего предела слышимости, определяемый пределом растяжимости барабанной перепонки, относится к порогу дискомфорта и далее к нарушению слуха, контузии и т. д. Этот предел зависит от того, как долго по времени на уши воздействует звук. Ухо способно переносить кратковременное повышение громкости до 120 дБ без последствий, но долговременное восприятие звуков громкостью более 80 дБ может вызвать потерю слуха.

Минимальный порог, при котором звук остаётся слышен, зависит от частоты. Наибольшая чувствительность находится в диапазоне от 1 кГц до 5 кГц, с возрастом чувствительность понижается в диапазоне выше 2 кГц.

Уровень громкости

Уровень громкости звука – относительная величина. Она выражается в фонах и численно равна уровню звукового давления в децибелах, создаваемого синусоидальным тоном частотой 1 кГц такой же громкости, как и измеряемый звук. На графике изображены кривые, представляющие собой зависимости уровня звукового давления от частоты при постоянном уровне громкости. С помощью этой диаграммы можно определить уровень громкости чистого тона какой-либо частоты, зная уровень создаваемого им звукового давления. Так, если синусоидальная волна частотой 5000 Гц создаёт звуковое давление уровнем 60 дБ, то в соответствие с диаграммой, этим значениям будет соответствовать уровень громкости 50 фон.

В свою очередь, уровень звукового давления – измеренное по относительной шкале значение звукового давления, отнесённое к опорному давлению 20 мкПа, соответствующему порогу слышимости синусоидальной звуковой волны частотой 1 кГц: Lp = 20 lg p/p0, где р0 – порог слышимости. Измерение звукового давления в уровнях целесообразно, поскольку человеческий слух различает огромный диапазон изменения звукового давления - разница между самым тихим и самым громким различимым звуком составляет 10⁶ паскаль. При измерениях такую большую шкалу неудобно, поэтому используется логарифмическая шкала, которая позволяет сжать масштаб измерения звукового давления.


Поделиться с друзьями:

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...

Адаптации растений и животных к жизни в горах: Большое значение для жизни организмов в горах имеют степень расчленения, крутизна и экспозиционные различия склонов...

Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.055 с.