Цифровое представление звуковых сигналов — КиберПедия 

Биохимия спиртового брожения: Основу технологии получения пива составляет спиртовое брожение, - при котором сахар превращается...

Индивидуальные очистные сооружения: К классу индивидуальных очистных сооружений относят сооружения, пропускная способность которых...

Цифровое представление звуковых сигналов

2019-09-04 726
Цифровое представление звуковых сигналов 0.00 из 5.00 0 оценок
Заказать работу

Интерпретация аналоговых аудио сигналов в цифровой форме, с целью последующей обработки, хранения, транспортировки и других целей получила очень широкое развитие, благодаря чему стало возможным применение компьютерной техники для работы со звуком. Непрерывно развивающиеся цифровые и компьютерные технологии делают все более и более доступными инструменты, предназначенные для работы в данной области. Кроме того, цифровой формат стал самой распространенной формой хранения и передачи аудиоинформации. Эти тенденции делают необходимостью изучение данной области, тем более в профессиональной среде.

Цифровой сигнал является формой представления аналогового сигнала. Прежде, акустический сигнал необходимо представить в аналоговой форме, и только после этого станет возможным перевести его в цифровое представление. Таким образом, так как аналоговый сигнал является необходимым условием, его качество будет прямым образом связано с качеством конечного цифрового результата. Как известно, звук имеет три основных аспекта, определяющих его характеристику: амплитуда, частота и фаза. Два последних являются функцией времени, тогда как амплитуда определяет динамический диапазон. Отсюда следует, что для того, чтобы корректно представить звуковой сигнал в какой-либо форме, в том числе и цифровой, необходимо записать и передать информацию, касающуюся времени и амплитуды этого сигнала. Процесс преобразования аналогового звукового сигнала в цифровой включает в себя несколько этапов. Сначала аналоговый звуковой сигнал подается на аналоговый фильтр, который ограничивает полосу частот сигнала и устраняет помехи и шумы. Затем с помощью схемы выборки/хранения замеряются мгновенные значения амплитуды аналогового сигнала в определенные и постоянные моменты времени. Измеренные значения при дискретизации и квантовании регистрируются в виде набора нулей и единиц. Количество таких нулей и единиц или длинна цифрового слова, доступных для записи одного дискретного замера, будет диктовать максимальную разрядность и разрешение. Процесс представления аналоговых сигналов в цифровой форме – оцифровка – производится по средствам аналогово–цифровых преобразователей – АЦП. Сигнал, к которому применены дискретизация и квантование, называется цифровым.

Дискретизация

Процесс превращения непрерывного сигнала в цифровой, путем измерения числовых значений амплитуды сигнала через равные интервалы времени называется дискретизацией. В общем случае период времени от одной выборки до следующей может различаться для каждой пары соседних выборок, но обычно при обработке сигнала, выборки следуют через фиксированный и постоянный промежуток времени. Этот промежуток в таком случае называют периодом дискретизации или интервалом выборок. Величину обратную периоду дискретизации называют частотой выборок или частотой дискретизации.

Квантование

Дискретизация разбивает сигнал по временной составляющей, а квантование же приводит сигнал к заданным амплитудным значениям, то есть округляет сигнал до ближайших к нему уровней. Таким образом, квантование – разбиение диапазона отсчётных значений сигнала на конечное число уровней и округление этих значений до одного из двух ближайших к ним уровней. При этом значение сигнала может округляться либо до ближайшего уровня, либо до меньшего или большего из ближайших уровней в зависимости от способа кодирования. В АЦП округление может производится до ближайшего меньшего уровня.

Кодирование

Представление дискретных сигналов, передаваемых по цифровому каналу связи на расстояние по физическому каналу связи, называется кодированием. Оно также применяется для записи данных на цифровой носитель. Процесс кодирования заключается в представлении сообщений условными комбинациями, составленными из небольшого количества элементарных сигналов. В зависимости от целей кодирования различают следующие его виды:

• Кодирование по образцу – используется всякий раз при вводе информации в компьютер для ее внутреннего представления.

• Криптографическое кодирование (шифрование) – используется при необходимости защиты информации от несанкционированного доступа.

• Эффективное или оптимальное кодирование – используется для устранения избыточности информации, т.е. для снижения ее объема.

• Помехозащитное кодирование – используется для обеспечения заданной достоверности в случае, когда на сигнал накладывается помеха.

Аналого-цифровое преобразование

Операция восстановления аналогового сигнала из его дискретного представления обратна операции дискретизации и представляет, по существу, интерполяцию данных. Дискретизация сигналов может приводить к определенной потере информации о поведении сигналов в промежутках между отсчетами. Однако существуют условия, определенные теоремой Котельникова-Шеннона, согласно которым аналоговый сигнал с ограниченным частотным спектром может быть без потерь информации преобразован в дискретный сигнал, и затем абсолютно точно восстановлен по значениям своих дискретных отсчетов.

Во время цифро-аналогового преобразования цифровой сигнал, состоящий из дискретных отсчетов преобразуется в непрерывный сигнал ступенчатого вида, состоящий из прилегающих друг к другу прямоугольных импульсов. Для сглаживания выходного сигнала на выходе цифро – аналогового преобразователя ставится аналоговый фильтр, который так и называется сглаживающим. Сглаживающий фильтр также, как и аналоговый, вносит дополнительные искажения в полезный сигнал.

Сжатие звуковой информации

Сжатие аудиоданных представляет собой процесс уменьшения скорости цифрового потока за счет сокращения избыточности цифрового звукового сигнала. Различают статистическую и психоакустическую избыточность цифровых сигналов. Сокращение статистической избыточности базируется на учете свойств самих звуковых сигналов, а психоакустичсской – на учете свойств слухового восприятия. Методы сокращения статистической избыточности аудиоданных также называют сжатием без потерь, а методы сокращения психоакустической избыточности – сжатием с потерями.

Статистическая избыточность обусловлена наличием корреляционной связи между соседними отсчетами временной функции звукового сигнала при его дискретизации. Для ее уменьшения применяют достаточно сложные алгоритмы обработки. При их использовании потери информации нет, однако исходный сигнал оказывается представленным в более компактной форме, что требует меньшего количества бит при его кодировании. Важно, чтобы все эта алгоритмы позволяли бы при обратном преобразовании восстанавливать исходные сигналы без искажений.

Сжатие аудиоданных с потерями основывается на несовершенстве человеческого слуха при восприятии звуковой информации. Неспособность человека в определенных случаях различать тихие звуки в присутствии более громких, называемая эффектом маскировки, была использована в алгоритмах сокращения психоакустической избыточности. Эффекты слухового маскирования зависят от спектральных и временных характеристик маскируемого и маскирующего сигналов и могут быть разделены на две основные группы: частотное (одновременное) маскирование и временное (неодновременное) маскирование. Эффект маскирования в частотной области связан с тем, что в присутствии больших звуковых амплитуд человеческое ухо нечувствительно к малым амплитудам близких частот. То есть, когда два сигнала одновременно находятся в ограниченной частотной области, то более слабый сигнал становится неслышимым на фоне более сильного. Маскирование во временной области характеризует динамические свойства слуха, показывая изменение во времени относительного порога слышимости, когда маскирующий и маскируемый сигналы звучат не одновременно. При этом следует различать явления послемаскировки – изменение порога слышимости после сигнала высокого уровня – и предмаскировки – изменение порога слышимости перед приходом сигнала максимального уровня. Более слабый сигнал становится неслышимым за 5 − 20 мс до включения сигнала маскирования и становится слышимым через 50 − 200 мс после его включения. Очевидно, что после устранения психоакустической избыточности звуковых сигналов их точное восстановления при декодировании оказывается уже невозможным. Методами устранения психофизической избыточности можно обеспечить сжатие цифровых аудиоданных в 10 − 12 раз без существенных потерь в качестве.

Стандарты звуковых файлов

Цифровой аудиоформат — формат представления звуковых данных, используемый при цифровой звукозаписи, а также для дальнейшего хранения записанного материала на компьютере и других электронных носителях информации, так называемых звуковых носителях.

Стандарты MPEG

• MPEG-1 — группа стандартов цифрового сжатия аудио и видео, принятых MPEG (Moving Picture Experts Group — группой экспертов в области видео).

MPEG-1 состоит из нескольких частей: синхронизация и мультиплексирование аудио и видео (MPEG-1 Program Stream), кодек для видео с прогрессивной разверткой, кодек для звука.

Стандарт MPEG-1 определяет три уровня сжатия звука: MP1 или MPEG-1 часть 3 уровень 1 (MPEG-1 Audio Layer 1), MP2 или MPEG-1 часть 3 уровень 2 (MPEG-1 Audio Layer 2), MP3 или MPEG-1 часть 3 уровень 3 (MPEG-1 Audio Layer 3)

• MPEG-2 — название группы стандартов цифрового кодирования видео- и аудиосигналов, организации транспортных потоков видео и аудио информации, передачи сопутствующей информации. Стандарты MPEG выпускаются экспертной группой по движущемуся изображению (MPEG). Стандарт MPEG-2 получил распространение в цифровых видеодисках DVD, системах компрессии видеоизображений, цифровом телевидении DVB. В случае использования в цифровом телевидении MPEG-2 активно применяется как стандарт, определяющий структуру транспортных потоков и способы передачи данных. Стандарт содержит несколько подразделов. MPEG-2 part 1 определяет тип контейнера, part 2 — структуру компрессированного изображения. Стандарт MPEG-2 намеренно не определяет способы компрессии изображения (звука), он лишь указывает, как должно быть оформлено сжатое изображение (звук). Стандарт не определяет, каким образом должен быть реализован кодер или декодер MPEG-2, он определяет только структуру данных. Это даёт возможность участникам рынка конкурировать друг с другом за создание более качественных устройств и алгоритмов.

• MPEG-3 разрабатывался группой MPEG как стандарт кодирования аудио и видео для Телевидения высокой четкости, имеющего скорость передачи данных в диапазоне от 20 до 40 Mбит/с. MPEG-3 начал разрабатываться приблизительно в то же время, что и MPEG-2. Однако вскоре выяснилось, что те же задачи может выполнять немного модифицированная версия стандарта MPEG-2. Вскоре после этого работа по стандарту MPEG-3 была прекращена.

• MPEG-4 — международный стандарт, используемый преимущественно для сжатия цифрового аудио и видео. Он появился в 1998 году и включает в себя группу стандартов сжатия аудио и видео и смежные технологии. Стандарт MPEG-4 в основном используется для вещания, записи фильмов на компакт-диск и в видеотелефонии и широковещании, в которых активно используется сжатие цифровых видео и звука. MPEG-4 включает в себя многие функции MPEG-1, MPEG-2 и других подобных стандартов, добавляя такие функции, как поддержка языка виртуальной разметки VRML для показа 3D-объектов, объектно-ориентированные файлы, поддержка управления правами и разные типы интерактивного медиа. AAC, который был стандартизован как дополнение к MPEG-2 (уровень 3), был также расширен и включен в MPEG-4. MPEG-4 делится на несколько частей. Ключевыми частями стандарта MPEG-4 являются часть 2 (MPEG-4 part 2, включая Advanced Simple Profile, используемый такими кодеками как DivX, Xvid, Nero Digital и 3ivx, а также QuickTime 6) и часть 10 (MPEG-4 part 10/MPEG-4 AVC/H.264 или Advanced Video Coding, используемый такими кодеками, как x264, Nero Digital AVC, QuickTime 7, а также в цифровых дисках, таких как HD DVD и Blu-ray Disc). MPEG-4 предоставляет комплект технологий для разработчиков, для различных поставщиков услуг и для конечных пользователей. MPEG-4 позволяет различным разработчикам создавать объекты услуг и технологий, например, цифровое телевидение и мультипликацию, WWW и их расширения, обладающие лучшей адаптивностью и гибкостью при улучшении качества. Этот стандарт позволяет разработчикам более эффективно управлять контентом и бороться против пиратства. Формат MPEG-4 предоставляет конечным пользователям широкий спектр возможностей, позволяющих взаимодействовать с различными анимированными объектами. Существуют стандартизированные процедуры конвертации типов данных MPEG-4, что увеличивает гибкость формата и позволяет адаптировать содержимое для различных сервисов. MPEG-4 использует объектное представление мультимедиа-данных, в котором в роли объектов могут выступать как фрагменты видео и аудио данных, так и статичные изображения, двух- и трёхмерные объекты и текст. Это основное отличие стандарта от его предшественника MPEG-2, который представляет собой совокупность техник сжатия видео- и аудиоданных. Благодаря этой основе, формат MPEG-4 выполняет различные функции, среди которых следующие: Аудиопотоки, видео и аудиовизуальные данные могут быть как естественными, так и искусственно созданными. Это означает, что они могут быть как записаны на видеокамеру или микрофон, так и созданы с помощью компьютера и специального программного обеспечения. Мультиплексирование и синхронизация данных, связанных с аудиовизуальным объектом, в том смысле, что они могут быть переданы через сетевые каналы. Возможно взаимодействие с аудиовизуальной сценой, формируемой на стороне приемника.

• MPEG-7, в отличие от предыдущих MPEG стандартов, предназначенных для кодирования, стандартизирует некоторые элементы, которые должны поддерживаться как можно большим количеством приложений.

Ogg Vorbis

Vorbis — свободный формат сжатия звука с потерями, официально появившийся летом 2002 года. По функциональности и качеству аналогичен таким кодекам, как AAC, AC3 и VQF, превосходящим MP3. Психоакустическая модель, используемая в Vorbis, по принципам действия близка к MP3 и подобным, однако математическая обработка и практическая реализация этой модели существенно отличаются, что позволило авторам объявить свой формат совершенно независимым от всех предшественников. Для хранения аудиоданных в формате Vorbis чаще всего применяется медиаконтейнер Ogg, такой файл обычно имеет расширение.ogg и называется двойным именем Ogg Vorbis. Однако Ogg Vorbis называют и сам кодек без контейнера, так как он является частью проекта Ogg.

WMA

Windows Media Audio — лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудиоинформации. Изначально формат WMA рекламировался как альтернатива MP3, но на сегодняшний день Apple противопоставляет ему формат AAC (используется в популярном музыкальном магазине iTunes). Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему превосходить формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Большинство портативных аудиопроигрывателей поддерживает формат WMA наряду с MP3. Данный формат очень плохо поддерживается на альтернативных платформах вследствие его закрытости. Microsoft включила в WMA поддержку цифровой системы управления авторскими правами. Основным следствием её является невозможность прослушивать защищённые композиции на других компьютерах, кроме того, на котором композиция была загружена из музыкального магазина. В последних версиях формата, начиная с Windows Media Audio 9.1, предусмотрено кодирование без потери качества, многоканальное кодирование объёмного звука и кодирование голоса.

Qdesign AIF

Audio Interchange File Format — формат аудиофайлов, разработанный компанией Apple Computer в 1988 году на основе формата IFF компании Electronic Arts и чаще всего используемый в компьютерах Apple Macintosh. Звуковые данные в стандартном файле формата AIFF представляют собой несжатую импульсно-кодовую модуляцию. Также существует и сжатая версия формата AIFF, которую называют AIFC (иногда AIFF-C), в которой для сжатия могут быть использованы различные кодеки. AIFF, наряду с CDA и WAV, является одним из форматов, используемых в профессиональных аудио- и видеоприложениях, так как в отличие от более популярного формата MP3, звук в AIFF кодируется без потерь в качестве. Как и любые несжатые файлы, файлы AIFF занимают намного больше дискового пространства, чем их сжатые аналоги: одна минута стереозвука с частотой дискретизации 44,1 кГц и размером выборки 16 бит занимает около 10 МБ. Стандартное расширение файлов:.AIFF или.AIF, для сжатого варианта должно применяться расширение.AIFC. Формат сжатия звука QDesign AIF был разработан компанией QDesign и впоследствии был замечен и активно поддержан концерном Apple/Macintosh. QDesign AIF является доработкой семейства стандартов AIFF, которое представляет собой разновидность мультимедийных стандартов, используемых на платформе Apple/Macintosh. Пара Qdesign AIF-AIFF является полным аналогом пары WAV-MP3, используемой на платформе Wintel, за исключением степени сжатия.


Поделиться с друзьями:

Общие условия выбора системы дренажа: Система дренажа выбирается в зависимости от характера защищаемого...

Особенности сооружения опор в сложных условиях: Сооружение ВЛ в районах с суровыми климатическими и тяжелыми геологическими условиями...

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.017 с.