Программные средства обработки аудио информации — КиберПедия 

Поперечные профили набережных и береговой полосы: На городских территориях берегоукрепление проектируют с учетом технических и экономических требований, но особое значение придают эстетическим...

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Программные средства обработки аудио информации

2020-12-08 192
Программные средства обработки аудио информации 0.00 из 5.00 0 оценок
Заказать работу

Это название объединяет очень разные по назначению программы.

Программы распознавания речи обеспечивают преобразование речевого сигнала в цифровую информацию, представленную, например, в виде текста. Используются для голосового управления информационными системами, голосового ввода текста, голосового поиска и т.п. Требуют четкой артикуляции и ясности речи, чувствительны к шуму.

Примеры: голосовой ввод текстов Dragon NaturallySpeaking (www.nuance.com/dragon/), RealSpeaker (realspeaker.net/ru/), программное обеспечение для систем контактных центров VoiceNavigator (www.voicenavigator.ru).

Существует несколько он-лайн сервисов для голосового создания текстов, например, «Голосовой блокнот» (www.speechpad.ru) и «Интернет-диктовки» (www.Dictation.io), оба сервиса работают с броузером Chrome, требуют установки расширения «Голосовой ввод текста» и используют движок «Google-голосовой поиск» для распознания.

Программы синтеза речи решают обратную задачу ­генерации речевого сигнала по тексту. Используются для помощи слепым и немым, для управления человеком со стороны компьютера, в информационно-справочных системах, например, для передачи объявлений об отправлении поездов. Пока, синтезированную речь можно сразу же отличить от голоса человека.

Примеры программ: Acapela (www.acapela-group.com/ на сайте можно прослушать примеры синтеза речи по введенному короткому тексту), Vokalizer (www.nuance.com), отечественная разработка RHVoice (www.tiflo.info/rhvoice/).

Аудио редакторы – программы для редактирования цифровой звукозаписи с целью устранения дефектов записи или создания определенных эффектов.

Основные функции аудио редактора:
– запись звукового сигнала, поступающего со входа звуковой платы. Обычно производится без сжатия;
– воспроизведение звукового сигнала используется в редакторе для контроля выполненных операций;
– отображение звукового сигнала в виде последовательности отсчетов, которые объединены одной огибающей, соответствующей амплитуде звукового сигнала, называемой сигналограммой или волновой формой (рис.8). Такое отображение позволяет визуально обнаруживать места требуемых изменений;
- преобразования звука:

  • устранение посторонних звуков,
  • подавление шумов,
  • удаление или вставка пауз,
  • изменение громкости,
  • создание нарастания или затухания звука и многое другое.

Одним из часто используемых преобразований является нормализация – процесс выравнивания громкости, относительно какого-либо уровня, например, до максимально возможного значения для цифрового звука без появления искажений (пиковая нормализация) или по среднеквадратичному значению уровня звука в файле (RMS-нормализация);

- создание и редактирование мета-данных (тегов),т.е. справочной текстовой информации, сохраняемой в том же файле, что и звук;
- сохранение записи в аудиофайле с требуемыми характеристиками, на этом этапе производится сжатие аудио данных.

Рекомендуется промежуточные результаты обработки сохранять в формате без сжатия, и только окончательный вариант - в формате с требуемой степенью сжатия.

Рисунок 8 Отображение сигнала в аудио редакторе (запись голоса в режиме моно)

 

Несколько популярных аудио редакторов.

Soudne Forge полупрофессиональный продукт Sony Creative Software, обеспечивает выполнение большинства необходимых функций (запись, обрезка, фильтрация, подавление шума), поддерживает более 20 звуковых форматов. Платный.

Adobe Audition (раньше назывался Cool Edit Pro) — полнофункциональный аудио редактор, производства фирмы Adobe. Поддерживает практически все звуковые форматы файлов. Входит в пакет Adobe Creative Suite. Помимо прочего позволяет выполнять сведение звукозаписи. Платный.

Audacity поддерживает запись (в том числе, нескольких каналов), редактирование, сведение. Требует установки кодеков libmad или LAME. Свободно распространяемый (лицензия GNU General Public License).

WavePad профессиональная программа для обработки звука, поддерживает большинство функция обработки звука, разработчик NCH Software. Среди прочих возможностей, поддерживает пакетную обработку файлов. Первоначально устанавливается облегченная версия, по мере обращения к тем или иным функциям загружаются дополнительные модули. Бесплатный (показывает встроенную рекламу).

Большой список и краткие характеристики аудио редакторов приведены в [8].

Большинство редакторов позволяют сохранять аудио файлы в одном из нескольких поддерживаемых форматов. Таким образом, они играют роль конверторов звуковых файлов. Существуют и специализированные конверторы.
Удачное решение предлагает компания DVDVideoSoft. Распространяемая ею программа FreeStudio Manager позволяет выбрать для запуска или загрузки программу из нескольких категорий (для работы с сервисом YouTube, для загрузки файлов с популярных ресурсов, для конвертации, редактирования и записи аудио и видео файлов, см. рис. 9.). При установке программ от DVDVideoSoft следует выбирать режим установки для опытного пользователя и не разрешать устанавливать предлагаемые программы (Opera, Skype, антивирус и др.). Программа и загружаемые компоненты бесплатны, поэтому постоянно демонстрируют рекламные заставки и назойливо предлагают обновить программное обеспечение до премиум класса (платного).

 

Рис. 9. Менеджер FreeStudio: выбор конвертора

 

Конверторы от DVDVideoSoft просты и позволяют конвертировать медиа файлы популярных форматов. Так аудио конвертор Free Audio Converter (рис.10) позволяет конвертировать одновременно несколько файлов разных форматов из различных источников в файлы выбранного формата с требуемым качеством. Файлы-результаты помещаются в выбранную папку или сохраняются в папке исходного файла.

Рисунок 10 Конвертор аудио файлов

Качественная обработка звука требует специальных знаний, хорошего слуха, профессиональной техники и программного обеспечения.

Можно дать несколько самых общих рекомендаций по непрофессиональной обработке звука средствами аудио редакторов.

1) Если не предполагается создание плей-листа для последовательного воспроизведения нескольких треков, то в начале и конце трека полезно создать паузу продолжительностью ~2 сек. (Операции Insert Silence | Mute | Вставить тишину и т.п.)

2) Следует очень аккуратно использовать программные средства шумоподавления. Они удаляют постоянную составляющую шума, например, шум ленты при оцифровке магнитных кассет, но одновременно теряется и часть полезной информации, и возникает эффект «голоса в металлической бочке».

3) Нормализация – выравнивание уровня звука по длине трека – производится после удаления резких щелчков, стуков и тому подобных шумов.

4) Все промежуточные результаты сохраняются в форматах без потерь. Конвертация в любой формат со сжатием должна быть последней операцией со звуковым файлом.

Обработка коротких речевых записей часто может быть ограничена сравнительно небольшим набором операций:

- удаление фрагмента записи (посторонний шум, ненужная пауза);
- вставка или удаление пауз в начало и конец записи;
- создание нарастания звука в начале записи и затухания в конце.

Если потребность в обработке звука возникает эпизодически, для выполнения этих функций можно воспользоваться одним из он-лайн сервисов.

В качестве примера такого сервиса рассмотрим ресурс Mp3Cut.ru. На рисунке 11 показаны три шага, позволяющие получить из аудиозаписи требуемый фрагмент. Для этого требуется загрузить аудио файл на сайт (шаг 1), установить границы обрезки (шаг 2) и скачать результат на свой компьютер (шаг 3).

Рисунок 11 Обработка записи на сайте Mp3Cut.ru

Так же просто производится склейка нескольких фрагментов в одну новую запись – микст (рис.12).

Рисунок 12 Склейка записи из двух фрагментов на сайте Mp3Cut.ru

Для создания микста на сайт загружаются или надиктовываются треки-фрагменты (1), для каждого трека устанавливаются границы обрезки, если необходимо, включается кросфейд (функция плавного соединения треков), и функции нарастания\затухания звука для первого и последнего трека (2). После соединения треков (3) полученный микст можно скачать.

Кроме обрезки и склейки треков ресурс позволяет конвертировать аудио файлы в несколько популярных форматов, конвертировать и обрезать видео (файла до 500 Мв), сделать аудио запись через микрофон или веб-камеру.

7. Индивидуальное задание

С помощью любого из доступных вам технических средств создайте аудио запись следующего содержания:

- представление (студент такой-то группы…);
- выступление длительностью 1.5-2 минуты по теме вашего индивидуального задания по курсу.

Сохраните запись на компьютере в формате mp3 с максимальным доступным качеством (при необходимости выполните конвертацию).

Используя он-лайн сервис или аудио редактор, установленный на вашем компьютере, отредактируйте запись:

- вырежьте паузы, кашель и слова-паразиты и прочие посторонние шумы;
- разделите запись на два трека: представление и выступление;
- сохраните полученные треки в формате mp3, 64kbps.

Загрузите в обучающую систему исходный файл и результат обработки.

8. Контрольные вопросы

1. Что означают надписи “A to D” и “D to A” на рис. 1?

2. На каком – левом или правом – изображении на рис. 3 обеспечивается лучшее приближение записи к исходному звучанию? Почему?

3. Каким параметром характеризуется степень сжатия звукового потока?

4. Что такое кодек?

5. Почему рекомендуется промежуточные результаты обработки звука сохранять без сжатия?

6. Приведите характеристики использованного устройства звукозаписи (используйте перечень параметров, рекомендованных для выбора устройств в разделе 5.)

7. Приведите характеристики созданного вами аудио файла.

8. Сравните качество созданной вами аудио записи с качеством конвертированных результатов редактирования.

Требования к отчету

Отчет оформляется как документ Word.

В отчете указываются номер и название лабораторной работы, номер учебной группы и фамилия студента,

Отчет должен содержать:

- ответы на контрольные вопросы;
- описание устройства, на котором была получена аудиозапись;
- описание использованных программных средств (название конверторов, аудио редакторов или url веб-ресурсов для обработки он-лайн);
- характеристики исходного и полученного аудио файлов в следующим виде:

Исходный файл  
имя  
тип (формат)  
размер файла  
время звучания  
Файл после редактирования  
имя  
тип (формат)  
размер файла  
время звучания  

Отчет загружается в обучающую систему

Источники

1. Analog to Digital Conversion // Introduction to Audio Storage. [Электронный ресурс] – Url: http://mediaintro.teeks99.com/Audio/Audio-1-Storage.html – Загл. с экрана.

2. Портал:Цифровой звук [Электронный ресурс] – Url: https://ru.wikipedia.org/wiki/Портал:Цифровой _звук – Загл. с экрана.

3. Меерзон Б.Я. Акустические основы звукорежиссуры, 2 изд. Аспекс-пресс, 2002.

4. Кузюренко Ю.И. Звукозапись с микрофона. 2 изд., перераб. и доп. – М.: Радио и связь, 1988.

5. Ересь звукозаписи // Пётр Семилетов. [Электронный ресурс] – Url: http://semiletov.org/eres-zvukozapisi/ – Загл. с экрана.

6. 11 конденсаторных микрофонов // Егор Курчаткин. Музыкальное Оборудование, январь 2000 [Электронный ресурс] – Url: http://www.muzoborudovanie.ru/equip/studio/condmics/11/11condmics.php – Загл. с экрана.

7. Лекция: микрофонная практика // А.Н.Костромин [Электронный ресурс] – Url: http://www.ksp-msk.ru/uploads/school/442_1227091175/mp.pdf – Загл. с экрана.

8. Редакторы // MyDiv.net [Электронный ресурс] – Url: http://soft.mydiv.net/win/cname47/cname48/cname51/ – Загл. с экрана

 


Поделиться с друзьями:

Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...

Механическое удерживание земляных масс: Механическое удерживание земляных масс на склоне обеспечивают контрфорсными сооружениями различных конструкций...

История развития хранилищ для нефти: Первые склады нефти появились в XVII веке. Они представляли собой землянные ямы-амбара глубиной 4…5 м...

Двойное оплодотворение у цветковых растений: Оплодотворение - это процесс слияния мужской и женской половых клеток с образованием зиготы...



© cyberpedia.su 2017-2024 - Не является автором материалов. Исключительное право сохранено за автором текста.
Если вы не хотите, чтобы данный материал был у нас на сайте, перейдите по ссылке: Нарушение авторских прав. Мы поможем в написании вашей работы!

0.027 с.