Навигация:

Главная Случайная страница Обратная связь ТОП Интересно знать Избранные Новые материалы

Топ:

Характеристика АТП и сварочно-жестяницкого участка: Транспорт в настоящее время является одной из важнейших отраслей народного хозяйства...

Основы обеспечения единства измерений: Обеспечение единства измерений - деятельность метрологических служб, направленная на достижение...

Процедура выполнения команд. Рабочий цикл процессора: Функционирование процессора в основном состоит из повторяющихся рабочих циклов, каждый из которых соответствует...

Интересное:

Распространение рака на другие отдаленные от желудка органы: Характерных симптомов рака желудка не существует. Выраженные симптомы появляются, когда опухоль...

Как мы говорим и как мы слушаем: общение можно сравнить с огромным зонтиком, под которым скрыто все...

Аура как энергетическое поле: многослойную ауру человека можно представить себе подобным...

Дисциплины:

Автоматизация Антропология Археология Архитектура Аудит Биология Бухгалтерия Военная наука Генетика География Геология Демография Журналистика Зоология Иностранные языки Информатика Искусство История Кинематография Компьютеризация Кораблестроение Кулинария Культура Лексикология Лингвистика Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлургия Метрология Механика Музыкология Науковедение Образование Охрана Труда Педагогика Политология Правоотношение Предпринимательство Приборостроение Программирование Производство Промышленность Психология Радиосвязь Религия Риторика Социология Спорт Стандартизация Статистика Строительство Теология Технологии Торговля Транспорт Фармакология Физика Физиология Философия Финансы Химия Хозяйство Черчение Экология Экономика Электроника Энергетика Юриспруденция

Особенности передачи речевой информации

2022-11-14

0.00 из 5.00 0 оценок

Заказать работу

⇐ ПредыдущаяСтр 19 из 22Следующая ⇒

Спектр речи весьма широк (примерно от 50 до 10000 Гц), но для передачи речи в аналоговой телефонии когда-то отказались от составляющих, лежащих вне полосы 0,3-3,4 кГц, что несколько ухудшило восприятие ряда звуков (например, шипящих, существенная часть энергии которых сосредоточена в верхней части речевого спектра. Ограничение частоты снизу (до 300 Гц) также ухудшает восприятие из-за потерь низкочастотных гармоник основного тона. Но тем не менее данный диапазон частот обеспечивает хорошее качество воспринимаемой речи. Решающими в выборе полосы 0,3-3,4 кГц были экономические соображения и нехватка телефонных каналов.

В цифровой телефонии к влиянию ограничения спектра добавляются еще шумы дискретизации, квантования и обработки, дополнительно зашумляющие речь. Для совместимости по полосе с распространенными аналоговыми сетями в цифровой телефонии отсчеты аналоговой речи приходится брать согласно теореме Котельникова с частотой 8 кГц. Правда, в цифровой телефонии существует принципиальная возможность использовать спектр речи за пределами полосы 0,3-3,4 кГц и тем самым повысить качество, но эти методы не реализуются, так как они вычислительно пока еще очень сложны.

Источники погрешности передачи речи

Потеря пакетов

Рассмотрим один из UDP-пакетов, генерируемых нашим телефонным приложением. Этот UDP-пакет инкапсулирован в IP-дейтаграмму. Перемещаясь по сети, дейтаграмма проходит через буферы маршрутизаторов. Возможно возникновение ситуаций, что один или несколько буферов на пути следования пакета от отправителя к получателю окажутся переполненными и не смогут принять прибывшую IP-дейтаграмму. В этом случае пакет будет отброшен маршрутизатором и не дойдет до получателя.

Сквозная задержка

Сквозная задержка или время запаздывания в IP-телефонии определяется как промежуток времени, затрачиваемый на то, чтобы речевой сигнал прошел расстояние от говорящего до слушающего. Эта задержка представляет собой сумму задержек передачи, обработки и ожидания пакета в очередях на маршрутизаторах, распространения сигнала в линиях и обработки на оконечных системах.

Для таких интерактивных аудиоприложений, как IP-телефония, сквозные задержки, не превышающие 150 мс, не воспринимаются на слух; задержки в интервале от 150 мс до 400 мс считаются приемлемыми, хотя и заметны; а задержки, превышающие 400 мс, способны существенно затруднить общение пользователей. Принимающая сторона в приложениях Интернет-телефонии, как правило, игнорирует все пакеты, задержавшиеся в пути дольше определенного порогового значения, например более 400 мс. Такие пакеты можно считать потерянными.

Джиттер

Основной составляющей сквозной задержки является время передачи пакета, содержащего речевую информацию по IP-сети. Это время неустойчиво и плохо предсказуемо. Если нагрузка сети относительно мала, маршрутизаторы и коммутаторы, могут обрабатывать пакеты практически мгновенно, а линии связи бывают доступны почти всегда. Если загрузка сети относительно велика, пакеты могут довольно долго ожидать обслуживания в очередях. Чем больше маршрутизаторов, коммутаторов и линий в маршруте, по которому проходит пакет, тем больше время его запаздывания, и тем больше вариация этого времени. Благодаря этим изменяющимся задержкам время между передачей и получением пакета для разных пакетов может быть разным. Это явление называется джиттером или дребезгом.

Если получатель будет игнорировать джиттер и попытается воспроизводить пакеты сразу же по их получении, качество воспроизведения может быть очень низким даже при незначительной загруженности IP-сети.

Проблема джиттера весьма существенна в сетях с коммутацией пакетов. Отправитель речевых пакетов передает их через фиксированные промежутки времени (например, через каждые 20 мс), но при прохождении через сеть задержки пакетов оказываются неодинаковыми, так что они прибывают в пункт назначения через разные промежутки времени. Это иллюстрирует Рис. 3.1.

Рис. 4.1 Различие интервалов между моментами прибытия пакетов (джиттер)

Задержка прохождения пакетов по сети Т может быть представлена как сумма постоянной составляющей Т (время распространения плюс средняя длительность задержки в очередях) и переменной величины j, являющейся результатом джиттера: T=T±j.

Для того чтобы компенсировать влияние джиттера, в терминалах используется т.н. джиттер-буфер. Этот буфер хранит в памяти прибывшие пакеты в течение времени, определяемого его емкостью (длиной). Пакеты, прибывающие слишком поздно, когда буфер заполнен, отбрасываются. Интервалы между пакетами восстанавливаются на основе значений временных меток RTP-пакетов. В функции джиттер-буфера обычно входит и восстановление исходной очередности следования пакетов, если при транспортировке по сети они оказались «перепутаны».

Слишком короткий буфер будет приводить к слишком частым потерям «опоздавших» пакетов, а слишком длинный - к неприемлемо большой дополнительной задержке. Обычно предусматривается динамическая подстройка длины буфера в течение всего времени существования соединения. Для выбора наилучшей длины используются эвристические алгоритмы.

Время накопления данных в джиттер-буфере входит в сквозную задержку передачи.

Вторая составляющая задержки это влияние операционной системы. Т.к. часть приложений IP-телефонии представляет собой программы, выполняемые в среде какой-либо операционной системы, такой как Windows или Linux, то мы вынуждены учитывать время взаимодействия этих программ с периферийными устройствами (платам обработки речевых сигналов, специализированным платам систем сигнализации).

Из сказанного следует, что выбор операционной системы является важным фактором, влияющим на общую величину задержки. Чтобы минимизировать влияние операционной системы, некоторые производители шлюзов и IP-телефонов используют так называемые ОС реального времени (VxWorks, pSOS, QNX Neutrino и т.д.), которые используют сложные механизмы разделения времени процессора, действующие таким образом, чтобы обеспечивать очень быструю реакцию на прерывания и эффективный обмен потоками данных между процессами.

Другой, более плодотворный подход - переложить все функции, которые необходимо выполнять в жестких временных рамках (обмен данными между речевыми кодеками и сетевым интерфейсом, поддержку RTP и т.д.), на отдельный быстродействующий специализированный процессор. При этом пересылка речевых данных осуществляется через выделенный сетевой интерфейс периферийного устройства, а операционная система рабочей станции поддерживает только алгоритмы управления соединениями и протоколы сигнализации, т.е. задачи, для выполнения которых жестких временных рамок не требуется. Этот подход реализован в современных IP-терминалах всех ведущих производителей, что позволяет обеспечить высокое качество передачи речи.

Еще одна составляющая сквозной задержки зависит от выбранного алгоритма кодирования и количества передаваемых в пакете кадров. Большинство современных эффективных алгоритмов кодирования/декодирования речи ориентировано на передачу информации кадрами, а не последовательностью кодов отдельных отсчетов. Поэтому в течение времени, определяемого длиной кадра кодека, должна накапливаться определенной длины последовательность цифровых отсчетов. Кроме того, некоторым кодекам необходим предварительный анализ большего количества речевой информации, чем должно содержаться в кадре. Это неизбежное время накопления и предварительного анализа входит в общее время задержки пакета.

ITU-T в рекомендации G.114 определил требования к качеству передачи речи. Оно считается хорошим, если сквозная задержка при передаче сигнала в одну сторону не превышает 150 мс (рис. 3.2). Современное оборудование IP-телефонии при включении «спина к спине» или «back to back» (два устройства - шлюза - соединяются напрямую) вносит задержку порядка 60 мс. Таким образом, остается еще около 90 мс на сетевую задержку при передаче IP-пакета от отправителя к пункту назначения, что говорит о возможности обеспечить при современном уровне технологии передачу речи с достаточно хорошим качеством.

Рис. 4.2 Задержка при передаче

На рис. 3.2 приведены также характеристики спутниковой передачи, при которой требуется примерно 250 мс для того, чтобы сигнал достиг спутника и вернулся обратно к Земле (без учета затрат времени на обработку сигнала). Таким образом, полное время задержки превышает 250-300 мс. Согласно рекомендации G.114, такая задержка выходит за границы диапазона, приемлемого для передачи речи. Тем не менее, ежедневно значительное количество разговоров ведется по спутниковым линиям связи. Следовательно, приемлемое качество речи определяется, прежде всего, требованиями пользователей.

Отметим, что вариация задержки пакетов (джиттер) гораздо сильнее влияет на субъективную оценку качества передачи, чем абсолютное значение задержки.

Принципы кодирования речи

Процесс преобразования аналогового речевого сигнала в цифровую форму называют анализом или цифровым кодированием речи, а обратный процесс восстановления аналоговой формы речевого сигнала - синтезом или декодированием речи.

Цель любой схемы кодирования - получить такую цифровую последовательность, которая требует минимальной скорости передачи и из которой декодер может восстановить исходный речевой сигнал с минимальными искажениями.

При преобразовании речевого сигнала в цифровую форму имеют место два процесса - дискретизация и квантование. Эти две функции выполняются аналого-цифровыми преобразователями (АЦП), которые размещаются в современных АТС на плате абонентских комплектов, а в случае передачи речи по IP-сетям - в терминале пользователя.

В телефонных сетях полоса частот речевого сигнала намеренно, посредством специальных фильтров, ограничена диапазоном 0.3 - 3.4 кГц, что не влияет на разборчивость речи и позволяет узнавать собеседника по голосу. Таким образом, исходя из теоремы Котельникова, частота дискретизации при аналого-цифровом преобразовании выбрана равной 8кГц. Данная частота используется во всех телефонных сетях всего мира.

Квантование приводит к потерям информации и для того, чтобы обеспечить достаточный динамический диапазон дискретная амплитуда сигнала кодируется 12-13ти разрядным двоичным числом по линейному закону. Чтобы снизить необходимую скорость передачи битов, применяют нелинейный (логарифмический) закон квантования, при котором квантованию подвергается не амплитуда сигнала, а ее логарифм. При таком алгоритме для обеспечения заданного динамического диапазона достаточно 8 бит/отсчет.

Процесс аналого-цифрового преобразования применительно к системам связи носит название импульсно-кодовой модуляции (ИКМ).

На сегодняшний день применяются две основные разновидности ИКМ: с кодированием по μ-закону и по А-закону. Как уже говорилось, в результате сжатия динамического диапазона сигнал с амплитудой, кодируемой 12-13 битами, описывается всего восемью битами. Две разновидности ИКМ отличаются именно деталями процесса сжатия (μ -закон кодирования предпочтительнее использовать при малой амплитуде сигнала и при малом отношении сигнал/шум). Исторически сложилось так, что в Северной Америке используется кодирование по μ -закону, а в Европе - по А-закону. Поэтому при международной связи во многих случаях требуется преобразование μ -закона в А-закон, ответственность за которое несет страна, в которой используется μ -закон кодирования. В обоих случаях каждый отсчет кодируется 8 битами, или одним байтом, который можно считать звуковым фрагментом. Для передачи последовательности таких фрагментов необходима пропускная способность канала, равная 64 Кбит/с. Это определяется простыми арифметическими действиями: 8 000 отсчетов/с * 8 битов = 64 Кбит/с, что составляет основу всей цифровой телефонии. Поскольку ИКМ была первой стандартной технологией, получившей широкое применение в цифровых системах передачи, пропускная способность канала, равная 64 Кбит/с, стала всемирным стандартом для цифровых сетей всех видов, причем - стандартом, который обеспечивает передачу речи с очень хорошим качеством. Соответствующие процедуры кодирования и декодирования стандартизованы ITU-T в рекомендации G.711.

Однако такое высокое качество передачи речевого сигнала (являющееся эталоном при оценке качества других схем кодирования) достигнуто в системах ИКМ за счет явно избыточной, при современном уровне технологии, скорости передачи информации.

Чтобы уменьшить присущую ИКМ избыточность и снизить требования к полосе пропускания, последовательность чисел, полученная в результате преобразования речевого аналогового сигнала в цифровую форму, подвергается математическим преобразованиям, позволяющим уменьшить необходимую скорость передачи. Эти преобразования исходного цифрового потока в поток меньшей скорости называют «сжатием» или кодированием, рассматривая ИКМ как некую отправную точку для дальнейшей обработки информации).

Все подходы к сжатию речевой информации можно разделить на три категории: кодирование формы сигнала, кодирование исходной информации и гибридное кодирование, представляющее собой сочетание двух предыдущих подходов.

Кодирование формы сигнала

Импульсно-кодовая модуляция, по сути, и представляет собой схему кодирования формы сигнала. Но существуют и более сложные алгоритмы, позволяющие снизить требования к полосе пропускания.

Рассматриваемые методы кодирования формы сигнала используют то обстоятельство, что между случайными значениями нескольких следующих подряд отсчетов существует статистическая зависимость. Т.е. значения соседних отсчетов обычно мало отличаются одно от другого. Это позволяет с довольно высокой точностью предсказать значение любого отсчета на основе значений нескольких предшествовавших ему отсчетов.

При построении алгоритмов кодирования названная закономерность используется двумя способами. Во-первых, есть возможность изменять параметры квантования в зависимости от характера сигнала. Некоторые алгоритмы предусматривают изменение параметров квантования приблизительно в рамках произносимых слогов, а некоторые изменяют шаг квантования на основе анализа статистических данных об амплитуде сигнала, полученных за относительно короткий промежуток времени.

Во-вторых, существует подход, называемый дифференциальным кодированием или линейным предсказанием. Такие алгоритмы кодируют не входной сигнал непосредственно, а разность между входным сигналом и «предсказанной» величиной, вычисленной на основе нескольких предыдущих значений сигнала.

- отсчеты входного сигнала;

- предсказанное значение в момент времени , которое представляет собой линейную комбинацию предыдущих отсчетов, множители являются коэффициентами предсказания.

Ошибка предсказания имеет меньший динамический диапазон и может кодироваться меньшим числом битов, что позволяет снизить требования к полосе пропускания.

Коэффициенты предсказания выбираются так, чтобы минимизировать среднеквадратическое значение ошибки предсказания , при этом значения коэффициентов изменяются, в среднем, каждые 10-25 мс.

Алгоритм адаптивной дифференциальной импульсно-кодовой модуляции (АДИКМ), предложенный ITU-T в рекомендации G.726 основан на этом принципе. Он предусматривает формирование сигнала ошибки предсказания и его последующее адаптивное квантование. Существует версия этого алгоритма, в которой информационные биты выходного цифрового потока организованы по иерархической схеме, что позволяет отбрасывать наименее значимую информацию, не уведомляя об этом кодер, и получать поток меньшей скорости за счет некоторого ухудшения качества. Документ G.726 специфицирует кодирование при скоростях 40, 32, 24 и 16 Кбит/с, что соответствует передаче 5, 4, 3 или 2 битов на отсчет. Качество речи, передаваемой с использованием АДИКМ G.726 при скорости 32 Кбит/с соответствует качеству речи, обеспечиваемому алгоритмом кодирования G.711.

Кодеры исходной информации (вокодеры) и гибридные алгоритмы

Кодеры, использующие особенности человеческой речи для кодирования сигнала являются кодерами исходной информации или вокодерами (voice coding).

Звуки речи образуются при прохождении выдыхаемого воздуха через голосовой аппарат человека. В формировании звуков участвуют различные элементы голосового аппарата. Формирование звука с участием голосовых связок порождает звуковой тон. Такие звуки составляют тоновый сегмент речи. Если звук формируется без участия связок, тон в нем отсутствует, и последовательность таких звуков составляет нетоновый (шумовой) сегмент речи. Спектр тонового звука может быть смоделирован путем подачи специальным образом сформированного сигнала возбуждения на вход цифрового фильтра с параметрами, определяемыми несколькими действительными коэффициентами. Спектр нетоновых звуков - практически равномерный, что обусловлено их шумовым характером.

Рис. 3.3 иллюстрирует описанную упрощенную модель функционирования голосового тракта человека. Работа кодера, согласно такой модели, состоит в том, чтобы, анализируя блок отсчетов речевого сигнала, вычислить параметры соответствующего фильтра и параметры возбуждения (тоновый/нетоновый сегмент речи, частота тона, громкость и т.д.).

Рис. 4.3 Модель функционирования голосового тракта

В реальных речевых сигналах не все звуки можно четко разделить на тоновые и нетоновые, а приходится иметь дело с некими переходными вариантами, что затрудняет создание алгоритмов кодирования, обеспечивающих высокое качество передачи речи при низкой скорости передачи информации.

Описанный принцип кодирования получил название LPC (Linear Prediction Coding - кодирование с линейным предсказанием), поскольку центральным элементом модели голосового тракта является линейный фильтр.

Гибридные алгоритмы кодирования и алгоритмы типа «анализ путем синтеза» (ABS) представляют собой попытки совместить положительные свойства кодеров формы сигнала и вокодеров.

Важное отличие кодеров такого типа состоит в том, что в рамках этих алгоритмов нет необходимости принимать решение о типе воспроизводимого звука (тоновый или нетоновый), так как предусматриваются специальные меры для кодирования сигнала ошибки после прохождения возбуждения через LPC-фильтр. Например, сигнал ошибки может быть закодирован по алгоритму, аналогичному АДИКМ, что обеспечит высокую точность его передачи. ABS-кодеры не могут быть строго классифицированы как кодеры формы сигнала, однако реально целью процедуры минимизации ошибки (Рис. 3.4), т.е. различия между входным и синтезированным сигналами, является синтез на выходе кодера сигналов, форма которых наиболее близка к форме входных. ABS-декодер является малой частью кодера и очень прост (рис. 3.5).

Рис. 4.4 Упрощенная блок-схема ABS-кодера

Рис. 4.5 Упрощенная блок - схема ABS - декодера

Подавление периодов молчания

При диалоге один его участник говорит, в среднем, только 35 % времени. Таким образом, если применить алгоритмы, которые позволяют уменьшить объем информации, передаваемой в периоды молчания, то можно значительно сузить необходимую полосу пропускания. В двустороннем разговоре такие меры позволяют достичь сокращения объема передаваемой информации до 50%. Технология подавления таких периодов имеет три важные составляющие.

Определение границ пауз в речи очень существенно для эффективной синхронизации передающей и приемной сторон: приемник может, незначительно изменяя длительности пауз, производить подстройку скорости воспроизведения для каждого отдельного сеанса связи, что исключает необходимость синхронизации тактовых генераторов всех элементов сети, как это имеет место в ТфОП.

Детектор речевой активности (Voice Activity Detector - VAD) необходим для определения периодов времени, когда пользователь говорит. Детектор VAD обладает малым временем реакции, чтобы не допускать потерь начальных слов и не упускать бесполезные фрагменты молчания в конце предложений; в то же время детектор VAD не должен срабатывать от воздействия фонового шума.

VAD оценивает энергию входного сигнала и, если она превышает некоторый порог, активизирует передачу. Если бы детектор отбрасывал всю информацию до момента, пока энергия сигнала не стала выше порога, то происходило бы отрезание начальной части периода активности. Поэтому реализации VAD требуют сохранения в памяти нескольких миллисекунд информации, чтобы иметь возможность запустить передачу до начала периода активности. Это увеличивает, в некоторой степени, задержку прохождения сигнала, однако ее можно минимизировать или свести к нулю в кодерах, работающих с блоками отсчетов.

Поддержка прерывистой передачи (Discontinuous Transmission -DTX) позволяет кодеку прекратить передачу пакетов в тот момент, когда VAD обнаружил период молчания. Некоторые наиболее совершенные кодеры не прекращают передачу полностью, а переходят в режим передачи гораздо меньшего объема информации (интенсивность, спектральные характеристики), нужной для того, чтобы декодер на удаленном конце мог восстановить фоновый шум.

Генератор комфортного шума (Comfort Noise Generator - CNG) служит для генерации фонового шума. В момент, когда в речи активного участника беседы начинается период молчания, терминалы слушающих могут просто отключить воспроизведение звука. Однако это неразумно, т.к. при возникновении в трубке полной тишины, т.е. фоновый шум (шум улицы и т.д.), который был слышен во время разговора, внезапно исчезает, у слушающего возникает ощущение, что соединение по каким-то причинам нарушилось. CNG позволяет избежать таких неприятных эффектов.

Простейшие кодеки просто прекращают передачу в период молчания, и декодер генерирует какой-либо шум с уровнем, равным минимальному уровню, отмеченному в период речевой активности. Более совершенные кодеки (G.723.1 Annex A, G. 729 Annex В) имеют возможность предоставлять удаленному декодеру информацию для восстановления шума с параметрами, близкими к фактически наблюдавшимся.

Размер кадра

Большинство узкополосных кодеков обрабатывает речевую информацию блоками, называемыми кадрами (frames), и им необходимо производить предварительный анализ отсчетов, следующих непосредственно за отсчетами в блоке, который они в данный момент кодируют.

Размер кадра важен, так как минимальная теоретически достижимая задержка передачи информации (алгоритмическая задержка) определяется суммой этого параметра и длины буфера предварительного анализа. В действительности процессоры цифровой обработки сигналов, которые выполняют алгоритм кодирования, имеют конечную производительность, так что реальная задержка сигнала больше теоретической.

Можно, казалось бы, заключить, что кодеки с меньшим размером кадра лучше в смысле такого важного критерия как минимизация задержки. Но учитывая, что при передаче информации по сети, к кадру, сформированному кодеком, добавляется множество дополнительной информации - заголовки IP (20 байтов), UDP (8 байтов), RTP (12 байтов). Для кодека с длительностью кадра 30 мс посылка таких кадров по сети приводит к передаче избыточной информации со скоростью 10.6 кбит/с, что превышает скорость передачи речевой информации у большинства узкополосных кодеков.

Поэтому обычно используется пересылка нескольких кадров в пакете, при этом их количество ограничено максимально допустимой задержкой. Чем меньше длительность кадра, тем больше кадров приходится упаковывать в один пакет, т.е. задержка определяется вовсе не длиной кадра, а практически приемлемым объемом полезной нагрузки в пакете.

Кроме того, кодеки с большей длиной кадра более эффективны, так как здесь действует общий принцип: чем дольше наблюдается явление (речевой сигнал), тем лучше оно может быть смоделировано.

Кодеки, стандартизованные ITU-T

Кодек G.711

Кодек G.711 представляет собой алгоритм ИКМ. Типичная оценка MOS составляет около 4.3- 4.4 балла. Минимально необходимым для оборудования VolP является ИКМ-кодирование G.711, т.е. любое устройство VolP должно поддерживать этот тип кодирования.

Кодек G.723.1

Рекомендация G.723.1 утверждена ITU-T в ноябре 1995 года. Форум IMTC выбрал кодек G.723.1 как базовый для приложений IP-телефонии.

Кодек G.723.1 производит кадры длительностью 30 мс с продолжительностью предварительного анализа 7.5 мс. Предусмотрено два режима работы: 6.3 Кбит/с (кадр имеет размер 189 битов, дополненных до 24 байтов) и 5.3 Кбит/с (кадр имеет размер 158 битов, дополненных до 20 байтов). Режим работы может меняться динамически от кадра к кадру. Оба режима обязательны для реализации.

Кодек G.723.1 имеет детектор речевой активности и обеспечивает генерацию комфортного шума на удаленном конце в период молчания. Эти функции специфицированы в приложении A (Annex А) к рекомендации G.723.1. Параметры фонового шума кодируются очень маленькими кадрами размером 4 байта. Если параметры шума не меняются существенно, передача полностью прекращается.

Кодек G.726

Алгоритм кодирования АДИКМ (рекомендация ITU-T G.726, принятая в 1990 г.) обеспечивает кодирование цифрового потока G.711 со скоростью 40, 32, 24 или 16 Кбит/с, гарантируя оценки MOS на уровне 4.3 (32 Кбит/с), что часто принимается за эталон уровня качества телефонной связи (tall quality).

Кодек G.728

Кодек G.728 использует оригинальную технологию с малой задержкой LD-CELP (low delay code excited linear prediction) и гарантирует оценки MOS, аналогичные АДИКМ G.726 при скорости передачи 16 Кбит/с. Этот кодер имеет длительность кадра только 0.625 мс. Реально задержка может достигать 2.5 мс, так как декодер должен поддерживать синхронизацию в рамках структуры из четырех кадров.

Недостатком алгоритма является высокая сложность и относительно высокая чувствительность к потерям кадров.

Кодек G.729

Кодек G.729 очень популярен в приложениях передачи речи по сетям Frame Relay. Он использует технологию CS-ACELP (Conjugate Structure, Algebraic Code Excited Linear Prediction). Кодек использует кадр длительностью 10 мс и обеспечивает скорость передачи 8 Кбит/с. Для кодера необходим предварительный анализ сигнала продолжительностью 5 мс.

Существуют два варианта кодека:

• G.729 (одобрен ITU-T в декабре 1996), требующий около 20 MIPS для кодера и 3 MIPS для декодера.

• Упрощенный вариант G.729A (одобрен ITU-T в ноябре 1995), требующий около 10.5 MIPS для реализации кодера и около 2 MIPS для декодера.

В спецификациях G.729 определены алгоритмы VAD, CNG и DTX. В периоды молчания кодер передает 15-битовые кадры с информацией о фоновом шуме, если только шумовая обстановка изменяется.

Кодеки, стандартизованные ETSI

В рамках деятельности европейского института ETSI стандартизованы узкополосные кодеки для применения в системах мобильной связи (GSM).

Спецификации кодека GSM Full Rate, известного также как GSM 06.10, утверждены в 1987г. Это первый и, скорее всего, наиболее известный из узкополосных кодеков, применяемый в миллионах мобильных телефонов по всему миру. Обеспечивает хорошее качество и устойчивую работу в условиях фонового шума (оценка MOS порядка 3.7 в условиях без шума). Кодируются кадры длительностью 20 мс, образуя цифровой поток со скоростью 13 Кбит/с. Кодек не требует высокой производительности процессора - необходимо только 4.5 MIPS для дуплексной реализации. Кодек очень важен для некоммерческих проектов в области IP-телефонии, особенно для проектов, связанных с открытым распространением исходных текстов ПО (open source), благодаря возможности бесплатного лицензирования. Такие проекты сегодня могут использовать только кодеки GSM FR и G.711, а также АДИКМ.

Существуют также спецификации кодеков GSM Half Rate, принятые в 1994 году, и GSM Enhanced Full Rate, принятые в 1995 году. Характеристики этих кодеков превосходят характеристики исходного варианта, описанного выше, однако алгоритмы требуют большей производительности процессора (до 30 MIPS). В приложениях IP-телефонии они, по разным причинам, распространения пока не получили.

Сегодня в приложениях VolP, кроме кодеков, прошедших процедуры международной стандартизации в ITU-T и ETSI, в продуктах ряда фирм-производителей применяются также нестандартные внутрифирменные алгоритмы. Такие алгоритмы часто лицензируются для использования в продуктах других компаний.

Приложения

П.1 Телефонные соединители с шаговыми и декадно-шаговыми искателями

Шаговые и декадно-шаговые искатели. Искатели называют шаговыми (ШИ) потому, что их контактные щетки передвигаются по ламелям контактного поля шаг за шагом при каждом притяжении якоря электромагнита и совершают только вращательное движение (рис.1).

Рис.1 Шаговый вращательный искатель ШИ-11: 1 - якорь, 2 - электромагнит, 3 - трехлучевые контактные щетки, 4 - контактные ламели, 5-8 - входы щеток, 9 - движущая собачка, 10 - храповик

Емкость контактного поля таких искателей, используемых на городских АТС, от 11 (ШИ-11) до 17 (ШИ-17) ламелей, расположенных по дуге. В искателе ШИ-11 (рис.1) имеются четыре щетки, изолированные друг от друга, а в ШИ-17-пять.

Для АТС большой емкости разработан декадно-шаговый искатель, щетки которого совершают подъемное и вращательное движения. Декадно-шаговый искатель имеет определенное число групп контактных ламелей, расположенных в вертикальном и горизонтальном направлениях. Он состоит из контактного поля, в которое можно включить до 100 абонентских линий, и движущего механизма (рис. ниже).

Контактное поле искателя ДШИ-100 (рис.2) включает три секции а, b и с. В каждую секцию входит десять горизонтальных рядов (декад) по десять контактных ламелей в ряду. Контактные ламели имеют длинные выступающие штифты с прорезями дл включения жил кабеля многократного поля. Контактное поле смонтировано на стативе, оно несъемное.

Рис.2 Кинематическая схема декадно-шагового искателя ДШИ-100: 1, 3 – вращательный и подъемный электромагниты, 2, 4 – якоря, 5 – храповой полуцилиндр, 6 – подъемная рейка, a, b, c – контактные щетки

Первая цифра двузначных чисел показывает число импульсов, поступающих в обмотку подъемного магнита, вторая - число импульсов, поступающих в обмотку вращательного магнита. Нумераци контактного поля ДШ искателя показана в таблице 1.

Подъем (снизу вверх) / Вращение (слева направо)

Таблица 1

01	02	03	04	05	06	07	08	09	00
91	92	93	94	95	96	97	98	99	90
81	82	83	84	85	86	87	88	89	80
71	72	73	74	75	76	77	78	79	70
61	62	63	64	65	66	67	68	69	60
51	52	53	54	55	56	57	58	59	50
41	42	43	44	45	46	47	48	49	40
31	32	33	34	35	36	37	38	39	30
21	22	23	24	25	26	27	28	29	20
11	12	13	14	15	16	17	18	19	10

Рис.3 Функциональная схема АТС на 100 номеров

схемы дают возможность представить взаимосвязь отдельных частей какой-либо системы или устройства. Так, на рис.3 изображена функциональная схема АТС на 100 номеров, из которой видно, что каждая абонентская лини включена в щетки линейного искателя ЛИ и параллельно в ламели контактного поля всех линейных искателей данной станции. Вследствие того, что каждая абонентская линия непосредственно соединена со своим (индивидуальным) искателем, для стономерной АТС потребуется сто достаточно сложных и дорогих искателей ДШИ-100, использование которых ограничено, так как из ста абонентов одновременно разговаривают не более 10-15 пар. Кроме того, емкость такой АТС ограничена емкостью контактного поля ДШИ-100 (не более 100 номеров).

Для сокращения количества ДШИ-100 и увеличени емкости АТС до необходимого числа номеров применяют способ последовательного (группового) искания. Функциональные схемы построения АТС на 1000 номеров по такому способу изображены на рис.4 а, б.

В качестве индивидуальных абонентских искателей, называемых предыскателями ПИ, используют ШИ-11 или ШИ-17. Сто предыскателей объединены в группу запараллеливанием одноименных ламелей контактных полей всех ПИ (т. е. первая ламель поля первого ПИ соединена с первой ламелью поля второго ПИ и т. д. подряд до сотого ПИ). Аналогично соединены остальные десять ламелей. Десять объединенных выходов от ста ПИ соединены со щетками десяти промежуточных групповых ГИ искателей ДШИ-100. Так как станция на 1000 номеров состоит из десяти сотенных групп, то на промежуточной ступени искания используется сто ГИ (по десять на группу).

Первая ламель первого горизонтального ряда (декады) контактного поля ГИ соединена с первыми ламелями первых декад (горизонтальных рядов) всех ГИ. Так же соединяются вторые и остальные восемь ламелей первых декад. Соединение ламелей в остальных девяти декадах производится аналогично.

Рис.4 Функциональные схемы АТС на 1000 номеров:
а - упрощенная, б - развернутая

Таким образом, создаются десять групп выходов от десяти декад контактного поля ГИ по десять линии в каждом выходе (от каждой декады). Десять линий от первой декады групповых искателей соединяются со щетками десяти линейных искателей ЛИ (ДШИ-100) первой сотенной группы - первой сотни абонентских линий, многократно включенных в ламели контактных полей этих ЛИ. Десять линий от второй декады ГИ соединены со щетками десяти искателей второй сотни. Аналогично соединяются линии остальных восьми декад группового искателя со щетками ЛИ соответствующих сотен.

Когда абонент снимает микротелефонную трубку с аппарата, например ТА100, щетки предискателя ПИ придут во вращение и автоматически остановятся на первой (любой из десяти) свободной линии к ГИ. Тогда из управляющей схемы ГИ к абоненту поступит сигнал ответа станции и он может начать набор требуемого номера, например ТА1. При наборе цифры (ноль) щетки ГИ в соответствии с числом импульсов, созданных номеронабирателем, делают десять подъемных шагов, после чего автоматически начинают вращаться по ламелям выбранной (нулевой) декады и останавливаются на первой (любой из десяти) свободной линии к щеткам ЛИ нулевой сотни. При наборе второй цифры (единицы) щетки ЛИ делают один подъемный шаг, а при наборе третьей цифры (также единицы) - один вращательный шаг. С этого момента начинается проба линии на занятость. Если линия свободна, то в аппарат ТА011 поступают периодические посылки вызова. В момент снятия микротелефонной трубки с аппарата ТА011 посылки вызова автоматически прекращаются, и абоненты могут разговари<

⇐ Предыдущая 13 14 15 16 17 181920 21 22 Следующая ⇒

Поделиться с друзьями:

Типы оградительных сооружений в морском порту: По расположению оградительных сооружений в плане различают волноломы, обе оконечности...

Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...

Археология об основании Рима: Новые раскопки проясняют и такой острый дискуссионный вопрос, как дата самого возникновения Рима...

Наброски и зарисовки растений, плодов, цветов: Освоить конструктивное построение структуры дерева через зарисовки отдельных деревьев, группы деревьев...

01	02	03	04	05	06	07	08	09	00
91	92	93	94	95	96	97	98	99	90
81	82	83	84	85	86	87	88	89	80
71	72	73	74	75	76	77	78	79	70
61	62	63	64	65	66	67	68	69	60
51	52	53	54	55	56	57	58	59	50
41	42	43	44	45	46	47	48	49	40
31	32	33	34	35	36	37	38	39	30
21	22	23	24	25	26	27	28	29	20
11	12	13	14	15	16	17	18	19	10

01	02	03	04	05	06	07	08	09	00
91	92	93	94	95	96	97	98	99	90
81	82	83	84	85	86	87	88	89	80
71	72	73	74	75	76	77	78	79	70
61	62	63	64	65	66	67	68	69	60
51	52	53	54	55	56	57	58	59	50
41	42	43	44	45	46	47	48	49	40
31	32	33	34	35	36	37	38	39	30
21	22	23	24	25	26	27	28	29	20
11	12	13	14	15	16	17	18	19	10

01	02	03	04	05	06	07	08	09	00
91	92	93	94	95	96	97	98	99	90
81	82	83	84	85	86	87	88	89	80
71	72	73	74	75	76	77	78	79	70
61	62	63	64	65	66	67	68	69	60
51	52	53	54	55	56	57	58	59	50
41	42	43	44	45	46	47	48	49	40
31	32	33	34	35	36	37	38	39	30
21	22	23	24	25	26	27	28	29	20
11	12	13	14	15	16	17	18	19	10