Навигация:

Главная Случайная страница Обратная связь ТОП Интересно знать Избранные Новые материалы

Топ:

Оценка эффективности инструментов коммуникационной политики: Внешние коммуникации - обмен информацией между организацией и её внешней средой...

Комплексной системы оценки состояния охраны труда на производственном объекте (КСОТ-П): Цели и задачи Комплексной системы оценки состояния охраны труда и определению факторов рисков по охране труда...

Генеалогическое древо Султанов Османской империи: Османские правители, вначале, будучи еще бейлербеями Анатолии, женились на дочерях византийских императоров...

Интересное:

Как мы говорим и как мы слушаем: общение можно сравнить с огромным зонтиком, под которым скрыто все...

Средства для ингаляционного наркоза: Наркоз наступает в результате вдыхания (ингаляции) средств, которое осуществляют или с помощью маски...

Подходы к решению темы фильма: Существует три основных типа исторического фильма, имеющих между собой много общего...

Дисциплины:

Автоматизация Антропология Археология Архитектура Аудит Биология Бухгалтерия Военная наука Генетика География Геология Демография Журналистика Зоология Иностранные языки Информатика Искусство История Кинематография Компьютеризация Кораблестроение Кулинария Культура Лексикология Лингвистика Литература Логика Маркетинг Математика Машиностроение Медицина Менеджмент Металлургия Метрология Механика Музыкология Науковедение Образование Охрана Труда Педагогика Политология Правоотношение Предпринимательство Приборостроение Программирование Производство Промышленность Психология Радиосвязь Религия Риторика Социология Спорт Стандартизация Статистика Строительство Теология Технологии Торговля Транспорт Фармакология Физика Физиология Философия Финансы Химия Хозяйство Черчение Экология Экономика Электроника Энергетика Юриспруденция

Методы сжатия статического изображения

2019-11-19

200

0.00 из 5.00 0 оценок

Заказать работу

⇐ ПредыдущаяСтр 11 из 15Следующая ⇒

Единственный образ, на компрессию которого направлены имеющиеся стандарты, касающиеся статического изображения, чаще всего подчиняется стандарту JPEG.

Название стандарта JPEG расшифровывается как «Joint Photographic Experts Group», объединенная группа фотоэкспертов. Это широко распространенный и высококачественный стандарт сжатия статических изображений, используемый в большинстве современных программ. Возможностей стандартных веб-браузеров вполне хватает для декомпрессии и демонстрации на мониторе персонального компьютера.

В компрессии по стандарту JPEG применяется несколько разных уровней сжатия, которые выбираются пользователем. Эти уровни означают степень сжатия видеоданных. ОТ этой цифры напрямую зависит вес файла и его качество.

Кроме уровня сжатия, определяющим для размера файла критерием становятся такие свойства самого изображения, как насыщенность цветами и деталями. Более яркая и пестрая картинка при одинаковом уровне сжатия будет весить больше.

Компрессия по стандарту JPEG опирается на следующие постулаты:

 От размеров изображения напрямую зависит количество содержащихся в нем данных.

 Устанавливая высокий уровень сжатия, будьте готовы к тому, что вы потеряете большую часть данных, и она будет тем больше, чем выше установлен уровень компрессии.

 Высокая детализация изображения подразумевает большое количество данных при сжатии. К примеру, изображение цветущего куста будет содержать в несколько раз больше данных, чем изображение белого листа.

Эта же экспертная группа разработала более совершенный формат компрессии JPEG-2000. Этот формат широко применяется в таких областях, требующих высокой детализации, как цифровое фото и работающие с изображениями медицинские компьютерные приложения. Если установлен низкий уровень компрессии, сжатие аналогично стандарту JPEG, но, чем выше уровень сжатия, тем вероятнее запуск более совершенных и сложных алгоритмов обработки изображения, позволяющих JPEG-2000 поддерживать лучшее, чем в обычном JPEG, качество. Однако по той причине, что количество программ, поддерживающих этот формат, невелико (в отличие от JPEG, его не поддерживают веб-браузеры), этот стандарт до сих пор значительно ограничен в использовании.

Идея JPEG кодирования проста – изображение по специальному алгоритму разбивается на блоки 16х16, к которым в дальнейшем применяется дискретное косинусное преобразование. При этом, в зависимости от выбранного качества, наименее значимые с точки зрения алгоритма цвета убираются (или подменяются более значимыми в этом блоке), что позволяет значительно уменьшить объем хранимой информации.

Рассмотрим процедуру дискретного косинусного преобразования на примере формата JPEG.

Компрессия изображения в JPEG формат производится в несколько этапов:

- преобразование цветового пространства

- сегментация

-дискретное косинусное преобразование (Discrete-Cosine Transform)

- квантование

- кодирование

Для декодирования формата JPEG используется алгоритм обратный приведенному выше.

1) Итак, начнем по порядку, с преобразования цветового пространства.

Принимая во внимание то, что формат JPEG имеет возможность кодировки изображения любого типа цветного пространства (RGB, CMYK и HSI), рекомендуется использовать цветовое пространство типа яркость/цветность для достижения наилучшей степени сжатия. При таком типа цветового пространства, где для каждого пикселя изображения используется 3 параметра Y,U и V. Для перехода в пространство яркость/цветность пользуются простыми математическими преобразовании.

2) Вторым пунктом стоит сегментация. Наиболее восприимчив наш глаз к такому параметру изображения как цветность(Y).Именно в этом параметре несется большая часть визуальной информации, воспринимаемой человеком. К компонентам цветности (U и V) человеческий глаз менее чувствителен. Это обусловлено строением и особенностями человеческого зрительного органа. Это означает что часть информации (цветность изображения) можно просто отбросить критической потери НУЖНОЙ информации, тем самым значительно сократив объём информации о изображении.

Изображение делится на части, содержащие по несколько пикселей каждая. Обычно каждая часть представляет собой квадрат 8 на 8 пикселей. Далее для каждой компоненты Y,U и V формируется собственная рабочая матрица. Для Y (яркость) матрица формируется из значений яркости каждого пикселя. А для компонентов U и V (цветность) такие матрицы формируются из значений пикселей через строчку и через ряд. После этого этапа идет потеря ¾ цветовой информации, но объем изображения уменьшается вдвое.

3) Далее переходим к самому принципу дискретному косинусному преобразованию. DCT является одним из преобразований Фурье, и оно также имеет обратное преобразование. В дискретном косинусном преобразовании изображение представляется как совокупность волн в пространстве, оси X и Y для которых проводятся параллельно поперечной и продольной осям изображения. Значение цвета для каждого пикселя откладывается по оси Z. Таком образом, используя дискретно косинусное преобразование, осуществляется переход от совокупности пространственных волн к спектральной интерпретации. Пространственная волна разделяется на ряд гармоник. Наиболее значимые остаются, а наименее значимые - отбрасываются. Степень сжатия изображения как раз и зависит от количества оставшихся гармоник. DCT трансформирует ранее полученные рабочие матрицы в матрицы частотных коэффициентов соответствующего размера. Высокочастотным коэффициентам отводятся места в левой верхней части матрицы, а низкочастотным - в противоположной, т.е. в правой нижней части матрицы. Стоит отметить, что основную часть графических образов изображения образуют именно низкочастотные коэффициенты.Следовательно можно сократить размер изображения при удалении высокочастотных коэффициентов. Как раз эта процедура и происходит в следующем этапе.

Квантовые матрицы частотных коэффициентов происходит путем деления поэлементного деления матрицы частотных коэффициентов на матрицу квантования. Создается отдельная матрица квантования для каждого компонента Y,U и V.Путем такого деления отбрасывается высокочастотная информация невоспринимаемая глазом. Затем элементы результирующих матриц округляются до целых чисел и получившиеся нули в правом нижнем углу матрицы отбрасываются.

5) Наступает завершающий этап - кодирование. В ходе этого процесса все элементы матрицы записываются в цепочку после зигзагообразного сканирования. Получаемый после этого вектор сворачивается при помощи алгоритма «группового кодирования» или сокращенно RLE (Run Length Encoding). Каждый элемент (не нулевой) представляется парой чисел. Первое число показывает количество нулей расположенных перед ним. Второе число равно значению самого элемента. Далее эти пары чисел кодируются алгоритмом Хаффмана сфиксированнойктаблицей. Именно этот двоичный код, полученный кодированием по алгоритму Хаффмана передается по сети и хранится в компьютере.

Стоит отметить, что из-за специфики кодирования изображения, формат JPEG эффективен только при использовании многоградационного изображения. В таком изображении различия у соседних пикселей незначительно. Одним из недостатков формата JPEG также является эффект «мозаики» который возникает из-за технологии компрессии видеоизображения. К недостатком относится и ограничения на полосу пропускания. Изображение с разрешением 768х576, коэффициентом сжатия 4 и скоростью передачи 25 кадров/с передается со скоростью 8 Мбит/с.

MotionJPEG предcтавляет видео как последовательность JPEG кадров. MotionJPEG один из основных стандартов, используемых в сетевых видео системах. Сетевая видеокамера, подобно цифровому фотоаппарату, обрабатывает отдельные изображения, сжимая их в формат JPEG. Сетевая камера может обрабатывать несколько кадров в течении одной секунды (Axis 221 до 60 кадров в секунду), а затем, создав непрерывный поток, транслировать их в сеть. При скорости 16 кдр/сек и выше, человеческий глаз воспринимает поток образов как непрерывное видео. Поскольку MotionJPEG представляет собой поток отдельных JPEG картинок, его можно сравнить с кинопленкой - каждый кадр имеет четкое изображение, качество которого определяется только уровнем сжатия, выбранным для отдельной сетевой видеокамеры или видео сервера.

H.263 – формат сжатия предназначенный для передачи видео с постоянной, фиксированной скоростью. Основным недостатком фиксированной скорости является то, что при движении объекта качество изображения падает. H.263 был разработан для видео конференц-связи, а не для наблюдения, где отображение деталей являются более критичным, чем скорость передачи данных.

Познакомимся с основными показателями, характеризующими качество движущихся изображений.

Частота кадра (Frame Rate). Стандартная скорость воспроизведения видеосигнала 30 кадров/с (для кино этот показатель составляет 24 кадра/с). Экспериментально установлено, что иллюзия движущегося изображения возникает при частоте смены кадров более 16-ти в секунду. В этом случае человек воспринимает быстроменяющиеся картинки в виде динамичного непрерывного изображения.

Глубина цвета (Color Resolution). Этот показатель определяет количество цветов, одновременно отображаемых на экране. Компьютеры обрабатывают цвет в RGB-формате (красный — зеленый — синий). RGB-формат позволяет путем смешения в разных пропорциях трех основных цветов получить любой другой цвет или оттенок. Для цветовой модели RGB обычно характерны следующие режимы глубины цвета: 8 бит/пиксель (256 цветов), 16 бит/пиксель (65 535 цветов) и 24 бит/пиксель (16,7 миллиона цветов).

Экранное разрешение (Spatial Resolution) или, другими словами, количество точек, из которых состоит изображение на экране, например, 640  480 точек (пикселей).

Качество изображения (Image Quality). Это комплексный показатель, который вбирает в себя три предыдущих. Требования к качеству зависят от конкретной задачи. Иногда достаточно, чтобы картинка была размером в четверть экрана с палитрой из 256 цветов (8 бит), при скорости воспроизведения 15 кадров/с. В других случаях требуется полноэкранное видео (768  576) с палитрой в 16,7 миллиона цветов (24 бит) и кадровой разверткой 30 кадров/с.

Расчеты показывают, что 24-битное цветное видео при разрешении 640  480 пикселей и частоте 30 кадров/с требует передачи более 26 Мбайт данных в секунду. Для наглядности приводим здесь эти расчеты.

640  480  24  30 = 221 184 000 бит/с = 26,37 Мбайт/с.

Для оптимизации процесса кодирования информации необходимо, с одной стороны, не передавать избыточную информацию, а с другой стороны, не допускать чрезмерной потери качества изображения.

В зависимости от скорости упаковки изображений методы сжатия подразделяются на две группы. К первой группе относится метод сжатия неподвижных изображений. Сжатие может выполняться с любой скоростью, так как этот процесс не регламентирован временем (в силу статичности изображения). Вторую группу образуют методы сжатия движущихся изображений. Сжатие движущихся изображений должно выполняться, как правило, в режиме реального времени по мере ввода данных.

Стандарт JPEG (J oint P hotographic E xperts G roup), предложенный Объединенной группой экспертов в области фотографии, позволяет сократить размеры графического файла с неподвижным изображением в 10—20 раз. Благодаря специальным процессорам, этим методом удается сжимать и движущиеся изображения.

8. Цифровые фильтры. Системная функция.

Цифровые сигналы (ЦС) – это квантованные по уровню дискретные сигналы, которые описываются кван

тованными решетчатыми функциями или квантованными последовательно- стями x ц (nT), принимающими в дискретные моменты времени лишь ряд дис- кретных значений – уровней квантования h 0, h 1, h 2,..., h l,..., h N-1 (при этом уменьшается число выборок по амплитуде, чем больше N – тем выше точ- ность, но увеличивается сложность цифрового устройства, т.к. требуется больше разрядов (рис. 1.3)).

Правильный выбор интервалов дискретизации по времени и по уровню (по амплитуде) очень важен при разработке систем ЦОС. Чем меньше интер- вал дискретизации Т, тем точнее дискретизированный сигнал соответствует исходному непрерывному. Однако при уменьшении интервала дискретизации по времени возрастает число отсчетов и, для сохранения общего времени об- работки сигнала неизменным, приходится увеличивать скорость обработки, что не всегда возможно. При уменьшении шага квантования по амплитуде требуется больше разрядов для представления сигнала, вследствие чего уст- ройство становится более сложным и громоздким.

Связь между решетчатой функцией x д (nT) и квантованной функцией

x ц (nT) определяется нелинейной функцией квантования x ц (nT) = F k [ x д (nT)].

Существуют различные способы выбора функции квантования. В про-

стейшем случае используется квантование с постоянным шагом

. Функция квантования имеет вид:

В дальнейшем мы оперируем не с самими отсчетами, а с их кодами. Ка- ждый из уровней квантования кодируется числом. Обычно при кодировке ис- пользуются двоичные числа (0 и 1), и квантованные отсчеты x ц (nT) кодируют- ся m -разрядными двоичными числами, например:

x ц (0) = 00012, x ц (T) = 00102, x ц (2T) = 00112 и т.д.

Число уровней квантования N и наименьшее число разрядов m двоичных

чисел, кодирующих эти уровни, связаны соотношением:

m = Int (log2 N),

где Int (A) – наименьшее целое число, не меньшее, чем число А. Например,

Int (3,1) = 4. Таким образом при N = 4 получим m = 2.

Цифровыми системами обработки сигналов называют системы, выпол- няющие однозначное преобразование входного массива данных x ц (nT) в вы- ходной массив данных (рис. 1.10).

x ц (nT) y ц (nT)

R [ x ц (nT)]

Рис. 1.10. – Цифровая система обработки сигналов

Здесь R [·] – оператор преобразования;

y ц (nT) = R [ x ц (nT)];

y ц (nT) – отклик системы или реак-

ция системы на входное воздействие.

Такое определение описывает очень широкий класс систем. Мы же чаще бу-

дем рассматривать более узкий класс систем: стационарных, линейных, физи-

чески реализуемых и устойчивых. Дадим определение таких систем.

Цифровая система называется стационарной (инвариантной во вре-

мени), если ее параметры не изменяются во времени. Это означает, что вид отклика на заданное входное воздействие не зависит от времени его прихода

на вход системы. Пусть

x (nT) ≡ y (nT) = 0

при n < 0 – невозбужденная систе-

ма или система с нулевыми начальными условиями, тогда, например,

ведлив при любом значении n.

Нестационарная система

– оператор преобразования спра-

Линейной цифровой системой называется система, для которой выпол-

няется принцип суперпозиции. Пусть, например,

á ⋅ x 1 (nT) + â ⋅ x 2 (nT) –

сложное входное воздействие, а операторы преобразования определены сле-

дующим образом:

R [ x 1 (nT)] = y 1 (nT) и

R [ x 2 (nT)] = y 2 (nT).

Тогда реакция такой системы на сложное воздействие будет равна взве- шенной с теми же коэффициентами α и β сумме реакций на отдельные воз- действия

при всех ненулевых α и β и всех доступных для данной системы воздействий

x 1 (nT) и x 2 (nT).

Нелинейная система – это система, операторы преобразования которой представляют собой математически нелинейные функции, например,

y (nT) = x 2 (nT)

– нелинейная, но стационарная система.

Физически реализуемыми системами называются системы, у которых текущий отсчет выходного сигнала y (nT) формируется из предыдущих отсче- тов и текущего отсчета входного сигнала и предыдущих отсчетов выходного сигнала. Такая система называется каузальной, т.е. сохраняющей причинно-

следственные связи. Например,

y (nT) = 0,5 x (nT - 2 T)

– физически реализуе-

мая система, а

y (nT) = 0,5 x (nT + 2 T)

– физически нереализуемая система.

Иначе можно сказать, что физически реализуемыми системами называются системы, реакция которых в данный момент времени не зависит от значений воздействий в последующие моменты времени.

Устойчивыми называют системы, выходные отклики которых ограни-

чены при любом ограниченном входном воздействии, т.е. , где

h (nT) есть импульсная характеристика. Или по другому, система устойчива, если все полюсы системной функции H (z) расположены внутри единичного круга z -плоскости. Понятие устойчивости требует уточнения. Например, ин- тегратор – условно устойчивая система, т.к. ограничение на амплитуду вы- ходного воздействия требует ограничения действия входного сигнала по вре- мени.

В дальнейшем устройства, реализующие ЦОС, мы будем называть циф-

ровыми фильтрами (ЦФ).

Цифровым фильтром, как правило, называют линейную, инерционную, цифровую систему, которую можно использовать для фильтрации дискрет- ных во времени и квантованных по уровню сигналов.

Как и другие системы обработки сигналов, цифровые фильтры могут быть стационарными или нестационарными, линейными или нелинейными, физически реализуемыми или нереализуемыми.

В табл. 1.1 приведены базовые операции, используемые для построения линейных ЦФ, а в табл. 1.2 – базовые сигналы, используемые в качестве входных воздействий.

Таблица 1.1

Аналитическая запись последовательности х (nT) (фильтрующее свойство

ЕИ):

Пусть определена последовательность из трех отсчетов x (nT) = {1, -2, 3}.

Тогда аналитическая запись последовательности может быть представлена в

виде

Следует отметить, что аналитическая запись используется при вычисле-

нии прямого Z -преобразования, сверток, откликов и т.д..

Линейный цифровой фильтр (ЛЦФ) – устройство, в котором выходные отсчеты сигнала представлены в виде линейной комбинации предыдущих от- счетов входного и выходного сигналов и текущего отсчета входного сигнала.

Основное разностное уравнение для ЛЦФ имеет вид:

Здесь T – период (интервал) дискретизации;

n – текущий номер отсчета сигнала, включая нулевой отсчет (n = 0, 1,...);

j – начинается с 1, чтобы уравнение было приведенным.

Первая сумма описывает нерекурсивную часть фильтра, вторая – рекур-

сивную часть фильтра.

Если a i и b j ≡ co n s t, то ЛЦФ с постоянными параметрами, иначе ЛЦФ с переменными параметрами.

Большее из чисел M и N – является порядком фильтра.

Если b j ≡ 0, то получаем нерекурсивные фильтры или фильтры с конеч-

ной импульсной характеристикой, так называемые КИХ-фильтры.

Фильтры без обратных связей, т.е. b j ≡ 0 называют также однородными, трансверсальными или фильтрами с многоотводной линией задержки [1]. Ес- ли b j ≠ 0, то получаем класс рекурсивных фильтров.

На рис. 1.11 проиллюстрирован принцип формирования выходного сигнала в ЛЦФ.

	× a 3
x (0)	× a 2
x (1)	× a 1
x (2)	× a 0
x (3)
…
x (n)
x (n +1)

Запись входного сигнала.

При n <0, x (nT) ≡ 0. T = 1c.

Пусть M = N = 3, (текущий шаг обработки n = 2)

b 3 ×
b 2 ×	y (0)
b 1 ×	y (1)
	y (2)
	y (3)
	…
	y (n)
	y (n +1)

∑

Выходной массив y (nT).

При n <0,

y (nT) ≡ 0.

Рис. 1.11. – Формирование выходного сигнала в ЛЦФ

Данное разностное уравнение точно описывает алгоритмы функциони- рования не цифровых, а дискретных фильтров, т.е. не учитываются эффекты квантования. В то же время это разностное уравнение описывает все типы линейных дискретных фильтров (полосовые, режекторные, ФНЧ, ФВЧ и др.).

Формы реализации (структурные схемы) ЛЦФ м. б. различными: прямая (рис. 1.12), каноническая (рис. 1.13), последовательная (рис. 1.14), параллель- ная (рис. 1.15) и др.

x (nT) y (nT)

a 0

z -1

a 1

z -1

a 2

z -1 a M

∑ z -1

b 1

z -1

b 2

b N z -1

Рис. 1.12. – Основная (прямая) форма реализации

ЛЦФ

Задержки (z –1) необходимы для того, чтобы иметь доступ к предыдущим отсчетам сигнала.

⇐ Предыдущая 6 7 8 9 101112 13 14 15 Следующая ⇒

Поделиться с друзьями:

Опора деревянной одностоечной и способы укрепление угловых опор: Опоры ВЛ - конструкции, предназначенные для поддерживания проводов на необходимой высоте над землей, водой...

Типы сооружений для обработки осадков: Септиками называются сооружения, в которых одновременно происходят осветление сточной жидкости...

Историки об Елизавете Петровне: Елизавета попала между двумя встречными культурными течениями, воспитывалась среди новых европейских веяний и преданий...

Индивидуальные и групповые автопоилки: для животных. Схемы и конструкции...