КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Сжатие в кодере MPEG 2
Сжатие в кодере MPEG 2 — сложный шестиуровневый процесс в виде иерархической структуры: блок - макроблок - слайс (вырезка) - кадр - группа кадров - последовательность кадров (рис. 4).
Рисунок 4 – Иерархическая структура кодирования MPEG 2
Сначала обрабатываются фрагменты изображения – блоки - размером 8x8 пикселов, несущие информацию о яркости или цветности. Блок(основной объект, к которому применяется ДКП) является базовой структурной единицей, над которой осуществляются все основные операции кодирования. Матрица блока состоит из 8x8 = 64 пикселей, т. е. имеет 64 отсчета. В телевизионном кадре по вертикали размещается 576/8 = 72 столбцов матрицы, а по горизонтали 704/8 = 88 строк матрицы. В итоге полное телевизионное изображение формируется из (72x88) = 6336 блоков, т. е. матриц яркостных данных, на которых возможно провести ДКП. Блок цветоразностных данных в формате изображения 4:2:2 отсутствует.
Яркостные блоки Y организуются в макроблоки (16x16 пикселов), состоящие из четырех блоков. Макроблок – это основной объект для предсказания с компенсацией движения.
Один или более смежных макроблоков группируются вместе и образуют вырезку (слайс), в которой по вертикали 16 пикселов, а по горизонтали 16 n (где n — 1, 2, 3 и т.д.) пикселов. Слайс является основным объектом для синхронизации и при восстановлении данных, формирующих изображение. Когда появляется ошибка в общем потоке цифровых данных, декодер обращается к началу следующего макроблока, входящего в слайс, что улучшает эффективность восстановления и качество изображения. Очередность обработки макроблоков в слайсе такая же, как и при обычном ходе строчной развертки, т. е. слева направо и сверху вниз. В области поиска осуществляется поиск «своего» макроблока в текущем кадре, смежном с опорным. Область поиска включают в себя 64x64 пикселей, т. е. ограничена размерами в 4x4 макроблока.
Таким образом, кадр, состоящий из группы слайсов, является первичной кодированной единицей передаваемого изображения. Последовательность из 12...15 кадров составляет группу кадров (GoP — Group of Picture) трех типов (I, Р, В), из которых только один I-кадр (Interframe) с внутрикадровым кодированием является опорным для декодирования остальных кадров (Р и В) группы, три или четыре Р-кадра (Predictive — предсказанные) используют межкадровое кодирование с компенсацией движения по ближайшему предшествующему I-кадру и 8...10 В-кадров (Bidirectional — двунаправленные) с межкадровым кодированием и предсказанием по последующим и предыдущим I- и Р-кадрами. Группа кадров GoP снабжается заголовком, и полученная структура данных называется элементарным потоком данных.
Последовательность кадров при межкадровом сжатии видеоданных
Для межкадрового сжатия видеоданных выбирается группа кадров (группа изображений GOP - Group of Pictures), которая состоит из нескольких последовательных кадров, объединении вместе и обеспечивающих возможность условного доступа к каждому ее кадру. I-кадры. Группа кадров всегда начинается с опорного I-кадра (Intra Frames), т. е. с изображения, которое подвергается только внутрикадровому сжатию - ДКП. Изображение I-кадра кодируется автономно, независимо от других кадров, и внутрикадровое сжатие видео данных здесь относительно небольшое. Это нужно для того, чтобы на приемной стороне изображение I-кадра меньше подвергалось изменениям, ошибкам и обеспечивало бы тем самым высокую точность восстановления В- и Р-кадров, что очень важно. При наличии ошибок и искажений в опорных кадрах они автоматически переносятся на следующие кадры. Количество I-кадров, входящих в группу GOP, может быть самым разным - все определяется возможностям кодера и может изменяться. I-кадры играют также решающую роль при синхронизации ви деопоследовательностей и звуковых последовательностей. Структура группы кадров показана на рис. 5 и 6.
Рисунок 6 - Структура группы кадров (изображений) при передаче по каналу связи
Как видно из рис. 5, после определенного количества Р- и В- кадров снова следует опорный I-кадр. Группа кадров должна быть достаточно большой, если необходимо получить высокую степень сжатия информации. С другой стороны, чем чаще следуют I-кадры, тем выше качество изображения, но тем больший объем информации в реальном масштабе времени нужно передать по каналу связи, т. е. тем шире должна быть его частотная полоса. Считается оптимальным, если на один I-кадр приходится в среднем от 7 до 15 Р- и В-кадров. Р-кадры (Predicted Frames). Текущие кадры Р-типа кодируются или на основе предыдущего опорного I-кадра, или предыдущего опорного Р-кадра предсказанием вперед. Сравнение и получение разностной информации между кадрами происходит по макроблокам. В текущих Р-кадрах информация сравнивается макроблоками с опорным I-кадром до тех пор, пока в любом макроблоке текущего кадра не появится новый фрагмент. С этого момента кодирование переключается на внутрикадровое, т. е. применяется ДКП и формируется новый Р-кадр, но уже как опорный. В опорных Р-кадрах сокращается пространственная (за счет ДКП) и временная избыточность (за счет межкадрового сжатия относительно опорных I-кадров) и они сами используются в качестве опорных для В-кадров. В этом случае необходима высокая точность их восстановления. В Р-кадрах по сравнению с I-кадрами достижимое сжатие информации в три раза выше. В-кадры (Bidirectional Interpolated Frames) кодируются в зависимости от характера передаваемых сюжетов телевизионного изображения следующими способами: § Предсказанием следующего ближайшего В-кадра на основе предыдущего опорного I- или Р-кадра (предсказанием вперед с компенсацией движения). § Обратным предсказанием (предсказанием назад с компенсацией движения). Опорным служит следующий, соседний I- или Р-кадр. Такое предсказание реализуется при появлении больших площадей в изображении (в кадре), которых не было в предшествующем кадре. § Двунаправленным предсказанием на основе предыдущего и следующего I- или Р-кадров, т. е. используется комбинация двух предсказаний - предсказание вперед и обратное предсказание - предсказание назад с компенсацией движения. Опорными служат два кадра - один из них ближайший предыдущий I-или Р-кадр, а другой ближайший следующий I- или Р-кадр. § Внутрикадровым предсказанием без компенсации движения только на основе I-кадров. При этом в текущем кадре информация сравнивается по макроблокам с опорным I-кадром и выделяется разностная информация между ними. Такое предсказание используется при резкой смене сюжета или при больших скоростях перемещения объекта изображения.
Дата добавления: 2013-12-13; Просмотров: 840; Нарушение авторских прав?; Мы поможем в написании вашей работы! Нам важно ваше мнение! Был ли полезен опубликованный материал? Да | Нет |