Компьютерное цифровое видео



Скачать 88.09 Kb.
Pdf просмотр
Дата14.02.2017
Размер88.09 Kb.
Просмотров213
Скачиваний0

КОМПЬЮТЕРНОЕ ЦИФРОВОЕ ВИДЕО
Компьютерное цифровое видео представляет собой последовательность цифровых изображений и связанный с ними звук. Элементы видео хранятся в цифровом формате.
Существует две линии развития компьютерной обработки видео, которые постоянно сближаются, но никогда, видимо, не сблизятся:

студийные системы телевидения, включающие специальное видео- оборудование, мощные компьютеры и дорогостоящие программы для создания профессиональных видеоклипов (полноэкранных с высоким разрешением, полнокадровых, 25-30 кадров в секунду, полноцветных – True Color) и монтажа видеопрограмм;

системы мультимедиа для ПК с использованием коротких видеоклипов и с соответствующими средствами их создания, возможно, с ограничениями на размер кадра, количество цветов и на кадровую частоту.
Основные характеристики цифрового видео
Видеосигнал получается при построчном сканировании прямоугольного цветного изображения "трёхствольной" электронной RGB-пушкой. Сканируемое изображение представляет собой растр, т.е. прямоугольную сетку пикселов, с отношением числа пикселов по горизонтали к числу пикселов по вертикали 4:3 (в системах телевидения высокой чёткости – HDTV – это отношение равно 16:9). Таким образом, видеосигнал содержит последовательности полукадров (точнее, пикселов в порядке сканирования), гасящих и синхронизирующих импульсов и аудиосигнала, синхронизированного с видеопотоком.
Цифровое видео характеризуется четырьмя основными факторами: частота кадра (Frame
Rate), экранное разрешение (Spatial Resolution), глубина цвета (Color Resolution) и качество изображения (Image Quality).
Частота кадра (Frame Rate). Стандартная скорость воспроизведени видеосигнала -- 30 кадров/с (для кино этот показатель составляет 24 кадра/с). Каждый кадр состоит из определенного количества строк, которые прорисовываютс не последовательно, а через одну, в результате чего получается два полукадра, или так называемых "поля". Поэтому каждая секунда аналогового видеосигнала состоит из 60 полей (полукадров). Такой процесс называетс interlaced видео.

Сканирование изображения на экране монитора и телевизора
Для создания видимости непрерывного движения частота смены кадров должна превышать 24 кадра в секунду (к/сек). Для устранения мерцания экрана частота смены кадров должна происходить не менее 50 раз в секунду. Чтобы устранить мерцание и не увеличивать при этом скорость сканирования и, следовательно, объём передаваемой информации, в телевидении применяют так называемую чересстрочную развертку, при которой сначала сканируются нечётные строки (первый полукадр), а затем чётные
(второй полукадр). При показе с частотой 25 к/сек смена полукадров происходит 50 раз в секунду и мерцание незаметно. Монитор компьютера для прорисовки экрана использует метод "прогрессивного сканирования" (progressive scan), при котором строки кадра формируются последовательно, сверху вниз, а полный кадр прорисовываетс 30 раз каждую секунду. Разумеется, подобный метод получил название non-interlaced видео. В этом заключается основное отличие между компьютерным и телевизионным методом формирования видеосигнала.
Действующие видеостандарты
NTSC
(США,
Япония)
PAL
(Англия,
Германия)
SECAM
(Франция,
Россия)
HDTV VHS
S-
VHS
Число строк в кадре 525 625 818 1150 250 400
Формат кадра 4:3 4:3 4:3 16:9 4:3 4:3
Частота полукадров
60 50 50 50
Ширина полосы сигналов яркости/цветности в МГц
4,2/1,5/0,6 5/1,5/1,5 6/1,5/1,5 27 3-
3,8 5
Скорость передачи цифровой информации в Мбит/сек
128,7 159,6 158,6 90
"Уложить" видеосигнал (поток пикселов) в отведённую полосу удаётся, основном, благодаря
1. переходу от RGB к YUV,

2. фильтрации части высоких частот сигнала яркости Y, что приводит к едва заметной размытости в быстро меняющихся участках кадра,
3. фильтрации значительно большей части высоких частот сигналов цветности U и V, основанной на меньшей чувствительности глаза к изменению цвета, чем к
изменению яркости.
Оцифровка видеосигнала обычно происходит с 4-кратной частотой по отношению к наибольшей частоте сигнала, причём разрядность квантования может выбираться
разной для сигналов яркости и цветности (напр., 9 и по 7). Обычные видеоплаты, выполняя оцифровку, не дают пользователю влиять на эти параметры в силу высокой сложности применяемых методов, учитывающих все особенности структуры видеосигнала. Получаемый в итоге цифровой поток приведен в предыдущей таблице.
Ясно, без сжатия этого потока работать с ним на компьютере невозможно. Сжатие осуществляет сама видеоплата, используя описанные ниже методы.
Глубина цвета (Color Resolution). Этот показатель является комплексным и определяет количество цветов, одновременно отображаемых на экране. Компьютеры обрабатывают цвет в RGB-формате (красный-зеленый-синий), в то время как видео использует и другие методы. Одна из наиболее распространенных моделей цветности для видеоформатов --
YUV. Каждая из моделей RGB и YUV может быть представлена разными уровнями глубины цвета (максимального количества цветов).
Теория формирования цветовых ощущений называется цветовой моделью. Здесь рассматриваются цветовые модели

RGB
, используемая в цветных электронно-лучевых трубках мониторов и телевизоров,

YUV
, используемая в каналах телевещания и для сжатия графики.
Установлено, что воспринимаемые нами цвета (точнее, цветовые оттенки), могут быть получены смешением трёх основных цветов – красного, синего и зелёного – в пропорции, определяемой соотношением интенсивностей (т.е. яркостей) каждой составляющей. При смешении этих цветов в равной пропорции получается оттенок серого цвета, яркость которого может изменяться от чёрного до белого. Такая модель получения цвета называется цветовой моделью RGB (от англ. названий основных цветов red, green и blue).
В ней каждый цвет характеризуется тремя значениями яркости составляющих основных цветов, которые обозначаются R, G и B, соответственно.
В модели RGB при смешении не основных цветов
складываются яркости их одинаковых основных составляющих. Такая модель называется аддитивной.
Она соответствует нашему восприятию источников
освещения (монитор компьютера, телевизионный экран).
Другая широко применяемая цветовая модель носит название модель HSB. В ней цвет характеризуется тоном (англ. Hue), насыщенностью (Saturation) и яркостью (Brightness). Здесь тон цветового оттенка задаётся на диаграмме углом, на который нужно
повернуть против часовой стрелки луч, выходящий из центра в правый нижний угол (тон красного равен 0, желтого 60, зелёного 120, синего 270 градусов).
В телевидении приняты стандарты, обеспечивающие передачу цветов из так называемого
цветового треугольника. Для разных телевизионных стандартов (NTSC, PAL, SECAM и др.) эти треугольники немного отличаются друг от друга.
В цветовой модели YUV эти величины рассматриваются как три составляющие цветового оттенка. В телевидении перед передачей видеосигнала в эфир он преобразуется из RGB в
YUV по приведенным выше формулам, а в телеприёмниках происходит обратное преобразование. Составляющие U и V ответственны за передачу цвета.
Необходимо было преобразовывать RGB-сигнал в один сигнал яркости изображения Y.
Наилучший результат получается при преобразовании по формуле
Y = 0,299 R + 0,587 G + 0,114 B, где R, G и B – яркости соответствующих цветовых составляющих, а коэффициенты при них отражают физиологические особенности нашего зрения.
Вместе с сигналом яркости Y были введены ещё так называемые сигналы цветности U и
V:
U = B – Y, V = R – Y.
Для цветовой модели RGB обычно характерны следующие режимы глубины цвета: 8 бит/пиксел (256 цветов), 16 бит/пиксел (65,535 цветов) и 24 бит/пиксел (16,7 млн. цветов).
Для модели YUV применяются режимы: 7 бит/пиксел (4:1:1 или 4:2:2, примерно 2 млн. цветов), и 8 бит/пиксел (4:4:4, примерно 16 млн. цветов).
Экранное разрешение (Spatial Resolution). Еще одна характеристика -- экранное разрешение, или, другими словами, количество точек, из которых состоит изображение на экране. Так как мониторы PC и Macintosh обычно рассчитаны на базовое разрешение в
640 на 480 точек (пикселей), многие считают, что такой формат является стандартным. К сожалению, это не так. Прямой связи между разрешением аналогового видео и компьютерного дисплея нет.
Стандартный аналоговый видеосигнал дает полноэкранное изображение без ограничений размера, так часто присущих компьютерному видео. Телевизионный стандарт NTSC
(National Television Standards Committee), разработан Национальным комитетом по телевизионным стандартам США. Используемый в Северной Америке и Японии, он предусматривает разрешение 768 на 484. Стандарт PAL (Phase Alternative), распространенный в Европе, имеет несколько большее разрешение -- 768 на 576 точек.
Поскольку разрешение аналогового и компьютерного видео различается, при преобразовании аналогового видео в цифровой формат приходится иногда масштабировать и уменьшать изображение, что приводит к некоторой потере качества.
Качество изображения (Image Quality). Последняя, и наиболее важна характеристика -- это качество видеоизображения. Требования к качеству зависят от конкретной задачи.
Иногда достаточно, чтобы картинка была размером в четверть экрана с палитрой из 256-
ти цветов (8 бит), при скорости воспроизведени 15 кадров/с. В других случаях требуется полноэкранное видео (768 на 576) с палитрой в 16,7 млн цветов (24 бит) и полной кадровой разверткой (24 или 30 кадров/с).
Методы сжатия видеоинформации
С точки зрения времени компрессии/декомпрессии различают симметричные и
асимметричные методы. В симметричных методах время компрессии (по числу операций) примерно совпадает с временем декомпрессии. В асимметричных методах компрессия требует значительно больше операций (в десятки и сотни раз), чем декомпрессия. Асимметричные методы часто дают большую степень сжатия, чем симметричные при одинаковом качестве результата. Под качеством здесь обычно понимают степень сохранения информации, существенной для её восприятия.
С точки зрения сохранения информации различают методы кодирования
• без потери информации
(Алгоритм Хаффмана основан на статистике повторяемости, Алгоритм Лемпеля-Зива-Уэлча (LZW) отличается от алгоритма
Хаффмана кодированием не отдельных элементов, а последовательностей, RLE-
алгоритм (Run Length Encoding) кодирует последовательности одинаковых элементов, указывая элемент и длину последовательности) и
• с потерей информации
. (Алгоритм JPEG, Метод WIC (Wavelet Image
Compression, Фрактальное сжатие. Термин "фрактальный" ввел
Б. Мандельброт. Практическое применение для сжатия изображений нашли фракталы на основе систем итеративных функций (IFS - Iterated Function System).
IFS строится для каждого изображения (автоматически) с таким расчётом, чтобы при их повторяющемся выполнении изображение постепенно уточнялось. Чем больше выполняется итераций, тем лучше его качество. Коэффициент сжатия достигает 10000:1, но процесс сжатия (т.е. построение IFS) длится долго)
В первых уменьшается информационная избыточность, а во вторых стараются потерять прежде всего только ту информацию, к которой приёмник (например, человек) не
чувствителен или мало чувствителен. Кодирование с потерей информации применяется тогда, когда полное сохранение информации не даёт нужной степени компрессии.
Для уменьшения объема цифровых видеофайлов используют методы сжатия данных, которые базируются на математических алгоритмах устранения, группировки и усреднения схожих данных, присутствующих в видеосигнале. Существует большое количество разнообразных алгоритмов сжатия, включая Compact Video, Indeo, Motion-
JPEG, MPEG, Cinepak, Sorenson Video. Все они могут быть разделены на следующие категории.
Обычное сжатие (в режиме реального времени). Система оцифровки видеосигнала с одновременным сжатием. Для качественного выполнения этих операций требуются высокопроизводительные специальные процессоры. Большинство плат ввода/вывода видео на PC пропускают кадры, что нарушает плавность изображения и его синхронизацию со звуком.
Симметричное сжатие. Оцифровка и запись производится при параметрах последующего воспроизведения (например, разрешение 640 х 480 при скорости 30 кадров в секунду).

Асимметричное сжатие. Обработка выполняется при существенных затратах времени.
Так, отношение асимметричности 150:1 указывает, что 1 минута сжатого видео соответствует затратам на сжатие в 150 минут реального времени.
Сжатие с потерей или без потери качества. Все методы сжатия приводят к некоторой потере качества. Существует только один алгоритм (разновидность Motion-JPEG для формата Kodak Photo CD), который выполняет сжатие без потерь, однако он оптимизирован только для фотоизображений и работает с коэффициентом 2:1.
Коэффициент сжатия — это цифровое выражение соотношения между объемом исходного и сжатого материала. Качество видео зависит от используемого алгоритма сжатия, параметров видеоплаты оцифровщика, конфигурации компьютера и даже от программного обеспечения. Для MPEG сейчас стандартом считается соотношение 200:1.
Различные варианты Motion-JPEG работают с коэффициентами от 5:1 до 100:1, хотя уже при уровне 20:1 трудно добиться нормального качества изображения.
Существует большое разнообразие алгоритмов сжатия, включая PLV, Compact Video,
Indeo, RTV и AVC, но только Motion JPEG (Joint Photographic Experts Group), MPEG-1 и
MPEG-2 признаны международными стандартами для сжати видео. обеспечить непрерывную передачу видео со скоростью 21 Мбайт/с (требования CCIR 601-
- признанного в мире стандарта цифрового телевидения
MPEG (Moving Picture Experts Group) - объединенный комитет Интернациональной
Организации по Стандартизации (ISO) и Интернациональной Электротехнической
Комиссии (IEC). Эта группа экспертов встречается примерно четыре раза в год чтобы разработать и утвердить стандарты на сжатие цифрового видео и звука. Основной критерий, который обсуждается комитетом MPEG - это интенсивность потока сжатых данных, определяемая в зависимости от современного уровня компьютерных технологий и сферы применения данного формата.
Типы и технологиии компьютерного видео
Система DVI (Digital Video Interactive) разработана фирмой RCA и General Electric, затем права приобрела фирма Intel. Здесь использована модель YUV с 9-ю битами на один пиксел. Прореживание осуществлялось по компонентам цветности 4:1:1, а дальше – алгоритм Хаффмана. Коэффициент сжатия достигает 25:1. Звук сжимается по алгоритму
ADPCM
. Техническая основа – спецпроцессоры i750 на видеоплате – допускает обработку в реальном масштабе времени:

Pixel Processor 82750PB – компрессия, декомпрессия, обработка спецэффектов;

Display Processor 82750DB – преобразование форматов и цветов, интерполяция пикселов, синхронизация.
INDEO (INtel viDEO) – продолжение DVI. Возможность программной декомпрессии.
Кодек INDEO:
RGB YUV прореживание 4:1:1
внутри и межкадровое сжатие обрезанием повторяющихся участков RLE) VCE (вариант Хаффмана). Возможность оцифровки видео на ПК и создания видеофайлов в памяти компьютера с последующим их проигрыванием на экране монитора впервые обеспечили технологии фирм IBM и Intel. В
1992 году этими фирмами была разработана программная видео технология Indeo (от Intel
Video), обеспечивающая:

захват – оцифровка, сжатие, запоминание в
AVI-файл и одновременное воспроизведение на компьютере – видеоизображения и звука из видеосигнала в
реальном времени (с помощью видеоплаты с процессорами линии i750);


воспроизведение AVI-файла на обычном ПК с с процессором i386, i486 без
специального оборудования (видеоплаты, спецпроцессоров; не мешает даже отсутствие звуковой платы, но если она есть, то показ видео будет сопровождаться звуком).
Эта технология включена в программные пакеты MS Video for Windows, QuickTime for
Windows, Apple's QuickTime.
MS Video for Windows – новый формат цифрового видео
AVI
(многодорожечный) был разработан в 1992 г.
Кодеки: Video1; RLE; INDEO; Cinepak; Motion JPEG (каждый кадр ключевой).
Существуют две основные технологии для воспроизведения видео на компьютере. Одна из них — QuickTime, разработанная фирмой Apple. Начиная с версии 3 она работает под
Windows и использует для вывода на экран технологию DirectDraw, обеспечивая поддержку графических ускорителей. Для воспроизведения звука используются возможности DirectSound. Формат файлов QuickTime имеет расширение MOV. Другая технология — Video for Windows фирмы Microsoft — реализуется с помощью DirectX
Media 5.1, в которой собрано несколько мультимедиа-технологий. В частности,
DirectShow заменила Active Movie в поддержке разнообразных аудио- и видеоформатов.
Стандартным форматом файлов служит AVI.
AVI - Audio Video Interleaved, файловый формат, введенный фирмой Microsoft для использования систем работы с видеоизображениями в среде Windows. Этот формат чередует секторы с видео данными вместе с секторами со звуковыми данными таким образом, что видеоплеер мог бы поддерживать минимальную буферизацию данных.
Широкое распространение формат AVI получил после выхода Wideo for Windows для
Windows 3.1 в ноябре 1992 года.
Несмотря на то что все большее распространение получает формат MPEG (MPEG стандарты включают MPEG-1, MPEG-2, MPEG-4, и MPEG-7), AVI продолжает оставаться наиболее распространенным форматом для видео/аудио данных на PC. В области ввода и редактирования видео AVI остается вне конкуренции.
Формат AVI является специальным случаем формата RIFF ( Resource Interchange File
Format). RIFF - универсальный формат для обмена типов данных мультимедиа, который был совместно разработан Microsoft и IBM. Фактически, RIFF - аналог формата IFF, разработанного Electronic Arts в 1984 году.
Аудио и видео последовательности в AVI файле не содержат временных меток и не создают индексы. Данные упорядочиваются во времени последовательно, согласно их порядку в AVI файле. Приложение (видеоплеер) должно отображать кадры видео согласно частоте кадров кадров, обозначенной в заголовках файла и аудиопоток согласно частоте дискретизации, обозначенной в заголовках. Звуковые данные - типично 8 или 16 бит PCM, стерео или моно, с частотой дискретизации 11, 22, или 44.1 КГЦ. Традиционно использовался несжатый Windows PCM звук.

Видеокарты

Кроме обычных видеокарт, предназначенных для вывода графической информации на монитор компьютера (их уместнее называть графическими адаптерами), для работы с видео используются специальные видеокарты (видеоплаты), выполняющие функции, перечисленные ниже. Следует иметь в виду, что воспроизведение видеофайлов на экране монитора во многих случаях не требует специальных видеокарт.

TV-тюнеры (преобразователи TV-VGA) имеют антенный видеовход и преобразуют принимаемый вещательный TV-сигнал в VGA-сигнал (RGB-сигнал), направляемый непосредственно в окно на экране монитора, как в телевизоре. Это окно, создаваемое программным обеспечением тюнера, перекрывает графическую информацию, выводимую другими программами. Поэтому такое видео ещё называют оверлейным или "живым".

Фрейм-грабберы (платы захвата) осуществляют оцифровку видео в следующих режимах: o
Захват отдельных кадров o
Захват последовательностей в реальном времени без сжатия сжатие в реальном времени.

VGA-TV (декодеры или платы вывода) – преобразование цифрового изображения из видеопамяти компьютера в аналоговый RGB-телесигнал для передачи на линейный вход телевизора или видеомагнитофона.

MPEG-плейеры – аппаратная декомпрессия MPEG-видеофайлов (применяется при недостаточной производительности центрального процессора).

Мультимедиа-акселераторы предоставляют программам обработки видео возможность аппаратной реализации некоторых функций: o преобразование YUV-RGB и обратно o цифровая фильтрация, интерполяция и масштабирование видео o цифровая компрессия и/или декомпрессия o управление наложением графики и видео и др.
Те или иные комбинации этих функций реализуются на различных видеоплатах, а также на графических акселераторах и даже на "материнских" платах.
Программное обеспечение
Quick Editor
(
www.wild.ch/quickeditor/
). Это условно-бесплатный редактор, осуществляющий основные операции с видеоизображением в формате MOV и AVI быстро и просто. Он представляет собой хорошее и доступное средство для работы с небольшими видеопоследовательностями. Для работы с этим редактором на вашем компьютере должна быть установлена программа просмотра QuickTime версии 3 и выше.
Конечно, данный редактор не заменит средств для профессионалов, но для многих небольших проектов будет крайне полезен.
Adobe Premiere
(
www.adobe.com/products/premiere/main.html
).
Наиболее распространенная программа редактирования цифрового видео. Обладает удобным интуитивно понятным интерфейсом. Поддерживает несколько видео- и звуковых каналов, содержит набор переходов между кадрами, позволяет синхронизировать звук и изображение. Поддерживает файлы форматов MOV и AVI. Подключение дополнительных модулей (plug-ins) от независимых производителей расширяет возможности программы.


Поделитесь с Вашими друзьями:


База данных защищена авторским правом ©nethash.ru 2017
обратиться к администрации

войти | регистрация
    Главная страница


загрузить материал