Опорный кадр в H.264. Маленький параметр с большими последствиями

Опубликовано: Скачать статью в формате pdf (необходимо зарегистрироваться или авторизоваться)

Кодек H.264 де-факто стал стандартом в IP-видеонаблюдении. Преимущества межкадрового сжатия очевидны - меньше поток, меньше нагрузка на ЛВС, меньше объём архива. Вычислительные мощности серверного оборудования растут, и обрабатывать потоки в H.264 уже не проблема. Но всё ли мы знаем об H.264? Какие параметры кодека и на что влияют? Что такое опорный кадр H.264 и какое его значение оптимально? Давайте разбираться.

Структура кодека H.264

Прежде чем говорить об опорном кадре, нужно понимать структуру потока и принципы работы кодека H.264. Для начала немного теории.

Спецификация H.264 была опубликована ещё в 2003 году. Кодек стал настоящей революцией в телевидении высокой чёткости. Он позволил хранить и передавать изображение высокого разрешения с высоким качеством и битрейтом в несколько раз меньшим, чем другие форматы сжатия. Давайте рассмотрим структуру потока формата H.264.

Структура потока кодека H.264 в IP-камере

IP-камера передает полные кадры (JPEG)а, между ними передаются только кодированные изменения изображения относительно опорного кадра. В этом и заключается суть межкадрового сжатия. Полные кадры получили название I-кадры. Далее следуют P и B-кадры. P-кадры содержат информацию об изменениях относительно I-кадра. B-кадры связаны как с I-кадрами, так и с P-кадрами. Все это нацелено на более эффективное сжатие и низкий поток с высоким качеством, но за это приходится расплачиваться высокими затратами на вычислительные мощности и оперативную память сервера при декодировании.

Из схемы структуры потока можно также заметить, что при декодировании невозможно восстановить изображение из B-кадра пока не будет получен P-кадр. В связи с этим мы и видим задержку в отображении потока с IP-камеры в H.264. 

Существуют различные профили H.264, которые отличаются возможностями по кодированию. Чтобы не углубляться в теорию стоит отметить, что чем выше спецификация профиля, тем выше степень сжатия с сохранением высокого качества, но тем больше нагрузка на процессор камеры для кодирования и на ресурсы сервера по декодированию потоков. Так же, у старших профайлов больше упомянутая задержка в отображении потока с IP-устройства. Современные камеры в большинстве своем поддерживают Baseline Profile и Main Profile. Профессиональным IP-камерам доступен High Profile. 

Некоторые производители IP-камер предоставляют возможность переключаться между профилями H.264. В этом случае доступен выбор - разгрузить ресурсы сервера и уменьшить задержку с Baseline Profile, но увеличить поток и дисковое пространство для архива, либо переключиться на High Profile и эффективно сжимать видеопоток с сохранением высокого качества изображения.

Что такое "опорный кадр"?

В схеме, расположенной выше, видно, что P и B-кадры, по сути, опираются на I-кадр, т.е. содержат информацию об изменениях относительно I-кадра. Именно поэтому I-кадр и получил название "опорный кадр". Частоту, а точнее период следования опорных кадров, указывают в виде параметра GOP length (Group of Pictures), либо GOV (Group Of VOPs). Это цифровое значение указывается числом (10, 32, 64, 100, …), которое показывает сколько кадров (P и B) следует между опорными I-кадрами.

Опорный кадр в потоке H.264 в IP-видеонаблюдении

Можно встретить название для GOP length в виде термина "частота опорных кадров". Это не совсем корректно и правильнее назвать GOP length - период следования опорных кадров. Когда мы обогатились новой терминологией, можно переходить к настройке этого параметра.

Оптимальная частота следования опорных кадров

Размер опорного кадра - весомая часть потока H.264. Чем чаще следует опорный кадр (меньше значение GOP length) - тем больше битрейт, но тем легче его обрабатывать процессору видеосервера при декодировании (отображения на УРМ или работе видеоаналитики). И наоборот, чем реже опорный кадр (больше значение GOP length) - тем меньше поток, но тем больше возможные артефакты межкадрового сжатия, и тем меньше восстановленный кадр соответствует реальному изображению с IP-камеры.  При большом периоде следования опорного кадра требуются большие вычислительные ресурсы ПЭВМ и объём памяти для хранения последовательности кадров для восстановления.

Оптимальное значение периода следования опорных кадров средней сцены и типовых задач видеонаблюдения выбирает производитель IP-камеры и выставляет по умолчанию в настройках кодека. Встречаются IP-камеры со значением GOP length от 32 до 120 и более. В то же время, значение частоты опорного кадра (GOP length) оказывает значительное влияние на работу систем видеоанализа, и об этом мало кто задумывается, а точнее никто и не знает. Вот об этом поговорим подробно.

Значение опорного кадра для видеонаблюдения

Открываем секрет! 

Практически вся видеоаналитика и технологии машинного зрения в большинстве программных продуктов (VMS) на рынке систем видеонаблюдения основаны на анализе и обработке именно опорных кадров.

Это связано с тем, что для восстановления дополнительных кадров из потока H.264 для работы видеоаналитики пришлось бы задействовать значительные вычислительные ресурсы ПЭВМ.

А вот теперь представьте себе, что для темпа видеоввода 25 к/с и значения GOP=100 мы получаем опорный кадр для работы видеоаналитики каждые 4 секунды!!! Какая точность и задержка у нас будет, хотя бы в детекции движения? За 4 секунды может произойти многое, а алгоритмы видеоанализа этого могут и не заметить, т.к. опорные кадры до возникновения происшествия и после будут одинаковыми. Для проверки этой теории мы даже сняли видеоролик и разместили его на нашем YouTube канале:

На канале VIDEOМАХ регулярно публикуются обучающие видео, демонстрации работы технологий, записи мероприятий.
Подпишитесь, чтобы быть в курсе новых технологий видеонаблюдения.Подпишись на канал

Как это ни странно, но об этом практически никто не говорит. В редких рекомендациях на форумах техподдержки можно встретить совет по уменьшению частоты следования опорных кадров (уменьшения GOP) в IP-камере для решения проблем с детекцией движения. 

Самое опасное в этой ситуации, что проблемы в детекции характерны на быстродвижущихся объектах и при определенном стечении обстоятельств. А по всеми известному закону эти обстоятельства возникнут в самый неподходящий момент, и в архиве не будет информации о том, кто поцарапал директорскую машину или куда пропал портфель важного гостя. И разобраться в первоисточнике проблемы практически невозможно. Проще сказать, что это глюк ПО видеонаблюдения, хотя заказчику от этого не легче.

Некоторые производители решают эту проблему через изменение настроек IP-устройств при их подключении к VMS. Семейство продуктов ITV (Интеллект, Intellect X +) автоматически меняет значение частоты следования опорных кадров в IP-камере и устанавливает GOP=8, но это возможно только в том случае, если камера качественно интегрирована. Если же мы подключаемся по RTSP или Onvif, то этого не происходит, и в детекции возможны проблемы и пропуски. При этом следует помнить, что изменение "опорника" сильно сказывается на потоке с IP-устройства и увеличивает размер видеоархива. Как решить эту проблему мы рассказывали в статье Настройка детектора движения в ПО Интеллект

Другие производители восстанавливают недостающие кадры путем частичной декомпрессии H.264 и получения промежуточных кадров для работы видеоаналитики. Так делает, например, Macroscop. Но, как мы уже заметили, это не дается даром и приходится расплачиваться высокой нагрузкой на видеосервер. Об этом рассказывается в статье Особенности работы ПО IP-видеонаблюдения.

Какой вариант лучше - сказать сложно. Правильным будет в конкретной ситуации и задаче выбрать оптимальное решение, опираясь на знание и понимание всех нюансов современных технологий и возможностей программных продуктов. И эти знания мы стараемся вам доносить в простой и понятной форме через информационные статьи, видеоролики на нашем канале, вебинары и семинары.

Резюме

Внимательно изучая значение и влияние различных параметров IP-устройств, открываешь для себя много интересного, а порой и крайне важного для работы систем видеонаблюдения. Кто бы мог подумать, что незаметный GOP в IP-камере может оказывать столь существенное влияние на такие базовые функции системы видеонаблюдения, как запись видеоархива по детекции движения.

В построении систем видеонаблюдения нет несущественных параметров. В определенных ситуациях любая функция или настройка может стать определяющей. Специалисты компании Видеомакс постоянно изучают возможности программных продуктов и функционал современных IP-камер на реальных стендах, изучая спецификации производителей и опираясь на фундаментальные принципы и знания, полученные в лучших технических вузах страны.

Результатами этих исследований мы делимся со своими партнёрами, помогая создавать эффективные системы видеонаблюдения, которые не подведут и будут долгие годы решать поставленные заказчиком задачи. Линейка оборудования VIDEOMAX вобрала в себя все последние достижения в компьютерной индустрии и оптимизирована для обработки видеопотоков с IP-камер в системах видеонаблюдения.

Оборудование VIDEOMAX

Каждый специалист инженерного отдела компании Видеомакс - это гуру в системах видеонаблюдения. По любому вопросу вы можете проконсультироваться у сотрудников отдела продаж или инженерного отдела по телефону +7(495)640-55-46 или отправить вопрос на email: info@videomax.ru

Впереди ещё много полезного для инженеров и проектировщиков систем видеонаблюдения. Зарегистрируйтесь на нашем сайте, чтобы оперативно получать новости о всем самом важном, что происходит на рынке систем безопасности.

Возврат к списку


Комментарии к статье:
Загрузка комментариев...
Рекомендуем прочитать

Мы собираем статистику о посещениях сайта, cookie, данные об IP-адресе и местоположении. Если Вы не хотите, чтобы эти данные обрабатывались нами, Вы должны покинуть сайт.