53
Методы сопоставления видео Глазистов Иван CS MSU Graphics & Media Lab (Video Group)

Методы сопоставления видео

Embed Size (px)

DESCRIPTION

 

Citation preview

Page 1: Методы сопоставления видео

Методы сопоставления видео

Глазистов Иван

CS MSU Graphics & Media Lab(Video Group)

Page 2: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)2

Оглавление

Введение

Где используются методы сопоставления

видео?

Основные подходы к описанию видео

Алгоритмы сопоставления

Заключение, планы

Page 3: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Где используются методы сопоставления видео?

Поиск дубликатов в базе фильмов

Генерация сценариев для быстрого

просмотра

Поиск фрагментов в базе

3

Page 4: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)5

Оглавление

Введение

Алгоритмы сопоставления

Алгоритм GMLabVideoGroup

Сопоставление строк

Иерархический метод

Поиск оптимального сопоставления в графе

Заключение, планы

Page 5: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

6

Алгоритм GMLabVideoGroup

Основные этапы:

1. Описание видео:

a. Разбиение видео на сцены

b. Построение дерева сцен

2. Сравнение фильмов

Page 6: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

7

Алгоритм GMLabVideoGroup

Разбиение на сцены

1. Каждый кадр описываемой последовательности

разбивается на блоки 32x32 пиксела

2. Для каждого блока строится гистограмма

распределения яркости

},,1),,({),,( mkyxhtyxН k

где ),( yx координата блока в кадре,

64m колличество уровней яркости в гистограмме.

Page 7: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Алгоритм GMLabVideoGroup

Разбиение на сцены

3. Вычисляется мера разности соседних кадров

},,1),,,()1,,({)1,,( mktyxhtyxhtyxdH kk

,)))1((()1(,

yx

tdHGStDiff где )(G низкочастотный фильтр, .)(1

m

k

khHS

:)(tH :)1( tH :)1( tdH :))1(( tdHG

Page 8: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

9

Алгоритм GMLabVideoGroup

Разбиение на сцены

4. Для более устойчивой работы в условиях стабильно высоких разностей кадров массив обрабатывается высокочастотным фильтром:

}.1,1,1,1,8,1,1,1,1{ F

5. Определение смен сцены:

Если ,))(( ThtDiffF i тогда it положение смены сцены.

При построении дерева учитываются только разности, удовлетворяющие этому условию.

Th некоторый порог.

Page 9: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Алгоритм GMLabVideoGroup

Построение дерева сцен

-1000000

0

1000000

2000000

3000000

4000000

5000000

6000000

7000000

8000000

9000000

0 20 40 60 80 100

dif

fere

nc

e

frames

pos = 38diff = 1,12

1. Находится максимальное

значение в массиве

разностей

2. Строится вершина дерева

3. Для правой и левой частей массива применяется п.1

Page 10: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

11

Алгоритм GMLabVideoGroup

Сравнение фильмов

Основные этапы:

1. Позиционирование короткого фильма более длинном

2. Построение оценки разности

3. Выбор наилучшего сопоставления

4. Построение дерева наилучшего кандидата

5. Обратный поиск

6. Усреднение оценок прямого и обратного поиска

Page 11: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

12

Сравнение фильмовПозиционирование

1. Позиционирование короткого фильма более длинном

a) Выбирается доминирующая смена

сцены

b) Составляется вектор сцен кандидатов

(обход в ширину)

c) Для каждой сцены кандидата координаты смен сцен сопоставляются и выполняется п.2

,ThDD i Если то сцена помечается как кандидат

D1

D3

D7D6

D2

D5D4

D

Page 12: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)13

Сравнение фильмовОценка разности

2. Построение оценки разности

a) Находится смещение дочерней по отношению к доминирующей смены сцены(D’) в длинном фильме

D

D’’D’

b) Производится поиск близких по координате и силе смен сцены, начиная с корня

c) Выбирается лучший кандидат по следующей мере:

,)'()'(),'( 22

iii ttDDDDDiff

где

it

't

предположительное положение D’.

положение

коэффициент, выравнивающий влияние положения и силы вершины кандидата

D1

D3

D7D6

D2

D5D4

D’

Page 13: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

14

Сравнение фильмов

Оценка разности D

D’’D’

d) Та же самая процедура повторяется для всех вершин короткого фильма, глубина которых <5

SD

_d

iffe

ren

ce

Position

D’

SD_threshold

Pos_threshold

t’

Found

nothing

e) Если не найдено близких вершин полагаем, что искомая вершина лежит на границе

f) Если найдено <3 вершин, то полагаем, что поиск неуспешен

g) Вычисляем разность:

.),'(),( 1 k

ikk DDDiffDDDiff

Page 14: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

15

Сравнение фильмов

Обратный поиск

3. Выбор наилучшего сопоставления

4. Построение дерева наилучшего кандидата

5. Обратный поиск

6. Усреднение оценок прямого и обратного поиска

a) «Разбор» дерева длинного фильма

b) Получения массива смен сцены

c) Построение поддерева

Оценка разности окончательно:

.2/)))',((min)),(((min),( 1 ss

kk

ji DDCrossDiffDDDiffVVDiff

Page 15: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

16

Алгоритм GMLabVideoGroup

Характеристики алгоритма

Время построения индекса:

Скорость поиска:

Ограничения:

llO ),( длина фильма.

),,max()),log(( qpmmmO

qp, колличества сцен в сравниваемых фрагментах

Корректно работает только с достаточно большими видео, не справляется с перемонтированным видео

Page 16: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

17

Алгоритм GMLabVideoGroup

Результаты

Алгоритм тестировался на базе из ~900 фильмов, разбитых на 5 групп.

Номер группыРазмер группы

(Mb)

Размер индекса

(Mb)

Размер после

сжатия (Mb)

1 7170 4,6 0,86

2 870 1,0 0,18

3 2690 0,9 0,18

4 3050 2,5 0,43

5 480 0,74 0,05

Объединенная

группа13900 9,74 1,7

Размер групп фильмов и их описаний

Page 17: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

18

Алгоритм GMLabVideoGroup

Результаты

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Recall

Pre

cis

ion

Group 2

Page 18: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

19

Алгоритм GMLabVideoGroup

Результаты

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Recall

Pre

cis

ion

Group 3

Page 19: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

20

Алгоритм GMLabVideoGroup

Результаты

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Recall

Pre

cis

ion

Group 4

Page 20: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Алгоритм GMLabVideoGroupРезультаты

21

0 0.2 0.4 0.6 0.8 10

0.1

0.2

0.3

0.4

0.5

0.6

0.7

0.8

0.9

1

Recall

Pre

cis

ion

United Group

Page 21: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)22

Оглавление

Введение

Алгоритмы сопоставления

Алгоритм GMLabVideoGroup

Сопоставление строк

Иерархический метод

Поиск оптимального сопоставления в графе

Заключение, планы

Page 22: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

23

Сопоставление строк

"Detection of video sequences using compact signatures ",T.C. Hoad and J. Zobel, ACM Transactions on InformationSystems (TOIS), 24(1):1-50, January 2006.

Основная идея:

Представить видеопоследовательность в виде строки символов и свести задачу сопоставления видео к задаче сопоставления строк

Основная проблема:

Грамотный выбор весовой функции для сопоставления строк

Page 23: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

24

Сопоставление строк

"Detection of video sequences using compact signatures ",T.C. Hoad and J. Zobel, ACM Transactions on InformationSystems (TOIS), 24(1):1-50, January 2006.

Предложено четыре метода:

1. Представление фильма в виде массива длин сцен

2. Видео - массив покадровых изменений яркости

3. Сохранение длины вектора глобального движения от кадра к кадру

4. Комбинированный метод

У всех методов есть общая часть – алгоритм сопоставления строк

Page 24: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Сопоставление строкСтратегия поиска

25

string1

string2

Вычисление меры сходства:

)),((max),(1

n

i

pq

ik

pq kissScVVSim

На каждом шаге алгоритма окно поиска сдвигается на 1 кадр

p

kis

q

is

Page 25: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Сопоставление строкВесовая функция

26

1. Бинарная весовая функция

2. Линейная весовая функция

3. Categorical scoring

Обозначение: ),( pq

jissk

,,5

,20),(

иначе

ssssSc

pq

ipq

iki

ki

string1

string2

p

kis

q

is

,2

320),(

pq

i kissSc

4,7

4,33

2,1,8

0,13

),(

pq

i kissSc

Page 26: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Сопоставление строкВесовая функция

27

4. Кубическая весовая функция

5. Mean-weighted scoring

Обозначение: ),( pq

jissk

string1

string2

p

kis

q

is

,50

)10(20),(

3

pq

i kissSc

,)2(2

),(q

pq

im

ssScki

n

i

q

q ism

1

.

Page 27: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

28

Сопоставление строк

Длина сцены

"Detection of video sequences using compact signatures ",T.C. Hoad and J. Zobel, ACM Transactions on InformationSystems (TOIS), 24(1):1-50, January 2006.

Алгоритм:

1. Построение для каждого кадра 48-уровневой гистограммы

распределения яркости

2. Сравнение гистограмм:

.|)()1(|))1(()1(1

m

k

kk ththtdHStDiff

},,1),()1({)1( mkththtdH kk

3. Применение адаптивного порога (не описан)

4. Получение описание фильма вектором длин сцен

Page 28: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

29

Сопоставление строкДлина сцены

a) «Грубое сопоставление» фрагментов

Недостатки:

b) Применимо только достаточно «длинных» фильмов

Достоинства:

a) Стабильная работа с искаженным видео

b) Короткое описание фильма (~5kb/h)

c) Быстрый поиск

c) Более чувствителен к ошибкам детектора сцен, чем GMLabVideoGroup

"Detection of video sequences using compact signatures ",T.C. Hoad and J. Zobel, ACM Transactions on InformationSystems (TOIS), 24(1):1-50, January 2006.

)))((( pqpO

Page 29: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)30

Сопоставление строкИзменения яркости (Color-shift Signature)

"Detection of video sequences using compact signatures ",T.C. Hoad and J. Zobel, ACM Transactions on InformationSystems (TOIS), 24(1):1-50, January 2006.

Строится гистограмма распределния яркости для

каждого кадра

Сохраняется разность

гистограмм соседних кадров

Алгоритм:

Page 30: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)31

Сопоставление строкИнформация о движении (Centroid Signature)

"Detection of video sequences using compact signatures ",T.C. Hoad and J. Zobel, ACM Transactions on InformationSystems (TOIS), 24(1):1-50, January 2006.

2. Информация о движении

Находятся средние координаты 5% самых светлых/темных пикселов

Сохраняется евклидова разность векторов соседних кадров

Page 31: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Сопоставление строк Комбинированный метод

"Detection of video sequences using compact signatures ",T.C. Hoad and J. Zobel, ACM Transactions on InformationSystems (TOIS), 24(1):1-50, January 2006.

Page 32: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

33

Сопоставление строкМетоды покадрового описания видео

Недостатки:

Достоинства:

a) Чувствительность к искажениям видео

b) Длинное описание фильма

c) Медленный поиск

a) Возможность поиска коротких фрагментов

b) Достоверность поиска

Page 33: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Сопоставление строкРезультаты

34

1. Тестирование весовых функций

База данных: 170 минут (1,9 Gb) broadcast-видео.

Работа проверялась на 18 запросах, имеющих в базе много дубликатов

Тестовый набор:

Page 34: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Сопоставление строкРезультаты

35

2. Тестирование indecision-points

Page 35: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)36

Оглавление

Введение

Алгоритмы сопоставления

Алгоритм GMLabVideoGroup

Сопоставление строк

Иерархический метод

Поиск оптимального сопоставления в графе

Заключение, планы

Page 36: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

37

Иерархический метод

Xiao Wu, Alexander G. Hauptmann and Chong-Wah Ngo“Practical Elimination of Near-Duplicates from Web Video Search”ACM International Conference on Multimedia, Sep. 2007

ЗапросРазбиение на

сцены

Выбор

ключевых

кадров

Построение

глобальных

характеристик

Уточненный

поиск

Построение

локальных

характеристик

Сужение поискаРезультат

Page 37: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

38

Иерархический метод

Построение глобальных характеристик

Xiao Wu, Alexander G. Hauptmann and Chong-Wah NgoPractical Elimination of Near-Duplicates from Web Video SearchACM International Conference on Multimedia, Sep. 2007

,1

),,...,,(1

21

n

j

ijim hn

ssssVS

.)(),()|(1

2

m

k

kkjiji yxVSVSdVVR

Page 38: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

40

Иерархический метод

Уточненный поиск

Xiao Wu, Alexander G. Hauptmann and Chong-Wah NgoPractical Elimination of Near-Duplicates from Web Video SearchACM International Conference on Multimedia, Sep. 2007

n – длина фильма в базе,

df – разность длин двух видео,

w – размер окна поиска.

aV – фильм-запрос,

aV – фильм из базы,

Page 39: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

41

Иерархический метод

Тестирование

Xiao Wu, Alexander G. Hauptmann and Chong-Wah NgoPractical Elimination of Near-Duplicates from Web Video SearchACM International Conference on Multimedia, Sep. 2007

Размер базы 12970 фильмов

База построена на основе 24 YouTube-запросов

При тестировании для каждого фильма-запроса строились графики

Recall/Precision для разных значений порога сходства фильмов

Precision – процент неправильно определенных пар.

Recall – процент определенных правильно фильмов от общего

колличества похожих фильмов в группе в группе

Page 40: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

42

Иерархический метод

Выводы

Xiao Wu, Alexander G. Hauptmann and Chong-Wah NgoPractical Elimination of Near-Duplicates from Web Video SearchACM International Conference on Multimedia, Sep. 2007

Недостатки:

Достоинства:

a) Нестабильность при работе с искаженным видео

b) Может искать только близкие по длине фрагменты

c) Медленный поиск

a) В теории может искать незначительно перемонтированные фрагменты

Page 41: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)43

Оглавление

Введение

Алгоритмы сопоставления

Алгоритм GMLabVideoGroup

Сопоставление строк

Иерархический метод

Поиск оптимального сопоставления в графе

Заключение, планы

Page 42: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

44

Поиск оптимального

сопоставления в графе

Алгоритм:

1. Разбиение на сцены

2. Выделение ключевых кадров на основе

анализа движения

3. Для каждого ключевого кадра строится

гистограмма распределения яркости

«Clip-based Similarity Measurefor Hierarchical Video Retrieval», Yuxin Peng,hong-Wah Ngo, MIR’04, October 15–16, 2004, New York, New York, USA

Page 43: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Поиск оптимального сопоставления в графе

45

4. Строится мера сходства сцен: )},(ˆ),({2

1),( jijiji ssssssSim

),,(max),(,..}2,1{,..},2,1{

jqipqp

ji rrIntersectss

),(ˆ ji ss второе по величине значение этого максимума

5. Строится двудольный граф сопоставления двух фильмов

},..,,{},,..,,{ 2121 qp yyyYxxxX описания двух фильмов

),,( EYXG двудольный граф, }),(|),{( ThyxSimyxE jiji

«Clip-based Similarity Measurefor Hierarchical Video Retrieval», Yuxin Peng,hong-Wah Ngo, MIR’04, October 15–16, 2004, New York, New York, USA

Page 44: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Поиск оптимального сопоставления в графе

46

6. Выделение однозначного двудольного подграфа

1)

2) Если перебраны все вершины ,то в содержется искомый граф

X3) Пусть - ещѐ не рассмотренная вершина . Тогда Xxi

{}},{ BxA i два разных множества.

4) Пусть YAN )( множество вершин, в которые можно попасть из

вершин в .A Если ,)( BAN то помечаем вершинуix

как обработанную и переходим на п.2, иначе на п.5.

5) Находим вершину .\)( BANy j

{}M

X M

«Clip-based Similarity Measurefor Hierarchical Video Retrieval», Yuxin Peng,hong-Wah Ngo, MIR’04, October 15–16, 2004, New York, New York, USA

Page 45: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Поиск оптимального сопоставления в графе

47

6) Если }{,,),( jj yBB{z}AAтоMyz

и переходим на п.4, иначе на п.7

7) ),( ji yxPMM , отмечаем и переходим на п.2.ix

X1

X2

X3

Y1

Y3

Y2

X1

X2

X3

Y1

Y3

Y2

X1

X2

X3

Y1

Y3

Y2

A={X1,X3}

B={Y2}

N(A)={Y2,Y3}

Page 46: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

48

Алгоритм Optimal Matching

1) Инициализация меток вершин

qjyl

piwxl

j

iji

,1,0)(

;,1),max()(

2) Построение максимального графа

})()(|),{(),,,( ijjijil wylxlyxEEYXG

И однозначного графа M на основе lG

3) Если M содержит все вершины ,X

то оптимальный граф построен, иначе на п.4

{}},{,, BxAMxXx iii4) Выбираем

7. Построение оптимального графа

«Clip-based Similarity Measurefor Hierarchical Video Retrieval», Yuxin Peng,hong-Wah Ngo, MIR’04, October 15–16, 2004, New York, New York, USA

Page 47: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Алгоритм Optimal Matching

49

5) Если ,)( BANlG то идем на п.9, иначе на п.6

6) Находим .\)( BANylGj

7) Если }{,,),( jj yBB{z}AAтоMyz

и переходим на п.5, иначе на п.8

8) ),( ji yxPMM и переходим на п.3.

9) Вычисляем },)()({min , ijjiNyAx wylxlalGji

,

),(

,)(

,)(

)(ˆ

иначеvl

Bvavl

Avavl

vl вычисляем на основе .,ˆˆˆ ll

EGl

10) .,ˆ ˆ llGGll Переход на п.6.

«Clip-based Similarity Measurefor Hierarchical Video Retrieval», Yuxin Peng,hong-Wah Ngo, MIR’04, October 15–16, 2004, New York, New York, USA

Page 48: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

50

Построение меры сходства

фильмов

8. Построение меры сходства

1) Оценка на основе суммы весов ребер графа: ,)(p

wXYSim

ij

OM

2) Учет порядка сцен

.],[

,

),(,0,]},1[],1,[max{

),(,0,,1]1,1[

00,0

],[p

qpCSim

MyxjijiCjiC

MyxjijiC

jori

jiC DP

ji

ji

3) Interference factor .||2

),(qp

MYXSimIF

Мера сходства:

IFDPOMi

ii YXSimYXSim,,

).,(),(

«Clip-based Similarity Measurefor Hierarchical Video Retrieval», Yuxin Peng,hong-Wah Ngo, MIR’04, October 15–16, 2004, New York, New York, USA

Page 49: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Результаты

Размер базы: 21 час видео (19929 смен сцены)

Некоторые результаты:

«Clip-based Similarity Measurefor Hierarchical Video Retrieval», Yuxin Peng,hong-Wah Ngo, MIR’04, October 15–16, 2004, New York, New York, USA

Page 50: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Результаты

Page 51: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Выводы

a) Большая вычислительная сложность

Недостатки:

Достоинства:

a) Возможность поиска перемонтированных фрагментов

))1()())((( 4 OpqOqpO

b) Наличие искажений может помешать корректному сравнению ключевых кадров

c) Достаточно большой размер описаний фильмов

Page 52: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)

Планы

54

По программе:

По алгоритму:

Построение локальных характеристик вблизи смены сцены

Построить более адекватную оценку вероятности сопоставления, учитывать:

1. Колличество сопоставленных смен сцены (достоверность)2. Плотность смен сцены3.Характеристики БД

Искать N самых сильных смен сцены, а не N самых первых

Провести рефакторинг

Исправить кое-какие баги

Page 53: Методы сопоставления видео

CS MSU Graphics & Media Lab (Video Group)55

Вопросы

?