69
Способы построения и оценки карт салиентности Максим Харенко Video Group CS MSU Graphics & Media Lab

Способы построения и оценки карт салиентности

Embed Size (px)

Citation preview

Page 1: Способы построения и оценки карт салиентности

Способы построения и оценки карт салиентности

Максим Харенко

Video Group CS MSU Graphics & Media Lab

Page 2: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Содержание

Введение

Реализованные модели

A Novel Multiresolution Spatiotemporal Saliency Detection Model

Nonparametric Bottom-Up Saliency Detection by Self-Resemblance

Сравнение и оценка качества

Заключение

2

Page 3: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Введение

Салиентность – это термин обозначающий свойство объекта, человека, пикселя и т.д. выделяться на фоне группы других, соседних объектов того же типа

Карты салиентности – вероятность того, что при первом взгляде человек обратит внимание на конкретные пиксели

3

Page 4: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Введение Применение карт салиентности

Сегментация (im, v)

Распознавание объектов (im, v)

Удаление объектов из видео (v)

Зрение роботов (v)

Сжатие (im, v)

Auto Focus (im, v)

Image & video description (im, v)

S. Goferman, L. Zelnik-Manor, and A. Tal, “Context-aware saliency detection,” CVPR, 2010

4

Создание коллажей (im)

Image thumbnailing (im)

Image and video retargeting (im, v)

Art effects (im, v)

Content-aware resize (im)

Web design (im)

Page 5: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Содержание

Введение

Реализованные модели

A Novel Multiresolution Spatiotemporal Saliency Detection Model

Nonparametric Bottom-Up Saliency Detection by Self-Resemblance

Сравнение и оценка качества

Заключение

6

Page 6: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Реализованные модели Contex-aware saliency

Рассмотривается окрестность некоторого пикселя (квадратный патч вокруг него)

В изображении ищется k (64 в статье) наиболее похожих патчей

Оценивается уникальность этого пикселя

7

Результаты нашей реализации

S. Goferman, L. Zelnik-Manor, and A. Tal, “Context-aware saliency detection,” CVPR, 2010

Page 7: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Реализованные модели Saliency from face detection

8

Результаты нашей реализации

Лица ищутся с помощью Viola/Jones Face Detector

На их месте создаются салиентные области

Page 8: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Реализованные модели Saliency from motion

Оценивается global motion

Оценивается loсal motion

Салиентность в каждой точке считается как разность loсal и global motion

9

Результаты нашей реализации

Page 9: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Реализованные модели Saliency from spectral residual

X. Hou and L. Zhang, “Saliency detection: A spectral residual Approach,” CVPR, 2007

10

Saliency map Input image

Page 10: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Содержание

Введение

Реализованные модели

A Novel Multiresolution Spatiotemporal Saliency Detection Model

Nonparametric Bottom-Up Saliency Detection by Self-Resemblance

Сравнение и оценка качества

Заключение

11

Page 11: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Особенности модели

Phase Quaternion Fourier Transform

Hierarchical selectivity

Multiresolution approach

Wavelet domain foveation model

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

12

Page 12: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus Novel Quaternion

Representation of an Image

Для входного кадра F(t) рассчитываются

функции:

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

13

Page 13: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus Novel Quaternion

Representation of an Image

Цветовые каналы представляются в виде:

Каналы яркости и движения рассчитываются:

t – пользовательский параметр задержки

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

14

Page 14: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus Novel Quaternion

Representation of an Image

Кадр F(t) переводится в квантернионное изображение q(t):

где mi, ш = 1, 2, такое, что:

и представляется в форме:

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

15

Page 15: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Quaternion Fourier Transform

QFT можно посчитать, используя два стандартных

FFT:

(n,m) и (u,v) – положение пикселя

в пространственных и частотных координатах

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

16

Page 16: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Phase QFT

Обратная преобразование рассчитывается

при помощи замены знака у экспоненты и индексов суммирования:

Таким образом, построено представление частотного домена Q(t) для q(t):

где Ф(t) – спектр фаз; м – элементарный кватернион

Если установить ||Q(t)|| =1, то останется только

интересующая фазовая составляющая

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

17

Page 17: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

PQFT(1)

Используя обратное преобразование, считается

реконструкция Q(t) обозначаемая q’(t), которая может быть

представлена в виде:

Тогда пространственно-временная карта салиентности

где g –2-D фильтр гаусса с дисперсией с

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

18

Page 18: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

PQFT(2)

Пусть , тогда

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

19

Page 19: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Поиск focus of attention (FoA)

Есть построенная sM(t) для кадра F(t) в момент времени t

smi(t) = sM(t) , smi(t) – i-я карта салиентности

Oma – наибольшая салиентная область в sdfsdf c координатами

i-тый object candidate area (OCA) вычисляется:

Найденная область обнуляется

Поиск не заканчивается пока для текущего i:

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

20

Page 20: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus Поиск focus of attention

Варьирование переменных

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

21

Page 21: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Hierarchical Selectivity PQFT Алгоритм

Предположение: “there may be a hierarchy of units of attention, ranging from intraobject surfaces and parts to multiobject surfaces and perceptual groups”

Количество уровней иерархии Y задается как параметр (в статье y = 3 )

Рассчитываются карты салиентности размером 64x64, 128x128 и 256x256

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

22

Древовидное представление изображения «sheeps»

Page 22: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Hierarchical Selectivity PQFT “coarse to fine” подход

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

23

Page 23: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Hierarchical Selectivity PQFT Уровни на изображении

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

24

Page 24: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus Multiresolution Wavelet

Domain Foveation Model

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

25

Page 25: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Сжатие с WDFW

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

26

Compressed size = 328 Kb

Original size = 628 Kb

Page 26: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Сжатие с HS-MWDF

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

27

Compressed size = 261 Kb

Original size = 628 Kb

Page 27: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Сжатие видео

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

28

Page 28: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus Сравнение с картами

фиксаций изображений

Chenlei Guo and Liming Zhang, “A novel multiresolution spatiotemporal saliency detection model and its applications in image and video compression,” Trans. Img. Proc., 2010

29

Page 29: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Выводы

Достоинства:

Real-time

Временные и цветовые каналы

Устойчивость к высокотекстурированному фону

Недостатоки:

Сравнение только со схожими или слабыми моделями

Высокая чувствительность к разрешению

30

Page 30: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Содержание

Введение

Реализованные модели

A Novel Multiresolution Spatiotemporal Saliency Detection Model

Nonparametric Bottom-Up Saliency Detection by Self-Resemblance

Сравнение и оценка качества

Заключение

31

Page 31: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus Saliency Detection

by Self-Resemblance

1. Расчет local steering kernels

2. Для каждого пикселя строится матрица F center+surrounding region

3. Салиентность пикселя определяется с помощью алгоритма self-resemblance

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

32

Graphical overview of saliency detection system

Page 32: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

2-D Local Steering Kernel

Анализируя расстояния, основанные на посчитанных градиентах, получают локальную структуру изображения

Эта информация и определяет форму и размер ядра

Для каждого пикселя xi моделируется Local Steering Kernel:

P – матрица ковариации

P – количество пикселей в локальном окне

h – сглаживающий параметр

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

33

Page 33: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

3-D Local Steering Kernel

Local Steering Kernel для центра xi

=

asdasddz1z2z3z3z – первые производные по соответствующим осям

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

34

Page 34: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

LSK-weights

K(xl-xi) )) рассчитывается для каждого x и нормализуется весами:

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

35

Устойчивость и надежность LSK-весов

Page 35: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Вероятностная модель(1)

– center feature matrix для

– center + surrounding region feature matrix

L – количество feature vectors в

N – количество feature matrix в

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

36

Page 36: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Вероятностная модель(2)

Введем случайную величину

Салиентность х определяется как вероятность:

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

37

Page 37: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Вероятностная модель(3)

По теореме Байеса:

Требуется оценить условную вероятность p(F|y= 1)

Для этого используется nonparametric kernel density estimation

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

38

Page 38: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Когда оценивается плотность вероятности в конкретной feature

point, ядро, с центром в этой точке, распространяет плотность масс

поровну во всех пространственных направлениях, уделяя много

внимания незначимым областям и мало внимания важным

Поэтому строится нормализованная функция:

||.||F – Frobenious norm

б – параметр, контролирующий стабильность весов

Self-resemblanse

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

39

Page 39: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Self-resemblanse Матрица похожести LSK-векторов

Функция G(. переписывается в виде:

где p( Fi, Fj ) – матрица похожести между Fi и Fj, определяемая как “Frobenius inner product”:

Эта матрица представляется в виде взвешенной суммы похожестей p(fi,fj) между каждой парой LSK-векторов:

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

40

Page 40: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Self-resemblanse

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

41

Пример на психологическом шаблоне

Page 41: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Self-resemblanse

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

42

Пример на изображении

Page 42: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Self-resemblanse Салиентность

Салиентность в пикселе x (S = (sdfsdfsdfdfsdfsfs)) это центральное значение нормализованной весовой функции G()

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

43

Page 43: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Self-resemblanse Обработка цветовых каналов

44 Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

Page 44: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Сравнение методов(1)

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

45

Page 45: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Сравнение методов(2)

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

46

Page 46: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus Схема построения

space-time saliency map

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

47

Page 47: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus Примеры на видео

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

48

Page 48: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Выводы

Достоинства:

Оригинальная вероятностная модель

Альтернатива ME и OF при построении SM во времени

Использование цветов

Предположительный недостаток:

Низкая скорость на HD при большом размере окна окрестностей

Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009

49

Page 49: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Содержание

Введение

Реализованные модели

A Novel Multiresolution Spatiotemporal Saliency Detection Model

Nonparametric Bottom-Up Saliency Detection by Self-Resemblance

Сравнение и оценка качества

Заключение

50

Page 50: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Оценка качества saliency map

В задачах обнаружения объектов – количество правильно распознанных объектов

В задачах сегментации – сравнение точности границ сегментов

Визуальное сравнение: группу людей просят показать «важные» регионы изображения

Бинарная ручная разметка изображений и подсчет площади под ROC-кривой

Объективное и субъективное сравнение с результатами eye-tracking

51

Page 51: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Оценка качества saliency map Eye tracking(1)

В ходе эксперимента испытуемый смотрит в экран

Плавное последовательное движение глаза, когда наблюдатель следит за происходящим на экране, регистрируется аппаратом как фиксация

Фиксации всех зрителей объединяются в карты фиксаций

Hani Alersa, Judith A. Redia, and Ingrid Heynderickxa, “Examining the effect of task on viewing behavior in videos using saliency maps,” Human Vision and Electronic Imaging XVII, 2012

52

Система слежения за глазами

Page 52: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Оценка качества saliency map Eye tracking(2)

Карты фиксаций нормализуют [0,1] с помощью весов Гаусса

Получается представление вероятности, пиксель в пиксель, что среднестатистический зритель зафиксирует конкретный пиксель

Henderson, J.M.: Diem video and eye tracking database. (http://thediemproject.wordpress.com/)

53

Page 53: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Базы eye-tracking видео

TUD

Eye-tracking видео от 24 человек

Разрешение 1280x720

Сцены из фильмов

DIEM

Eye-tracking видео от 30 до 100 человек

Разрешение SD,HD

Фильмы, трейлеры, новости, спорт, реклама, анимация, документалистика

54

Page 54: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Оценка качества saliency map Как же автоматически сравнивать с GT?

Hani Alersa, Judith A. Redia, and Ingrid Heynderickxa, “Examining the effect of task on viewing behavior in videos using saliency maps,” Human Vision and Electronic Imaging XVII, 2012

55

motion

frequency contrast

Page 55: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Сравнение метрикой SAD

56

0 10 20 30 40 50 60 70 80 90

100

Мotion

Frequency

Contrast

0 10 20 30 40 50 60 70 80 90

100

DIE

M

T

UD

SAD

Page 56: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Сравнение метрикой NCC

57

DIE

M

T

UD

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8

Мotion

Frequency

Contrast

NCC =

Page 57: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Сравнение метрикой PSNR

58

DIE

M

T

UD

0 2 4 6 8

10 12 14 16 18 20

0

5

10

15

20

25

30

Мotion

Frequency

Contrast

Page 58: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Сравнение метрикой Моя метрика

59

Ground truth Saliency map

Gt(i) Sm(i)

LMM = Med((Abs(Gt(i)-Sm(i)))

LMA = Sum((Abs(Gt(i)-Sm(i)))/N

Gt – вектор значений локальных максимумов на Ground truth

Sm – вектор значений соответствующих координат на Saliency map

N – количество найденных максимумов

Page 59: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Сравнение метрикой LMM

60

DIE

M

T

UD

0

50

100

150

200

250

300

0

50

100

150

200

250

Мotion

Frequency

Contrast

Page 60: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Сравнение метрикой LMA

61

DIE

M

T

UD

0

50

100

150

200

250

Мotion

Frequency

Contrast

0 20 40 60 80

100 120 140 160 180 200

Page 61: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Сравнение метрикой Similarity

62

DIE

M

T

UD

0 0,05 0,1

0,15 0,2

0,25 0,3

0,35 0,4

0,45 0,5

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7

Мotion

Frequency

Contrast

Tilke Judd, Fredo Durand and Antonio Torralba, "A Benchmark of Computational Models of Saliency to Predict Human Fixations,” PAMI ,2012

Page 62: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Субъективное тестирование

63

DIE

M

T

UD

0 2 4 6 8

10 12 14 16 18 20

0 2 4 6 8

10 12 14 16 18 20

Мotion

Frequency

Contrast

Суммарные результаты шести человек

Page 63: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Оценка метрик для DIEM

64

0

10

20

30

40

50

60

70

SAD NCC PSNR LMM LMA Similarity

0

20

40

60

80

100

120

140

160

Баллы: ABC=3 ACB=2 BAC=2 CAB=1 BCA=1 CBA =0

Баллы: ABC=9 ACB=4 BAC=4 CAB=1 BCA=1 CBA =0

Max = 30*3=90 Max = 30*9=270

Page 64: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Оценка метрик для TUD

65

Баллы: ABC=3 ACB=2 BAC=2 CAB=1 BCA=1 CBA =0

Баллы: ABC=9 ACB=4 BAC=4 CAB=1 BCA=1 CBA =0

Max = 20*3=60 Max = 20*9=180

0

10

20

30

40

50

60

SAD NCC PSNR LMM LMA Similarity

0

20

40

60

80

100

120

140

160

Page 65: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Содержание

Введение

Реализованные модели

A Novel Multiresolution Spatiotemporal Saliency Detection Model

Nonparametric Bottom-Up Saliency Detection by Self-Resemblance

Сравнение и оценка качества

Заключение

66

Page 66: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Заключение

Улучшить SR до PQFT

Saliency Detection by Self-Resemblance хорошая модель, идеи можно использовать как улучшение модели Context-aware

Для обучения классификатора на результатах eye-tracking стоит использовать метрику similarity или комбинацию similarity+LMA

67

Page 67: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Литература

1. S. Goferman, L. Zelnik-Manor, and A. Tal, “Context-aware saliency detection,” CVPR, 2010.

2. X. Hou and L. Zhang, “Saliency detection: A spectral residual Approach”, CVPR, 2007.

3. Hani Alersa, Judith A. Redia, and Ingrid Heynderickxa, “Examining the effect of task on viewing behavior in videos using saliency maps,” Human Vision and Electronic Imaging XVII, 2012.

4. Hae Jong Seo and P. Milanfar, “Nonparametric bottom-up saliency detection by self-resemblance,” CVPR, 2009.

5. Henderson, J.M.: Diem video and eye tracking database. (http://thediemproject.wordpress.com/)

6. Tilke Judd, Fredo Durand and Antonio Torralba, “A Benchmark of Computational Models of Saliency to Predict Human Fixations,” PAMI, 2012.

68

Page 68: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus

Вопросы?

69

Page 69: Способы построения и оценки карт салиентности

CS MSU Graphics & Media Lab (Video Group) www.compression.ru/video/

Only for Maxus Лаборатория компьютерной

графики и мультимедиа

Видеогруппа — это:

Выпускники в аспирантурах Англии, Франции, Швейцарии (в России в МГУ и ИПМ им. Келдыша)

Выпускниками защищены 5 диссертаций

Наиболее популярные в мире сравнения видеокодеков

Более 3 миллионов скачанных фильтров обработки видео

70