6
19º Congreso Europeo de Procesado de Señales (EUSIPCO 2011) Barcelona, 29 de Agosto 2 de septiembre, 2011 DETECCIÓN DE INCENDIOS EN TIEMPO REAL USANDO DESCRIPTORES DE CORRELACIÓN Traducción de Eloy Ruiz Montañez. Título original: REAL-TIME WILDFIRE DETECTION USING CORRELATION DESCRIPTORS Y. Hakan Habiboglu, Osman Gunay, and A. Enis Cetin Dept. of Electrical and Electronics Engineering, Bilkent University 06800, Ankara, Turkey phone: + (90)312-290-15-25, fax:+(90)312-266-4192, email:{yhakan,osman,cetin}ee.bilkent.edu.tr web: www.ee.bilkent.edu.tr/˜signal RESUMEN Se desarrolla a continuación un sistema de detección de incendios mediante video que se basa en descriptores de correlación espacio-temporal. Durante la fase inicial de conato, la columna de humo se hace visible antes que las propias llamas. El método que se propone utiliza una sustracción del fondo y de determinados umbrales de color para así acotar las regiones de video en las que se ha detectado un movimiento paulatino y un color correspondientes al humo. Estas regiones se dividirán en bloques espacio-temporales de los que se extraen las características de correlación. El conjunto de propiedades (que representan tanto las características espaciales como las temporales) de las regiones de humo se utiliza para formar los descriptores de correlación. Se ha entrenado y probado los resultados con un clasificador mediante SVM (Supported Vector Machine) con los descriptores obtenidos de los datos de video que contienen tanto humo como objetos con el color de humo. Se presentarán los resultados experimentales. 1. INTRODUCCIÓN La mayoría de los sistemas de vigilancia ya incorporados incluían módulos de detección sencillos (detección de movimiento o análisis de eventos, p.e) Ha sido recientemente cuando ha habido un interés significativo por desarrollar algoritmos de detección en tiempo real para el recono- cimiento de fuego y humo en sistemas de vigilancia estándar. [1]-[7]. La detección de humo basada en video puede emplearse para sustituir a los detectores tipo sensor de punto tradicionales puesto que una sola cámara puede monitorizar un área de gran superficie desde largas distancias y detectar el humo antes que un detector de punto tradicional (si se emplea un algoritmo robusto). Pese a que la detección de humo basada en video es una alternativa prometedora a los sensores de humo tradicionales, existen ciertas carencias o inconvenientes que han de ser resueltos para perfeccionar estos sistemas: el humo es difícil de modelar debido a características tales como su textura dinámica y movimiento irregular. La inestabilidad de la cámara, dinamismo de fondo en la imagen, obstáculos en el radio de alcance y condiciones de luz, suponen también problemas para la detección. Además, los sistemas actuales de detección requieren de supervisión humana y siempre hay espacio para nuevas mejoras. Las columnas de humo observadas a larga distancia y las observadas a corta distancia tienen diferentes características espaciales y temporales. De ahí que por lo general se diseñen algoritmos diferentes para detectar columnas de humo a corta y a larga distancia. Jerome y Philippe [1, 2] implementaron un sistema de detección automático de humo en tiempo real para estaciones de vigilancia forestal. La clave de su método de detección consistía en asumir que la energía de la distribución de velocidad de las columnas de humo es más altas que en otros efectos naturales, exceptuando las nubes, las cuales por otro lado poseen una desviación estándar más baja que la del humo. Durante la fase de clasificación emplearon fractal embedding y linked list chaining para segmentar las regiones de humo. Este método fue utilizado en el detector de fuego “ARTIS FIRE”, comercializado por T2M Automation. Otro método de detección de humo aplicado a la prevención de incendios se describe en [3]. Este método toma la ventaja de la descomposición de onda (wavelet decomposition) y flujo óptico (optical flow) para la detección de humo de incendio y su monitorización. El algoritmo de flujo óptico se usa para la detección de movimiento. El método basado en Wavelet De- composition se empleó para resolver el problema de abertura en el flujo óptico. Una vez detectado el humo y segmentado éste, pueden extraerse las características como la velocidad del humo, dispersión, altura máxima, nivel de gris y ángulo de inclinación usando fotogramas de un video o una secuencia de imágenes. Damir y otros autores [4] han trabajado con diferentes transformaciones en el espacio de colores y con los diferentes clasificadores de características que se emplean en sistemas de detección de incendios basados en la segmentación del humo de la imagen por medio de histogramas. Su investigación proporcionó una evaluación de histogramas en YCrCb, CIE Lab, HSI, y “ modified HSI colour spaces”. Utilizaron tablas de consulta y dos clasificadores bayesianos sencillos distintos con diferentes métodos de estimación de densidad para clasificar los histogramas. Los mejores resultados se consiguieron con espacios de color RGB y HSI al usar el clasificador bayesiano. El método así descrito es uno de los algoritmos usados en el Intelligent Forest Fire Monitoring System (iForestFire) que se utiliza para monitorizar las costas de Croacia.

DETECCIÓN DE INCENDIOS EN TIEMPO REAL … · humo basada en video es una alternativa prometedora a los ... sub-algoritmos que detectan: (i) ... Condition 1 Y > T Y Condition 2

Embed Size (px)

Citation preview

Page 1: DETECCIÓN DE INCENDIOS EN TIEMPO REAL … · humo basada en video es una alternativa prometedora a los ... sub-algoritmos que detectan: (i) ... Condition 1 Y > T Y Condition 2

19º Congreso Europeo de Procesado de Señales (EUSIPCO 2011) Barcelona, 29 de Agosto – 2 de septiembre, 2011

DETECCIÓN DE INCENDIOS EN TIEMPO REAL USANDO DESCRIPTORES DE CORRELACIÓN

Traducción de Eloy Ruiz Montañez. Título original:

REAL-TIME WILDFIRE DETECTION USING CORRELATION DESCRIPTORS

Y. Hakan Habiboglu, Osman Gunay, and A. Enis Cetin Dept. of Electrical and Electronics Engineering,

Bilkent University 06800, Ankara, Turkey phone: + (90)312-290-15-25, fax:+(90)312-266-4192,

email:{yhakan,osman,cetin}ee.bilkent.edu.tr web: www.ee.bilkent.edu.tr/˜signal

RESUMEN

Se desarrolla a continuación un sistema de detección de incendios mediante video que se basa en descriptores de correlación espacio-temporal.

Durante la fase inicial de conato, la columna de humo se hace visible antes que las propias llamas. El método que se propone utiliza una sustracción del fondo y de determinados umbrales de color para así acotar las regiones de video en las que se ha detectado un movimiento paulatino y un color correspondientes al humo. Estas regiones se dividirán en bloques espacio-temporales de los que se extraen las características de correlación. El conjunto de propiedades (que representan tanto las características espaciales como las temporales) de las regiones de humo se utiliza para formar los descriptores de correlación. Se ha entrenado y probado los resultados con un clasificador mediante SVM (Supported Vector Machine) con los descriptores obtenidos de los datos de video que contienen tanto humo como objetos con el color de humo. Se presentarán los resultados experimentales.

1. INTRODUCCIÓN

La mayoría de los sistemas de vigilancia ya incorporados incluían módulos de detección sencillos (detección de movimiento o análisis de eventos, p.e) Ha sido recientemente cuando ha habido un interés significativo por desarrollar algoritmos de detección en tiempo real para el recono-cimiento de fuego y humo en sistemas de vigilancia estándar. [1]-[7]. La detección de humo basada en video puede emplearse para sustituir a los detectores tipo sensor de punto tradicionales puesto que una sola cámara puede monitorizar un área de gran superficie desde largas distancias y detectar el humo antes que un detector de punto tradicional (si se emplea un algoritmo robusto). Pese a que la detección de humo basada en video es una alternativa prometedora a los sensores de humo tradicionales, existen ciertas carencias o inconvenientes que han de ser resueltos para perfeccionar estos sistemas: el humo es difícil de modelar debido a características tales como su textura dinámica y movimiento irregular. La inestabilidad de la cámara, dinamismo de fondo en la imagen, obstáculos en el radio de alcance y condiciones de luz, suponen también problemas para la detección.

Además, los sistemas actuales de detección requieren de supervisión humana y siempre hay espacio para nuevas mejoras. Las columnas de humo observadas a larga distancia y las observadas a corta distancia tienen diferentes características espaciales y temporales. De ahí que por lo general se diseñen algoritmos diferentes para detectar columnas de humo a corta y a larga distancia. Jerome y Philippe [1, 2] implementaron un sistema de detección automático de humo en tiempo real para estaciones de vigilancia forestal. La clave de su método de detección consistía en asumir que la energía de la distribución de velocidad de las columnas de humo es más altas que en otros efectos naturales, exceptuando las nubes, las cuales por otro lado poseen una desviación estándar más baja que la del humo. Durante la fase de clasificación emplearon fractal embedding y linked list chaining para segmentar las regiones de humo. Este método fue utilizado en el detector de fuego “ARTIS FIRE”, comercializado por T2M Automation.

Otro método de detección de humo aplicado a la prevención de incendios se describe en [3]. Este método toma la ventaja de la descomposición de onda (wavelet decomposition) y flujo óptico (optical flow) para la detección de humo de incendio y su monitorización. El algoritmo de flujo óptico se usa para la detección de movimiento. El método basado en Wavelet De-composition se empleó para resolver el problema de abertura en el flujo óptico. Una vez detectado el humo y segmentado éste, pueden extraerse las características como la velocidad del humo, dispersión, altura máxima, nivel de gris y ángulo de inclinación usando fotogramas de un video o una secuencia de imágenes.

Damir y otros autores [4] han trabajado con diferentes transformaciones en el espacio de colores y con los diferentes clasificadores de características que se emplean en sistemas de detección de incendios basados en la segmentación del humo de la imagen por medio de histogramas. Su investigación proporcionó una evaluación de histogramas en YCrCb, CIE Lab, HSI, y “modified HSI colour spaces”. Utilizaron tablas de consulta y dos clasificadores bayesianos sencillos distintos con diferentes métodos de estimación de densidad para clasificar los histogramas. Los mejores resultados se consiguieron con espacios de color RGB y HSI al usar el clasificador bayesiano. El método así descrito es uno de los algoritmos usados en el Intelligent Forest Fire Monitoring System (iForestFire) que se utiliza para monitorizar las costas de Croacia.

Page 2: DETECCIÓN DE INCENDIOS EN TIEMPO REAL … · humo basada en video es una alternativa prometedora a los ... sub-algoritmos que detectan: (i) ... Condition 1 Y > T Y Condition 2

Qinjuan y otros autores [5] propusieron un método de detección de largo alcance para ser usado en sistemas de vigilancia forestal. El método utiliza multi-frame temporal difference y OTSU thresholding para encontrar las regiones de movimiento del humo. También utilizaron indicios de cambios en color y área para verificar la existencia de humo dentro del rango de visión de la cámara.

En [6] se desarrolla un algoritmo de detección de incendio en tiempo real basado en la sustracción del fondo de imagen y análisis por onda (wavelet analysis). En [7] se desarrolla un algoritmo de detección de humo de largo alcance para utilizarse en sistemas de vigilancia contra incendios. El algoritmo consiste en un método de apren-dizaje online que actualiza sus valores de decisión por medio de la supervisión de un oráculo (el vigilante de la torre). El algoritmo de detección principal se compone de cuatro sub-algoritmos que detectan: (i) objetos en movimiento lento, por medio de eliminación de fondo adaptada, (ii) regiones grises, por medio de espacio de colores YUV, (iii) regiones con objetos levantándose, usando modelos ocultos de Markov (HMM: hidden Markov models), y (iv) sombras, usando el ángulo RGB entre la imagen y el fondo. Las decisiones de los sub-algoritmos se combinan usando el método LMS (valor cuadrático mínimo o error cuadrático mínimo, Least Mean Square) durante la fase de entrena-miento.

Este es un artículo de análisis que describe la investi-gación puesta en marcha en el FP-7 FIRESENSE project [8]. La mayor parte de los sistemas de detección de humo encuentran primero las regiones con movimiento utilizando una sustracción del fondo. Estas regiones son entonces analizadas espacialmente y espacio-temporalmente para detectar las características propias del humo. En este trabajo utilizaremos una aproximación diferente combinando dife-rente información en el dominio espacio-temporal y el del color en vectores de características para cada bloque espaciotemporal utilizando descriptores de covarianza de región (region covariance descriptors) [9, 10]. Los bloques se obtienen dividiendo las regiones correspondientes al color del humo en regiones 3D que se solapan en el tiempo. La clasificación de características se lleva a cabo sólo en la frontera temporal de los bloques en lugar de en cada fotograma. Esto reduce el coste computacional del proceso.

En las secciones siguientes se describe la construcción de nuestro algoritmo.

2. CONSTRUCCIÓN DE LOS

BLOQUES DEL ALGORITMO DE DETECCIÓN

El uso de las torres de vigilancia está ampliamente extendido en bosques de todo el mundo para detectar incendios. Pueden colocarse cámaras de vigilancia en estas torres para monitorizar el área forestal circundante ante posibles incendios. Además pueden utilizarse para realizar un segui-miento del progreso de las llamas desde un centro remoto. Las cámaras, una vez instaladas, operan en las torres durante toda la estación seca durante alrededor de seis meses, que es particularmente soleada y seca en la región mediterránea. Con frecuencia no es posible visualizar directamente las llamas de un incendio desde la torre sobre la que se monta la cámara salvo que el foco sea muy cercano. En cambio, las columnas de humo ascendente que se levantan por encima del bosque provocadas por las llamas, son normalmente visibles a largas distancias. La figura 1 muestra una típica captura de imagen del humo de un incendio desde una torre de vigilancia a 5km de distancia.

Figure 1: Snapshot of a typical wildfire smoke captured by a forest watch tower which is 5 km away from the fire.

2.1 Slow Moving Region Detection

El humo, detectado a larga distancia, exhibe unas caracterís-

ticas espaciales y temporales diferentes a las del humo y el fuego próximo [11]-[12]. Por lo tanto deberán desarrollarse métodos distintos para una detección a larga distancia que los métodos de detección de humo cercano descritos en [13].

El algoritmo de detección de humo procedente de incendio que se propone consta de tres sub-algoritmos principales: (i) detección en vídeo de objetos en movimiento lento, (ii) detección de regiones con coloración de humo, (iii) clasificación basada en correlaciones (correlation based classification).

Para la detección de objetos en movimiento usamos un modelo de combinaciones gausianas o Gaussian Mixture Model (GMM) basado en métodos de sustracción del fondo [14]. Durante unos escasos segundos actualizamos el fondo muy rápido tras lo cual se actualiza el fondo muy lentamente, de manera que se pudieran detector objetos en movimiento pequeños y lentos. También se aplicó un segundo modelo de fondo GMM optimizado para detector objetos rápidos en el movimiento, empleado para descartar objetos ordinarios en movimiento.

2.2 Smoke Color Model

Las regiones con color humo pueden ser identificadas estableciendo unos valores umbrales (thresholds) en el espacio de colores YUV [7]. El valor de luminancia de las regiones de humo debería de ser alto para la mayoría de focos de humo. Por otro lado, la crominancia (refiriéndose el autor a la variedad cromática en la señal) debería ser muy baja en una zona de humo.

Las condiciones en el espacio de color YUV son las que siguen:

Condition 1 Y > TY

Condition 2 |U ­ 128| < TU & |V ­ 128| < TV

donde Y, U y V son los valores de luminancia y crominancia de un píxel. La componente de luminancia Y toma valores reales en el rango entre [0, 255] en una imagen, y el valor medio de los canales de crominancia, U y V, se incrementan a 128 de manera que también toman valores comprendidos entre 0 y 255. El valor umbral TY es un valor determinado experimen-talmente y que se ha establecido como 128 en la componente de luminancia (Y) durante el presente trabajo. TU y TV se fijarán en 10.

Page 3: DETECCIÓN DE INCENDIOS EN TIEMPO REAL … · humo basada en video es una alternativa prometedora a los ... sub-algoritmos que detectan: (i) ... Condition 1 Y > T Y Condition 2

.

2.3 Método de Correlación 2.3.1 Correlation Descriptors for Videos

Los descriptores de covarianza han sido propuestos por Tuzel, Porikli y Meer para ser usados en la detección de objetos y problemas de clasificación de texturas [9,10]. Nosotros proponemos descriptores de correlación extendidos en el tiempo para extraer características de las secuencias de vídeo.

Los descriptores de covarianza proporcionan una descripción muy buena de una región de una imagen dada cuando el conjunto de propiedades de esa región de dicha imagen puede describirse mediante una distribución normal multivariada y cuasi-estacionaria (wide-sense stationary multivariate normal distribution) [9]. La cuasi-estaciona-riedad es un requisito razonable para regiones de humo de una imagen, puesto que dichas regiones no contienen bordes acentuados. De esta manera los descriptores de covarianza pueden ser usados para modelar características espaciales en regiones de humo. Se ha observado experimentalmente que la suposición de estacionariedad débil o cuasi-estacio-nariedad es también válida en el dominio temporal. Para modelar la variación temporal en regiones de humo en este artículo introdujimos descriptores de covarianza norma-lizados y extendidos temporalmente. Hasta donde nosotros sabemos, no se han utilizado parámetros espacio-temporales para construir descriptores de covarianza en otras inves-tigaciones.

Los descriptores de correlación extendidos en el dominio temporal se designan para describir bloques de vídeo en espacio y tiempo. Sea I(i, j, n) la intensidad del pixel (i, j) del n-avo fotograma de un bloque espacio-temporal, mientras que Luminance, ChrominanceU y ChrominanceV representan los valores del color de los píxeles del bloque. Los parámetros definidos en las ecuaciones de la (1) a la (8) se emplean para formar una matriz de covarianza repre-sentando la información espacial. Además de los parámetros espaciales introduciremos derivadas temporales, It e Itt correspondientes a la derivada primera y derivada segunda de la intensidad respecto al tiempo. Añadiendo estas dos características al conjunto de propiedades previo, podrán usarse descriptores de correlación para definir bloques de vídeo en espacio, así como a lo largo del tiempo.

2.3.2 Computation of Correlation Values in Spatio - temporal Blocks En esta sección se describen los detalles de la computación en vídeo de las características de correlación. En primer lugar se ha dividido el video en bloques de 10 × 10 × Frate de tamaño, donde Frate es el ratio de frames del vídeo. Calcular los parámetros de correlación de cada bloque de vídeo resultaría ineficiente a nivel computacional. Utilizamos por ello el primero de los dos sub-algoritmos para hallar regiones candidatas a ser zonas de humo. Por lo tanto, sólo los píxeles correspondientes a valores distintos de cero de la siguiente máscara se utilizarán en la selección de bloques. La máscara se define mediante la siguiente función: Donde M(. , . , n) es la máscara binaria obtenida del primero de los dos sub-algoritmos. Para reducir el efecto de los píxeles sin color del humo, se emplearán para la estimación de las carac-terísticas basadas en correlaciones sólo los parámetros de aquellos píxeles obtenidos de la máscara, en lugar de usar cada uno de los píxeles de un bloque dado. Se usaron un total de 10 parámetros por cada píxel para satisfacer la condición de color. Para reducir más el coste computacional, calculamos por separado los valores de correlación de los vectores de carac-terísticas:

y:

Por lo tanto, el vector de propiedades Φcolor(i ; j ; n) proporciona

3 · 42 = 6

valores de correlación, y el vector ΦST (i ; j; n) produce 7 · 8

2 = 28 valores de correlación respectivamente, y se emplean en total 34 parámetros de correlación en el entrenamiento y puesta a prueba de la SVM, en lugar de 55 parámetros.

Durante la implementación del método de correlación se calcula la derivada primera filtrando la imagen mediante un filtro [-1 0 1] y la segunda derivada se halla filtrando la imagen mediante filtro [1 -2 1]. Las partes triangulares inferiores o superiores de la matriz de correlación, C(a, b), que se obtiene normalizando la matriz de covarianza, Σˆ(a, b), forma el vector característico de una región de imagen dada. Empleamos la fórmula de estimación de la matriz de correlación descrita en (15), que puede ser inicializada para calcular sin esperar a la entrada de datos. Los

Page 4: DETECCIÓN DE INCENDIOS EN TIEMPO REAL … · humo basada en video es una alternativa prometedora a los ... sub-algoritmos que detectan: (i) ... Condition 1 Y > T Y Condition 2

vectores de características se procesan mediante una máquina de soporte vectorial (SVM).

Hemos asumido también que el tamaño de los frames de vídeo es de 320 por 240. De no ser así se escalará a 320 por 240 para reproducen en tiempo real el algoritmo de detección de humo.

3. ENTRENAMIENTO Y PRUEBAS

Para el entrenamiento y puesta a prueba se han extraído bloques de 10 × 10 × Frate de diferentes vídeos. La dimensión temporal de cada bloque se determina por la tasa de fotogramas Frate que valdrá entre 10 y 25 en nuestros vídeos de aprendizaje y test. Estos bloques no se solapan en el dominio del espacio pero hay una superposición del 50% en el dominio del tiempo. Significa que la clasificación no se va a repetir en cada uno de los fotogramas totales del vídeo. Una vez construidos los bloques se extraen las características y se utilizan para formar el juego de ensayo. Para la clasificación se ha entrenado una SVM [15].

La clasificación se realiza periódicamente con un período de Frate / 2. Esto reduce el coste de clasificación.

Durante la implementación se halla el número de píxeles en movimiento lento y color del humo, ΣiΣjΣnΨ(i , j , n), en cada bloque espacio-temporal. Si este número es más alto o igual a 2/5 del número de elementos del bloque (10 × 10 × Frate), entonces el bloque es clasificado como bloque de humo. Este límite umbral se hizo debido a que sólo se utilizan en el análisis de correlación aquellos píxeles con un color conforme al modelo YUV descrito en [7]. Si el número de posibles píxeles correspondientes a humo es suficientemente alto, entonces se realiza la clasificación mediante el clasificador SVM usando el vector de características aumentado que se describió en la sección 2.3.2.

En este artículo se han empleado 13 vídeos positivos y 12 negativos. Los clips de vídeo negativos contienen regiones en movimiento con colores característicos del humo. Para los vídeos positivos (los vídeos que contienen humo) sólo se han usado partes de vídeos en los que aparezca humo real.

En el último paso de nuestro método de detección se determina un valor de fiabilidad de acuerdo al número de bloques de vídeo clasificados positivamente y de su posición. Una vez se ha clasificado cada bloque, se analizan las vecindades del bloque para decidir el nivel de fiabilidad de la alarma. Si no hay ningún otro bloque vecino clasificado como humo, el nivel de fiabilidad se establece en 1. Si hay un único bloque vecino clasificado como humo, el nivel de fiabilidad será de 2. Y si hay más de dos bloques de humo vecinos el nivel será de 3, que es el nivel más alto que proporciona el algoritmo.

4. RESULTADOS EXPERIMENTALES

Se ha comparado el sistema propuesto con el método de detección de incendios forestales descrito en [6]. En el proceso de decisión, si el nivel de fiabilidad de cualquier bloque del fotograma es mayor o igual a 2, entonces el fotograma es marcado como fragmento de vídeo que contiene humo. Los resultados se han resumido en las tablas 1 y 2 expresados en forma de ratios de detección positiva acertada y de falsas alarmas, respectivamente. En las tablas 1 y 2 la tasa de acierto en la detección para un vídeo cualquiera se define como el número de fotogramas clasificados correctamente y que contenían humo, dividido entre el número total de frames que contienen humo. De manera similar, la tasa de alertas falsas se ha definido como el número de clasificaciones erróneas dividido por el número total de fotogramas que no contienen humo.

Tabla 1: Comparación del método basado en correlación con el método propuesto en [6] en base a las tasas de detección.

Se han empleado 15 clips de vídeo para testear el Sistema propuesto. Los primeros 8 vídeos contenían incendios forestales de facto o fuegos controlados de prueba que habíamos grabado, y los 7 vídeos restantes no contienen humo pero sí objetos en movimiento con el rango de colores del humo, como sombras y nubes. En la tabla 1 se representan las tasas de acierto en la detección positiva de los dos algoritmos para los ocho vídeos que contenían humo. En la tabla 2 se muestran las tasas de detecciones erróneas por falsa alarma en los dos algoritmos para los 7 vídeos que no contienen humo.

Tabla 2: Comparación del método basado en correlación con el método propuesto en [6] en base al ratio de falsas alarmas.

Page 5: DETECCIÓN DE INCENDIOS EN TIEMPO REAL … · humo basada en video es una alternativa prometedora a los ... sub-algoritmos que detectan: (i) ... Condition 1 Y > T Y Condition 2

Comparado con el método anterior, el nuevo método tiene una tasa de acierto en la detección positiva más alto en todos los vídeos que realmente contienen estelas o columnas de humo. “posVideo7” y “posVideo8” son de hecho vídeos de incendios grabados desde cámaras montadas en alto en mástiles o postes en los que puede percibirse las sacudidas del viento cuando se hace zoom. Dado que el método antiguo [6] asumía una cámara plenamente estática para la sustracción del fondo de imagen, no se podía clasificar correctamente la mayoría de regiones de humo en estos vídeos. Aunque la tasa de verdaderos positivos (detección acertada) es baja en algunos vídeos, no hará falta detectar cada uno de los fotogramas en los que aparezca humo para dar finalmente una alarma. Basta con detector humo durante un corto plazo de tiempo, sin dar cabida a demasiadas alertas falsas.

(a) posVideo1 - new method (b) posVideo1 - old method

(c) posVideo5 - new method (d) posVideo5 - old method

(e) posVideo7 - new method (f) posVideo7 - old method

(g) posVideo8 - new method (h) posVideo8 - old method

(i) negVideo7 - new method (j) negVideo7 - old method

Figura 2: Resultados de detección en los vídeos de prueba.

El primer tiempo de detección es menor a 10 segundos en todos los vídeos de prueba. En la mayoría de vídeos que no contienen humo el método nuevo tiene una tasa de alertas falsas menor que el antiguo.

En la Figura 2 se muestran los resultados de detección para el método nuevo y el método en distintos vídeos de prueba. Como puede verse, el nuevo método mejora significativamente los resultados de detección.

Este método que proponemos es computacionalmente eficiente. Los experimentos han tenido lugar con un PC Core 2 Duo de procesador 2.66GHz y los archivos de video se reproducen generalmente sobre 15-20 fps siendo el tamaño de resolución de las secuencias de 320 × 240. La velocidad de procesamiento puede verse reducida cuando existen muchas regiones de humo en movimiento, dado el incremento de bloques que son clasificados por la máquina SVM.

La capacidad o la desenvoltura del algoritmo en la detección irá ligada al tamaño de los bloques de vídeo. Dado que se requieren dos bloques vecinos a un tercero para alcanzar el máximo nivel de fiabilidad o de excitación de la alarma, el humo debería de ocupar así una región de tamaño de 10 × 20 en el vídeo.

5. CONCLUSIONES

Se ha propuesto un sistema de detección en vídeo de humo en tiempo real que emplea descriptores de correlación con una máquina de soporte vectorial. Una contribución importante de este artículo es el uso de correlaciones de los datos en el tiempo durante el proceso de decisión. La mayoría de métodos de detección de humo usan separadamente el color y la información espacial y temporal, pero en este trabajo hemos utilizado matrices de correlación extendidas en el dominio temporal para emplear toda la información conjunta. El método propuesto consideramos que es eficiente computacionalmente, ya que se pueden procesar frames de vídeo de 320 × 240 a 15-20 fps en un pc de prestaciones normales.

Agradecimientos

This work was supported in part by FIRESENSE (Fire De- tection and Management through a Multi-Sensor Network for the Protection of Cultural Heritage Areas from the Risk of Fire and Extreme Weather Conditions, FP7-ENV-2009- 1244088-FIRESENSE).

REFERENCIAS

[1] Philippe Guillemant and Jerome Vicente, “Real-time identification of smoke images by clustering motions on a fractal curve with a temporal embedding method,” Optical Engineering, vol. 40, no. 4, pp. 554–563, 2001.

[2] Jerome Vicente and Philippe Guillemant, “An image processing technique for automatically detecting forest fire,” International Journal of Thermal Sciences, vol. 41, no. 12, pp. 1113 – 1120, 2002.

[3] F. Gomez-Rodriguez, B. C. Arrue, and A. Ollero, “Smoke monitoring and measurement using image pro- cessing: application to forest fires,” in Society of Photo- Optical Instrumentation Engineers (SPIE) Conference Series, F. A. Sadjadi, Ed., Sept. 2003, vol. 5094, pp. 404–411.

[4] Damir K., Darko S., and Toni J, “Histogram- based smoke segmentation in forest fire detection sys- tem,” INFORMATION TECHNOLOGY AND CON- TROL, 2009.

Page 6: DETECCIÓN DE INCENDIOS EN TIEMPO REAL … · humo basada en video es una alternativa prometedora a los ... sub-algoritmos que detectan: (i) ... Condition 1 Y > T Y Condition 2

[5] Qinjuan L. and Ning H., “Effective dynamic object de- tecting for video-based forest fire smog recognition,” in 2nd International Congress on IImage and Signal Pro- cessing CISP, 2009, pp. 1–5.

[6] B. U. Toreyin and A. E. C etin, “Computer vision based forest fire detection,” in IEEE 16. Sinyal Isleme ve Iletisim Uygulamalari Kurultayi, SIU-2008, 2008.

[7] B. U. Toreyin and A. E. C etin, “Wildfire detection us- ing lms based active learning,” in in Proceedings of the IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP, 2009.

[8] FIRESENSE, “Fire detection and management through a multi-sensor network for the protection of cul- tural heritage areas from the risk of fire and extreme weather conditions, fp7-env-2009-1244088-firesense,” 2009, http://www.firesense.eu.

[9] O. Tuzel, F. Porikli, and P. Meer, “Region covariance: A fast descriptor for detection and classification,” Com- puter Vision–ECCV 2006, pp. 589–600, 2006.

[10] H. Tuna, I. Onaran, and A. Enis C etin, “Image descrip- tion using a multiplier-less operator,” Signal Processing Letters, IEEE, vol. 16, no. 9, pp. 751 –753, sept. 2009.

[11] B. U. Toreyin, Y. Dedeoglu, and A. E. C etin, “Flame detection in video using hidden markov models,” in International conference on Image Processing (ICIP), 2005, pp. 1230–1233.

[12] B. U. Toreyin, Y. Dedeoglu, U. Gudukbay, and A. E. C etin, “Computer vision based system for real-time fire and flame detection,” Pattern Recognition Letters, vol. 27, pp. 49–58, 2006.

[13] B. U. Toreyin, Y. Dedeoglu, and A. E. C etin, “Wavelet based real-time smoke detection in video,” in European Signal Processing Conference (EUSIPCO), 2005.

[14] Z. Zivkovic, “Improved adaptive gaussian mixture model for background subtraction,” in Pattern Recog- nition, 2004. ICPR 2004. Proceedings of the 17th Inter- national Conference on, aug. 2004, vol. 2, pp. 28 – 31 Vol.2.

[15] Chih-Chung Chang and Chih-Jen Lin, LIBSVM: a library for support vector machines, 2001, Soft- ware available at:

http://www.csie.ntu.edu.tw/˜cjlin/libsvm