14
Propostes PFC 2012-13 Document Analysis Group http://dag.cvc.uab.cat

Propostes PFC 2012-13

  • Upload
    cloris

  • View
    41

  • Download
    0

Embed Size (px)

DESCRIPTION

Propostes PFC 2012-13. Document Analysis Group http://dag.cvc.uab.cat. El grup d’Anàlisi de Documents. Word spotting (cerca de paraules en imatges ). Essex. Word spotting (cerca de paraules en imatges ). Diversos subprojectes. Classificació d’imatges. Interfície web. - PowerPoint PPT Presentation

Citation preview

Page 1: Propostes PFC 2012-13

Propostes PFC 2012-13

Document Analysis Grouphttp://dag.cvc.uab.cat

Page 2: Propostes PFC 2012-13

2

El grup d’Anàlisi de Documents

Page 3: Propostes PFC 2012-13

Word spotting (cerca de paraules en imatges)

3

Essex

Page 4: Propostes PFC 2012-13

Word spotting (cerca de paraules en imatges)

4

Titol: Cercador web de text en imatges (5152)

Director: Ernest Valveny ([email protected])

Resum:Els cercadors web ens permeten fàcilment buscar una paraula qualsevol dins del text de les pàgines web així com també trobar imatges relacionades amb aquella paraula. Però, en general no són capaços d’indexar i trobar el text que apareix dintre de les imatges que hi ha a la web. L’objectiu d’ aquesta proposta és utilitzar i avaluar tècniques de visió per computador per poder implementar alguns dels mòduls necessaris per incloure en un cercador web la funcionalitat de poder buscar una paraula en el text inclòs a les imatges (ja sigui text imprès o manuscrit, ja sigui en imatges de documents o qualsevol altre tipus d’imatge) Generació de deformacions del text

Barcelona Barcelona, Barcelona, Barcelona, Barcelona, Barcelona, Barcelona, Barcelona, Barcelona,

Diversos subprojectes

Interfície web Classificació d’imatges

Cerca text imprés Cerca text manuscrit

Page 5: Propostes PFC 2012-13

Word spotting (cerca de paraules en imatges)

5

Titol: Redes Neuronales para descubrir notas escritas a mano en documentos (5172)

Director: Volkmar Frinken ([email protected]) Oriol Ramos Terrades ([email protected])

Resum:La forma más ágil de añadir información a un texto impreso es escribiendo anotaciones en los márgenes y entre el texto e imágenes de los documentos. Este proyecto trata sobre el uso de Redes neuronales para el desarrollo de una herramienta que pueda detectar estas anotaciones.

Documentos papel

Documentos electrónicos

Page 6: Propostes PFC 2012-13

Word spotting (cerca de paraules en imatges)

6

Titol: Métodos de aprendizaje para extracción automática de texto en entornos urbanos

Director: Dimosthenis Karatzas ([email protected])Volkmar Frinken ([email protected])

Resum:En este proyecto se desarrollará un algoritmo para localizar y reconocer texto en imágenes complejas, como por ejemplo fotografías sacadas en ambientes urbanos. Tales imágenes presentan una gran variedad de desafíos que dificultan la extracción automática (localización y reconocimiento) de texto. Dado un conjunto de regiones detectadas en las imágenes (algunas de ellas correspondientes a caracteres) y la transcripción del texto en cada imagen, los estudiantes investigarán métodos alternativos de aprendizaje para extracción automática de texto.

Transcription

Segmentation

Student Accounts Do you Know anyone starting university this year?

Page 7: Propostes PFC 2012-13

Word spotting (cerca de paraules en imatges)

7

Titol: Aplicación basada en Android para la traducción de texto en imágenes

Director: Dimosthenis Karatzas ([email protected])Lluis Gomez i Bigorda ([email protected])

Resum:En este proyecto se desarrollará una aplicación en un dispositivo Android que permita la extracción (localización y reconocimiento) de texto en imágenes obtenidas con la cámara del mismo dispositivo, como por ejemplo fotografías de letreros o carteles. El estudiante diseñará e implementará la aplicación en el dispositivo, que incluirá los siguientes pasos: análisis de la imagen y extracción de componentes, clasificación de componentes y detección de líneas de texto, reconocimiento del texto y traducción automática del texto reconocido. La mayoría de los pasos se basaran en librerías externas que se deben integrar en la aplicación final.

Page 8: Propostes PFC 2012-13

Projecte 5CofM (Five Centuries of Marriages)

8

• Projecte d’abast europeu entre la UAB, CED i CVC.• Objectiu: Data-mining del Llibres d'Esposalles conservat a l’Arxiu de la Catedral

de Barcelona. Conté 291 llibres manuscrits de registres matrimonials (aproximadament 610.000 matrimonis celebrats en més de 250 parròquies de la diòcesi entre 1451 i 1905.

• En general, els registres matrimoials, naixement, defunció, censos, són la font per als demògrafs, genealogistes I historiadors per fer estudis sobre la població però … milions de dades que cal processar !

Dicta die 13 Juny 1786D(on) Domingo Felix de Mora y de Areny/ Marques de Llio fill de D(on) J(ose)ph de Mora, / y de D(ona) Violante de Areny A(m)b D(ona) M(aria) / Caetana de Paguera filla de D(on) Narcis / de Paguera y Sala y de D(ona) M(aria) Ventura / Vilalba Par(roquia) Pi 24 lliures

On said date of the 13 of June 1786Don Domingo Felix de Mora y de Areny Marques of Llio son of Don Joseph de Mora, and of Dona Violante de Areny with Dona Maria Caetana de Paguera daughter of Don Narcis de Paguera y Sala and of Dona Maria Ventura Vilalba Pi Parish 24 lliures

Page 9: Propostes PFC 2012-13

9

Projecte 5CofM (Five Centuries of Marriages)

Titol: Gamesourcing: Un joc d'ordinador per a transcripció de manuscrits històrics.

Directors: Josep Lladós (Email: [email protected]), Alicia Fornés (Email: [email protected])

Resum:En aquest projecte ens plantegem una nova tendència de crowdsourcing, que és el gamesourcing. Això consisteix a incorporar dins d'un joc d'ordinador l'etiquetatge d'informació, en el nostre cas transcripcions. Un exemple senzill seria un joc a Facebook on els usuaris aconsegueixin l'objectiu (passar de nivell, aconseguir punts, etc.) si escriuen correctament una paraula (entesa per exemple com una clau dins d'una història en la que el joc estigui ambientada). El projecte per tant consistirà a dissenyar i implementar un joc d'ordinador que inclogui la tasca de transcripció de manuscrits històrics.

Page 10: Propostes PFC 2012-13

10

Projecte 5CofM (Five Centuries of Marriages)

Titol: Xarxa social històrica. Construcció i cerca d'arbres genealògics.Directors: Josep Lladós (Email: [email protected]), Alicia Fornés (Email: [email protected])

Resum:En aquest projecte es treballarà a partir d'una base de dades real que emmagatzema cinc segles de matrimonis de l'Arxiu de la Catedral de Barcelona. A partir d'aquesta base de dades (format MySQL), l'objectiu del projecte serà el de construir primer el graf de relacions entre les persones registrades a la base de dades. Un segon objectiu serà el de construir un entorn de cerques basat en una pàgina web on a partir d'un nom es pugui mostrar gràficament el seu arbre genealògic, o altres cerques com connexions entre persones, les agrupacions segons vinculació a un lloc o un parentiu, etc..

Page 11: Propostes PFC 2012-13

Language ModellingTitol: Modeling an language with neural networks

Director: Volkmar Frinken (Email: [email protected])

Resum: Studying several types of neural networks for creating a language model, i.e., a program that predicts the next word when the beginning of a sentence is given

Titol: Recognition of historic texts in several languages.

Director: Volkmar Frinken (Email: [email protected])

Resum: Studying how to create langauge models when only limited information about a langauge is known. Specifically it should be studied if Old Spanish can be used to create a language model for old Catalan.

Page 12: Propostes PFC 2012-13

12

Interpretació de plànols arquitectura 2D

Titol: Càlcul de descriptors de símbols en JPEG 2000 (5173)

Director: Oriol Ramos Terrades (Email: [email protected])

Resum:Implementar un petit conjunt de mètodes usats pel reconeixement de símbols sobre la representació comprimida de la imatge utilitzant la llibreria OpenJPEG http://www.openjpeg.org

Page 13: Propostes PFC 2012-13

13

Altres projectes

Titol: Reconocimiento de Posturas de bebes basado en Android (5123)

Director:Dimosthenis Karatzas (Email: [email protected]) and Sergio Escalera (Emaiil: [email protected])

Resum:En este proyecto el alumno desarrollará una aplicación Android para el análisis en tiempo real de secuencias de vídeo de bebés que se mueven de forma natural en su cuna. El objetivo es detectar y reconocer una serie de movimientos predefinidos: el movimiento de la cabeza, los dos brazos y las dos piernas. El algoritmo tiene que ser robusto a condiciones reales y hacer frente satisfactoriamente a cambios de iluminación, variaciones de perspectiva y oclusión.El estudiante debe construir un prototipo de aplicación que se ejecute en un teléfono Android. Las secuencias de video de prueba serán proporcionadas.

Page 14: Propostes PFC 2012-13

14

Altres projectes

Titol: Implementació d’algorismes bàsics de Visió per Computador en una Raspberry Pi

Director:Marçal Rusiñ[email protected]:Implementar, algorismes bàsics de Visió per Computador (processament bàsic d'imatges, background substraction, detecció de cares, detecció de text en imatges, etc...) en una Raspberry Pi per estudiar-ne les seves limitacions.

La Raspberry Pi:• Mida d'una tarja de visita• Cost un 30$• 700 Mhz ARM processador• 256 MB RAM• USB, Ethernet, GPIO...