16
Structuration d'un document textuel Patrick JAMET, Frédéric MOREAU, Ramy TEMIM 07/06/2012 Master 1 Informatique

document textuel Structuration d'un - patrickjamet.com · La structuration d'une page textuel passe par de nombreux pré-traitements (rotation, translation) avant la méthode projection

  • Upload
    lamhanh

  • View
    228

  • Download
    0

Embed Size (px)

Citation preview

Structuration d'un document textuel

Patrick JAMET, Frédéric MOREAU, Ramy TEMIM

07/06/2012

Master 1 Informatique

SommaireI PrésentationII Méthode1. prétraitement

a. Rotation (hough,fourrier)b. Translation, Fermeture du texte

2. projectiona. principeb. interpretationc. recursivité

III Amélioration possibleIV Conlusion

1/10

Présentation

● UE Analyse d'image

● Présentation du projet

● Ensemble de TPs

● Structuration d'une page textuelle

2/10

I PrésentationII Méthode1. prétraitement

a. Rotation(Hough, Fourrier)b. Translation, Fermeture du texte

2. projectiona. principeb. interpretationc. recursivité

III Amélioration possibleIV Conlusion

Transformée de Fourier discrète

1. Image mise en niveaux de gris (optionnel)2. DFT3. Histogramme cumulé inversé4. Binarisation5. Rotation

3/10

Transformée de Hough1. Mise en gris (obligatoire)2. otsu3. accumulateur4. rotation

4/10

Prétraitements

1. Transformationsa. Translationb. Fermeture du texte

2. Comparaison Hough/Fourierrotation 10° avec Gimp sur une image textuelle et un seuil à 120 pour hough

5/10

Comparaison des mesures d'angle

Projection:principeRécupération des histogrammes du nombre de pixels du texte en colonnes et en ligne sur une image binarisé, ce sont les profils de projection.

6/10

Projection:InterpretationAprès analyse des histogrammes on peut encadrer plusieurs zones.

7/10

Projection: récursivitéCertain bloc en contenant d'autre il faut ré-appliquer la projection à l'intérieur de ceux-ci, sinon il ne seront pas détectés.

8/10

I PrésentationII Méthode1. prétraitement

a. Rotation (Hough, Fourrier)b. Translation, Fermeture du texte

2. projectiona. principeb. interpretationc. recursivité

III Amélioration possibleIV Conlusion

Amélioration possibleStructuration de page contenant du texte manuscrit, des images et du texte

Identification des zones (texte, image, liste à puces, titres...)

Intégration à un logiciel de traitement de texte.

9/10

I PrésentationII Méthode1. prétraitement

a. Rotation (Hough, Fourrier)b. Translation, Fermeture du texte

2. projectiona. principeb. interpretationc. recursivité

III Amélioration possibleIV Conlusion

Conclusion

La structuration d'une page textuel passe par de nombreux pré-traitements (rotation, translation) avant la méthode projection (récursive).

Méthode simple et efficace seulement sur les documents dont le contenu est dans des blocs de forme rectangulaire.

Les Résultats obtenus sont satisfaisant, même si des améliorations sont encore possibles.

10/10

Fin

questions ?