Laboratoire de Recherche LATIS Laboratory of Advanced Technology and Intelligent Systems

Actualités

PROPOSITION DE STAGE

Sujet du stage : Implémentation et intégration d’un module de numérisation cognitive d’images de documents d’archives dans un scanner

 Mots clés : Scanner intelligent, caractérisation des documents d’archives, apprentissage profond.

 Informations complémentaires :

 Encadrante :

  • Maroua Mehri (mehri@gmail.com) - "Laboratory of Advanced Technology and Intelligent Systems" (LATIS) - ENISo - Université de Sousse - Tunisie

 Laboratoire :

  • LATIS - Université de Sousse - Tunisie

 Axe thématique :

  • "Signal, image et document" - LATIS - Université de Sousse - Tunisie

 Date de début du stage : Février/Mars 2021

Durée du stage : 5 mois

Lieu de stage : LATIS - École Nationale d'Ingénieurs de Sousse, BP 264 Sousse 4023

 

Les documents de candidature à envoyer (CV, lettre de motivation, lettres de recommandation et relevés de notes) à envoyer à maroua.mehri@gmail.com.

Contexte de l’étude :

 

Dans un contexte général international où se multiplient les grands projets d’acquisition et de valorisation du patrimoine archivistique, nous travaillons actuellement dans un projet de recherche se focalisant sur l’étape de numérisation. Notre projet est en collaboration avec la société « Smart Information Trade » et les archives nationales de Tunisie (ANT). Notre projet se focalisera sur le développement d’un scanner intelligent qui sera mis à la disposition des ANT et de tout autre organisme intéressé par la numérisation des documents. Notre solution permettra de fournir, en plus de l’image numérisée, une caractérisation précise de son contenu et une transcription automatique du texte inclus dans le document scanné, une tâche très fastidieuse souvent effectuée manuellement par un archiviste.

Description du sujet de stage :

 

Récemment, avec l’essor des architectures profondes des travaux de recherche ont proposé d’utiliser des représentations à base d’apprentissage profond (e.g. réseaux neuronaux profonds) pour segmenter des images. Ces représentations à base d’apprentissage profond ont permis d’atteindre des performances très satisfaisantes pour la segmentation et la reconnaissance d’objets dans les images [1-6].

Nous proposons ainsi une solution basée sur l’apprentissage profond qui sera intégrée sur un scanner. La solution proposée sera à base de réseaux de neurones profonds assurant la caractérisation des contenus des documents numérisés (i.e. identification des zones graphiques et textuelles).

Pour valider la méthode proposée, de nombreuses expérimentations seront menées sur un large corpus d’images de documents anciens. La méthode proposée pourra finalement être intégrée dans un module de numérisation cognitive de documents à ajouter aux scanners. Ce module pourra par la suite assister le travail, entre autres des archivistes, notamment aux niveaux : transcription, archivage et indexation des documents.

Le sujet de stage proposé est orienté à la fois recherche et développement. Il portera sur les volets suivants :

  1. Exploration des architectures profondes ;

 

  1. Implémentation et intégration de la solution profonde proposée dans un module à ajouter aux scanners ;

 

  1. Mise en place, test et validation du prototype du module produit dans le processus de numérisation.

Profil recherché :

 Ce stage s'adresse aux étudiants de 2ème année master recherche ou de 3ème année d'école d’ingénieurs en informatique, électronique, télécommunications embarquées ou mécatronique.

 

Pré-requis et contraintes particulières :

 Forte motivation pour la recherche et l’innovation ;

  • Connaissances en intelligence artificielle (deep learning…) et les outils associés (keras…) ;
  • Maîtrise de python ;
  • Compétences en développement de systèmes embarqués.

 

Références bibliographiques :

 [1] O. Mechi, M. Mehri, R. Ingold and N. Essoukri Ben Amara. Combining Deep and Ad-hoc Solutions to Localize Text Lines in Ancient Arabic Document Images. International Conference on Pattern Recognition, 7759-7766, 2020.

[2] O. Mechi, M. Mehri, R. Ingold and N. Essoukri Ben Amara. A Text Line Extraction Method for Archival Document Transcription. International Multi-Conference on Systems, Signals and Devices, 479-484, 2020.

[3] O. Mechi, M. Mehri, R. Ingold and N. Essoukri Ben Amara. Text Line Segmentation in Historical Document Images Using an Adaptive U-Net Architecture. International Conference on Document Analysis and Recognition, 369-374, 2019.

[4] O. Mechi, M. Mehri, and N. Essoukri Ben Amara. Une architecture U-Net adaptée pour l’extraction des lignes de texte dans des documents anciens. Symposium International Francophone sur l'Ecrit et le Document, 2019.

[5] K. Chen, M. Seuret, J. Hennebert and R. Ingold. Convolutional Neural Networks for Page Segmentation of Historical Document Images. International Conference on Document Analysis and Recognition, pp. 965-970, 2017.

[6] V. Badrinarayanan, A. Kendall and R. Cipolla. SegNet: A Deep Convolutional Encoder-Decoder Architecture for Image Segmentation. IEEE Transactions on Pattern Analysis and Machine Intelligence, pp. 2481-2495, 2017.