{"id":107,"date":"2019-01-10T22:33:57","date_gmt":"2019-01-10T21:33:57","guid":{"rendered":"https:\/\/projets.litislab.fr\/plair\/?page_id=107"},"modified":"2024-11-17T21:54:51","modified_gmt":"2024-11-17T20:54:51","slug":"wp1-scan-on-demand","status":"publish","type":"page","link":"https:\/\/projets.litislab.fr\/plair\/wp1-scan-on-demand\/","title":{"rendered":"WP1 : Scan on demand"},"content":{"rendered":"\n<p><a href=\"https:\/\/projets.litislab.fr\/plair\/wp1-scan-on-demand\/\"><strong>WP1 : Scan On Demand<\/strong><\/a>\u00a0: D\u00e9veloppement de technologies de Machine Learning pour instancier des cha\u00eenes de num\u00e9risation et des moteurs d\u2019indexation de corpus \u00e9crits du patrimoine normand.<\/p>\n\n\n\n<p>Les travaux men\u00e9s dans cette t\u00e2che s\u2019int\u00e9ressent \u00e0 d\u00e9velopper des m\u00e9thodes d\u2019analyse d\u2019images de documents pour Transformer les images (des pixels) en du texte informatique (des caract\u00e8res). Cette transformation est indispensable pour pouvoir utiliser les technologies du Web (qui op\u00e8rent sur des textes num\u00e9riques) sur des images de documents. C\u2019est cette transformation qui permet de r\u00e9aliser des biblioth\u00e8ques num\u00e9riques qui offrent des moyens de consultation des ouvrages \u00e0 distance, et ce sans d\u00e9grader les originaux, parfois tr\u00e8s fragiles.<\/p>\n\n\n\n<p>Au cours de PlaIR 2.018 nous avons mis l\u2019accent sur le d\u00e9veloppement de technologies de reconnaissance de textes manuscrits.<\/p>\n\n\n\n<p>\u00c0 partir de l\u2019image obtenue pas scan du document (1) Le syst\u00e8me d\u00e9tecte tout d\u2019abord les lignes d\u2019\u00e9criture pr\u00e9sentes dans l\u2019image (2), puis il d\u00e9tecte et reconna\u00eet les caract\u00e8res sur chaque ligne (2). Enfin, \u00e0 l\u2019aide d\u2019un mod\u00e8le de langage, il corrige en partie les erreurs de reconnaissance (4)<\/p>\n","protected":false},"excerpt":{"rendered":"<p>WP1 : Scan On Demand\u00a0: D\u00e9veloppement de technologies de Machine Learning pour instancier des cha\u00eenes de num\u00e9risation et des moteurs d\u2019indexation de corpus \u00e9crits du patrimoine normand. Les travaux men\u00e9s dans cette t\u00e2che s\u2019int\u00e9ressent \u00e0 d\u00e9velopper des m\u00e9thodes d\u2019analyse d\u2019images de documents pour Transformer les images (des pixels) en du texte informatique (des caract\u00e8res). Cette &hellip; <a href=\"https:\/\/projets.litislab.fr\/plair\/wp1-scan-on-demand\/\" class=\"more-link\">Continuer la lecture de <span class=\"screen-reader-text\">WP1 : Scan on demand<\/span>  <span class=\"meta-nav\">&rarr;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"parent":0,"menu_order":0,"comment_status":"closed","ping_status":"closed","template":"","meta":{"footnotes":""},"class_list":["post-107","page","type-page","status-publish","hentry"],"_links":{"self":[{"href":"https:\/\/projets.litislab.fr\/plair\/wp-json\/wp\/v2\/pages\/107","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/projets.litislab.fr\/plair\/wp-json\/wp\/v2\/pages"}],"about":[{"href":"https:\/\/projets.litislab.fr\/plair\/wp-json\/wp\/v2\/types\/page"}],"author":[{"embeddable":true,"href":"https:\/\/projets.litislab.fr\/plair\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/projets.litislab.fr\/plair\/wp-json\/wp\/v2\/comments?post=107"}],"version-history":[{"count":2,"href":"https:\/\/projets.litislab.fr\/plair\/wp-json\/wp\/v2\/pages\/107\/revisions"}],"predecessor-version":[{"id":109,"href":"https:\/\/projets.litislab.fr\/plair\/wp-json\/wp\/v2\/pages\/107\/revisions\/109"}],"wp:attachment":[{"href":"https:\/\/projets.litislab.fr\/plair\/wp-json\/wp\/v2\/media?parent=107"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}