Le géant internet russe Yandex dévoile une IA déchiffrant les manuscrits prérévolutionnaires
Suivez Russia Beyond sur Telegram ! Pour recevoir nos articles directement sur votre appareil mobile, abonnez-vous gratuitement sur https://t.me/russiabeyond_fr
En 1918, le jeune pouvoir bolchévique a entrepris une vaste réforme linguistique, visant à réduire l’analphabétisme et à simplifier la langue russe. Cela est notamment passé par une modification de son alphabet, des signes ayant été remplacés par d’autres, tandis que certains ont tout bonnement disparu. Il en résulte que les écrits prérévolutionnaires s’avèrent aujourd’hui parfois difficiles à comprendre.
Conscient de ce problème, Yandex, ce mastodonte russe du Web, a développé une intelligence artificielle (IA), disponible en suivant ce lien, permettant de déchiffrer les manuscrits datant de la période impériale. L’ayant entraînée sur la base d’un nombre considérable d’écrits des XVIII-XIXe siècles, ainsi que de millions d’exemples générés artificiellement, les spécialistes lui ont appris, par le biais de la reconnaissance optique des symboles, à prendre en compte les spécificités de l’écriture manuscrite, à identifier les signes désuets, et à comprendre la structure des documents d’archives.
Lors de ce processus d’apprentissage de l’IA, les développeurs ont eu recours aux Archives centrales de Moscou, mais la base de données englobe d’ores et déjà celles des régions d’Orenbourg et de Novgorod, et est vouée à s’élargir avec le temps.
De cette manière, les utilisateurs peuvent désormais consulter près de 2,5 millions de documents allant de la moitié du XVIIIe siècle au début du XXe et les déchiffrer. Grâce à l’exploration de la base de données par filtres, par exemple par année ou par fonds d’archives, mais aussi en lançant une recherche de nom de famille ou d’un lieu précis, les internautes pourront retrouver, notamment, des traces de leurs ancêtres. Il est ainsi attendu que cet outil soit d’une aide précieuse pour les historiens, sociologues et démographes, mais aussi pour les particuliers se chargeant de la reconstitution de leur arbre généalogique.
« J’ai décidé d’expérimenter, et l’acte de naissance de mon grand-père a été trouvé en 20 secondes environ. Mon frère et moi avions cherché ce document nous-mêmes au printemps dernier, avant que ce service ne soit disponible, et la recherche avait duré plusieurs jours : nous avions dû lire à quatre mains les livres d’Église numérisés de Moscou pour l’année 1915. Néanmoins, l’intelligence artificielle ne nous a pas aidés à résoudre notre principal problème – déchiffrer le nom de la ville polonaise d’où vient notre arrière-grand-mère, mais nous n’avons pas eu de chance – l’enregistrement écrit a été réalisé de manière très négligée », commente ainsi une Moscovite ayant décidé de tester ce nouveau service.
Si vous pensez savoir déchiffrer l’écriture manuscrite russe, véritable casse-tête pour les étrangers, testez donc vos aptitudes grâce à notre quiz, disponible en suivant ce lien.
Notre site web et nos comptes sur les réseaux sociaux sont menacés de restriction ou d'interdiction, en raison des circonstances actuelles. Par conséquent, afin de rester informés de nos derniers contenus, il vous est possible de :
- Vous abonner à notre canal Telegram
- Vous abonner à notre newsletter hebdomadaire par courriel
- Activer les notifications sur notre site web