Le 29 septembre 2009

L’API de Google Docs pour la traduction et l’OCR


Google Document List API Traduire du texte est déjà possible avec Google Docs, l’OCR pas encore.

L’API « Document List Data » de Google, destinée aux développeurs qui souhaitent réaliser des applications en lien avec Google Docs, se dote aujourd’hui de deux nouvelles fonctionnalités.

La première permet d’envoyer un texte au serveur de Google, cela créera automatiquement un nouveau fichier dans votre compte Google Docs contenant la traduction du texte dans la langue de votre choix. La méthode à suivre est décrite dans la spécification du protocole. Toutefois, les utilisateurs peuvent traduire eux-même leurs propres documents directement depuis Google Docs, puisque l’option traduire se trouve dans le menu outils.

La seconde fonctionnalité n’est pas encore proposée aux internautes. Grâce à l’API, vous pouvez envoyer une image à Google, qui réalisera une reconnaissance optique de caractères (OCR) et créera automatiquement un nouveau fichier Google Docs contenant le texte.

Un exemple a été mis en place par Google pour vous permettre de tester ceci. Vous ne pouvez envoyer que des fichiers GIF, JPEG ou PNG. Pour que tout fonctionne correctement, il est indiqué que les caractères doivent faire au moins 10 pixels de haut et faire partie de l’alphabet latin, comme ce fichier.

Néanmoins, ne vous attendez pas à de l’OCR de haute voltige : ce n’est visiblement pas le même outil que celui qui est utilisé pour Google Books et alimenté prochainement par reCAPTCHA. Hormis la page d’exemple fournie par Google, aucune de nos images n’a pu être décodée correctement, pas même celles extraites de Google Books

Publié le 29 septembre 2009 à 16:23 par dans Actualité

Billet trop ancien. Les commentaires sont maintenant fermés.