03 octobre 2006

 

La machine à traduire de Google

google

Peter Norvig, le directeur de la recherche chez Google, a présenté la semaine passée quelques-unes des toutes nouvelles innovations de la société et le futur de l'analyse de données.

Il a d'abord présenté la Statistical Machine Translation, un logiciel de traduction toujours en cours de développement. Le but de ce programme est d'améliorer la précision de la traduction (on s'en serait douté), de la rendre plus humaine. C'est vrai que pour l'instant, Google Translate ne casse pas des briques.

Un logiciel de traduction est vraiment un super exemple de l'utilisation d'énormes quantités de données dans le but d'améliorer continuellement la précision d'un service pour tout le monde.
En résumé, ça veut dire qu'avec tous les services qu'il propose...
... google peut créer un algorithme qui apprend au fur et à mesure la grammaire et la syntaxe, et en tirer profit dans d'autres services, comme la traduction.

Mise à jour du 2 avril 07: ScientificAmerican revient sur la Statistical Machine Translation, expliquant que Google nourrit son algorithme avec une tonne de documents déjà traduits dans les principaux langages mondiaux.

Norvig a également cité d'autres projets de recherche qui découlent du même principe, comme l'amélioration du service sets, qui permet de fournir d'autres mots-clés en relation avec le mot-clé recherché ou encore une future application qui permettra de voir le volume des recherches sur un mot aux différentes périodes de l'année (un peu comme google trends, finalement...)



Source: The Daily Californian, la semaine passée.

Pour ceux qui ne savent pas:

- google books, google scholar ... au moins deux services dont le contenu est certifié à 99,9% sans spam, c'est-à-dire sans donnée faite pour tromper l'utilisateur, sans entourloupe. Bref, un contenu parfait pour le sujet qui nous occupe ici.
- deux nouvelles options sont apparues récemment dans google translate: Arabic-English et English-Arabic. Elles utilisent le prototype de cette Statistical machine translation. Voici quelques résultats de tests.

Libellés :





Commentaires: Enregistrer un commentaire



archives >> fevrier10 - janvier10 - novembre09 - octobre09 - septembre09 - août09 - juillet09 - mars09 - février09 - janvier09 - decembre08 - novembre08 - octobre08 - septembre08 - août08 - juillet08 - juin08 - mars08 - fevrier08 - janvier08 - decembre07 - novembre07 - octobre07 - septembre07 - août07 - juillet07 - juin07 - mai07 - avril07 - mars07 - février07 - janvier07 - decembre06 - novembre06 - octobre06 - septembre06 - août06 - juillet06 - juin06 - mai06 - avril06 - mars06 - février06 - janvier06 - decembre05 - novembre05 - octobre05

Powered by Stuff-a-Blog
une page au hasard

This page is powered by Blogger. Isn't yours?