ReCaptcha: Recyclage 2.0
Marilyse Dionne | 30 septembre 2008ReCaptcha est un captcha nouveau genre; une idée brillante qui comble deux besoins que rien ne lie en apparence: enrayer le spam, et numériser des vieilles publications imprimées afin d’en archiver le contenu.
Comment ça marche? Les publications sont scannées pour produire des fichiers images. Ces derniers sont ensuite « lus » par un programme de reconnaissance de caractères afin d’identifier les mots et les archiver dans un format numérique. La lisibilité des textes n’étant pas toujours optimale, certains mots échappent au programme de reconnaissance. C’est ici que s’exprime toute la brillance du processus de reCaptcha : les images des mots problématiques sont isolées pour être relayées dans un formulaire sur le Web et être décryptés par les usagers. La routine de saisie de reCaptcha sert ainsi deux fonctions : distinguer l’usager qui complète le formulaire des robots de spam, et mettre à profit la connaissance des ces mêmes usagers pour pallier aux manques des programmes de reconnaissance numérique.
Le projet est une initiative Luis von Ahn, assistant professeur à l’école des sciences informatique de l’université Carnegie Melon. Von Ahn a travaillé à la conception des modules de captcha en 2000 pour le compte de Yahoo. Il a été frappé par la somme des minutes perdues par les usagers lors de la saisie d’information en ligne. Les chiffres sont effectivement saisissants: à elle seule, la complétion de captcha représente 60 millions de saisies par jour sur le Web. En comptant 10 secondes la saisie, on parle de 150 000 heures. La journée de travail de 18 500 personnes. Avec le projet de reCaptcha, Von Ahn dit souhaiter récupérer les processus humains gaspillés et mettre à profit l’intelligence et les ressources collectives. Une sorte de piggyback technologique.
Dans le même esprit, on pense à Google Image Labeler lancé l’an dernier. Par contre, dans le cas de reCaptcha ce qui frappe c’est l’automatisation des processus et le fait qu’une seule intervention serve deux projets tellement éloignés.














2 octobre 2008 à 7:46
Super intéressant comme article. En plus, il existe un tas de plugins pour intégrer ce genre de captcha sur des plateformes connues telles que Wordpress ou encore Drupal.
3 octobre 2008 à 9:44
“Von Ahn dit souhaiter récupérer les processus humains gaspillés et mettre à profit l’intelligence et les ressources collectives”
Brillant!