reCaptcha, une vraie innovation web !

reCaptcha est un nouveau service web créé par des étudiants de l’université américaine Carnegie Mellon qui se lance sur une idée que je trouve particulièrement originale : profiter de la saisie fréquente des « captcha » pour faire une autre action « utile ».

2007-05-23 Recaptcha-5

Les captchas (cf. l’article détaillé sur Wikipédia), ce sont ces petites images tarabiscotées qui apparaissent lors de la création d’un compte sur un site, par exemple, et qui permettent de distinguer un vrai humain d’un ordinateur. Ils permettent donc d’éviter que des personnes malveillantes réalisent des scripts informatiques pour répéter ad nauseam des actions comme envoyer un mail ou un SMS, créer un compte ou poster des commentaires avec des liens vers des sites porno((hop, j’ai casé porno dans un post, ca va me générer du trafic, ça :-))) dans un blog.

La vraie innovation de reCaptcha, c’est de présenter à l’utilisateur deux mots : l’un est connu du système et est le « vrai » captcha qui reconnaît un humain, quant au second, c’est une image provenant d’un fond de livres scannés mais pas numérisés au sens « convertis en texte » : le fait de la saisir permet donc de contribuer à transformer en texte informatique un livre qui ne l’est pas encore ! Chaque personne résolvant un reCaptcha numérise donc un tout petit bout d’un livre (un mot !) — d’après les auteurs du service, près de 60 millions de captchas sont résolus chaque jour : on peut imaginer la puissance de numérisation si tous étaient convertis en reCaptcha.

Autres éléments intéressants de reCaptcha :

  • C’est un service gratuit intégrable sur n’importe quel site — en particulier, les auteurs fournissent un plugin WordPress tout prêt (mémo to myself : à essayer !)
  • Ce système permet aussi de masquer une adresse mail, ce qui permet de s’assurer que seul un humain pourra la voir, et donc qu’elle ne pourra pas être « moissonnée » par un robot de spammeur comme celle-ci oliv@fontenelle.org
  • Enfin, le site web est fait avec Django, un framework en Python qui a l’air sympathique 😉

Technorati Tags:

10 réflexions au sujet de « reCaptcha, une vraie innovation web ! »

  1. En effet l’idée est pas mal du tout 🙂
    Reste à savoir si c’est vraiment efficace pour la numérisation de nouveaux livres ^^
    Merci de cette information 🙂

  2. Deux jours d’avance sur le post de M Nauges sur le même sujet, ça mériterait un ptit link entre les deux articles, ça.

  3. Merde! c pas un site porno 🙁 …

    Sinon, reCaptcha est une EXELLENTE idee…

  4. Je trouve que l’idée est très bonne !
    Cependant :
    J’imagine que pour que le captcha fonctionne, il faut que la valeur entrée par l’utilisateur et celle qui apparait sur l’image soient identiques.
    Cela nécessite donc une comparaison entre deux valeurs.
    Le premier mot doit permettre cela alors que le second mot doit être non comparé.
    Si l’utilisateur entre une valeur fausse pour le second mot, le captcha ne le détectera pas.
    Il y a donc des chances pour que la traduction soit imparfaite.
    Je me trompe ? .

  5. Wavemaker : tu as raison, mais ils ont prévu ce coup-là 🙂

    En fait, le second captcha est soumis à plusieurs personnes de manière aléatoire, ce qui permet de comparer les divers résultats et d’identifier les éventuels problèmes. Ca diminue l’efficacité du processus, mais augmente la qualité de la numérisation.

  6. Et pourquoi le deuxième mot est tordu aussi ? J’ai du mal à imaginer un livre aussi mal scanné …

Les commentaires sont fermés.