Google ha comprat reCaptcha, una empresa que fins ara oferia a més de 100.000 de webs un sistema de CAPTCHA gratuït una mica particular.

L’anunci es va fer públic fa dos dies al blog de Google, i s'ha de reconèixer que ha estat, un cop més, una maniobra brillant del Gran Germà de la xarxa, que amb un tret net ha matat dos ocells. Analitzem la jugada.

reCaptcha
Els CAPTCHA (acrònim anglès de Completely Automated Public Turing test to tell Computers and Humans Apart), són aquelles paraules arbitràries i difícils de llegir que acostumem a introduir en una capseta quan ens registrem a un web per demostrar que som humans, i no malvats robots intentant forçar el sistema.

La particularitat que distingeix el sistema de reCaptcha és que ofereix sempre dues paraules: la primera és una paraula normal que ha estat distorsionada per tal que resulti comprensible només per a un humà. Fins aquí, cap novetat. Però la segona paraula té trampa: es tracta d’un terme provinent d’un llibre antic o d’un diari que ha estat escanejat prèviament per un sistema de digitalització (OCR) però que no ha pogut ser identificat per la màquina. I quan la màquina fracassa... entra en joc l’humà.

Quan en el nostre dia a dia en línia ens trobem amb un reCaptcha i introduïm les dues paraules, el sistema analitza només la paraula “controlada”: si és correcte, dóna per suposat que la segona també ho és, i l’afegeix a la seva base de dades. Acabem de fer-li gratuïtament la feina complicada al sistema de digitalització. Amb 200 milions de nosaltres resolent CAPTCHA cada dia, els resultats són imaginables. No en va el lema de l’empresa era “Evita l’spam, llegeix llibres”.

Imprimeix-me un “Quixot”, sisplau

I aquí entra la segona part de l’equació: durant els últims anys Google porta a terme un controvertit procés de digitalització massiva de llibres i diaris, que són pujats a Google Books i Google News i són indexats pel cercador.

Només un dia després de l’anunci de compra de reCAPTCHA, Google Book Search i l’empresa On Demand Books anunciaven un acord que tornarà els llibres digitalitzats al paper. A partir del 29 de setembre, consumidors de tot el món podran imprimir a demanda qualsevol dels dos milions de llibres de "domini públic" (que tenen els drets d’autor vençuts) que Google ha escanejat en els últims cinc anys. Obres anteriors a 1923, amb el Quixot o "Hamlet” entre elles, podran ser impreses en quatre minuts a un cost d’impressió de 3 dòlars a les llibreries que ofereixin aquesta opció, amb portada en color inclosa (què cobri la llibreria pel llibre ja és un altre tema).

De moment, només llibreries, biblioteques i universitats dels Estats Units, el Regne Unit, el Canadà, Austràlia i Egipte (la biblioteca d’Alexandria) han comprat la màquina que ho fa possible, l’Espresso Book Machine, que va ser considerada un dels millors invents del 2007 per la revista “Time” .