reCAPTCHA
reCAPTCHA er et system opprinnelig utviklet av Carnegie Mellon University som bruker CAPTCHA til å digitalisere teksten i bøker samtidig som det holder roboter ute fra nettsteder de ikke skal ha tilgang til. 16. september 2009 ble reCAPTCHA kjøpt opp av Google.[1] Prosjektet arbeider per 2009 med digitalisering av The New York Times’ arkiv. De har digitalisert 20 års arkiver, og håper å være ferdige med 110 år til innen 2010.[trenger oppdatering][2]
reCAPTCHA sender bilder av ord som tekstgjenkjennelsesteknologi (OCR) ikke har klart å tyde til samarbeidende nettsider. Nettsidene, som som regel ikke har noe å gjøre med digitaliseringsprosjektet å gjøre, gir dermed sine brukere i oppgave å løse disse ordene på samme måte som med annen CAPTCHA, som del av en valideringsprosess. De sender dermed resultatet tilbake til reCAPTCHA, som bruker disse i digitaliseringsjobben.
Systemet har rapportert å løse 200 millioner CAPTCHA-oppgaver per dag (per 2010),[3] og samarbeider med sider som Facebook, Twitter, TicketMaster, Craigslist og StumbleUpon.
Referanser
[rediger | rediger kilde]- ^ Luis von Ahn og Will Cathcart (16. september 2009). «Teaching computers to read: Google acquires reCAPTCHA» (på engelsk). Google. Besøkt 20. september 2009.
- ^ Luis von Ahn. (2009). NOVA ScienceNow s04e01. [TV-program]. Sitatet er fra 46:58. «The New York Times has this huge archive, over 130 years of newspaper archive there. And we've done maybe about 20 years so far of The New York Times in the last few months and I believe we're going to be done next year by just having people do a word at a time.»
- ^ reCAPTCHA: About us
Eksterne lenker
[rediger | rediger kilde]- (en) Offisielt nettsted
- (en) ReCAPTCHA – kategori av bilder, video eller lyd på Commons