Desde 1994 en la Red. La pagina de los aficionados a la electronica, informatica y otras curiosidades de la vida. No dudes en visitarnos.
Ahora 2 visitas.| 3409652 Visitas (desde Dic. 2011), hoy: 310 Visitas 765 Pag. Vistas , ultimos 36 dias: 10067 Visitas. 48355 Pag. Vistas. Tu IP: 3.145.173.112
Que ando curioseando:
AutosuficienciaCosas de casaElectronicaEn InternetInformáticaMundo MisticoSin categoríaSociedadTe lo recomiendo

pesadillo.com incorpora reCAPCHA a la web

El alto volumen de ataques spam a la web, me ha obligado a incorporar una proteccion efectiva ante robots publicitarios:

Google adquiere reCAPCHA para usar su tecnología en Google Books

Si navegas habitualmente por internet seguro te habrás topado con el sistema de verificación llamado “reCAPCHA“. Este sirve para evitar que programas informáticos manipulen los formularios de búsqueda o ingreso de datos, creando una barrera infranqueable a la hora de hacerse pasar por un humano. De esta manera el propietario del website que usa este sistema se asegura de que sus contenidos webs no son victimas de la manipulación electrónica que abunda en estos días.

Por ejemplo un día entramos en un website que realiza un servicio de búsqueda por ejemplo de dominios libres de internet, pero sin saberlo cuando hacemos clic en el botón de buscar este accede a una web tercera para realizar la búsqueda de forma robotizada y luego muestra en sus páginas los resultados  como si fuese una tecnología propia. Lo cierto es que si esa tercera web utilizara reCAPCHA no tendría el problema de que abusasen de su sistema.

Pues ahora la noticia dice que Google ha comprado esta compañía y la usará en su “Google Book Search” (Busqueda de libros)….

Actualmente reCAPCHA brinda el servicio a más de 100.000 websites. El sistema muestra letras o palabras mal formadas que solo pueden ser interpretadas por un humano. Además, cuenta con la posibilidad de emitir esas mismas palabras en formato de audio. La mayoría de los sistemas de Blogs que hoy en día se usan en la web, ofrecen la posibilidad de implementar reCAPCHA en las páginas de los usuarios de forma gratuita.

No ha trascendido la suma del monto económico del acuerdo, pero explican un poco el trasfondo del interés de Google por la compañía. Al parecer la clave de reCAPCHA pasa por que las letras y palabras que muestra proviene de segmentos de libros, revistas y periódicos escaneados, que con el paso del tiempo se han ido degradando. De esta forma las letras que vemos no han sido generadas por un computador inicialmente lo que dificultaría la forma de hacer la digitalización del texto por parte de un robot. (Con la vieja tecnología de OCR (Optical Character Recognition)

Por lo tanto explican que reCAPCHA ha desarrollado una tecnología superior de OCR a la hora de reconocer texto para emplearlo en su sistema. Y esta misma tecnología sería la que Google desearía implementar para escanear y digitalizar libros y otros documentos.

De esta forma se pueden hacer dos conjeturas.

  • Una, que Google adquiere la tecnología para uso propio y no dará servicio de filtrado de SPAM en webs de terceros
  • Dos, reCAPCHA seguiría funcionando de tal manera, quizás ahora con la ayuda de los altas prestaciones de los servidores de Google.

reCAPTCHA

Re-Capcha es el invento de un ingenioso joven programador que decidió poner manos sobre el asunto, ayudar a las bibliotecas a digitalizar sus libros y a los sitios web a mantenerse limpios de spam.

Las computadoras no pueden reconocer bien lo que dicen ciertos textos antiguos en papel, por lo cual son necesarios el ojo y el cerebro humanos para comprenderlos y ayudar a digitalizarlos, pasando de imágenes en pixels (la foto de la página de un libro) a texto de computadora (el tipo de texto digital que vemos en cualquier sitio web o tipeamos en nuestro procesador de textos)

Cada vez que tipeas en capcha de reCAPTCHA estás contribuyendo con la preservación de gran parte de la cultura de la humanidad. Los medios masivos de comunicación se hicieron eco de la historia: Wall Street Journal, Boston Globe, Guardian, Wired entre otros cientos de publicaciones importantes destacaron la iniciativa. Cerca de 75.000 sitios web se han subscripto a la utilización de este servicio, incluyendo los enormes Facebook, Craigslist o Ticketmaster, y hasta ahora algo así como 300 millones de personas (más del 5% de la población mundial!) ayudó a digitalizar contenidos desde New York Times y Internet Archive. Por lo pronto, unas 5.000 millones de palabras han sido procesadas por humanos en operaciones reCAPTCHA.

Escribe un comentario

Tu comentario