sábado, 25 de septiembre de 2010

CAPTCHAS

Foto From mifactur-e.com.mx

Foto From Venezuela.net.ve 

Seguro que muchas veces nos hemos preguntado que son o a que sirven aquellas letras raras y distorsionadas  que tenemos que copiar para darnos de alta en alguna página web.
 Se llaman “Captcha”, y Captcha es el acrónimo de Completely Automated Public Turing test to tell Computers and Humans Apart (Prueba de Turing pública y automática para diferenciar máquinas y humanos).
Se trata de una prueba desafío-respuesta utilizada en computación para determinar cuándo el usuario es o no humano. El término se empezó a utilizar en el año 2000.
La típica prueba consiste en que el usuario introduzca un conjunto de caracteres que se muestran en una imagen distorsionada que aparece en pantalla. Se supone que una máquina no es capaz de comprender e introducir la secuencia de forma correcta por lo que solamente el humano podría hacerlo.
Los captchas son utilizados para evitar que robots, puedan utilizar ciertos servicios. Por ejemplo, para que no puedan participar en encuestas, registrarse para usar cuentas de correo electrónico (o su uso para envío de correo basura) o, más recientemente, para evitar que correo basura pueda ser enviado por un robot (el remitente debe pasar el test antes de que se entregue al destinatario).

Actualmente hacer un captcha seguro requiere métodos complicados de implementar que únicamente poseen las grandes empresas. Pero hay métodos para dificultar a los programas OCR.

Método del tachado

Este método consiste en tachar las letras del captcha de manera que un humano sepa identificarlas pero un software de OCR no pueda separar las unas de las otras. Para este método es importante utilizar un mismo color de letra (realmente modificar el color de poco sirve ya que para reconocerlas las convierten a color negro) y tachar con el mismo color que las letras, a ser posible, una línea que no sea recta y de más de un píxel de grosor.
Método DelaRub
Este método es bastante sencillo de implementar en los captchas. Consiste en utilizar los mismos colores en las letras que en el fondo, de manera que un programa de reconocimiento óptico de caracteres no pueda separar el fondo de las letras. Para hacer esto, utiliza un degradado de color de fondo y las letras tienen el color "inverso" que el degradado. Viendo la imagen se observa mejor la explicación.
Este método consigue un captcha prácticamente irrompible, ya que hasta la fecha no se ha demostrado que ningún programa pueda romper un captcha basado en el método DelaRub.

 Reconocimiento de caracteres por ordenador:

aunque los CAPTCHAs han sido originalmente diseñados para impedir que el software OCR reconozca los caracteres de las imágenes generadas, existen proyectos de investigación que han probado que es posible saltarse muchos CAPTCHAs con programas que han sido específicamente diseñados para un tipo determinado de CAPTCHA. Para CAPTCHAs con letras distorsionadas, la aproximación típica es seguir los siguientes pasos:

  1. Eliminación del ruido de fondo, por ejemplo con filtros de color y detecciones de líneas finas.

  2. Segmentación, por ejemplo partiendo la imagen en segmentos que contienen una sola letra.

  3. Identificar la letra de cada segmento, y así utilizar la información extraída de la imagen.
El paso 1 es típicamente muy fácil de automatizar. En 2005, se mostró que un algoritmo de una red neuronal tiene un menor margen de error que los humanos resolviendo el paso 3.
La única parte donde los humanos superan a las máquinas es en el paso 2. Si el ruido de fondo consiste en formas similares a letras, y las letras están unidas a este ruido, la segmentación se hace casi imposible con el software actual. Por lo tanto, un CAPTCHA efectivo debería enfocarse en el paso 2, la segmentación.
Fuente Wikipedia


Hoy 25 de Septiembre se celebra el Día Mundial del Corazón y el Día Mundial del Webmaster.

No hay comentarios:

Publicar un comentario

Nota: solo los miembros de este blog pueden publicar comentarios.