Las máquinas han aprendido a ver

¿Qué es?

La visión artificial o visión por computador es una disciplina científica que incluye métodos para adquirir, procesar, analizar y comprender las imágenes del mundo real con el fin de producir información numérica o simbólica para que puedan ser tratados por un computador.

Los seres humanos usamos los ojos y el cerebro para comprender el mundo que nos rodea. De la misma manera, se pretende que un computador mediante secuencias de imágenes pueda comprender lo que en ellas se refleja. Hablamos de que puede ser una imagen simple, una imagen multidimensional o un vídeo que no deja de ser una sucesión de imágenes.

Esto se consigue gracias a la fusión de distintas áreas como pueden ser la estadística, la física, la geometría…

CVoverview2

Un poco de historia

Se podría decir que la visión artificial nació con el artículo de Seymour Papert en el año 1966. Puede parecer que es una disciplina relativamente reciente y, de hecho, dependiendo con qué lo comparemos, sí lo es. Sin embargo, en el mundo de la informática algo que cuenta con más de 50 años no es algo nuevo.

Aunque en este caso, como en muchos otros, sucedió que su nacimiento no fue tan exitoso como sus creadores esperaban que fuera. Las tecnologías en las que se apoya aun no estaban lo suficientemente maduras y es por eso que hasta hace no demasiado tiempo, no ha empezado a tener la fama que tiene ahora. Y es que es una disciplina con una gran complejidad como se explicará en futuros apartados.

Problemas Principales

La gran dificultad que tienen los sistemas basados en visión por computación es que no se trata únicamente de coger una imagen y convertirla a píxeles, con sus colores, luces y sombras. Se trata de convertir esos píxeles en conceptos matemáticos abstractos, desafiar las definiciones filosóficas básicas de lo que es un concepto y lo que es un objeto. ¿Por qué una mesa es una mesa?

Además, hay que añadir otras dificultades aparte de la mencionada:

Punto de vista

El punto de vista o cómo está orientado el objeto respecto al observador. Un coche no tiene el mismo aspecto visto desde arriba que desde un lado o por detrás.

Focos de luz

Dependiendo de cómo incida la luz en los objetos destacarán más unas partes que otras, haciendo que varios objetos iguales puedan parecer distintos.

Oclusión

Hay objetos en segundo plano que estarán tapados parcialmente por otro objeto que se encuentre en un primer plano. El sistema debe de ser capaz de tener esto en cuenta a la hora de extraerlo y analizarlo.

Escala

La escala es otro gran problema. Por ejemplo, un edificio no parecerá que tenga el mismo tamaño en una imagen si se encuentra en el horizonte o si está junto al fotógrafo.

Fondo desordenado

Un objeto puede estar en un contexto desordenado y caótico. Como por ejemplo un mosaico. Deberemos saber distinguir el objeto entre el caos que le envuelve.

Variaciones dentro de una misma clase

Esto nos lleva a la introducción de este apartado, un mismo objeto puede tener distintas formas. Una mesa puede tener 4 patas en las esquinas o una central, puede ser redonda o cuadrada, puede ser de madera o de metal, etc.

bow

En la imagen se puede apreciar en los detalles que un sistema con visión artificial se centra para detectar qué clase de objeto es. En algunos casos resulta bastante extraño para un ser humano ya que no es en lo que una persona se suela fijar para identificar el objeto (o al menos, no conscientemente).

¿Por qué usarlo?

El lector puede hacerse la pregunta de, si se presentan tantas dificultades, ¿por qué iba a querer usarlo? Sobre todo si tenemos en cuenta que una persona puede ver con sus ojos y procesar las imágenes con el cerebro sin necesidad de entrenamiento especial.

Sin embargo, hay muchas situaciones en las que se hace inviable utilizar solo personas ya sea por la cantidad de imágenes a tratar, por ser necesaria una monitorización de 24 horas, porque el sistema no admita que un ser humano lo controle por motivos de precisión, etc.

Técnicas y Áreas

Aprendizaje Automático

Las técnicas de aprendizaje automático tienen como objetivo conseguir diferenciar automáticamente patrones usando algoritmos matemáticos. Se utiliza principalmente en el are de la visión por computador para clasificar imágenes.

Detección de Objetos

Se estudia cómo detectar la presencia de objetos en una imagen dada su apariencia visual.

Análisis de Video

Consiste en la evolución del campo de la vigilancia con video y de la seguridad. Con estos cambios se consigue identificar automáticamente la actividad sospechosa en áreas restringidas y disminuye considerablemente los falsos positivos.

Visión 3D

La visión 3D artificial es la encargada de proporcionar la capacidad de emular la visión de un ser humano a un ordenador. De esta manera, el ordenador será capaz de generar un modelo en tres dimensiones de un objeto o escena mediante una o varias imágenes en dos dimensiones.

Algunos Usos

Algunos de los muchos usos que se le puede dar a sistemas de visión por computador son los siguientes:

  • En un sistema de circuito cerrado de televisión tradicional es habitual visualizar hasta 16 cámaras de manera simultánea. Esta tarea resulta compleja para un vigilante y está demostrado que tras 22 minutos de supervisión, el vigilante pierde hasta el 95% de la actividad de la escena. Con el análisis de video el vigilante es alertado cuando hay movimientos sospechosos. E incluso en algunos casos, detectando si el movimiento es realmente de una persona o se trata de viento, luces, etc.
  • Se puede utilizar para detectar si la gente que se encuentra en una sala es autorizada o no mediante reconocimiento facial.
  • Existen multitud de ejemplos en los que se obtienen patrones en el comportamiento de la gente de manera que puede ser detectado el comportamiento sospechoso de algunos individuos.
  • Informatización introduciendo textos fotografiados y/o escaneados en el sistema. De esta manera se puede obtener la información de estos y de facilitar el almacenamiento, acceso a la información y/u operaciones relacionadas.

check

  • Verificación de la posición y orientación de elementos en una cinta transportadora.
  • Inspección automática para detección de defectos en fábricas.
  • Procesos de control, por ejemplo, en un robot industrial.
  • Navegación en robots móviles o vehículos autónomos
  • Modelo de objetos o entornos, por ejemplo, en análisis médicos o modelos topográficos
Llevado a la práctica con éxito

– Google utiliza en su self-driving car detección de objetos, junto con radares y sensores para conducir por la vía pública de una forma autónoma.

MTk0ODU0MQ

– Uber utiliza escanéo inteligente de tarjetas de crédito para automatizar el proceso de pago.

– Microsoft apostó por la visión por computador cuando lanzó al mercado el dispositivo Microsoft Kinect el cual aparte de en entretenimiento ha sido muy usado en investigación.

– Conafor usa drones para detectar incendios y monitorizar los distintos parámetros de los cultivos.

– Snapchat en la actualidad destaca por contar la opción de intercambio de caras que consiste en intercambiar los dos rostros de dos personas en la pantalla del móvil. Tal vez sea el ejemplo menos conocido, pero no por ello despreciable ya que según The FInancial Times, Snapchat podría conseguir unos ingresos de 100 millones de dólares en este año.

El Futuro

A estas alturas del post el lector ya se habrá dado cuenta de la importancia que tiene esta tecnología y de la fuerza que está ganando con el avance de la tecnología, la creciente cantidad de información que requiere ser procesada y la necesidad de crear sistemas de seguridad más robustos dado que los criminales también van actualizando sus técnicas conforme la tecnología avanza.
Sin embargo, siempre está bien ver lo que opinan los grandes gurús de la tecnología.

Mark Zuckerberg, creador de Facebook, se atrevió a decir que el futuro estará “repleto” de Inteligencia Artificial e hizo hincapié en los sistemas que están basados en visión por computador.

El Doctor Robert Loce, investigador de Xerox (el proveedor más grande del mundo de fotocopiadoras de tóner y sus accesorios) también apuesta por esta tecnología centrando sus investigaciones en ella. Y no hay mejor manera de acabar esta entrada que utilizando una de las muchas frases de Loce sobre la visión por computador.

“The incentive to teach computers to ‘see’ seems to expand every day,” Loce said. “It’s only limited by our imagination.”

 

Autor: Rubén Martín

 

Referencias:

http://robotzeitgeist.com/tag/computer-vision

http://www.computervisionblog.com/2016/01/why-slam-matters-future-of-real-time.html

https://cs.stanford.edu/people/eroberts/courses/soco/projects/1997-98/computer-vision/applications.html

http://www.forbes.com/sites/xerox/2013/10/30/how-we-use-computer-vision-present-and-future/#5dbaef501169

http://www.businessinsider.com/mark-zuckerbergs-prediction-about-computer-vision-2015-7

http://www.computervisionblog.com/2016/01/why-slam-matters-future-of-real-time.html

http://www.egavves.com/a-brief-history-of-computer-vision/#sthash.UvTZbHkR.dpbs

http://www.businessinsider.com/snapchat-is-on-track-to-generate-100-million-in-revenue-2015-10

Digital Technologies

Leave a Reply

Your email address will not be published. Required fields are marked *

SWA Learners Blog © 2018