web analytics

CaptionBot, el bot de Microsoft que describe fotos… con más o menos acierto

La nueva prueba de inteligencia artificial de Microsoft intenta describir los elementos de cualquier fotografía... y puede ser divertido

Por Manu Contreras ,
CaptionBot describe perfectamente lo que muestra la imagen: "Creo que es un hombre montando en una ola en una tabla de surf en el agua"

CaptionBot describe perfectamente lo que muestra la imagen: “Creo que es un hombre montando en una ola en una tabla de surf en el agua”

Microsoft ha lanzado otra de sus aplicaciones para demostrar el poder de Bing en inteligencia artificial y más concretamente en reconocimiento de imágenes. Su anterior prueba fue Tay, un bot de personalidad adolescente que aprendió tendencias racistas de otros usuarios. Esto provocó su retirada para que Microsoft pudiese corregirlo y que aprendiese a ser más respetuosa con otras personas. En esta nueva prueba CaptionBot un bot que intenta describir las fotos.

El sistema que usa Microsoft es el resultado de años de investigación en hacer que las máquinas sean capaces de reconocer que están viendo, además de decirlo de una forma natural. No es lo mismo que un programa como este te diga que en una foto hay X personas en una calle que te diga que hay X personas sonriendo mientras caminan por la calle.

El funcionamiento es sencillo: subes una imagen o le das la dirección de una foto para que la analice y automáticamente te intentará dar una descripción. Pero los resultados aun tienen que afinarse un poco. Como los bots de Microsoft han tenido este problema de saber qué es socialmente aceptable, lo hemos puesto a prueba con unas simples pruebas.

Primero, ¿reconocerá una simple foto de dos personas? Parece que no.

CaptionBot de Micrososft: "No estoy muy seguro, pero creo que es un hombre hablando con un móvil y parece 😬."

CaptionBot de Micrososft: “No estoy muy seguro, pero creo que es un hombre hablando con un móvil y parece 😬.”

De acuerdo, la primera prueba no ha salido del todo bien. ¿Qué pasará si usamos una foto de… las Spice Girls?

CaptionBot: "Creo que es Melanie Brown y Melanie Chisholm y Victoria Beckham y Geri Halliwell y Emma Bunton posando para una foto y parecen 😬😬😬😬😬"

CaptionBot: “Creo que es Melanie Brown y Melanie Chisholm y Victoria Beckham y Geri Halliwell y Emma Bunton posando para una foto y parecen 😬😬😬😬😬”

¡En el clavo! CaptionBot no solo ha reconocido quién es quién, también que están posando. Donde todavía falla es en saber el contexto de la foto, como se puede leer identifica a Victoria Beckham, pero cuando esta foto se tomó no había tomado el apellido del futbolista. Es decir, sabe quiénes son, sabe que están haciendo, pero no sabe que en conjunto son una banda de pop.

Pongamos a prueba si han aprendido de errores pasados y sabe reconocer a este dictador.

CaptionBot de pronto no sabe quién es este señor

CaptionBot de pronto no sabe quién es este señor

CaptionBot sabe perfectamente quién es la persona en la imagen, Adolf Hitler, pero no lo dice. Parece que Microsoft ha decidido saltarse el reconocimiento de ciertas personas y situaciones.

+ Info | CaptionBot

Compartir en: