Actualidad42 Madrid
IA. Más allá del concepto. P1.
Desde que era pequeño, a Manu siempre le apasionó el mundo de la tecnología, la iluminación, la música, el 3D, "con esas gafas azules y rojas que mareaban tanto"…en resumidas cuentas, todo lo que era necesario para poder crear mundos ajenos a la realidad y en los que se pudiera estar dentro de ellos disfrutando o transmitiendo emociones. Un festival de diseño y tecnología le consiguió la llave de la puerta que llevaba tanto tiempo intentando abrir y supo que debía estudiar programación para poder entender y dialogar de manera más amigable con la tecnología. Y así descubrió 42. Manu firma el siguiente texto sobre IA y generación de imágenes. Sospechamos que habrá continuación... 🎨

Un gato robótico. Esta es la definición gráfica del concepto “gato robótico” generado por una Inteligencia Artificial, con un modelo en especifico, el modelo imagenet_16384.
En este caso, aparentemente va generando la forma de un gato, con un distintivo clave: la punta de la oreja. Sin embargo, la fusión entre “gato” y “robot” hace que nuestro gato posea una especie de circuitería en el morro y un cuerpo casi de metal. Típico de los robots.
El uso de estos conceptos cuyo significado es bastante explicito, no produce ningún tipo de problema a la hora de generar la imagen final, ya que esta idea está bastante asentada. Pero a partir de este punto empecé a explorar otra posibilidad: utilizar conceptos ambiguos, antónimos y sesgados.
Sin darnos cuenta, nos encontramos casi todo el día frente a los servicios digitales o la tecnología, una tecnología que ha sido programada por una persona. Una persona que vive con un tipo de estilo de vida, con una cierta ideología, en una cierta ubicación y con una cierta cultura. Todos estos factores hacen que, al fin y al cabo, nuestros servicios digitales se vean sesgados de manera indirecta.
Pensarán… ¿y esto que tiene que ver con la AI y con la generación de imágenes? Bueno, pues una parte fundamental en cualquier proceso de aprendizaje son los patrones de similitudes. Así como nosotros sabemos que un gato es un gato por su forma, color y forma de comportarse, una maquina podría determinar los mismos patrones para determinar que es una cosa u otra. Si la sociedad está sesgada, entonces las imágenes que tienen como significado un concepto también lo estarán.
El proceso de generación de las imágenes que uso, junto con el modelo imagenet_16384 permite la entrada de los siguientes inputs:
- Texto
- Imagen inicial
- Imagen objetivo
Mi viaje por estos conceptos tan ambiguos comienza con las siguientes palabras: masculinidad y feminidad.
Comencé realizando series de 600 iteraciones (procesos de generación de imágenes) por si el concepto era muy ambiguo y le costaba generar dichas imágenes. Pero según este modelo, en torno a las 300 iteraciones genera ya la representación por completo, y a partir de este numero añade hasta texto.
Analizando los resultados obtenidos respecto a estas palabras, podemos demostrar claramente que según la IA y los patrones:
- La masculinidad son mucho músculo, y pelo con colores verde y rojo.
- La feminidad son belleza, ojos pintados, rosas y vestidos.
Parece que estos resultados son bastante afines al del imaginario colectivo en rasgos generales.
Más adelante continué con los conceptos de vida y muerte.
Sin lugar a duda, los resultados de estos términos me impresionaron bastante. Sobre todo por la combinación de múltiples conceptos en uno solo. Posteriormente introduje los siguientes términos: amor y odio.
En este caso, ambas me han creado confusión. A pesar de esto tengo que destacar especialmente la imagen del odio. Esas heridas y esa especie de puñal negro afilado, el cual se clava en la piel, además de odio me producen una sensación de rabia. Además, introduce una especie de calendario y unos pinos de fondo. Respecto a la del amor, no consigo comprender que intenta demostrar, aunque intenta generar corazones y ha escrito la palabra “love”. Para finalizar esta primera parte, inserte los conceptos de xenofobia y homofobia.
He de admitir que estos resultados son de los que más me han impactado hasta este momento. Por la composición, estética y simbolismo. Me impacta la representación de la xenofobia. Una especie de grafiti reivindicativo, la combinación de distintas banderas en la parte superior y las personas. La opresión que reside sobre las personas dibujadas, demostrada por estar agachadas, con múltiples piernas por encontrarse todos aglomerados en un mismo sitio, y con la capa de su país de origen sobre la espalda… me parece sorprendente. En cuanto a la homofobia, se encuentran los colores de la bandera LGTB y moratones y heridas sobre la piel. Me gustaría destacar en este caso un punto bastante importante. La definición de homofobia se ve descrita de la siguiente manera: “Aversión hacia los homosexuales, tanto masculinos como femeninos” Cabe destacar, que, en nuestra imagen generada mediante IA, lo que se ve representado principalmente es barba, algo característico de los hombres. Incluso en este caso ya podemos observar cómo se encuentra sesgada la definición de homofobia, en la que la IA solo esta contemplando el odio solo hacia los homosexuales masculinos. Para finalizar, dejo un video de como se van generando algunas de las imágenes anteriormente mostradas.
Por Manuel Córdoba Velicias, estudiante de 42 Madrid Fundación Telefónica (mensaje para reclutadores y personas curiosas, este es su LinkedIn)
Publicación original en Medium