El principio de la física que inspiró el arte moderno de la IA

hace 1 año

Pregúntale a DALL·E 2, un sistema de generación de imágenes creado por OpenAI, para pintar una imagen de "peces dorados sorbiendo Coca-Cola en una playa", y escupirá imágenes surrealistas de exactamente eso. El programa habría encontrado imágenes de playas, peces dorados y Coca-Cola durante el entrenamiento, pero es muy poco probable que hubiera visto una en la que los tres estuvieran juntos. Sin embargo, DALL·E 2 puede ensamblar los conceptos en algo que podría haber enorgullecido a Dalí.

DALL·E 2 es un tipo de modelo generativo, un sistema que intenta usar datos de entrenamiento para generar algo nuevo que sea comparable a los datos en términos de calidad y variedad. Este es uno de los problemas más difíciles en el aprendizaje automático y llegar a este punto ha sido un viaje difícil.

Los primeros modelos generativos importantes para imágenes utilizaron un enfoque de inteligencia artificial llamado red neuronal, un programa compuesto por muchas capas de unidades computacionales llamadas neuronas artificiales. Pero incluso cuando la calidad de sus imágenes mejoró, los modelos demostraron ser poco confiables y difíciles de entrenar. Mientras tanto, un poderoso modelo generativo, creado por un investigador posdoctoral apasionado por la física, permaneció inactivo hasta que dos estudiantes graduados lograron avances técnicos que dieron vida a la bestia.

DALL·E 2 es una bestia. El conocimiento clave que hace posibles las imágenes de DALL·E 2, así como las de sus competidores Stable Diffusion e Imagen, proviene del mundo de la física. El sistema que los sustenta, conocido como modelo de difusión, está fuertemente inspirado en la termodinámica de desequilibrio, que gobierna fenómenos como la propagación de fluidos y gases. “Hay muchas técnicas que inicialmente fueron inventadas por físicos y ahora son muy importantes en el aprendizaje automático”, dijo Yang Song, investigador de aprendizaje automático en OpenAI.

El poder de estos modelos ha sacudido tanto a la industria como a los usuarios. “Este es un momento emocionante para los modelos generativos”, dijo Anima Anandkumar, científica informática del Instituto de Tecnología de California y directora sénior de investigación de aprendizaje automático en Nvidia. Y aunque las imágenes de aspecto realista creadas por los modelos de difusión a veces pueden perpetuar los sesgos sociales y culturales, dijo, “hemos demostrado que los modelos generativos son útiles para tareas posteriores. [that] mejorar la equidad de los modelos predictivos de IA”.

Altas probabilidades

Para entender cómo funciona la creación de datos para imágenes, comencemos con una imagen simple hecha de solo dos píxeles adyacentes en escala de grises. Podemos describir completamente esta imagen con dos valores, basados en el tono de cada píxel (de 0 siendo completamente negro a 255 siendo completamente blanco). Puede usar estos dos valores para trazar la imagen como un punto en el espacio 2D.

Si trazamos múltiples imágenes como puntos, pueden surgir grupos: ciertas imágenes y sus correspondientes valores de píxel que ocurren con más frecuencia que otras. Ahora imagine una superficie sobre el plano, donde la altura de la superficie corresponde a la densidad de los grupos. Esta superficie traza una distribución de probabilidad. Lo más probable es que encuentre puntos de datos individuales debajo de la parte más alta de la superficie y pocos donde la superficie es más baja.

DALL·E 2 produjo estas imágenes de “peces dorados sorbiendo Coca-Cola en una playa”. El programa, creado por OpenAI, probablemente nunca había encontrado imágenes similares, pero aún podía generarlas por sí mismo.

Cortesía de DALL·E 2

Si quieres conocer otros artículos parecidos a El principio de la física que inspiró el arte moderno de la IA puedes visitar la categoría Ciencia.

Otras noticias que te pueden interesar