Con GPT-4, OpenAI toma la delantera en IA generativa

hace 12 meses

GPT-4 est capable de traiter des images, de l

La última versión del transformador, GPT de OpenAI, se presentó ayer. En el menú de GPT-4, mejores prestaciones, pero sobre todo capacidades multimodales. El modelo es capaz de analizar texto, imágenes, videos y esto en varios idiomas y en diferentes roles.

Andreas Braun, director técnico de Microsoft Alemania, había insinuado la semana pasada el próximo lanzamiento de GPT-4. Ese día finalmente llegó ayer cuando el CEO de OpenAI, Sam Altman, levantó el velo sobre esta evolución del transformador que impulsa el servicio ChatGPT. En su presentación, el dirigente destaca el principal elemento diferenciador: el sistema multimodal.

Índice

Texto, video, audio, el combo mágico
Los errores persisten y la competencia lucha

Texto, video, audio, el combo mágico

En la versión anterior (3.5), GPT solo podía procesar texto. GPT-4 va más allá al procesar no solo texto, sino también imágenes, video o audio. “Los demostradores presentados en el multimodal son impresionantes”, observa Alexei Grinbaum, director de investigación de la CEA y presidente del Comité Operativo Piloto de Ética Digital (CNPEM). Agrega, tomando un ejemplo, "un estudiante puede muy bien desde su teléfono tomar una foto de una tarea y pedirle a ChatGPT, impulsado por GPT-4, que resuelva el problema o escriba una respuesta".

Ejemplo de reconocimiento de imágenes y explicaciones por ChatGPT. (Crédito de la foto: OpenAI)

Además de cuestiones en torno a la educación y la enseñanza, GPT-4 trae elementos interesantes para las empresas. “Ofrece contextos compuestos por 32.000 tokens, lo que significa la posibilidad de poner textos más largos en cualquier idioma, pero también imágenes como PDF. Es capaz de asumir un rol (patio de recreo)”, indica la investigadora. “Por ejemplo, un banquero puede proporcionarle a GPT-4 el historial de un cliente y luego pedirle a ChatGPT que asuma el papel de asesor financiero y le proporcione ofertas o determine si se le puede otorgar un préstamo”, completa. Los roles se pueden declinar en varias profesiones, RRHH, asesor legal, desarrollador,… Sin embargo, Alexei Grinbaum advierte que las respuestas tan impresionantes como son “no constituyen una verdad”. Se trata de tomar esta herramienta como “un borrador, una ayuda para la toma de decisiones”.

Los errores persisten y la competencia lucha

De hecho, los errores (o alucinaciones en la jerga de la IA) todavía están presentes en GPT-4. “Son más raros”, admite Alexei Grinbaum. También señala que OpenAI no se ha comunicado sobre la cantidad de parámetros utilizados para entrenar la última iteración del transformador. "Se sabe que se ejecuta en decenas de miles de tarjetas aceleradoras Nvidia dentro de una supercomputadora de Microsoft, lo que significa que el tiempo de entrenamiento fue largo", sugiere.

¿GPT-4 dobla el juego contra la competencia? Ayer, justo antes del anuncio de OpenAI, Google se apresuró a sacar su respuesta presentando las integraciones de IA generativas en GCP y su suite de productividad Workspace. “El rendimiento del transformador básico de Google, PALM, no es peor que GPT. Por otro lado, la capa de control de LAMDA lo es menos que la de OpenAI”, observa Alexei Grinbaum. Por su parte, Facebook (Meta) ha optado por otro camino con los modelos mini LLAMA, uno de los cuales acaba de filtrarse para ser probado localmente. También hay iniciativas europeas como el proyecto Bloom, que está “en el nivel GPT-2”, remarca el director de investigación. El trabajo en estos modelos de IA es voraz en recursos de TI y dinero, por lo que los GAFAM parecen más capaces de imponerse en este campo. “Pero las iniciativas se multiplicarán en países como China, Corea o Israel”, pronostica Alexei Grinbaum.

Si quieres conocer otros artículos parecidos a Con GPT-4, OpenAI toma la delantera en IA generativa puedes visitar la categoría Otros.

Otras noticias que te pueden interesar