febrero 29, 2024

En un evento celebrado en San Francisco en noviembre, se le preguntó a Sam Altman, director ejecutivo de la empresa de inteligencia artificial OpenAI, qué sorpresas traería la industria en 2024.

Los chatbots en línea como ChatGPT de OpenAI darán “un salto adelante que nadie esperaba”, respondió Altman de inmediato.

Sentado a su lado, James Manyika, un ejecutivo de Google, asintió y dijo: “Uno más”.

Este año el sector de la IA se definirá por una característica principal: una mejora notablemente rápida de la tecnología a medida que los avances se complementan entre sí, lo que permitirá a la IA generar nuevos tipos de medios, imitar el razonamiento humano de nuevas maneras y penetrar en el mundo físico. a través de una nueva generación de robots.

En los próximos meses, generadores de imágenes basados ​​en inteligencia artificial como DALL-E y Midjourney entregarán videos e imágenes fijas al instante. Y poco a poco se irán fusionando con chatbots como ChatGPT.

Esto significa que los chatbots se expandirán mucho más allá del texto digital al manejar fotografías, videos, diagramas, gráficos y otros medios. Mostrarán un comportamiento que se parece más al razonamiento humano y abordarán tareas cada vez más complejas en campos como las matemáticas y las ciencias. A medida que la tecnología avanza hacia los robots, también ayudará a resolver problemas fuera del mundo digital.

Muchos de estos desarrollos ya han comenzado a surgir en los mejores laboratorios de investigación y productos tecnológicos. Pero en 2024, la potencia de estos productos aumentará significativamente y serán utilizados por muchas más personas.

“El rápido progreso de la inteligencia artificial continuará”, afirmó David Luan, director ejecutivo de Adept, una nueva empresa dedicada a la inteligencia artificial. «Es inevitable».

OpenAI, Google y otras empresas tecnológicas están haciendo avanzar la inteligencia artificial mucho más rápido que otras tecnologías debido a la forma en que están construidos los sistemas subyacentes.

La mayoría de las aplicaciones de software las crean ingenieros, una línea de código informático a la vez, lo que suele ser un proceso lento y tedioso. Las empresas están mejorando la IA más rápidamente porque la tecnología se basa en redes neuronales, sistemas matemáticos que pueden aprender habilidades analizando datos digitales. Al detectar patrones en datos como artículos de Wikipedia, libros y textos digitales recopilados de Internet, una red neuronal puede aprender a generar texto por sí sola.

Este año, las empresas de tecnología planean alimentar a los sistemas de inteligencia artificial con más datos (incluidas imágenes, sonidos y más texto) de los que la gente puede imaginar. A medida que estos sistemas aprendan las relaciones entre estos diversos tipos de datos, aprenderán a resolver problemas cada vez más complejos, preparándolos para la vida en el mundo físico.

(El New York Times demandó a OpenAI y Microsoft el mes pasado por infracción de derechos de autor de contenido de noticias relacionado con sistemas de inteligencia artificial).

Esto no significa que la IA pueda igualar al cerebro humano en el corto plazo. Incluso cuando las empresas y los empresarios de IA pretenden crear lo que llaman “inteligencia general artificial” (una máquina capaz de hacer todo lo que el cerebro humano puede hacer), esto sigue siendo una tarea difícil. A pesar de todos sus rápidos avances, la inteligencia artificial aún se encuentra en sus primeras etapas.

Aquí hay una guía sobre cómo cambiará la IA este año, comenzando con avances a corto plazo que conducirán a mayores avances en sus capacidades.

Hasta ahora, las aplicaciones impulsadas por IA generaban principalmente texto e imágenes fijas en respuesta a solicitudes. DALL-E, por ejemplo, puede crear imágenes fotorrealistas en segundos a partir de solicitudes como «un rinoceronte que se lanza desde el puente Golden Gate».

Pero este año, empresas como OpenAI, Google, Meta y Runway, con sede en Nueva York, probablemente lanzarán generadores de imágenes que permitirán a las personas generar videos también. Estas empresas ya han creado prototipos de herramientas que pueden crear videos instantáneamente a partir de instrucciones de texto breves.

Es probable que las empresas de tecnología transfieran los poderes de los generadores de imágenes y videos a los chatbots, haciéndolos más poderosos.

Los chatbots y los generadores de imágenes, originalmente desarrollados como herramientas independientes, se están fusionando gradualmente. Cuando OpenAI lanzó una nueva versión de ChatGPT el año pasado, el chatbot podía generar imágenes y texto.

Las empresas de IA están construyendo sistemas «multimodales», lo que significa que la IA puede manejar múltiples tipos de medios. Estos sistemas adquieren experiencia al analizar fotografías, texto y potencialmente otros tipos de medios, incluidos diagramas, gráficos, sonidos y videos, para luego poder producir texto, imágenes y sonidos personalizados.

Pero eso no es todo. Debido a que los sistemas también aprenden las relaciones entre diferentes tipos de medios, podrán comprender un tipo de medio y responder con otro. En otras palabras, alguien puede insertar una imagen en el chatbot y este responderá con texto.

«La tecnología será más inteligente y más útil», afirmó Ahmad Al-Dahle, que dirige el grupo de inteligencia artificial generativa en Meta. «Hará más cosas».

Los chatbots multimodales cometen errores, al igual que los chatbots de sólo texto cometen errores. Las empresas de tecnología están trabajando para reducir los errores mientras se esfuerzan por crear chatbots que puedan pensar como un humano.

Cuando Altman habla del salto adelante en inteligencia artificial, se refiere a chatbots que son mejores en «razonamiento» para que puedan realizar tareas más complejas, como resolver problemas matemáticos complicados y generar programas informáticos detallados.

El objetivo es construir sistemas que puedan resolver un problema de manera precisa y lógica a través de una serie de pasos discretos, cada uno de los cuales se basa en el siguiente. Así piensan los humanos, al menos en algunos casos.

Los principales científicos no están de acuerdo sobre si los chatbots realmente pueden razonar de esta manera. Algunos argumentan que estos sistemas simplemente parecen razonar mientras repiten el comportamiento que han observado en los datos de Internet. Pero OpenAI y otros están construyendo sistemas que pueden responder de manera más confiable preguntas complejas que involucran materias como matemáticas, programación de computadoras, física y otras ciencias.

«A medida que los sistemas se vuelvan más confiables, se volverán más populares», dijo Nick Frosst, un ex investigador de Google que ayuda a dirigir Cohere, una nueva empresa de inteligencia artificial.

Si los chatbots razonaran mejor, podrían transformarse en “agentes de IA”.

A medida que las empresas enseñan a los sistemas de inteligencia artificial cómo resolver problemas complejos paso a paso, también pueden mejorar la capacidad de los chatbots para utilizar aplicaciones de software y sitios web en su nombre.

Básicamente, los investigadores están convirtiendo los chatbots en un nuevo tipo de sistema autónomo llamado agente de inteligencia artificial. Esto significa que los chatbots pueden utilizar aplicaciones de software, sitios web y otras herramientas en línea, incluidas hojas de cálculo, calendarios en línea y sitios de viajes. La gente podría entonces descargar el tedioso papeleo a los chatbots. Pero estos agentes también podrían eliminar puestos de trabajo por completo.

Los chatbots ya operan como agentes en pequeñas formas. Pueden programar reuniones, editar archivos, analizar datos y crear gráficos de barras. Pero estas herramientas no siempre funcionan como deberían. Los agentes se rompen por completo cuando se aplican a tareas más complejas.

Este año, las empresas de inteligencia artificial están preparadas para presentar agentes más confiables. «Debería poder delegar cualquier tedioso trabajo informático diario a un agente», dijo Luan.

Esto podría incluir el seguimiento de gastos en una aplicación como QuickBooks o el registro de días de vacaciones en una aplicación como Workday. A largo plazo, irá más allá del software y los servicios de Internet y se adentrará en el mundo de la robótica.

En el pasado, los robots estaban programados para realizar siempre la misma tarea, como recoger cajas que siempre tenían el mismo tamaño y forma. Pero utilizando el mismo tipo de tecnología que impulsa a los chatbots, los investigadores están dando a los robots el poder de manejar tareas más complejas, incluidas algunas nunca antes vistas.

Así como los chatbots pueden aprender a predecir la siguiente palabra de una oración analizando grandes cantidades de texto digital, un robot puede aprender a predecir lo que sucederá en el mundo físico analizando innumerables videos de objetos empujados, levantados y movidos.

“Estas tecnologías pueden absorber enormes cantidades de datos. Y a medida que absorben datos, pueden aprender cómo funciona el mundo, cómo funciona la física, cómo se interactúa con los objetos”, dijo Peter Chen, ex investigador de OpenAI que dirige Covariant, una nueva empresa de robótica.

Este año, la inteligencia artificial mejorará los robots que operan detrás de escena, como brazos mecánicos que doblan camisas en una lavandería o clasifican montones de cosas dentro de un almacén. Incluso los titanes tecnológicos como Elon Musk están trabajando para avanzar robots humanoides en los hogares de las personas.