Qué podemos esperar de la inteligencia artificial en los próximos nueve meses
Qué podemos esperar de la inteligencia artificial en los próximos nueve meses
Hace poco más de un año la inteligencia artificial generativa era sólo una promesa de oportunidades que provocaba recelos e incertidumbre.
Hoy es una realidad que cambia numerosos sectores, industrias, negocios, profesiones y carreras, y que transforma nuestras vidas. La velocidad a la que se desarrolla la IA y sus avances hace difícil predecir su futuro, aunque algunos se atreven a pronosticar cómo serán estos avances en los próximos meses de este 2024.
Es el caso de CB Insights, que hace algunas predicciones sobre la IA en cuatro campos: la infraestructura de IA generativa, los llamados modelos fundacionales, la interacción entre el humano y la máquina y las aplicaciones de esta IA generativa en continuo desarrollo.
Infraestructura de IA
La primera predicción se refiere a que proliferarán los centros de datos de IA que consumen mucha energía. El estudio revela que los chips de alta gama de Nvidia consumen la misma cantidad de energía que un país de tamaño pequeño y destaca la existencia de una demanda masiva de centros de datos de IA de alta potencia.
Resulta evidente que se destinan grandes sumas de dinero a tecnologías como la refrigeración líquida, y así KKR adquirió CoolIT Systems por 270 millones de dólares en el segundo trimestre de 2023, y Vertiv adquirió CoolTerain en el cuarto trimestre del año pasado.
La investigación recuerda que "la demanda de energía renovable se está incrementando por el crecimiento de la IA generativa" y añade que "la energía nuclear puede ser el futuro de las operaciones sostenibles de IA", algo que tiene reflejo en la financiación de empresas de tecnología de fusión y pequeños reactores modulares, como es el caso de Helion, valorada en 3.500 millones de dólares, y respaldada por Sam Altman en una ronda de 500 millones de dólares en 2021; o el de Energy, valorada en 1.100 millones de dólares, y el de OKLO, que alcanza ya un valor de 800 millones de dólares.
Otra de las predicciones apunta a que la escasez de datos impulsa la búsqueda de nuevas fuentes. El estudio destaca quen para 2026 agotaremos los datos de texto de alta calidad para la formación de LLM -modelos de lenguaje de gran tamaño que se preentrenan con grandes cantidades de datos-, una tendencia que puede ralentizar el progreso de la IA.
En la reciente CEO Council Summit de The Wall Street Journal, el fundador de Tesla y SpaceX y dueño de X, Elon Musk, decía que "las GPU son más difíciles de conseguir que las drogas". Hablamos de Graphics Processing Unit o Unidad de Procesamiento Gráfico, un tipo de chip especializado en el procesamiento de gráficos y renderización de imágenes, y CB Insights se refiere a los eneamigos (frenemies) de Nvidia, y de cómo las rivalidades asociadas a los chips crecen en un entorno de escasez de GPU que afecta duramente a la industria.
Más del 50% de las ventas de Nvidia corresponden a compañías que renuevan equipos para atender su demanda. Son empresas como Amazon, Google o Microsoft. Y ante la creciente demanda, los mayores clientes de Nvidia también están impulsando sus propios chips. El estudio sostiene que "los rivales dedicados a los chips representan un riesgo para el meteórico crecimiento de Nvidia", y recoge unas declaraciones del director ejecutivo de Amazon, Andrew Jassy, quien asegura que "es difícil conseguir la cantidad de GPU que todo el mundo quiere. Y esta es una de las razones por las que los chips de Amazon -Trainium e Inferentia- son tan atractivos para la gente".
Hay que recordar que el pasado 21 de febrero Jenssen Huang, CEO de Nvidia, presentó los resultados de la compañía que, en un año, ha logrado duplicar sus ventas, pasando de 30.000 a 60.000 millones de dólares en 12 meses. La compañía prevé además que sus ventas crecerán un 20% en este primer trimestre, y confía en que la inversión en chips de IA llegará al trillón de dólares hasta 2027.
Relación humano-máquina
Una 'Generación Z' cada vez más solitaria estrecha sus lazos de amistad con la inteligencia artificial: Así se enuncia otra de las grandes tendencias de la IA en los próximos meses. CB Insights recuerda que "estamos experimentando una epidemia de la soledad en la que los miembros de esta generación pasan mucho menos tiempo con amigos en persona en la era de los teléfonos inteligentes... Pero, ¿quién necesita amigos de verdad cuando tu robot de IA puede ser tan agradable como un ser humano?".
La realidad es que la tecnología que se refiere a diálogos abiertos y a la generación de personajes con IA está evolucionando rápidamente. Los avances en la industria de los juegos conducirán a experiencias sociales online cada vez más inmersivas. Se prevé que 2024 sea el año de la explosión de "los amigos de IA".
Según CB Insights, "el próximo iPhone tendrá que ver con la revolución del hardware de la IA. Quince años después de su lanzamiento, las ventas del iPhone están estancadas, y los avances en IA han iniciado la búsqueda del próximo iPhone".
El estudio se refiere a algunas start up que desarrollan dispositivos de IA para consumidores, como hu.ma.ne, especializada en la interacción por voz; Rewind, con su producto que es un "colgante" portátil que graba y analiza audio; o Tab, otra especie de collar portátil que graba y analiza audio con GPT-4.
La inteligencia artificial habla de la capacidad para realizar tareas que normalmente realizan los humanos, utilizando datos, aprendizaje automático y más. Se puede utilizar la IA para crear contenido, responder preguntas y generar arte realista.
La cuestión es que será necesario instruir a muchos de estos sistemas de inteligencia artificial sobre qué deben hacer. Y si uno no quiere dar instrucciones y desea que su sistema de inteligencia artificial sea esencialmente capaz de pensar por sí mismo, ahí entran en juego los agentes autónomos de IA. Cuando se les asigna un objetivo pueden crear, priorizar y completar tareas por ellos mismos. Se logra mediante instrucciones autodirigidas que se ejecutan en un bucle para producir acciones en cada iteración.
Otra de las predicciones de CB Insights se refiere a la proliferación de proyectos de agentes autónomos, aunque éstos aún no tienen una utilidad comercial plena.
El estudio cita algunos proyectos como Toolformers, de Meta, que se refiere a modelos de lenguaje que enseñan por sí mismos a utilizar herramientas externas; o Voyager, de Nvidia y Caltech, un agente de aprendizaje permanente en Minecraft que explora continuamente el mundo, y que adquiere diversas habilidades y hace descubrimientos novedosos sin intervención humana.
CB Insights se refiere asimismo al interés de las grandes tecnológicas y el capital riesgo durante 2024 por las iniciativas que tienen que ver con los agentes autónomos, y habla del interés de Microsoft, Andreessen Horowitz, Founders Fund, Khosla Ventures o Sequoia Capital en ciertas iniciativas de Open AI; o el de Eric Schmidt, The Alexa Fund, Astera Institute y Nvidia por determinados agentes de IA de Imbue.
Modelos fundacionales
Entre los modelos fundacionales se encuentran GPT-4, de OpenAI; Gemini, de Google; Llama 2, de Meta o Claude, de Anthropic.
Estos modelos fundacionales sirven para interactuar con grandes volúmenes de información; para generar contenidos, informes y código; y también para automatizar y aumentar tareas.
El estudio de CB Insights asegura que la IA multimodal está en su infancia, pero los modelos están evolucionando rápidamente. La IA multimodal se distingue de la tradicional por su capacidad para procesar e interpretar simultáneamente varios tipos de datos, como texto, imágenes y sonidos. Se prevé que la IA multimodal pueda desbloquear nuevas oportunidades comerciales.
"Las empresas hacen cada vez más con modelos 'de bolsillo'". El gasto empresarial en modelos grandes puede ascender a millones, y CB Insights recoge la opinión del analista de The Wall Street Journal, Tom Dotan, para quien "GPT-4 está entre los modelos de IA más grandes y costosos disponibles. Usarlo para resumir un correo electrónico es como usar un Lamborghini para repartir pizzas".
En 5 millones de dólares se cifra el gasto anual de una empresa de atención médica del Fortune 500 en OpenAI; entre 2 y 3 millones de dólares se calcula el precio inicial para personalizar GPT-4; y unos 720.000 dólares cuesta GPT-4 para resumir seis millones de artículos de Wikipedia a la mitad de su tamaño.
David A. Steinberg, emprendedor en serie y fundador y director ejecutivo de Zeta Global, asegura que su compañía "está enfocada hacia lo que se llaman modelos de lenguaje pequeño, que permiten que el algoritmo viva dentro de la plataforma de datos de clientes y vea sólo sus datos y la nube de datos de Zeta, y se vuelva realmente inteligente en sus productos" .
CB Insights concluye que "los modelos pequeños se harán cargo de tareas específicas en las finanzas -con ejemplos como DPT-SEC, de Arcee.AI-, la atención sanitaria -PalmyraMed, de Writer, o AntGLM-Med, de Ant Group-, o el sector legal, con ejemplos como DPT-Patent, también de Arcee.AI".
Aplicaciones de IA generativa
En determinados sectores, el efecto de los copilotos de IA tiene un impacto decisivo en la productividad. Esta es otra predicción para los próximos nueve meses: en el desarrollo de software, los copilotos de IA son ya esenciales para la productividad de los desarrolladores; y los copilotos de codificación tienden a convertirse en herramientas estándar en las empresas.
En el sector sanitario los copilotos están automatizando tareas tediosas como la documentación, mientras que en el sector legal ya juegan un papel decisivo en la redacción de contratos, para resumir documentos y optimizar la investigación.
Otra predicción negativa se refiere al hecho de que los ciberataques seguirán aumentando, con la IA como fuerza impulsora; y los deepfakes se están volviendo más sofisticados gracias al uso de herramientas de inteligencia artificial generativa como el intercambio de rostros y la suplantación de voz. Sin olvidar la influencia de ChatGPT en la explosión de ataques de phishing por correo electrónico.
Los proveedores de ciberseguridad tienden a utilizar IA generativa para contrarrestar los ataques, y CB Insights pronostica que surgirá una nueva generación de proveedores de ciberseguridad centrados en IA generativa.
La IA generativa se hace cargo del periodismo... Esta es una de las predicciones más llamativas de CB Insights, que asegura que las organizaciones de medios están adoptando la inteligencia artificial para acelerar la recopilación, producción y distribución de noticias.
The Dynamic Meter en The New York Times es un modelo de aprendizaje automático que establece límites de medidores personalizados para un muro de pago más inteligente.
El American Journalism Project, un proyecto en colaboración con Open AI de 5 millones de dólares, aprovecha las herramientas de inteligencia artificial para respaldar la cobertura de noticias locales, mientras que The Washington Post desarrolla desde 2016 el proyecto Heliograf, que automatiza informes sobre datos estructurados y los usa para los resultados deportivos.
Por su parte la agencia Associated Press está involucrada en el proyecto SAM (Social Media Monitoring), una herramienta para monitorizar las redes sociales y estar al tanto de las últimas noticias.
Se prevé que las organizaciones de noticias cerrarán nuevos acuerdos con desarrolladores de LLM para licenciar contenido a medida que se ven obligadas a cambiar sus modelos de ingresos.
CB Insights pronostica además que los presentadores de noticias de IA (lo que en EEUU se conoce como anchors) serán cada vez más comunes: Allí Channel+1 planea el lanzamiento de una red de noticias generada por IA para este otoño, con presentadores de noticias creadas por IA y voces generadas digitalmente; Google prueba Genesis, una herramienta que puede producir noticias; y Sports Illustrated se ha tenido que enfrentar a críticas por publicar artículos de escritores falsos generados por IA.