
Hace más de 10 años descubrimos que el entrenamiento de los modelos de lenguaje escala. Es decir, cuanto más poder de cómputo utilizamos para su entrenamiento, más inteligente es el modelo. Desde entonces, llevamos multiplicando ese poder de cómputo por 4.6 cada año y los modelos han evolucionado en igual medida hasta llegar donde estamos ahora. Para ese entrenamiento hemos utilizado datos estructurados en su gran mayoría. Etiquetados por seres humanos, preprocesados y ordenados
Observemos el trazado de los continentes desde Google Maps o la complejidad de un bosque: aunque a primera vista parezca aleatorio, cada elemento lleva implícito un patrón que, sin embargo, sigue siendo difícil de capturar en su totalidad. Es este desorden lo que nos ha motivado a buscar orden, tanto en la naturaleza como en nuestras estructuras sociales y empresariales.
Pero el mundo que nos rodea es un vasto océano de información desordenada. Observemos el trazado de los continentes desde Google Maps o la complejidad de un bosque en su trazado o incluso al alzar la vista al cielo nocturno, las estrellas que se esparcen sin un patrón evidente. Aunque a primera vista parezca aleatorio, cada elemento lleva implícito un patrón que, sin embargo, sigue siendo difícil de capturar en su totalidad.
Frente a este caos aparente, el ser humano despliega una creatividad incansable para poner orden. Clasificamos, etiquetamos, segmentamos. El urbanismo de una ciudad, la taxonomía de las especies, el calendario, o el propio concepto de tiempo es un claro ejemplo de nuestro empeño por estructurar lo inabarcable.
En el plano empresarial, cualquiera que utilice un software de gestión de clientes (CRM), puede comprobar cómo simplificamos las complejas relaciones con las empresas en etiquetas y segmentos. Es asombroso cómo reducimos interacciones humanas ricas y multifacéticas a categorías manejables. Al fin y al cabo, una empresa no es más que un intento de estructurar información con un propósito productivo.
Limitaciones y paradojas
Sin embargo, esta estructuración es, inevitablemente, subóptima. Nuestras limitaciones cognitivas nos impiden procesar y organizar la inmensidad de datos que nos rodea y sacar partido de ella. Según mi propia estimación, hemos logrado estructurar el 0,00% de la información que el mundo nos ofrece. Una cifra que, al contemplarla, despierta en mí la misma mezcla de asombro y pequeñez que debe experimentar un astronauta al observar la Tierra desde la inmensidad del espacio.
"No podemos subestimar el poder de un agente autónomo, entendiendo como tal una IA con capacidad de acción sobre el mundo real, ya sea digital o físico"
Por contra, la capacidad de los modelos de lenguaje para aprender y mejorar crece de manera exponencial, superando las limitaciones humanas en el procesamiento de información desestructurada. Sería un gran error por nuestra parte no tener en cuenta esta ventaja competitiva. No podemos subestimar el poder de un agente autónomo, entendiendo como tal una IA con capacidad de acción sobre el mundo real, ya sea digital o físico. No subestimemos su capacidad para aprender nuevos patrones de información no estructurada: patrones atmosféricos, lógica de fluidos, las mismas redes neuronales o algo tan sencillo como las cámaras de una ciudad que monitorizan el tráfico. Y derivado de ese aprendizaje, su capacidad de adaptación a todo tipo de herramientas, entornos y situaciones. Deep research, a mi juicio el primer agente que se ha explotado de manera masiva, está revolucionando el mundo de la investigación. Y es solo el primero y más sencillo de ellos.
Pongamos el ejemplo de los enjambres de drones e intentemos ver más allá de la belleza de la coreografía. Este despliegue no es solo un espectáculo, sino una demostración de cómo sistemas autónomos pueden coordinarse. Sistemas como este podrían transformar sectores como la logística. O a la armamentística por mucho que nos incomode.
Es crucial ampliar nuestra perspectiva en este sentido. Y no pensemos en una escala 1 a 1 con el ser humano y sus capacidades actuales. Los costes de producción y más importante aún el coste por token (la gasolina que utilizan los modelos de lenguaje), están cayendo rápidamente, en parte por la competencia brutal, la gran inversión en este sector y el propio uso de la IA para mejorar de forma continua los algoritmos.
Estos agentes pueden procesar volúmenes ingentes de datos no estructurados y asimilarlos en fracciones de segundo. Su capacidad para comprender el entorno que les rodea y generar sus propias representaciones internas del mundo para simular escenarios potenciales y anticiparse seleccionando la mejor acción, abre nuevos caminos en múltiples direcciones. Concretamente, la conducción autónoma está altamente enfocada en este aspecto.
En general, los agentes tienen el poder de transformar la economía global. No hay exageración en mis palabras. Posibilitan un mundo donde la mano de obra deje de ser un recurso escaso. Dediquemos un par de ciclos mentales a pensar sobre esto antes de continuar. "Que la vivienda deje de ser un bien escaso". ¿Qué implicaciones tendría esto sobre la sociedad y la economía? La comida, el transporte, los bienes de consumo. Estamos a punto de presenciar cómo los mercados y modelos de negocio actuales se verán sacudidos hasta sus cimientos.
Reflexiones finales
Los modelos de lenguaje no enfrentan nuestras limitaciones humanas ni las restricciones de procesamiento de datos. Recordemos la hipótesis inicial. El 99,99% de la información del mundo no está estructurada por el ser humano. La IA puede seguir mejorando a partir de esos datos. ¿En qué podría convertirse? ¿Hasta dónde podría llegar? Estamos al borde de una era donde la inteligencia artificial no solo complementará, sino que redefinirá nuestra comprensión y organización del mundo. Como dijo Frank Sinatra, lo mejor está por llegar.