O por qué la Súper IA requerirá un tipo diferente de tecnología
Saltémonos las largas introducciones y vayamos directo al grano: la principal ventaja de los grandes modelos lingüísticos (LLM) es que casi cualquier cosa en el mundo puede, de alguna manera, describirse mediante texto. Y, al mismo tiempo, esa es su mayor limitación.
El texto es un código universal: una brillante invención de la mente humana que nos permite describir casi cualquier cosa y preservar esa descripción para que otros puedan entenderla. Y no solo los humanos pueden entenderlo, sino también las máquinas. Utilizando únicamente texto, los grandes modelos lingüísticos pueden interactuar con las personas y el mundo que las rodea. Describe hechos, objetos, eventos o fenómenos con palabras y oraciones, y el modelo puede "captarlos". En cierto sentido, se puede construir una "máquina inteligente" sin sentidos, una que experimente el mundo enteramente como texto.
Por otro lado, cualquier descripción textual es inherentemente aproximada. Por muy detallados que intentemos ser, el texto por sí solo nunca puede capturar todo a la perfección. Tomemos una manzana, por ejemplo. Imaginemos intentar describir su superficie con una lupa: la forma y el tamaño de cada partícula y cada vena. Ahora imaginemos hacer lo mismo bajo un microscopio. Eso requeriría miles de palabras, y eso es solo para la superficie, una pequeña parte de la manzana. En resumen, el texto solo puede ofrecer una imagen parcial de un objeto o fenómeno, buscando un equilibrio entre precisión y brevedad.
Para los humanos, esto no es un gran problema. El texto suele servir como referencia, y completamos el resto con la experiencia y la imaginación. Las máquinas, sin embargo, no tienen una base sólida en la realidad: no tienen experiencia directa del mundo. Carecen de sentidos para percibirlo de primera mano. Como resultado, el conocimiento que los modelos basados en LLM tienen sobre el mundo es limitado. Simplemente carecen de detalles precisos.
Además, la mayor parte de su formación y reciclaje se basa en datos de internet. Esto significa que gran parte de la información que aprenden no puede considerarse realmente "calificada, precisa ni detallada". Cabe destacar que una proporción cada vez mayor del contenido en línea es generado por IA.
Si intentáramos entrenar una IA basada en LLM para que su comprensión del mundo y percepción de la realidad fueran remotamente comparables a las de un humano, necesitaríamos una enorme cantidad de texto: descripciones minuciosamente detalladas de todo lo que una persona puede aprender con un vistazo rápido o unos segundos manipulando un objeto. Claramente —y el ejemplo de la manzana mencionado lo ilustra a la perfección— este enfoque requeriría muchísimo trabajo y, en última instancia, sería un callejón sin salida. Consumiría enormes cantidades de recursos y eventualmente alcanzaría un límite; sin embargo, el nivel de detalle aún estaría lejos de proporcionar a la máquina una comprensión de la realidad similar a la humana.
La conclusión es simple. Los LLM pueden usarse para construir diversos modelos de IA especializados. Sin embargo, no son adecuados para crear una IA general completa, capaz de realizar todas las tareas humanas, ni siquiera a un nivel medio. Y, por supuesto, no son adecuados para crear una IA general sólida que pueda superar a los expertos humanos en todos los ámbitos.
En resumen, los LLM son una herramienta multiusos increíble, construida sobre otra herramienta multiusos: el texto. Aún hay mucho margen para mejorarlos y ampliar sus usos. Pero incluso ahora, es evidente que presentan serias limitaciones que los convierten en una base deficiente para crear una IA general, y mucho menos una IA potente y sobrehumana.
Parece probable que resolver este desafío requiera un modelo diferente: uno que pueda aprender mediante la interacción directa con el mundo real, utilizando algo similar a los sentidos humanos. Dicho esto, es razonable esperar que los LLM sigan desempeñando un papel importante en estos sistemas futuros.
El tema de los modelos avanzados de IA es tan fascinante que realmente merece una discusión propia.