Alibaba Cloud invierte 2.000 millones de yuanes en ShengShu para desarrollar "modelos del mundo" con IA basada en videos y datos físicos, buscando replicar mejor la realidad y superar los límites de ChatGPT. La gigante tecnológica china Alibaba Cloud anunció una inversión de 2.000 millones de yuanes (aproximadamente 290 millones de dólares) en la startup ShengShu. Esta jugada, revelada el pasado viernes, busca liderar el desarrollo de "modelos del mundo" con IA que repliquen la realidad física de forma más profunda que los actuales chatbots de texto. Según la investigación publicada por CNBC , este movimiento estratégico refleja una tendencia global. Empresas tecnológicas, con inversiones de más de 50.000 millones de dólares en IA, reevalúan los modelos de lenguaje masivos (LLM) como ChatGPT, reconociendo sus límites al entender el mundo físico y anticipar acciones reales. La Inversión de 2.000 Millones de Yuanes en Modelos del Mundo Causa Impacto Alibaba Cloud, la rama de computación en la nube del gigante chino Alibaba Group, ha liderado una ronda de inversión Serie B de 2.000 millones de yuanes (290 millones de dólares) en ShengShu. Esta startup, fundada hace solo tres años, es la creadora de Vidu. TAL Education y Baidu Ventures también participaron, subrayando la importancia estratégica. Esto ocurre apenas dos meses después de que ShengShu ya hubiera captado otros 600 millones de yuanes de Qiming Venture Partners. ¿Por qué los "Modelos del Mundo" Superan a los Chatbots Actuales? El cambio de enfoque responde a una realidad innegable: los "Grandes Modelos de Lenguaje" (LLMs), aunque revolucionarios para el texto, alcanzan sus límites al intentar comprender y replicar el mundo real. A diferencia de ChatGPT, entrenado con miles de millones de palabras, los desarrolladores ahora se inclinan por "modelos del mundo". Estos se entrenan con datos multimodales como videos, audio y retroalimentación táctil de escenarios físicos. ShengShu argumenta que un modelo general del mundo, construido sobre estos datos diversos, captura de forma más natural cómo funciona la física y la interacción. Es crucial: solo el 10% del aprendizaje humano es textual; el 90% proviene de la experiencia sensorial. Vidu: La Apuesta China que Desafía el Liderazgo de OpenAI La herramienta Vidu Q3 Pro de ShengShu, lanzada en enero, ya se posiciona entre los 10 principales modelos de IA global para generar videos a partir de texto e imágenes, según Artificial Analysis. Su lanzamiento global se produjo meses antes de que OpenAI presentara su Sora, que, aunque generó gran expectación, no estuvo ampliamente disponible. ¿Cómo Impulsan estas Inversiones el Futuro de la IA Física? La inversión en ShengShu no es un caso aislado. Alibaba ha expandido sus participaciones en startups de IA para entender el mundo físico. El mes pasado, con Baidu Ventures, lideró 50 millones de dólares en Tripo AI, que genera modelos digitales 3D de fotografías. Tripo AI, al igual que ShengShu, se aleja de los modelos de lenguaje. En septiembre, Alibaba también invirtió 60 millones de dólares en PixVerse, que lanzó su propio modelo del mundo permitiendo dirigir cómo se desarrolla un video, con 85% de precisión. Alibaba: Más Allá del Comercio Electrónico con Inversiones Estratégicas Aunque Alibaba inició su imperio en el comercio electrónico hace más de 25 años, su visión actual va más allá. La compañía ha liberado modelos de IA de código abierto para video y, en febrero, lanzó uno para potenciar robots. ShengShu ha anunciado alianzas estratégicas con empresas que desarrollan "IA encarnada" (embodied AI), como robots humanoides que interactúan con el mundo físico. Se estima que el mercado global de robótica superará los 150.000 millones de dólares en los próximos cinco años, un área donde los modelos del mundo serán fundamentales para que la tecnología funcione eficazmente en entornos industriales, comerciales y domésticos, con mejoras de eficiencia de hasta un 40%. El Momento Crítico para la Inteligencia Artificial del Futuro Kevin Kelly, cofundador de Wired, destacó que la IA necesita tres componentes para replicar la inteligencia humana: razonamiento, comprensión del mundo físico y aprendizaje continuo. Los chatbots de LLM cubrieron el conocimiento; los modelos del mundo son el eslabón clave para un avance decisivo en los próximos 10 a 15 años hacia la inteligencia general. ¿Estamos en el Umbral de una Nueva Era de la Inteligencia Artificial? Con estas ambiciosas inversiones y el rápido avance de ShengShu y otras startups, la carrera por construir una IA que entienda y actúe en nuestro entorno físico está más viva que nunca. ¿Será China, a través de gigantes como Alibaba, la nación que lidere la próxima gran revolución de la inteligencia artificial, moviéndose de pantallas y textos a un mundo de robots y vehículos autónomos completamente integrados? El desenlace de esta competencia tecnológica de cientos de miles de millones de dólares definirá cómo viviremos y trabaja