DeepSeek tumba las IA de los gigantes tecnológicos de Silicon Valley

Modelo DeepSeek de IA

La empresa Nvidia se desploma en bolsa, su cotización de mercado ha colapsado en gran medida por un competidor del chatbot de OpenAI, se trata de DeepSeek, el competidor chino de ChatGPT que es de bajo costo y opera de manera similar brindando la misma experiencia de usuario.

La revolución en los modelos de inteligencia artificial (IA) impulsada por la empresa china DeepSeek se sustenta en un factor clave: ofrecen resultados similares a un costo significativamente menor. Su rendimiento general es comparable al de los líderes del mercado, como los modelos desarrollados por empresas de Silicon Valley, pero con costos de creación y operación mucho más reducidos.

OpenAI, Anthropic, Google y Nvidia, responsables de los modelos más reconocidos y los chips avanzados que los soportan, han visto cómo su aparente ventaja se desvanece en cuestión de días. Hoy en día, son menos los expertos que creen que entrenar y utilizar un modelo de IA requiera los recursos de un gigante tecnológico. La drástica caída en bolsa de Nvidia refleja esta nueva realidad.

Los chatbots de DeepSeek funcionan de manera similar a los demás. El usuario se registra con un correo electrónico y una contraseña en la plataforma de la empresa y puede comenzar a hacer preguntas de inmediato. Aunque en ocasiones tarda un poco más en responder, evita abordar temas políticos delicados, como Tiananmén o Taiwán, y su desempeño en español es bastante notable. Lo más destacado, sin embargo, es que su uso es gratuito. DeepSeek monetiza su servicio cobrando a usuarios que requieren funcionalidades profesionales con el uso de su API.

El modelo R1, el más reciente de DeepSeek, ha sido el detonante del declive en la hegemonía de la IA occidental. Su capacidad de razonamiento es equiparable a la del modelo más avanzado de OpenAI, el o1. Durante las festividades navideñas, la empresa china lanzó su modelo V3, comparable al popular ChatGPT-4, incorporando avances técnicos que han generado gran expectación.

DeepSeek ha logrado reducir drásticamente los costos de entrenamiento de nuevos modelos. Mientras que entrenar ChatGPT-4 costaba más de 100 millones de dólares, DeepSeek ha conseguido hacerlo por menos de 6 millones. Andrei Karpathy, cofundador de OpenAI y exdirector de IA en Tesla, calificó este presupuesto como "de broma" y destacó la necesidad de optimizar recursos en datos y algoritmos. El último modelo de DeepSeek es tan eficiente que requirió solo una décima parte del poder computacional necesario para el modelo equivalente de Meta.

Los modelos de IA son extremadamente costosos tanto en su entrenamiento como en su operación. DeepSeek ha logrado reducir estos costos mediante técnicas innovadoras. Por un lado, ha implementado un sistema de aprendizaje basado en modelos anteriores, algo que, aunque no está permitido por los términos de servicio de muchas empresas, es difícil de detectar y evitar. Esta técnica, conocida como "destilación", permite que los modelos aprendan unos de otros, acelerando su evolución.

Otra estrategia de DeepSeek para reducir costos es el uso de un sistema de "expertos". Cuando un usuario hace una pregunta, el modelo decide qué experto (médico, traductor, abogado, físico, etc.) debe activar, en lugar de activar todos a la vez, lo que supone un ahorro significativo de energía y recursos computacionales. Este enfoque es similar a conectar una pequeña fábrica a una fuente de energía eficiente, en lugar de depender de una planta eléctrica masiva.

Como resultado, los usuarios que pagaban alrededor de 20 dólares por utilizar los modelos de OpenAI ahora pueden obtener resultados similares de forma gratuita. La IA está avanzando rápidamente hacia una etapa de commoditización, en donde la tecnología se convierte en un producto de uso común y accesible para todos.

Este avance ha tenido lugar en Hangzhou, una ciudad cercana a Shanghái. A pesar de las restricciones impuestas por la administración Biden, que vetó la exportación de los chips más avanzados para limitar la competencia china, DeepSeek ha demostrado que no los necesita. La empresa ha optado por el código abierto, compartiendo abiertamente sus logros y documentación en internet, convirtiendo la necesidad en virtud.

El final de esta etapa inicial de la IA parece ser una mala noticia para los pioneros del sector, que ven cómo su ventaja competitiva se desvanece. Sin embargo, otras grandes compañías, como Amazon o Apple, que no estaban a la vanguardia de esta carrera, podrían beneficiarse al ofrecer servicios similares a una fracción del costo.

La carrera por la IA se vuelve cada vez más competitiva, ahora con China y sus principales empresas tecnológicas entrando a hacer competencia y plantar cara a las principales compañías norteamericanas. El principal beneficiado es el usuario final ya que es quien experimentará mejoras en los sistemas en cuanto a optimización, reducción de costos y operatividad.

Te puede interesar: