DeepSeek, una startup china fundada en mayo de 2023 por Liang Wenfeng, ha emergido como un actor destacado en el ámbito de la inteligencia artificial (IA). En menos de dos años, la empresa ha desarrollado un modelo de IA comparable a ChatGPT de OpenAI, con una inversión inferior a 6 millones de dólares, una fracción de los 80.000 millones que Microsoft y OpenAI planean invertir en infraestructura de IA este año.
Una de las estrategias clave detrás del éxito de DeepSeek es su enfoque en la contratación de talento local. La empresa recluta exclusivamente a ingenieros dentro de China continental, evitando buscar talento en Estados Unidos o Taiwán, como hacen otras compañías chinas. Además, ofrece salarios competitivos, superando los 1,3 millones de dólares anuales para sus investigadores más destacados. Este enfoque ha permitido a DeepSeek innovar en el campo de la IA y priorizar la eficiencia sobre la mejora mediante fuerza bruta.
En cuanto a infraestructura, DeepSeek opera su propio hardware, lo que le otorga una ventaja significativa sobre otras startups que dependen de proveedores externos de servicios en la nube. Según analistas de SemiAnalysis, la empresa cuenta con aproximadamente 50.000 GPU de NVIDIA, incluyendo al menos 10.000 H100 y 10.000 H800. Esta inversión en infraestructura, estimada en alrededor de 1.600 millones de dólares, se utiliza tanto para entrenar modelos de IA como para investigación y modelado financiero.
Además de utilizar hardware de NVIDIA, DeepSeek ha diversificado su infraestructura incorporando GPU desarrolladas por Huawei, como los chips Ascend 910C, que han demostrado ser efectivos en procesos de inferencia. Huawei y SiliconFlow han sido fundamentales para que los modelos DeepSeek V3 y R1 estén disponibles a gran escala para usuarios globales. Esta combinación de talento local bien remunerado y una infraestructura propia diversificada ha posicionado a DeepSeek como un referente en el desarrollo de inteligencia artificial en China y a nivel mundial
Fuente: Xataca