L’actualité récente dans le secteur des technologies a été marquée par l’impact de DeepSeek sur les marchés financiers. Ce modèle chinois d’intelligence artificielle a secoué non seulement la bourse américaine, mais aussi européenne, avec notamment une chute de 16 % pour NVIDIA et une volatilité importante parmi les géants de la technologie. En Europe, des entreprises telles que Siemens Energy et Schneider Electric ont également enregistré des baisses significatives.
DeepSeek est une entreprise chinoise, filiale de High Flyer Capital Management, un hedge fund créé en 2015. Cette entité s’est spécialisée dans des stratégies de trading basées sur l’intelligence artificielle. Bien que les performances initiales de ce hedge fund aient été mitigées, l’intelligence artificielle a rapidement été identifiée comme un levier stratégique, d’où la création de la filiale DeepSeek.
Cette entreprise propose plusieurs modèles d’intelligence artificielle, dont le modèle V3, lancé en décembre dernier, et le modèle R1, introduit en janvier 2025. Le modèle V3 est un modèle généraliste comparable à ChatGPT, capable de comprendre et générer du texte de manière fluide. En revanche, le modèle R1 est spécifiquement conçu pour des tâches complexes telles que la résolution de problèmes mathématiques et techniques, avec une approche axée sur des performances élevées dans des cas d’usage bien définis.
Une des particularités notables du modèle R1 réside dans sa méthode d’entraînement basée sur le renforcement, où le modèle apprend par essais et erreurs. Contrairement aux approches traditionnelles reposant sur des exemples fournis par des humains, ce modèle est capable de développer des solutions par lui-même à partir de règles de base, le rendant particulièrement performant pour des tâches complexes.
Sur le plan technique, DeepSeek affirme que ses modèles offrent des performances équivalentes, voire supérieures, à certains modèles leaders du marché. Par exemple, le modèle R1 serait comparable à ChatGPT-O1, tandis que V3 surpasserait prétendument ChatGPT-4 et d’autres modèles tels que Claude 3.5 ou Llama 3.1 de Meta.
Cependant, ce qui a véritablement attiré l’attention des marchés est le coût d’entraînement particulièrement bas des modèles de DeepSeek. Contrairement à la norme actuelle, où l’entraînement des modèles coûte entre 100 millions et 1 milliard de dollars, DeepSeek annonce avoir entraîné son modèle V3 pour seulement 5,6 millions de dollars. De plus, le modèle a été entraîné avec 2 048 puces NVIDIA, contre 16 000 ou plus pour les modèles comparables, et en utilisant des puces H800 plus anciennes. Ces optimisations réduisent également les ressources nécessaires pour le fonctionnement des modèles, diminuant ainsi les coûts énergétiques.
Cette innovation remet en question le paradigme actuel de l’intelligence artificielle, basé sur une consommation massive de ressources. Les conséquences sont particulièrement importantes pour les acteurs des semi-conducteurs, à commencer par NVIDIA, dont les perspectives de croissance pourraient être revues à la baisse. Des entreprises comme ASML, Schneider Electric ou Siemens Energy, impliquées dans la chaîne de valeur des semi-conducteurs et des data centers, ont également été fortement impactées.
Du côté des grandes entreprises technologiques comme Microsoft, Amazon ou Alphabet, la situation est plus nuancée. Ces acteurs conservent des avantages compétitifs significatifs grâce à leurs bases de données massives et leurs clients captifs dans le cloud, ce qui leur permet de proposer des solutions intégrées d’intelligence artificielle.
Pour l’économie globale, les annonces de DeepSeek sont perçues comme une avancée positive. En réduisant considérablement les coûts liés à l’intégration de l’intelligence artificielle, cette technologie devient plus accessible pour les entreprises. L’IA pourrait ainsi jouer un rôle similaire à celui d’Internet il y a 25 ans, en apportant de la valeur ajoutée, en améliorant la productivité et en réduisant les coûts opérationnels.
Reste à observer comment le marché interprétera ces développements. Les réactions actuelles se concentrent sur les impacts négatifs pour les semi-conducteurs, mais les opportunités économiques plus larges offertes par ces innovations pourraient également attirer l’attention à long terme.