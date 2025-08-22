Se connecter  
DeepSeek V3.1 surpasse ChatGPT. Le modÃ¨le open source chinois se renforce
PubliÃ© le: 22/08/2025 @ 18:46:39: Par Nic007 Dans "Programmation"
ProgrammationDans le monde de l'intelligence artificielle, les choses se passent rarement en catimini ; les lancements s'accompagnent gÃ©nÃ©ralement d'un battage mÃ©diatique considÃ©rable (et parfois d'une excitation malsaine). Cette fois, sans battage mÃ©diatique, sans confÃ©rences ni annonces, le modÃ¨le DeepSeek V3.1 vient d'apparaÃ®tre sur la plateforme Hugging Face. Une startup chinoise de Hangzhou a lancÃ© une solution comportant 685 milliards de paramÃ¨tres. Lors des premiers tests, ses performances sont similaires Ã  celles des systÃ¨mes phares d'OpenAI (qui a rÃ©cemment subi un revers avec le lancement de GPT-5) et d'Anthropic. Cependant, la diffÃ©rence est fondamentale : DeepSeek Ã©tant open source, chacun peut le tÃ©lÃ©charger, l'utiliser et mÃªme le modifier Ã  sa guise. Il est Ã©galement rapide : DeepSeek V3.1 a obtenu 71,6 % au benchmark d'encodage Aider , ce qui le place parmi les meilleurs modÃ¨les disponibles. C'est impressionnant ; il ne s'agit pas d'une solution mÃ©diocre parmi tant d'autres, mais d'un concurrent capable de rivaliser avec les meilleurs.

L'aspect le plus surprenant du projet rÃ©side dans son aspect Ã©conomique. Actuellement, le coÃ»t d'une tÃ¢che d'encodage est d'environ 1,01 $, alors que les systÃ¨mes concurrents coÃ»tent prÃ¨s de 70 $ pour une charge de travail similaire. Un coÃ»t 68 fois supÃ©rieur Ã  la moyenne pour une qualitÃ© de rÃ©sultats comparable est un facteur surprenant, que l'industrie n'avait probablement pas anticipÃ©. Le modÃ¨le peut gÃ©rer jusqu'Ã  128 000 jetons, ce qui Ã©quivaut Ã  environ 400 pages de texte traitÃ©es simultanÃ©ment. Il conserve une vitesse de rÃ©ponse relativement satisfaisante, ce qui lui confÃ¨re un avantage sur les systÃ¨mes plus lents basÃ©s sur le raisonnement. L'architecture hybride reprÃ©sente une vÃ©ritable innovation. DeepSeek a crÃ©Ã© un systÃ¨me combinant efficacement les fonctions de chat, de raisonnement et de codage en un modÃ¨le unique et cohÃ©rent, alors que les prÃ©cÃ©dentes tentatives dans ce sens ont abouti Ã  des modÃ¨les globalement peu performants. La communautÃ© a dÃ©couvert plusieurs innovations techniques Â« sous le capot Â» : quatre nouveaux jetons spÃ©ciaux cachÃ©s dans le framework : des fonctions de recherche permettant l'intÃ©gration rÃ©seau en temps rÃ©el et des jetons Â« pensants Â» permettant des processus de raisonnement interne. Le modÃ¨le prend en charge diffÃ©rents formats de prÃ©cision, du BF16 standard au FP8 expÃ©rimental, dont la prÃ©cision et les besoins de calcul sont moindres.
