Charles TechCharles Tech
  • Tests High-Tech
    • Smartphones
      • iPhone
      • Asus
      • Huawei
      • Poco
      • Samsung
      • Xiaomi
    • Ordinateurs
      • PC fixe / gamer
      • PC portables
    • Composants PC
      • Cartes Graphiques
      • Processeurs
      • SSD
    • Eléctromenager
      • Aspirateurs robots
    • Périphériques
      • Claviers
      • Souris
  • Actu Tech
  • Bons plans
  • Dossiers
  • Guides d’achat
  • Tutos
  • Langues
Vous lisez DeepSeek V4 : NVIDIA assure le support Blackwell à 3 500 tokens/s
Font ResizerAa
Charles TechCharles Tech
Font ResizerAa
Rechercher ...
  • Tests High-Tech
    • Smartphones
    • Ordinateurs
    • Composants PC
    • Eléctromenager
    • Périphériques
  • Actu Tech
  • Bons plans
  • Dossiers
  • Guides d’achat
  • Tutos
  • Langues
Suivez-nous
Charles Tech > Actualité High-Tech : Toutes nos dernières news > DeepSeek V4 : NVIDIA assure le support Blackwell à 3 500 tokens/s

DeepSeek V4 : NVIDIA assure le support Blackwell à 3 500 tokens/s

Charles Gouin-Peyrot
Charles Gouin-Peyrot
Published: 26/04/2026
Last updated: 26/04/2026
Ce site utilise des liens affiliés qui participent aux revenus du site. En les utilisant, ça ne vous coûte pas plus cher, mais un pourcentage nous est reversé pour continuer à vous informer et à proposer des tests toujours plus complets.
Partager
Résumer avec :
ChatGPT ChatGPT
Grok Grok
Perplexity Perplexity
Claude Claude
Sommaire
  • DeepSeek V4, deux modèles aux architectures distinctes
  • Jusqu’à 3 500 tokens par seconde sur GB300
  • La compatibilité MXFP4 dépasse les frontières matérielles
  • Des optimisations encore attendues
DeepSeek V4 : NVIDIA assure le support Blackwell à 3 500 tokens/s

NVIDIA a anticipé le lancement de DeepSeek V4 en proposant un support immédiat de ses GPU Blackwell, sans période d’adaptation. Les premières mesures de performance ont été communiquées par l’entreprise dès la disponibilité du modèle.

Cette réactivité s’inscrit dans un contexte de compétition accrue autour des modèles d’inférence à très grande échelle, où la vitesse de déploiement devient un critère déterminant pour les opérateurs de centres de données.

DeepSeek V4, deux modèles aux architectures distinctes

DeepSeek V4 se décline en deux variantes : un modèle Pro à 1 600 milliards de paramètres et une version Flash à 284 milliards. Les deux sont conçus pour réduire les exigences de calcul par rapport aux générations précédentes.

D'autres articles intéressants

Un malware iOS permet de simuler l’arrêt de l’appareil
Facebook Messenger : Des millions de comptes hackés
Apple dépose un brevet pour les écrans de MacBook Pro
Xiaomi : MIUI dépasse les 547 millions d’utilisateurs
Samsung Galaxy A14 : Caractéristiques et design du smartphone

Le modèle consomme 27 % des opérations à virgule flottante nécessaires pour l’inférence d’un seul token, et seulement 10 % de l’espace de cache KV lors d’un contexte d’un million de tokens. Ces réductions allègent significativement la charge mémoire à grande échelle.

La quantification FP4, plus précisément MXFP4, joue un rôle central dans ces gains. Elle compresse les représentations numériques des poids du modèle, ce qui réduit le trafic mémoire et la latence d’échantillonnage lors de l’inférence.

Jusqu’à 3 500 tokens par seconde sur GB300

Selon les données présentées par NVIDIA, le GPU GB300, aussi appelé Blackwell Ultra, atteint un débit proche de 3 500 tokens par seconde pour DeepSeek V4. L’entreprise précise que ces chiffres sont préliminaires et devraient progresser avec les optimisations à venir.

Close-up of a digital assistant interface on a dark screen, showcasing AI technology communication.
Photo : Matheus Bertelli (pexels)

La pile logicielle Blackwell mobilise plusieurs technologies pour ce résultat : la précision NVFP4, l’outil d’orchestration Dynamo, des noyaux CUDA optimisés et des techniques de parallélisation avancées. NVIDIA propose également ces capacités via ses microservices NIM et ses flux de fine-tuning.

L’entreprise positionne Blackwell comme une plateforme adaptée aux modèles dépassant le billion de paramètres, avec une gestion de contexte long allant jusqu’à un million de tokens en conditions réelles de déploiement.

La compatibilité MXFP4 dépasse les frontières matérielles

Un élément notable concerne les futurs processeurs Ascend d’Huawei. Les puces Ascend 950PR et Ascend 950DT, dont le lancement est prévu en 2026, intègrent elles aussi des instructions MXFP4.

Cela signifie que DeepSeek V4 sera techniquement compatible avec ces accélérateurs domestiques chinois, sans modification du modèle. La standardisation autour de MXFP4 pourrait ainsi faciliter le déploiement de V4 sur un spectre matériel plus large que les seuls GPU NVIDIA.

Cette compatibilité croisée reflète une tendance plus large : les formats de quantification basse précision deviennent des standards de fait dans l’écosystème des grands modèles de langage.

Des optimisations encore attendues

Les chiffres actuels de 3 500 tokens par seconde constituent un point de départ, non un plafond. NVIDIA indique que son équipe travaille à affiner davantage la pile logicielle pour DeepSeek V4, notamment au niveau du co-design entre le matériel et le modèle.

L’entreprise est également décrite comme contributrice active à l’écosystème open source, avec plusieurs centaines de projets publiés sous licences ouvertes. DeepSeek V4 s’inscrit dans cette logique de modèles ouverts que NVIDIA cherche à optimiser en priorité lors de chaque lancement majeur.

Source : WCCFTech

Partager cet article
Facebook Email Copy Link Imprimer
ByCharles Gouin-Peyrot
Suivre
Depuis plus de 10 ans, je suis passionné des innovations technologiques et de ce qu'elles apportent. Comme une fiche technique ne dit jamais tout, rien ne vaut un vrai test, par un expert qui a déjà vu passer entre ses mains des centaines de produits en tout genre. Geek, passionné d'informatique qui monte des ordinateurs le week-end et teste un nouveau robot tondeuse le soir, je suis aussi photographe amateur.
Laisser une note

Laisser une note Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Sélectionnez une note

Notre partenaire

offre nordvpn

Réseaux sociaux

23KLike
38KSuivre
170Suivre
2.8KAbonnement
10.8KSuivre
1.1KSuivre
34Suivre

Vous aimerez aussi ...

battlefield 6 date de sortie

Battlefield 6 : la date de sortie révélée indirectement sur le site officiel

25/04/2026
mediatek dimensity 9400

MediaTek lance son Dimensity 9400, un sérieux concurrent au Snapdragon 8 Gen 3

25/04/2026

Samsung : Première image officielle du Galaxy Z Slide

11/05/2022
Honor Magic Vs

Honor tease le lancement mondial de son téléphone pliable le Magic VS

31/01/2023

A ne pas louper !

laifen wave acier
Prix sacrifié pour le Black Friday sur ces produits Laifen
Bons plans
laifen se lite
Black Friday : économisez 40% sur ces sèche-cheveux design de chez Laifen
Bons plans
laifen wave acier
Black Friday : ces brosses à dents connectées sont en promo exceptionnelle jusqu’à 40% de réduction dès aujourd’hui
Bons plans
  • Annoncer sur CharlesTech
  • Mentions légales
  • Contactez nous
  • À propos
  • Plan de site
© Charles Tech 2017 - 2025 - Toute reproduction (même partielle) interdite sous peine de poursuites.
Re !

Connectez-vous

Username or Email Address
Password

Vous avez perdu votre mot de passe ?