Charles TechCharles Tech
  • Tests High-Tech
    • Smartphones
      • iPhone
      • Asus
      • Huawei
      • Poco
      • Samsung
      • Xiaomi
    • Ordinateurs
      • PC fixe / gamer
      • PC portables
    • Composants PC
      • Cartes Graphiques
      • Processeurs
      • SSD
    • Eléctromenager
      • Aspirateurs robots
    • Périphériques
      • Claviers
      • Souris
  • Actu Tech
  • Bons plans
  • Dossiers
  • Guides d’achat
  • Tutos
  • Langues
Vous lisez Kimi K2.6 écrase Claude et GPT-5.5 dans un tournoi de code en temps réel
Font ResizerAa
Charles TechCharles Tech
Font ResizerAa
Rechercher ...
  • Tests High-Tech
    • Smartphones
    • Ordinateurs
    • Composants PC
    • Eléctromenager
    • Périphériques
  • Actu Tech
  • Bons plans
  • Dossiers
  • Guides d’achat
  • Tutos
  • Langues
Suivez-nous
Charles Tech > Actualité High-Tech : Toutes nos dernières news > Kimi K2.6 écrase Claude et GPT-5.5 dans un tournoi de code en temps réel

Kimi K2.6 écrase Claude et GPT-5.5 dans un tournoi de code en temps réel

Charles Gouin-Peyrot
Charles Gouin-Peyrot
Published: 03/05/2026
Last updated: 03/05/2026
Ce site utilise des liens affiliés qui participent aux revenus du site. En les utilisant, ça ne vous coûte pas plus cher, mais un pourcentage nous est reversé pour continuer à vous informer et à proposer des tests toujours plus complets.
Partager
Résumer avec :
ChatGPT ChatGPT
Grok Grok
Perplexity Perplexity
Claude Claude
Sommaire
  • Un puzzle de grille pour départager les modèles
  • Kimi K2.6 en tête, deux modèles chinois dans le podium
  • Ce que révèlent les cas extrêmes
  • Un écart qui se resserre, sans effacer les nuances
Interface DeepSeek IA chinoise sur écran sombre, modèle concurrent
Photo : Matheus Bertelli (pexels)

Lors de la 12e édition d’un concours de programmation en temps réel, le modèle Kimi K2.6 de la startup chinoise Moonshot AI a terminé premier d’un classement à dix participants. Claude Opus 4.7, GPT-5.5 et Gemini Pro 3.1 ont tous fini derrière les deux premières places.

Ce concours, organisé et arbitré de façon indépendante, consiste à faire jouer des modèles de langage à un puzzle de lettres sur grille, en temps réel, avec un système de notation objectif. Les résultats sont calculés automatiquement et publiés avec les journaux de mouvements.

A lire aussi

D'autres articles intéressants

Ces écouteurs sans fil sont dotés de piles remplaçables !
Apple autorise l’utilisation de pièces d’occasion pour la réparation des iPhones
Les GPU MSI GeForce RTX 4070 Ventus et Gaming ont fuité
Windows 11 : La date de sortie fixée au 5 octobre 2021 officiellement
MSI présente 6 nouveaux ordinateurs portables
  • La Chine dévoile une IA encore moins chère que DeepSeek
  • ChatGPT : sa plus grande mise à jour GPT-5 pourrait arriver bien plus tôt que prévu

Un puzzle de grille pour départager les modèles

L’épreuve du jour s’appelait le Word Gem Puzzle. Les modèles devaient écrire du code capable de se connecter à un serveur TCP, puis de jouer à un jeu de tuiles coulissantes sur une grille allant de 10×10 à 30×30 cases. L’objectif était de former des mots en anglais sur les lignes horizontales ou verticales.

Interface DeepSeek DeepThink R1, compétition modèles IA code
Photo : Matheus Bertelli (pexels)

Le système de score pénalise les mots courts : un mot de cinq lettres coûte un point, un mot de trois lettres en coûte trois. Les mots de sept lettres ou plus rapportent leur longueur moins six. Ce mécanisme visait à décourager les stratégies de réclamation systématique de petits mots courants.

Les grandes grilles se sont avérées décisives. Sur un plateau 30×30, les mots-graines placés initialement avaient presque tous été dispersés par le brassage, rendant le déplacement actif de tuiles indispensable pour marquer des points.

Kimi K2.6 en tête, deux modèles chinois dans le podium

Kimi K2.6 a terminé avec 22 points de match et un bilan de sept victoires, une défaite et aucun nul, pour un total cumulé de 77 points de score. MiMo V2-Pro de Xiaomi a pris la deuxième place avec 20 points de match, suivi de GPT-5.5 à la troisième place. Claude Opus 4.7 a fini cinquième, Gemini Pro 3.1 sixième.

La stratégie de Kimi reposait sur une boucle gloutonne : évaluer chaque mouvement possible, exécuter celui qui ouvre le plus de mots positifs, puis recommencer. Ce comportement présentait des défauts sur les petites grilles, notamment un oscillation stérile du curseur vide entre deux cases, mais il s’est montré productif à grande échelle quand les autres modèles n’avaient plus rien à réclamer.

Interface ChatGPT sur écran, comparaison modèles IA
Photo : Matheus Bertelli (pexels)

MiMo V2-Pro a adopté une approche inverse : aucun déplacement de tuile, mais un balayage immédiat de la grille initiale pour revendiquer d’un seul envoi tous les mots de sept lettres ou plus encore visibles. Cette méthode était très efficace quand les mots-graines étaient intacts, et totalement inopérante sur les grandes grilles.

Ce que révèlent les cas extrêmes

À l’autre bout du classement, les résultats sont instructifs. DeepSeek V4 a envoyé des données malformées à chaque round, ne marquant aucun point utile. Le modèle Muse a récolté un score cumulé de -15 309 points en réclamant systématiquement tous les mots courts qu’il détectait, sans tenir compte des pénalités prévues par les règles.

L’auteur du concours note que Muse avait manifestement lu les instructions de façon partielle, puis exécuté cette lecture partielle avec une complétude totale. Il souligne que ce type de comportement mérite attention pour quiconque déploie des modèles sur des tâches structurées avec pénalités.

Un écart qui se resserre, sans effacer les nuances

L’organisateur précise lui-même que cette épreuve mesure la capacité à écrire du code fonctionnel sous contrainte de temps réel, pas le raisonnement en contexte long ni la génération de code à partir de spécifications complexes. Un seul défi ne remet pas en cause les classements généraux.

Sur l’indice Artificial Analysis Intelligence Index, Kimi K2.6 obtient un score de 54, GPT-5.5 de 60 et Claude de 57. L’écart reste mesurable. Kimi K2.6 est disponible en open-weights depuis Moonshot AI, une startup fondée en 2023.

Source : Thinkpol

Partager cet article
Facebook Email Copy Link Imprimer
ByCharles Gouin-Peyrot
Suivre
Depuis plus de 10 ans, je suis passionné des innovations technologiques et de ce qu'elles apportent. Comme une fiche technique ne dit jamais tout, rien ne vaut un vrai test, par un expert qui a déjà vu passer entre ses mains des centaines de produits en tout genre. Geek, passionné d'informatique qui monte des ordinateurs le week-end et teste un nouveau robot tondeuse le soir, je suis aussi photographe amateur.
Laisser une note

Laisser une note Annuler la réponse

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Sélectionnez une note

Notre partenaire

offre nordvpn

Réseaux sociaux

23KLike
38KSuivre
170Suivre
2.8KAbonnement
10.8KSuivre
1.1KSuivre
34Suivre

Vous aimerez aussi ...

OPPO A96 : Officiellement présenté par la marque

26/04/2022
xiaomi 15 ultra

Xiaomi 15 Ultra : Voici tout ce que vous devez savoir sur le smartphone

25/04/2026

Huawei P50 Pocket : une merveille de technologie

02/05/2023

Vine pourrait faire son retour pour s’attaquer à TikTok

01/11/2022

A ne pas louper !

laifen wave acier
Prix sacrifié pour le Black Friday sur ces produits Laifen
Bons plans
laifen se lite
Black Friday : économisez 40% sur ces sèche-cheveux design de chez Laifen
Bons plans
laifen wave acier
Black Friday : ces brosses à dents connectées sont en promo exceptionnelle jusqu’à 40% de réduction dès aujourd’hui
Bons plans
  • Annoncer sur CharlesTech
  • Mentions légales
  • Contactez nous
  • À propos
  • Plan de site
© Charles Tech 2017 - 2025 - Toute reproduction (même partielle) interdite sous peine de poursuites.
Re !

Connectez-vous

Username or Email Address
Password

Vous avez perdu votre mot de passe ?