32 points par GN⁺ 2025-05-01 | 5 commentaires | Partager sur WhatsApp
  • gpt-4.1 agit comme un assistant prudent et fiable, avec un fort niveau de compréhension précise du code et une approche conservatrice
  • gemini 2.5 pro excelle dans le traitement de contextes larges et l’analyse d’images, mais présente un risque de corrections excessives
  • sonnet 3.5/3.7 est créatif et intelligent, mais manque de maintien du contexte et de cohérence, ce qui le rend moins stable dans les conversations longues
  • grok-3-beta est lent, mais montre un excellent potentiel pour la visualisation de design et la résolution de problèmes complexes
  • Les utilisateurs séparent l’usage des modèles selon le flux de travail et privilégient des stratégies de restauration de checkpoint et de changement de modèle en cas d’échec du débogage

gpt-4.1

  • Se comporte comme un assistant intelligent et hautement fiable
  • Ne tire pas de conclusions hâtives, suit les demandes sans faire de modifications excessives
  • Donne l’impression d’être le prolongement du développeur, et convient particulièrement aux développeurs expérimentés

gemini 2.5 pro

  • Très performant lorsqu’il faut exploiter un contexte large, comme de longs logs de console ou des fichiers de code complets
  • Excellente capacité d’analyse d’images, capable de repérer des erreurs visuelles
  • Son point faible est de fonctionner de manière trop autonome, ce qui peut entraîner des suppressions de code inutiles ou des corrections excessives
  • Il nécessite un contrôle attentif

sonnet 3.5 / 3.7

  • La version 3.7 est créative et intelligente, mais peut perdre le contexte ou ignorer des instructions dans les conversations longues
  • La version 3.5 est solide pour comprendre et modifier du code dans un seul fichier
  • Son intégration avec Cursor traverse une phase de transition et ne montre pas encore des performances constantes

Autres avis et stratégies

  • grok-3-beta est lent, mais utile pour résoudre des problèmes sur lesquels d’autres modèles ont échoué
  • Un utilisateur applique la stratégie de répartition des modèles suivante :
    • o3/4-mini : organisation du plan et structuration du raisonnement en Markdown
    • gemini 2.5 pro : analyse de problèmes à l’échelle de fichiers complets et appels de fonctions
    • sonnet 3.5 : modifications d’un seul fichier via cmd+k

5 commentaires

 
bungker 2025-05-02

On peut affirmer sans hésiter que Gemini 2.5 Pro est le plus performant, du moins en ce qui concerne exclusivement Go.

 
daddy 2025-05-02

Je recommande Gemini car c’est le plus rapide pour les questions-réponses.

 
jk34011 2025-05-02

J’utilisais surtout Sonnet jusqu’ici
Je me reconnais beaucoup dans ce qui est écrit dans le corps de l’article
Je vais aussi essayer la 4.1

 
gnoopy 2025-05-01

Je ressens à peu près la même chose. Plus j’utilisais sonnet, plus je me sentais inquiet, alors qu’avec chatgpt 4.1, même après avoir donné une consigne, on se sent d’abord plutôt rassuré.

Je partage aussi l’avis sur Grok, mais j’ai tendance à l’utiliser davantage pour vérifier calmement des choses dans le chat plutôt que directement dans l’IDE.

 
GN⁺ 2025-05-01

Réactions de la communauté Reddit

Manières d’utiliser les modèles

  • o3/4-mini : utilisé pour la planification et l’organisation à base de Markdown, avec un meilleur reasoning et une meilleure aptitude à la conversation (Masony817, scragz, Princekid1878)
  • gemini 2.5 pro :
    • utile en mode agent ou pour les appels de fonctions avec un long contexte (Masony817, computerlegs)
    • puissant pour avoir une vue d’ensemble du code et porter un jugement sur des projets complexes (WorryBubbly3438)
    • bon pour la recherche, les vérifications croisées et le prétraitement (computerlegs)
  • sonnet 3.5 : très bon pour comprendre et modifier un seul fichier, adapté au raccourci cmd+k (Masony817)
  • sonnet 3.7 :
    • plus créatif et meilleur que 3.5, mais a tendance à perdre le fil dans les longues conversations (Sea_Cardiologist_212)
    • excellent sur les données de cutoff les plus récentes et les capacités de raisonnement (yairEO)
    • reste stable si l’on gère bien la fenêtre de contexte (computerlegs)
  • Claude 3.7 : stable et constant dans l’environnement Cursor (cmndr_spanky)
  • gpt-4.1 :
    • adapté aux tâches simples et répétitives ou aux travaux structurés (Princekid1878, ILikeBubblyWater)
    • a tendance à faire trop de changements sans explication (ILikeBubblyWater)
  • Deepseek R1 : fonctionne parfois étonnamment mieux que d’autres modèles sur certains problèmes (Leather_Science_7911)

Stratégies d’usage et workflow

  • répartition des rôles entre les modèles puis bascule selon la situation (plusieurs avis)
  • cmd+k : traitement d’un seul fichier avec sonnet 3.5 (Masony817)
  • le mode agent n’est plus utilisé après la configuration initiale ; à la place, utilisation des checkpoints et de prompts clairs (WorryBubbly3438)
  • préférence pour le mode Auto : exécution rapide et à faible coût (Funny-Anything-791, d0RSI)
  • approche mécanique : des instructions explicites et précises sont importantes, comme avec une machine CNC (Funny-Anything-791)
  • les modèles spécialisés pour les tests UI et design sont encore insuffisants (Princekid1878)

Autres avis

  • plaintes selon lesquelles Sonnet 3.7 a perdu en concentration et en maintien du contexte par rapport à avant (Sea_Cardiologist_212)
  • Gemini ou Claude semblent bons dans les vidéos de test, mais c’est différent en situation réelle (cmndr_spanky)
  • pour la plupart des modèles, l’essentiel reste des prompts explicites (remarque récurrente)
  • certains utilisateurs attendent des intégrations crypto ou basées sur le Web (mention indirecte)