Publication de Thoughtworks Technology Radar, Volume 33

(thoughtworks.com)

15 points par GN⁺ 2025-11-07 | Aucun commentaire pour le moment. | Partager sur WhatsApp

Visualisation et explication des dernières tendances dans les domaines techniques/outils/plateformes/langages de développement et frameworks selon quatre niveaux : Adopt (adoption recommandée), Trial (essai), Assess (évaluation), Hold (prudence)
4 thèmes majeurs : orchestration de l’infrastructure IA, essor des agents fondés sur MCP, workflows de développement assistés par l’IA, apparition d’anti-patterns de l’IA

Adoption de l’orchestration d’infrastructure pour l’IA

Les charges de travail IA imposent aux organisations une orchestration de flottes de GPU à grande échelle pour l’entraînement et l’inférence
- Avec la multiplication des grands modèles dépassant les limites de capacité HBM (80 Go) d’un GPU unique, l’entraînement distribué et l’inférence multi-GPU deviennent indispensables
- Les équipes plateforme construisent des pipelines complexes à plusieurs étapes et ajustent en continu le débit et la latence
- Télémétrie de flotte à distance avec Nvidia DCGM Exporter, et planification sensible à la topologie pour placer les tâches là où la bande passante d’interconnexion est la plus élevée
Kubernetes reste la base essentielle pour gérer les charges de travail IA à grande échelle, mais des plateformes alternatives comme microVM (Firecracker) et Uncloud attirent aussi l’attention
- Les stratégies de placement évoluent avec la gestion des files d’attente et des quotas via Kueue, la planification sensible à la topologie (topology-aware scheduling), le gang scheduling et d’autres approches tenant compte des communications rapides entre liens GPU
- Placement des tâches multi-GPU à l’intérieur d’« îlots » continus de datacenter (rack ou pod) dotés de liens GPU haut débit comme NVLink/NVSwitch et de RDMA
Les récentes améliorations des API Kubernetes pour les environnements multi-GPU et sensibles au NUMA renforcent ces capacités, avec une meilleure bande passante inter-périphériques, une réduction de la tail latency et une hausse du taux d’utilisation effectif
- Avec la hausse de la demande pour les workflows de développement assistés par l’IA et l’essor d’agents améliorés par MCP, une innovation rapide est attendue dans l’infrastructure IA
- L’orchestration orientée GPU devient une exigence de base, et la topologie s’impose désormais comme un critère de planification de premier ordre

Essor des agents fondés sur MCP

La montée en puissance simultanée de MCP et des agents, ainsi que l’expansion de l’écosystème de protocoles et d’outils construit autour d’eux, constituent l’un des grands thèmes de cette édition du Radar
- MCP s’impose comme le protocole d’intégration ultime pour piloter les agents et leur permettre de fonctionner efficacement de manière semi-autonome
Presque tous les grands fournisseurs ajoutent la prise en charge de MCP, et les workflows centrés sur les agents connaissent une croissance rapide
Une innovation continue est observée dans les workflows d’agents, et le context engineering s’affirme comme un levier clé pour optimiser le comportement des modèles et l’efficacité des ressources
- De nouveaux protocoles comme A2A (Agent-to-Agent) et AG-UI réduisent la complexité de création d’applications collaboratives multi-agents
- Des techniques comme AGENTS.md, Anchoring coding agents et le serveur MCP Context7 sont adoptées dans de vrais workflows de développement
Compte tenu de la nature de l’écosystème IA, de nouvelles innovations surgissent de manière explosive à chaque édition du Radar
— la fois précédente, c’était le RAG ; cette fois, ce sont les workflows d’agents et l’ensemble grandissant (constellation) d’outils, de techniques et de plateformes qui les soutiennent
- Et certains anti-patterns de l’IA notables commencent aussi à apparaître

Workflows de développement assistés par l’IA

L’IA transforme la manière de construire et de maintenir les logiciels, et c’est devenu un thème dominant des discussions récentes
- De l’usage de l’IA pour comprendre des bases de code legacy à la GenAI pour le forward engineering, elle s’intègre stratégiquement à l’ensemble de la chaîne de valeur logicielle
- Les équipes apprennent à fournir plus efficacement des connaissances aux agents de développement
Les équipes expérimentent de nouvelles pratiques, comme la définition d’instructions personnalisées via des fichiers AGENTS.md et l’intégration avec des serveurs MCP comme Context7 pour récupérer une documentation à jour des dépendances
- La prise de conscience progresse que l’IA doit amplifier non seulement les contributeurs individuels, mais aussi l’ensemble de l’équipe
- Des instructions partagées et curées ainsi que des commandes personnalisées émergent pour garantir une diffusion équitable des connaissances
L’environnement outillage évolue rapidement :
- Les designers utilisent UX Pilot et AI Design Reviewer, tandis que les développeurs recourent à v0 et Bolt pour un prototypage UI en self-service permettant de produire rapidement des prototypes
- Le débat se poursuit sur la portée du développement piloté par les spécifications, son niveau de granularité et sa capacité à servir de source unique de vérité pour une livraison progressive
- Malgré l’enthousiasme, la complaisance vis-à-vis du code généré par l’IA reste une inquiétude récurrente, rappelant que si l’IA peut accélérer l’ingénierie, le jugement humain demeure indispensable

Apparition de nouveaux anti-patterns de l’IA

L’accélération de l’adoption de l’IA dans toute l’industrie fait émerger, en plus de pratiques efficaces, des anti-patterns émergents
- Tout en reconnaissant l’utilité évidente de concepts comme le prototypage UI jetable en self-service à l’aide de GenAI, les organisations prennent conscience de leur potentiel à les entraîner vers l’anti-pattern de Shadow IT accéléré par l’IA
- Avec l’attention croissante portée à MCP (Model Context Protocol), de nombreuses équipes tombent dans l’anti-pattern d’une conversion naïve d’API vers MCP
L’efficacité des solutions Text-to-SQL reste inférieure aux attentes initiales, et la complaisance vis-à-vis du code généré par l’IA demeure une préoccupation persistante
- Même dans des pratiques émergentes comme le développement piloté par les spécifications, il existe un risque de retomber dans des anti-patterns classiques du génie logiciel
  — en particulier une spécification excessive en amont et un biais en faveur des livraisons en big bang
Comme la GenAI progresse à une vitesse et à une échelle sans précédent, de nouveaux anti-patterns devraient apparaître rapidement
- Les équipes doivent rester vigilantes face à des schémas qui semblent efficaces au départ mais qui, avec le temps, dégradent les performances, ralentissent le feedback, nuisent à l’adaptabilité ou brouillent la responsabilité

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

1. Continuous compliance

Pratique visant à garantir que le processus de développement logiciel et les technologies respectent en continu les exigences réglementaires et les standards de sécurité grâce à l’automatisation
Intégration d’outils de policy-as-code comme Open Policy Agent, génération de SBOM dans le pipeline CD pour détecter et résoudre dès les premières étapes les problèmes de conformité conformément aux directives SLSA
En codifiant règles et bonnes pratiques, il devient possible d’imposer des standards cohérents à l’échelle de l’équipe sans créer de goulets d’étranglement
Avec la hausse du risque de complaisance vis-à-vis du code généré par l’IA, intégrer la conformité au processus de développement est plus important que jamais

2. Curated shared instructions for software teams

Pour les équipes qui utilisent activement l’IA dans la livraison logicielle, il faut aller au-delà du prompting individuel et passer à des instructions curées
La manière la plus intuitive de les mettre en œuvre consiste à versionner directement dans le dépôt du projet des fichiers d’instructions comme AGENTS.md
La plupart des outils de développement assisté par l’IA, notamment Cursor, Windsurf et Claude Code, prennent en charge le partage d’instructions via des commandes slash personnalisées ou des workflows
Dès qu’un prompt est amélioré, toute l’équipe en bénéficie, ce qui garantit un accès cohérent aux meilleures instructions IA

3. Pre-commit hooks

Les Git hooks existent depuis longtemps, mais restent encore sous-exploités
Avec la montée de l’assistance IA et du développement par agents, le risque de committer accidentellement des secrets ou du code problématique augmente
Il existe de nombreux mécanismes de vérification du code, comme la continuous integration, mais les hooks pre-commit sont une protection simple et efficace que davantage d’équipes devraient adopter
Il est préférable de les garder légers et ciblés, en se concentrant sur les risques capturés le plus efficacement à cette étape du workflow, comme le secret scanning

4. Utiliser la GenAI pour comprendre des bases de code legacy

L’utilisation de la GenAI pour comprendre des bases de code legacy accélère fortement la compréhension de systèmes complexes à grande échelle
Des outils comme Cursor, Claude Code, Copilot, Windsurf, Aider, Cody, Swimm, Unblocked, PocketFlow-Tutorial-Codebase-Knowledge aident à faire émerger les règles métier, à résumer la logique et à identifier les dépendances
Utilisée avec des frameworks open source et du prompting direct de LLM, cette approche réduit drastiquement le temps nécessaire pour comprendre une base de code legacy
L’effort de mise en place d’approches avancées comme GraphRAG varie notamment selon la taille et la complexité de la base de code analysée, mais l’impact sur la productivité est constant et important

Trial

5. AGENTS.md

Un format commun pour fournir des instructions aux agents de codage IA travaillant sur un projet
Il s’agit essentiellement d’un fichier README pour les agents, sans champs obligatoires ni format imposé au-delà de Markdown
Repose sur la capacité des agents de codage basés sur des LLM à interpréter des instructions rédigées et lisibles par des humains
Il est courant d’y inclure des conseils d’utilisation des outils dans l’environnement de développement, des consignes de test et des pratiques privilégiées pour la gestion des commits

6. IA pour les migrations de code

Les migrations de code prennent de nombreuses formes, de la réécriture de langage aux mises à niveau de dépendances ou de frameworks, et nécessitent souvent plusieurs mois de travail manuel
Une équipe de montée de version de .NET framework version expérimente l’usage de l’IA pour raccourcir le processus
Par le passé, elle utilisait des outils de refactoring déterministes basés sur des règles comme OpenRewrite ; l’IA seule est coûteuse et les échanges ont tendance à s’éparpiller
Au lieu de déléguer l’intégralité de la mise à niveau, le processus est décomposé en étapes plus petites et vérifiables, comme l’analyse des erreurs de compilation, la génération de diff de migration et la validation itérative des tests
Des cas industriels comme la migration massive int32-to-int64 migration de Google reflètent aussi cette tendance

7. Delta Lake liquid clustering

Une technologie pour les tables Delta Lake qui sert d’alternative au partitionnement et au Z-ordering
Historiquement, l’optimisation des performances de lecture des tables Delta nécessitait de définir des partitions et des clés de Z-order lors de la création de la table, en fonction des schémas de requête anticipés
Le liquid clustering utilise un algorithme basé sur des arbres pour regrouper les données selon des clés spécifiées
Il peut être modifié progressivement sans réécrire l’ensemble des données, ce qui offre une plus grande flexibilité pour prendre en charge divers schémas de requête
Databricks Runtime for Delta Lake prend en charge le liquid clustering automatique en analysant les charges de requêtes passées, en identifiant les colonnes optimales puis en clusterisant les données en conséquence

8. Prototypage UI en self-service avec la GenAI

Des outils comme Claude Code, Figma Make, Miro AI, v0 permettent aux product managers de créer directement, à partir de prompts textuels, des prototypes interactifs pouvant être testés par des utilisateurs
Au lieu de produire manuellement des wireframes, les équipes peuvent générer en quelques minutes des artefacts HTML, CSS et JS fonctionnels
Ces prototypes « jetables » troquent le niveau de finition contre une capacité d’apprentissage rapide, ce qui les rend idéaux pour une validation précoce lors des design sprints
Une fidélité plus élevée peut entraîner une focalisation excessive sur les détails ou des attentes irréalistes quant à l’effort de mise en production, d’où l’importance d’un cadrage clair et d’une bonne gestion des attentes

9. Sortie structurée des LLM

Une pratique consistant à contraindre les LLM à générer des réponses dans un format prédéfini, comme du JSON ou une classe de programmation spécifique
Elle transforme le texte généralement imprévisible des LLM en contrats de données déterministes et lisibles par machine, ce qui est essentiel pour construire des applications de production fiables
Les approches vont du simple formatage piloté par prompt et des model-native structured outputs à des méthodes de constrained decoding plus robustes avec des outils comme Outlines et Instructor
Elle est utilisée avec succès pour extraire des données complexes et non structurées de différents types de documents et les convertir en JSON structuré pour la logique métier en aval

10. TCR (Test && Commit || Revert)

Un workflow de programmation dérivé du test-driven development qui favorise des étapes très petites et continues grâce à une règle simple
Après chaque modification, si les tests passent, les changements sont commités ; s’ils échouent, ils sont annulés
Sa mise en œuvre est simple, puisqu’il suffit de définir des scripts automatisant ce cycle dans la base de code
Introduit pour la première fois dans l’article officiel de Kent Beck, TCR renforce des pratiques de codage positives comme YAGNI et KISS

Assess

11. Tests UI pilotés par l’IA

Dans un précédent Radar, les tests UI basés sur l’IA étaient surtout axés sur les tests exploratoires, et il était mentionné que le caractère non déterministe des LLM pouvait engendrer de l’instabilité
Avec la montée en puissance de MCP, les principaux frameworks de test UI comme Playwright et Selenium ont introduit leurs propres serveurs MCP (playwright-mcp, mcp-selenium)
En fournissant une automatisation du navigateur fiable via des technologies natives, ils permettent aux assistants de codage de générer des tests UI fiables dans Playwright ou Selenium
L’équipe se dit enthousiaste face à des développements comme Playwright Agents dans les dernières versions de Playwright et s’attend à l’émergence de recommandations plus pratiques et de retours d’expérience terrain

12. Ancrer les agents de code à une application de référence

Par le passé, nous avons blippé le pattern des tailored service templates, qui aide les organisations adoptant les microservices à amorcer de nouveaux services et à s’intégrer sans friction à l’infrastructure existante
Avec le temps, à mesure que de nouvelles dépendances, de nouveaux frameworks et de nouveaux patterns d’architecture apparaissent, la dérive du code entre ces templates et les services existants a tendance à augmenter
À l’ère des agents de code, nous expérimentons anchoring coding agents to a reference application afin de préserver les bonnes pratiques et la cohérence architecturale
Un serveur Model Context Protocol (MCP) expose à la fois le code du template de référence et les diff de commit, afin que les agents puissent détecter la dérive et proposer des corrections

13. Context engineering

Conception et optimisation systématiques des informations fournies au LLM pendant le raisonnement afin de produire de manière fiable la sortie souhaitée
Inclut la structuration, la sélection et l’ordonnancement d’éléments de contexte tels que les prompts, les données récupérées, la mémoire, les instructions et les signaux de l’environnement
Contrairement au prompt engineering, qui se concentre uniquement sur la formulation du prompt, le context engineering prend en compte l’ensemble de la construction du contexte
Aujourd’hui, les ingénieurs utilisent diverses techniques distinctes que l’on peut regrouper en trois domaines : Context setup, Context management for long-horizon tasks, Dynamic information retrieval

14. GenAI for forward engineering

Technique émergente pour moderniser les systèmes legacy grâce à des descriptions de codebases legacy générées par l’IA
Introduit une étape explicite centrée sur ce que fait le code legacy (la spécification), tout en masquant délibérément la manière dont il est actuellement implémenté
Lié au spec-driven development, mais appliqué spécifiquement à la modernisation du legacy
En suivant la boucle reverse-engineering → design/solutioning → forward-engineering, humains comme agents IA peuvent raisonner à un niveau plus élevé avant de s’engager dans l’implémentation

15. GraphQL comme pattern d’accès aux données pour les LLM

Approche émergente visant à créer une couche d’accès aux données uniforme et compatible avec les modèles pour améliorer le context engineering
Permet d’exposer des données structurées et interrogeables sans accorder au modèle un accès direct à la base de données
Contrairement aux API REST, qui nécessitent de nouveaux endpoints ou filtres pour chaque cas d’usage, GraphQL permet au modèle de ne récupérer que les données dont il a besoin
Un schéma GraphQL bien défini fournit des métadonnées que le LLM peut utiliser pour raisonner sur les entités et relations disponibles

16. Les flux de connaissances plutôt que les stocks de connaissances

On nous demande souvent « comment améliorer la manière dont l’information est partagée entre les équipes »
Le concept de knowledge flows and knowledge stocks, une perspective empruntée à la pensée systémique, est précieux
Il encourage à considérer la connaissance organisationnelle comme un système : les stocks représentent les connaissances accumulées, et les flux la manière dont la connaissance circule et évolue dans l’organisation
Augmenter le flux de connaissances externes vers l’organisation tend à stimuler l’innovation, et créer des communities of practice est un moyen éprouvé d’améliorer ces flux

17. LLM as a judge

L’usage d’un LLM comme juge pour évaluer la sortie d’autres systèmes (généralement des générateurs basés sur des LLM) a attiré l’attention pour son potentiel à fournir une évaluation scalable et automatisée en IA générative
Ce blip passe de Trial à Assess afin de refléter des complexités et des risques nouvellement reconnus
L’évaluation est vulnérable au position bias, au verbosity bias et à une faible robustesse ; un problème plus grave encore est la scaling contamination
Pour répondre à ces défauts, des techniques améliorées sont explorées, comme LLMs as a jury (utiliser plusieurs modèles pour parvenir à un consensus) ou le raisonnement chain-of-thought pendant l’évaluation

18. On-device information retrieval

Technique permettant d’exécuter entièrement sur l’appareil de l’utilisateur (mobile, desktop ou edge device) la recherche, la contextualisation et la retrieval-augmented generation (RAG)
Donne la priorité à la confidentialité et à l’efficacité de calcul, en combinant des bases de données locales légères avec des modèles optimisés pour l’inférence on-device
Une implémentation prometteuse associe sqlite-vec (extension SQLite qui prend en charge la recherche vectorielle dans une base de données embarquée) et EmbeddingGemma (modèle d’embedding de 300 millions de paramètres basé sur l’architecture Gemma 3)
Recommandé pour évaluation dans les applications local-first ainsi que dans d’autres cas d’usage où la souveraineté des données, la faible latence et la confidentialité sont essentielles

19. SAIF

SAIF (Secure AI Framework) est un framework développé par Google pour fournir un guide pratique de gestion des risques de sécurité liés à l’IA
Il traite systématiquement des menaces courantes comme l’empoisonnement des données et l’injection de prompt, au moyen d’une cartographie claire des risques, d’une analyse des composants et de stratégies d’atténuation pragmatiques
Son attention portée aux risques en évolution liés à la construction de systèmes agentiques est particulièrement opportune et précieuse
Il fournit un playbook concis et actionnable pour renforcer les pratiques de sécurité autour de l’usage des LLM et des applications basées sur l’IA

20. Service mesh sans sidecar

Alors que les coûts et la complexité opérationnelle des service meshes basés sur des sidecars persistent, nous sommes enthousiastes à l’idée de voir apparaître des options de service mesh sans sidecar, comme l’Istio ambient mode
L’ambient mode introduit une architecture en couches qui sépare les responsabilités entre deux composants principaux : un proxy L4 par nœud (ztunnel) et un proxy L7 par namespace (Waypoint proxy)
ztunnel garantit que le trafic L3 et L4 est transmis de manière efficace et sécurisée, récupère les certificats pour toutes les identités du nœud et gère la redirection du trafic vers les workloads compatibles ambient
Le Waypoints proxy est un composant optionnel de l’ambient mode qui active des fonctionnalités Istio plus riches, comme la gestion du trafic, la sécurité et l’observabilité

21. Small language models

Au fil de plusieurs volumes du Technology Radar, observation d’une progression constante des small language models (SLMs)
L’intérêt croissant pour la création de solutions agentiques renforce les preuves que les SLM peuvent faire fonctionner efficacement l’IA agentique
La plupart des workflows agentiques actuels se concentrent sur des tâches étroites et répétitives ne nécessitant pas de raisonnement avancé, ce qui les rend bien adaptés aux SLM
Les progrès continus de SLM comme Phi-3, SmolLM2 et DeepSeek leur donnent des capacités suffisantes pour ce type de tâches

22. Spec-driven development

Approche émergente des workflows de développement assisté par l’IA, dont la définition du terme continue d’évoluer
Désigne généralement un workflow qui commence par une spécification fonctionnelle structurée, puis la décompose en plusieurs étapes en éléments plus petits, solutions et tâches
Kiro d’Amazon guide l’utilisateur à travers trois étapes de workflow : exigences, conception et génération de tâches
Le spec-kit de GitHub suit un processus similaire en trois étapes, mais ajoute une orchestration plus riche, des prompts configurables et une « constitution » définissant des principes invariants à toujours respecter

23. Team of coding agents

Technique dans laquelle le développeur orchestre plusieurs agents IA de codage, chacun ayant un rôle distinct comme architecte, spécialiste back-end ou testeur
Des outils comme Claude Code, Roo Code et Kilo Code prennent en charge des sous-agents et plusieurs modes de fonctionnement
En s’appuyant sur le principe démontré selon lequel attribuer un rôle et une persona spécifiques à un LLM améliore la qualité du résultat, la coordination de plusieurs agents spécialisés donne de meilleurs résultats que le recours à un seul agent généraliste
Marque une transition vers des pipelines de développement assisté par l’IA, orchestrés et multiétapes

24. Topology-aware scheduling

Les GPU et LPU ne sont plus des appareils indépendants, mais des réseaux d’accélérateurs étroitement couplés dont les performances dépendent du placement et de la topologie
Dans des systèmes à l’échelle du rack comme le NVL72 de NVIDIA, 72 GPU partagent plus de 13 To de VRAM et fonctionnent comme un seul accélérateur, mais lorsque la charge de travail traverse des îlots de commutation, les opérations collectives deviennent un goulet d’étranglement
L’architecture de Groq, planifiée par logiciel au moment de la compilation, repose sur un déplacement déterministe des données ; une planification aléatoire casse ces hypothèses et cette prévisibilité
Les ordonnanceurs naïfs qui ignorent la topologie répartissent souvent arbitrairement les charges multi-GPU, ce qui allonge le temps par étape et réduit l’efficacité

25. Toxic flow analysis for AI

La blague bien connue selon laquelle le S de MCP signifie « security » masque un problème très réel
Lorsque des agents communiquent entre eux via des appels d’outils ou d’API, ils peuvent rapidement se retrouver face à ce qu’on appelle la lethal trifecta : accès à des données privées, exposition à du contenu non fiable et capacité de communication externe
Un agent qui possède ces trois caractéristiques est très vulnérable, et comme les LLM ont tendance à suivre les instructions présentes dans les entrées, un contenu provenant d’une source non fiable et contenant des consignes d’exfiltration de données peut facilement provoquer une fuite
La toxic flow analysis examine le graphe des flux d’un système agentique afin d’identifier des chemins de données potentiellement dangereux nécessitant une enquête plus poussée

Hold

26. AI-accelerated shadow IT

L’IA abaisse les barrières qui empêchaient les non-développeurs de créer et d’intégrer eux-mêmes des logiciels, au lieu d’attendre le service IT
Enthousiasme pour le potentiel que cela débloque, mais vigilance face aux premiers signes d’AI-accelerated shadow IT
Les plateformes no-code d’automatisation de workflows prennent désormais en charge l’intégration d’API d’IA, par exemple OpenAI ou Anthropic, ce qui crée la tentation d’utiliser l’IA comme du ruban adhésif pour relier des intégrations auparavant impossibles
Dans le même temps, les assistants de codage IA deviennent plus agentiques, au point que des non-développeurs ayant reçu une formation de base peuvent créer des applications utilitaires internes

27. Capacity-driven development

La clé du succès des pratiques modernes de développement logiciel est de conserver l’attention sur le flux de travail
Les équipes stream-aligned se concentrent sur un seul flux de valeur significatif, comme un parcours utilisateur ou un produit, afin de livrer efficacement de la valeur de bout en bout
Mais une tendance préoccupante est observée : lorsque ces équipes alignées de cette manière disposent de capacité disponible, elles prennent en charge des fonctionnalités d’autres produits ou flux, ce qui relève du capacity-driven development
À court terme, cela peut sembler efficace, mais il s’agit d’une optimisation locale surtout adaptée à l’absorption de pics de demande, et sa normalisation augmente la charge cognitive ainsi que la dette technique

28. Complacency with AI-generated code

Alors que les assistants et agents de codage IA attirent l’attention, de plus en plus de données et de recherches soulignent les inquiétudes autour de la complacency with AI-generated code
Il existe suffisamment de preuves que ces outils peuvent accélérer le développement, mais les recherches montrent que la qualité du code peut se dégrader avec le temps
Dans la recherche 2024 de GitClear, le code dupliqué et le code churn ont augmenté davantage que prévu, tandis que l’activité de refactoring dans l’historique des commits a diminué
La recherche de Microsoft sur les travailleurs du savoir montre que la confiance apportée par l’IA se fait souvent au détriment de la pensée critique

29. Naive API-to-MCP conversion

Les organisations sont tentées de convertir de manière fluide et directe leurs API internes vers le Model Context Protocol (MCP) afin de permettre aux agents IA d’interagir avec les systèmes existants
Des outils comme MCP link et FastAPI-MCP sont de plus en plus nombreux à chercher à faciliter cette conversion
Opposition à cette naive API-to-MCP conversion, car les API sont généralement conçues pour des développeurs humains et se composent d’opérations atomiques fines qui, une fois enchaînées par une IA, peuvent entraîner une consommation excessive de tokens, une pollution du contexte et une dégradation des performances de l’agent
Ces API exposent aussi souvent des données sensibles ou autorisent des opérations destructrices, en particulier dans le cas des API internes

30. Équipes d’ingénierie data autonomes

Organiser une équipe d’ingénierie data distincte qui développe et possède des pipelines et des produits de données séparément du domaine métier auquel elle fournit des flux ordonnés constitue un antipattern, qui mène à des inefficacités et à de faibles résultats métier
Cette structure répète les erreurs du passé consistant à séparer les fonctions DevOps, de test ou de déploiement, créant des silos de connaissances, des goulets d’étranglement et du gaspillage d’efforts
Sans collaboration étroite, les ingénieurs data manquent souvent du contexte métier et domaine nécessaire pour concevoir des produits de données pertinents, ce qui limite à la fois l’adoption et la valeur
À la place, les équipes de plateforme data devraient se concentrer sur la maintenance d’une infrastructure partagée, tandis que les équipes métier pluridisciplinaires devraient construire et posséder leurs propres data products selon les principes du data mesh

31. Text to SQL

Le Text to SQL utilise des LLM pour traduire le langage naturel en SQL exécutable, mais sa fiabilité est souvent en deçà des attentes
Ce blip a été déplacé vers Hold afin de ne pas recommander son utilisation dans des workflows non supervisés — par exemple lorsque la sortie est masquée ou quand des requêtes générées par les utilisateurs sont converties dynamiquement de manière automatisée
Dans ces cas, les LLM hallucinent souvent en raison d’une compréhension limitée du schéma ou du domaine, avec un risque d’extraction de données erronées ou de modification involontaire des données
Pour l’agentic business intelligence, il vaut mieux éviter l’accès direct à la base de données et utiliser à la place une couche sémantique d’abstraction des données gérée, comme Cube ou dbt's semantic layer

[Platforms]

Adopt

32. Arm dans le cloud

Les instances de calcul Arm dans le cloud sont devenues de plus en plus populaires ces dernières années grâce à leur efficacité en matière de coût et d’énergie par rapport aux instances traditionnelles basées sur x86
Les principaux fournisseurs cloud, dont AWS, Azure et GCP, proposent désormais de solides options Arm
De nombreuses équipes ont migré avec succès vers Arm des workloads comme les microservices, les bases de données open source et même le calcul haute performance, avec des changements de code minimes et seulement quelques ajustements des scripts de build
Des outils modernes comme les images Docker multi-arch simplifient la build et le déploiement à la fois dans des environnements Arm et x86

Trial

33. Apache Paimon

Apache Paimon est un format open source de data lake conçu pour rendre possible une architecture lakehouse
Il s’intègre de manière fluide avec des moteurs de traitement comme Flink et Spark pour prendre en charge à la fois les traitements en streaming et en batch
L’un des principaux avantages de l’architecture de Paimon est la fusion entre les formats standard de data lake et la structure LSM (log-structured merge tree)
Cette combinaison répond aux défis traditionnels des data lakes : des mises à jour hautes performances et une lecture à faible latence

34. DataDog LLM Observability

Datadog LLM Observability fournit du tracing, du monitoring et du diagnostic de bout en bout pour les workflows d’applications à base de grands modèles de langage et d’agents
Il mappe chaque prompt, appel d’outil et étape intermédiaire à des spans et des traces, suit la latence, l’usage des tokens, les erreurs et les métriques de qualité, et s’intègre à la vaste suite de produits APM et de visibilité de Datadog
Les organisations qui utilisent déjà Datadog et connaissent sa structure de coûts peuvent constater que ses fonctionnalités de visibilité LLM constituent un moyen intuitif d’obtenir de la visibilité sur les workloads IA, à condition de pouvoir instrumenter ces workloads
Configurer et utiliser l’instrumentation LLM exige de la prudence ainsi qu’une bonne compréhension du workload et de son implémentation, et une collaboration étroite entre ingénieurs data et équipes d’exploitation est recommandée lors du déploiement

35. Delta Sharing

Delta Sharing est un standard ouvert et un protocole de partage de données sécurisé, cross-platform, développé par Databricks et la Linux Foundation
Indépendant du cloud, il permet aux organisations de partager des données en direct entre fournisseurs cloud et environnements on-premise sans copier ni répliquer les données
À l’aide d’une simple API REST, il émet des URL présignées de courte durée afin que les destinataires puissent récupérer de grands jeux de données avec des outils comme pandas, Spark ou Power BI
Il prend en charge le partage de tables de données, de vues, de modèles IA et de notebooks, tout en fournissant une gouvernance centralisée robuste et des capacités d’audit

36. Dovetail

La plateforme Dovetail s’attaque au défi persistant de la gestion de données de recherche qualitative dispersées
Elle fournit un référentiel centralisé pour les entretiens utilisateurs, les transcriptions et les insights, transformant les données brutes en actifs structurés et analysables
Elle est particulièrement utile dans les workflows de product discovery pour créer une traçabilité des preuves reliant directement les citations clients et les thèmes synthétisés aux hypothèses produit et au ROI attendu
Ce faisant, Dovetail renforce le rôle des données qualitatives dans la prise de décision produit

37. Langdock

Langdock est une plateforme qui permet aux organisations de développer et d’exécuter des agents d’IA générative et des workflows pour leurs opérations internes
Elle fournit un environnement intégré avec un assistant de chat interne, une couche API pour se connecter à plusieurs LLM, et des outils de création de workflows d’agents qui s’intègrent à des systèmes comme Slack, Confluence et Google Drive
La plateforme met l’accent sur la souveraineté des données en proposant des options d’hébergement on-premise et dans l’UE, avec des standards de conformité de niveau entreprise
Les organisations qui déploient Langdock doivent néanmoins accorder une attention particulière à la gouvernance des données et utiliser des techniques comme la toxic flow analysis pour éviter le lethal trifecta

38. LangSmith

LangSmith est la plateforme hébergée de l’équipe LangChain, qui fournit visibilité, traçabilité et évaluation pour les applications LLM
Elle capture des traces détaillées des chaînes, outils et prompts afin de permettre aux équipes de déboguer et mesurer le comportement des modèles, de suivre les régressions de performance et de gérer des jeux de données d’évaluation
LangSmith est une plateforme SaaS propriétaire avec une prise en charge limitée des workflows non-LangChain, ce qui la rend surtout attractive pour les équipes déjà investies dans cet écosystème
Son support intégré pour l’évaluation des prompts et l’expérimentation est particulièrement plus abouti que celui d’alternatives open source comme Langfuse

39. Model Context Protocol (MCP)

Le Model Context Protocol (MCP) est un standard ouvert qui définit la manière dont les applications et agents LLM s’intègrent à des sources de données et des outils externes
MCP se distingue du protocole Agent2Agent (A2A), qui gère la communication entre agents, en se concentrant sur le contexte et l’accès aux outils
Depuis le dernier blip, l’adoption de MCP a fortement accéléré, avec l’arrivée dans l’écosystème de grandes entreprises comme JetBrains (IntelliJ) et Apple, aux côtés de frameworks émergents comme FastMCP
Le standard de préversion MCP Registry prend désormais en charge la découverte d’outils publics et propriétaires

40. n8n

n8n est une plateforme d’automatisation de workflows sous licence fair-code, comparable à Zapier ou Make (anciennement Integromat), mais conçue pour les développeurs qui veulent des options auto-hébergées, extensibles et contrôlables par le code
Elle propose une approche low-code et visuelle de la création de workflows, davantage qu’Apache Airflow, tout en prenant en charge du code personnalisé en JavaScript ou Python
Son principal cas d’usage consiste à intégrer plusieurs services dans des workflows automatisés, mais elle peut aussi connecter des LLM à des sources de données, des mémoires et des outils configurables
De nombreuses équipes utilisent n8n pour prototyper rapidement des workflows d’agents déclenchés par des applications de chat ou des webhooks, en exploitant souvent les fonctions d’import et d’export pour générer des workflows avec l’aide de l’IA

41. OpenThread

OpenThread est une implémentation open source du protocole réseau Thread développée par Google
Il prend en charge toutes les fonctionnalités majeures de la spécification Thread, y compris les couches réseau comme IPv6, 6LoWPAN et LR-WPAN, ainsi que les capacités de réseau maillé permettant aux appareils de fonctionner comme nœuds et border routers
OpenThread fonctionne sur un large éventail de plateformes matérielles en s’appuyant sur une couche d’abstraction flexible et des hooks d’intégration permettant aux fournisseurs d’intégrer leurs propres fonctions radio et cryptographiques
Ce protocole mature est largement utilisé dans des produits commerciaux et, d’après notre expérience, il est fiable pour construire des solutions IoT variées, allant des appareils basse consommation alimentés par batterie à de grands réseaux maillés de capteurs

Assess

42. AG-UI Protocol

AG-UI est un protocole ouvert et une bibliothèque conçus pour standardiser les interfaces utilisateur riches et la communication entre agents
Il se concentre sur les agents directement orientés vers l’utilisateur, tout en se généralisant à tous les frontends et backends via des intégrations middleware et client
Le protocole définit une manière cohérente pour les agents backend de communiquer avec les applications frontend, rendant possible une collaboration en temps réel avec conservation d’état entre l’IA et les utilisateurs humains
Il prend en charge plusieurs protocoles de transport, dont SSE et WebSockets, et fournit des types d’événements standardisés représentant les différents états d’exécution des agents

43. Agent-to-Agent (A2A) Protocol

Agent2Agent (A2A) est un protocole qui définit un standard pour la communication et les interactions entre agents dans des workflows multi-agents complexes
Il décrit les éléments essentiels de la communication entre agents, notamment la découverte des capacités et le transport au moyen d’Agent Cards, ainsi que les spécifications des schémas de sécurité
A2A complète le Model Context Protocol (MCP) en se concentrant sur la communication entre agents sans exposer de détails internes tels que l’état, la mémoire ou les internes de l’agent
Le protocole encourage les bonnes pratiques comme une approche async-first pour les tâches de longue durée, des réponses en streaming pour des mises à jour progressives, ainsi qu’un transport sécurisé via HTTPS, l’authentification et l’autorisation

44. Amazon S3 Vectors

Amazon S3 Vectors étend le stockage objet S3 avec des capacités vectorielles natives, offrant un stockage de vecteurs intégré et des fonctions de recherche de similarité
Il s’intègre de manière fluide à l’écosystème AWS, notamment Amazon Bedrock et OpenSearch, et apporte des fonctionnalités supplémentaires comme le filtrage de métadonnées et la gouvernance via IAM
Bien qu’il soit encore en préversion et présente des limitations, sa proposition de valeur est attrayante : cette approche économique et accessible du stockage vectoriel ouvre la voie à diverses applications impliquant de gros volumes de données, lorsque la faible latence n’est pas la préoccupation principale

45. Ardoq

Ardoq est une plateforme d’architecture d’entreprise (EA) qui permet aux organisations de construire, gérer et faire évoluer une base de connaissances d’architecture afin de mieux planifier l’avenir
Contrairement à la documentation statique traditionnelle, sujette à la dérive et au cloisonnement, l’approche pilotée par les données d’Ardoq récupère des informations depuis les systèmes existants pour créer un graphe de connaissances dynamique qui reste à jour à mesure que le paysage évolue
Une fonctionnalité particulièrement utile est Ardoq Scenarios, qui permet de modéliser et définir visuellement des états futurs hypothétiques à l’aide d’une approche de branchement et fusion semblable à Git
Les organisations engagées dans une transformation architecturale devraient évaluer des plateformes EA dédiées comme Ardoq pour leur potentiel à simplifier et accélérer ce processus

46. CloudNativePG

CloudNativePG est un opérateur Kubernetes qui simplifie l’hébergement et la gestion de clusters PostgreSQL hautement disponibles sur Kubernetes
Exécuter des services stateful comme PostgreSQL sur Kubernetes peut être complexe, car cela nécessite une connaissance approfondie à la fois de Kubernetes et de la réplication PostgreSQL
CloudNativePG abstrait l’essentiel de cette complexité en traitant l’ensemble du cluster PostgreSQL comme une ressource déclarative unique et configurable
Il fournit une architecture primary/standby fluide reposant sur la réplication native en streaming, ainsi que des fonctions de haute disponibilité prêtes à l’emploi, dont l’auto-réparation, le basculement automatique avec promotion de la réplique la plus à jour et la recréation automatique des répliques en échec

47. Coder

Coder est une plateforme qui provisionne rapidement des environnements de développement standardisés, conformément à la pratique development environments in the cloud décrite précédemment
Par rapport à des outils similaires comme Gitpod (désormais rebaptisé Ona) et GitHub Codespaces, Coder offre un contrôle plus poussé sur la personnalisation des postes de travail via Terraform
Il héberge les workstations sur votre propre infrastructure dans le cloud ou dans votre datacenter, plutôt que sur les serveurs du fournisseur
Cette approche offre davantage de flexibilité, y compris pour exécuter des agents de codage IA et accéder aux systèmes internes de l’organisation

48. Graft

Graft est un moteur de stockage transactionnel qui permet une synchronisation des données fortement cohérente et efficace dans des environnements edge et distribués
Il utilise la lazy replication pour ne synchroniser les données qu’en cas de besoin, la partial replication pour minimiser la consommation de bande passante, et la serializable snapshot isolation pour garantir l’intégrité des données
Nous avons déjà mentionné Electric dans le Radar pour des cas d’usage similaires, mais Graft se distingue en transformant le stockage objet en système transactionnel sans imposer de format de données et en prenant en charge des mises à jour cohérentes au niveau des pages
Il convient bien à l’alimentation d’applications mobiles local-first, à la gestion d’une synchronisation cross-platform complexe, ainsi qu’au rôle de socle pour des répliques stateless dans des systèmes serverless ou embarqués

49. groundcover

groundcover est une plateforme cloud native d’observabilité qui unifie logs, traces, métriques et événements Kubernetes dans une interface unique
En s’appuyant sur eBPF, elle capture des données d’observabilité granulaires avec une instrumentation zero-code, sans insérer d’agent ni de SDK dans le code applicatif
Les capteurs eBPF de groundcover s’exécutent sur des nœuds dédiés de chaque cluster surveillé, ce qui leur permet de fonctionner indépendamment des applications observées
Parmi les principales fonctionnalités : une observabilité approfondie au niveau du kernel, une architecture bring-your-own-cloud (BYOC) pour la confidentialité des données, et un modèle tarifaire indépendant du volume de données afin de garder des coûts prévisibles

50. Karmada

Karmada (« Kubernetes Armada ») est une plateforme d’orchestration de workloads à travers plusieurs clusters Kubernetes, clouds et data centers
De nombreuses équipes déploient aujourd’hui à l’échelle de plusieurs clusters en combinant des outils GitOps comme Flux ou ArgoCD avec des scripts personnalisés, d’où l’intérêt d’une solution dédiée
Karmada s’appuie sur des API natives Kubernetes, ce qui évite d’avoir à modifier les applications déjà construites pour des environnements cloud native
Offre des capacités avancées de scheduling pour la gestion multicloud, la haute disponibilité, la reprise après incident et l’ordonnancement du trafic

51. OpenFeature

À mesure que l’activité se développe, la gestion des feature flags devient souvent de plus en plus complexe, et les équipes ont besoin d’une couche d’abstraction allant au-delà des simples feature toggles
OpenFeature fournit cette couche via une spécification d’API indépendante des fournisseurs et portée par la communauté, qui standardise la façon dont les feature flags sont définis et consommés
Le CLI offre un large support de plusieurs schémas de définition, allant de configurations de base avec variables d’environnement ou configuration in-memory jusqu’à des plateformes matures comme ConfigCat ou LaunchDarkly
Une mise en garde importante demeure toutefois : les équipes doivent gérer séparément et avec rigueur les différentes catégories de flags afin d’éviter la prolifération des flags, la complexité applicative et une surcharge excessive de tests

52. Oxide

Construire et exploiter une infrastructure privée est complexe, ce qui explique en grande partie pourquoi le cloud public est le choix par défaut de la plupart des organisations
Mais pour celles qui en ont besoin, Oxide propose une alternative consistant à assembler et intégrer matériel et logiciel dès le départ
Propose des racks préconstruits comprenant calcul, réseau et stockage, exécutant un logiciel système entièrement intégré
Les équipes peuvent gérer les ressources via l’API IaaS d’Oxide en utilisant Terraform et d’autres outils d’automatisation — ce qu’Oxide appelle une infrastructure élastique on-premise

53. Restate

Restate est une plateforme d’exécution persistante conçue pour résoudre les défis complexes des systèmes distribués lors de la création d’applications stateful et tolérantes aux pannes
Grâce au journaling d’exécution, elle enregistre chaque étape pour garantir la tolérance aux pannes, une reprise fiable et une communication exactly-once entre services
Le principal avantage architectural de la plateforme est de séparer la logique applicative en trois types de services persistants : Basic Services pour les fonctions stateless, Virtual Objects pour modéliser des entités stateful concurrentes, et Workflows pour orchestrer des processus complexes en plusieurs étapes
Restate est évalué avec soin dans un système d’assurance à grande échelle, et jusqu’à présent les performances donnent entière satisfaction

54. SkyPilot

SkyPilot est une plateforme open source pour exécuter et faire monter en charge des workloads IA on-premise ou dans le cloud
Développé par le Sky Computing Lab de l’UC Berkeley, SkyPilot agit comme un courtier intelligent en trouvant et provisionnant automatiquement les GPU les moins chers et disponibles à travers les principaux clouds et clusters Kubernetes, ce qui réduit souvent les coûts de calcul
Pour les équipes infrastructure, il simplifie l’exécution de l’IA sur Kubernetes grâce à des fonctionnalités comme une facilité d’usage comparable à Slurm, la robustesse cloud native, l’accès SSH direct aux pods, le gang scheduling et le support multicluster
Prend en charge l’extension fluide des workloads d’entraînement ou d’inférence

55. StarRocks

StarRocks est une base de données analytique qui redéfinit la business intelligence en temps réel en combinant la rapidité des systèmes OLAP traditionnels et la flexibilité des data lakehouses modernes
Son moteur d’exécution optimisé SIMD, son stockage en colonnes et son optimiseur sophistiqué basé sur les coûts lui permettent d’atteindre une latence de requête inférieure à la seconde à très grande échelle
Cette architecture haute performance permet aux utilisateurs d’exécuter directement des analyses complexes sur des formats de données ouverts comme Apache Iceberg, sans précalcul ni copie de données
L’espace compte de nombreuses plateformes, mais StarRocks apparaît comme un candidat solide pour une solution rentable exigeant à la fois une concurrence extrême et une fraîcheur des données constamment à jour

56. Uncloud

Uncloud est un outil léger d’orchestration et de clustering de conteneurs qui permet aux développeurs de faire passer des applications Docker Compose en production
Il offre une expérience simple et proche du cloud, sans la surcharge opérationnelle de Kubernetes
Il permet la montée en charge entre plusieurs machines et les déploiements sans interruption en configurant automatiquement un réseau mesh sécurisé WireGuard pour les communications et en utilisant le reverse proxy Caddy pour fournir automatiquement HTTPS et l’équilibrage de charge
Le principal avantage architectural d’Uncloud est sa conception entièrement distribuée, qui élimine le besoin d’un plan de contrôle centralisé et garantit que le fonctionnement du cluster reste intact même si certaines machines passent hors ligne

[Tools]

Adopt

57. ClickHouse

ClickHouse est une base de données OLAP distribuée, open source et orientée colonnes pour l’analytique en temps réel
Son moteur très performant et scalable est arrivé à maturité pour traiter l’analyse de données à très grande échelle
Les vues matérialisées incrémentales, un moteur de requête efficace et une forte compression des données en font une solution idéale pour les requêtes interactives
Le support intégré des fonctions d’agrégation approximative permet d’arbitrer entre précision et performance, ce qui est particulièrement utile pour les analyses à haute cardinalité

58. NeMo Guardrails

NeMo Guardrails est la boîte à outils open source de NVIDIA pour ajouter facilement des mécanismes programmables de sécurité et de contrôle aux applications conversationnelles basées sur des LLM
Il permet de définir et d’appliquer des règles de comportement afin de garantir que les sorties restent sûres, pertinentes et conformes
Les développeurs utilisent Colang, un langage dédié, pour créer des flux conversationnels flexibles, gérer les conversations et imposer des chemins prédéfinis ainsi que des procédures opérationnelles
NeMo Guardrails fournit une API asynchronous-first pour les performances, ainsi qu’un support de garde-fous pour la sûreté du contenu, la sécurité et l’alignement des entrées et des sorties

59. pnpm

Depuis le dernier Radar, nous continuons à recevoir des retours positifs des équipes sur pnpm
pnpm est un gestionnaire de paquets Node.js qui offre des gains de performance significatifs par rapport aux alternatives, à la fois en vitesse et en efficacité d’utilisation de l’espace disque
Il prend en charge l’optimisation incrémentale au niveau des fichiers, qui améliore encore les performances en créant des liens physiques vers les paquets dupliqués présents dans les dossiers node_modules de plusieurs projets vers un emplacement unique sur le disque
pnpm est devenu le choix par défaut pour la gestion des paquets Node.js, car il offre une boucle de feedback nettement plus rapide avec un minimum de problèmes de compatibilité

60. Pydantic

Pydantic est une bibliothèque Python qui utilise les indications de type standard pour définir des modèles de données et appliquer les schémas de données à l’exécution
À l’origine, les annotations de type ont été ajoutées à Python pour l’analyse statique, mais leur diversité croissante a conduit à des usages bien plus larges, y compris la validation à l’exécution
Construit sur un cœur Rust rapide, il fournit une validation, un parsing et une sérialisation efficaces des données
Il est devenu indispensable dans les applications LLM et est couramment utilisé avec la technique structured output from LLMs pour gérer la nature imprévisible des LLM

Trial

61. AI Design Reviewer

AI Design Reviewer est un plugin Figma destiné à réaliser des audits de design ou des évaluations heuristiques, et à recueillir des retours exploitables sur des designs existants ou nouveaux
Les audits couvrent les critiques UX, les incohérences UI, les lacunes en accessibilité, la qualité du contenu et les scénarios de cas limites
Au-delà de l’identification des problèmes, il fournit des recommandations tenant compte du domaine, qui aident les équipes à construire un vocabulaire de design partagé et à expliciter les raisons derrière les choix de design
Les équipes utilisent AI Design Reviewer pour analyser des designs legacy, identifier les expériences positives à conserver et les expériences négatives à corriger, afin d’éclairer les objectifs UX d’une refonte

62. Barman

Barman (Backup and Recovery Manager) est un outil open source de gestion des sauvegardes et de la reprise après sinistre pour les serveurs PostgreSQL
Il simplifie la création de sauvegardes physiques via différentes méthodes, les organise dans un catalogue complet et prend en charge l’ensemble du processus de reprise après sinistre, y compris la restauration de sauvegardes sur des serveurs en production avec des capacités de restauration à un instant donné
Nous avons constaté que Barman est robuste et simple à utiliser, et avons été particulièrement impressionnés par la rapidité des opérations de restauration à un instant donné lors des activités de migration
Il est également très compétent pour les sauvegardes planifiées et sait gérer des configurations de planification et de rétention complexes et hybrides

63. Claude Code

Claude Code d’Anthropic est un outil de codage IA agentique qui fournit une interface en langage naturel et un modèle d’exécution agentique pour planifier et mettre en œuvre des workflows complexes en plusieurs étapes
Bien qu’il ait été lancé il y a moins d’un an, il est déjà largement adopté par les développeurs, à l’intérieur comme à l’extérieur de Thoughtworks, ce qui lui vaut sa place en Trial
Des agents de codage en console comme Codex CLI d’OpenAI, Gemini CLI de Google et l’open source OpenCode ont été lancés, tandis que des assistants intégrés aux IDE comme Cursor, Windsurf et GitHub Copilot incluent désormais un mode agentique
Nous voyons des équipes l’utiliser non seulement pour écrire et modifier du code, mais aussi comme agent IA généraliste pour gérer les spécifications, les user stories, la configuration, l’infrastructure et la documentation

64. Cleanlab

Dans le paradigme de l’IA centrée sur les données, améliorer la qualité des jeux de données apporte souvent un gain de performance supérieur à celui obtenu en ajustant le modèle lui-même
Cleanlab est une bibliothèque Python open source conçue pour traiter ce problème, en identifiant automatiquement des problèmes de données courants tels que les erreurs d’étiquetage, les valeurs aberrantes et les doublons dans des jeux de données textuels, d’images, tabulaires et audio
Fondé sur les principes du confident learning, Cleanlab exploite les probabilités de prédiction du modèle pour estimer le bruit des labels et quantifier la qualité des données
Cette approche indépendante du modèle permet aux développeurs de diagnostiquer et corriger les erreurs de jeu de données, puis de réentraîner les modèles pour améliorer leur robustesse et leur précision

65. Context7

Context7 est un serveur MCP qui s’attaque aux inexactitudes du code généré par l’IA
Là où les LLM s’appuient sur des données d’entraînement obsolètes, Context7 garantit la génération d’un code exact, à jour et spécifique aux versions des bibliothèques et frameworks utilisés dans le projet
Il récupère directement depuis les dépôts source des frameworks la documentation la plus récente et des exemples de code fonctionnels, puis les injecte dans la fenêtre de contexte du LLM au moment du prompt
D’après notre expérience, Context7 réduit fortement les hallucinations de code et la dépendance à des données d’entraînement obsolètes

66. Data Contract CLI

Data Contract CLI est un outil en ligne de commande open source conçu pour travailler avec la spécification Data Contract
Il permet de créer et modifier des contrats de données et, surtout, de valider les données par rapport aux contrats, ce qui est essentiel pour garantir l’intégrité et la qualité des produits de données
Le CLI offre une prise en charge étendue de plusieurs définitions de schéma (Avro, SQL DDL, Open Data Contract Standard, entre autres) et permet de comparer différentes versions d’un contrat afin de détecter immédiatement les changements majeurs
Nous l’avons trouvé particulièrement utile, surtout dans l’espace du data mesh, pour opérationnaliser la gouvernance des contrats entre produits de données via l’intégration CI/CD

67. Databricks Assistant

Databricks Assistant est un outil conversationnel alimenté par l’IA, directement intégré à la plateforme Databricks, qui joue le rôle de pair programmer contextuel pour les spécialistes de la donnée
Contrairement aux assistants de codage généralistes, il bénéficie d’une compréhension native de l’environnement Databricks et du contexte des données, y compris les métadonnées de Unity Catalog
L’Assistant va au-delà de la génération d’extraits de code : il peut rédiger des requêtes SQL et Python complexes en plusieurs étapes, diagnostiquer des erreurs et fournir des explications détaillées propres à l’espace de travail
Pour les organisations déjà investies dans l’écosystème Databricks, il peut accélérer la productivité et abaisser la barrière d’entrée pour les tâches data complexes

68. Hoppscotch

Hoppscotch est un outil open source léger pour le développement, le débogage, le test et le partage d’API
Il prend en charge plusieurs protocoles, dont HTTP, GraphQL et WebSocket, et propose des clients multiplateformes pour le web, le desktop et l’environnement CLI
Alors que l’espace des outils API est déjà encombré d’alternatives comme Postman, Insomnia et Bruno, Hoppscotch se distingue par sa faible empreinte et son design respectueux de la vie privée
En renonçant à l’analytics, en utilisant un stockage local-first et en prenant en charge l’auto-hébergement, il constitue un choix solide pour les organisations qui cherchent un moyen intuitif de partager des scripts API tout en maintenant une forte confidentialité des données

69. NVIDIA DCGM Exporter

NVIDIA DCGM Exporter est un outil open source qui aide les équipes à surveiller à grande échelle l’entraînement distribué sur GPU
Il convertit la télémétrie propriétaire de NVIDIA Data Center GPU Manager (DCGM) dans un format ouvert compatible avec les systèmes de supervision standard
Il expose des métriques critiques en temps réel sur les GPU et les serveurs hôtes, telles que l’utilisation GPU, la température, la consommation électrique et le nombre d’erreurs ECC
Cette visibilité est essentielle pour les organisations qui affinent des LLM personnalisés ou exécutent des tâches d’entraînement longues et intensives en GPU

70. RelationalAI

Lorsque de grands volumes de données variées sont ingérés dans Snowflake, les relations uniques et les règles implicites présentes dans ces données peuvent devenir floues
RelationalAI, construit comme une Snowflake Native App, permet aux équipes de bâtir des modèles sophistiqués capables de capturer des concepts pertinents, de définir les principales entités métier et d’intégrer directement une logique complexe aux tables Snowflake
Grâce à un puissant Graph Reasoner, les utilisateurs peuvent créer, analyser et visualiser des graphes de connaissances relationnels à partir de ces modèles
Pour les organisations qui gèrent des jeux de données volumineux et en évolution rapide, la construction de graphes de connaissances peut être essentielle pour la surveillance proactive et la production d’insights plus riches et exploitables

71. UX Pilot

UX Pilot est un outil d’IA qui prend en charge plusieurs étapes du processus de design UX, du wireframing au design visuel haute fidélité et à la revue
Il accepte des entrées textuelles ou visuelles et peut générer automatiquement des écrans, des flux et des mises en page
La fonctionnalité Autoflow génère des transitions de parcours utilisateur, et Deep Design produit des résultats plus riches et plus détaillés
UX Pilot inclut aussi un plugin Figma qui permet d’exporter les designs générés pour les affiner dans les outils de design standard

72. v0

v0 a évolué depuis sa dernière présentation dans le Radar
Il inclut désormais un mode design qui permet aux product managers de créer et d’ajuster plus facilement des prototypes d’interface en self-service
La dernière version introduit son propre modèle avec une grande fenêtre de contexte et des capacités multimodales, ce qui permet à v0 de générer et d’améliorer des interfaces à partir d’entrées textuelles comme visuelles
Autre ajout notable : un mode agent qui permet au système de décomposer des tâches plus complexes et de sélectionner le modèle approprié pour chacune d’elles

Assess

73. Augment Code

Augment Code est un assistant de codage IA qui fournit une assistance profondément contextuelle sur de vastes bases de code
Il se distingue par un context engineering avancé qui permet des mises à jour rapides de l’index du code et une recherche rapide, même lorsque le code change fréquemment
Augment prend en charge des modèles comme Claude Sonnet 4 et 4.5 ainsi que GPT-5, s’intègre à GitHub, Jira et Confluence, et prend en charge le Model Context Protocol (MCP) pour l’interopérabilité avec des outils externes
Il fournit un guidage étape par étape pour des modifications complexes d’une base de code, du refactoring et des mises à niveau de dépendances jusqu’aux mises à jour de schéma

74. Azure AI Document Intelligence

Azure AI Document Intelligence (anciennement Form Recognizer) extrait le texte, les tableaux et les paires clé-valeur de documents non structurés pour les convertir en données structurées
Il utilise des modèles de deep learning préentraînés pour interpréter la mise en page et la sémantique, et permet d’entraîner des modèles personnalisés via une interface no-code pour des formats spécifiques
L’une des équipes indique qu’ADI a fortement réduit la saisie manuelle de données, amélioré la précision des données et accéléré le reporting, ce qui a conduit à des décisions plus rapides fondées sur les données
Comme Amazon Textract et Google Document AI, il offre un traitement de documents de niveau entreprise grâce à une solide compréhension de la mise en page

75. Docling

Docling est une bibliothèque open source en Python et TypeScript pour le traitement avancé de documents à partir de données non structurées
Il s’attaque au problème souvent négligé du « dernier kilomètre » consistant à convertir des documents réels comme des PDF et des PowerPoint en formats propres et lisibles par machine
Contrairement aux extracteurs traditionnels, Docling utilise une approche fondée sur la computer vision pour interpréter la mise en page des documents et leur structure sémantique, ce qui rend sa sortie particulièrement précieuse pour les pipelines de retrieval-augmented generation (RAG)
Il convertit des documents complexes en formats structurés comme JSON ou Markdown, ce qui prend en charge des techniques comme les structured output from LLMs

76. E2B

E2B est un outil open source permettant d’exécuter du code généré par l’IA dans des sandboxes sécurisées et isolées dans le cloud
Les agents peuvent utiliser ces sandboxes, construites sur des microVM Firecracker, pour exécuter du code en toute sécurité, analyser des données, mener des recherches ou faire tourner des machines virtuelles
Cela permet de créer et de déployer des agents IA de niveau entreprise avec un contrôle total sur l’environnement d’exécution et la sécurité

77. Helix editor

On a assisté à une sorte de retour des éditeurs de texte simples en ligne de commande qui cherchent à remplacer le favori des utilisateurs du terminal, Vim
Helix est l’un des concurrents dans cet espace encombré, aux côtés de Neovim et, plus récemment, de Kakoune
Se décrivant avec une certaine malice comme un éditeur de texte postmoderne, Helix propose notamment plusieurs curseurs, la prise en charge de Tree-sitter et un support intégré du Language Server Protocol (LSP), ce qui a d’abord attiré notre attention
Activement développé avec un système de plugins en cours, c’est globalement un éditeur modal léger qui semblera familier aux utilisateurs de Vim tout en ajoutant quelques commodités modernes

78. Kueue

Kueue est un contrôleur natif Kubernetes pour les files d’attente de jobs qui gèrent les quotas et la consommation de ressources
Il fournit des API pour traiter des workloads Kubernetes avec différents niveaux de priorité et besoins en ressources, et agit comme un gestionnaire au niveau du job qui décide quand admettre ou retirer des tâches
Conçu pour une gestion efficace des ressources, la priorisation des jobs et l’ordonnancement avancé, Kueue aide à optimiser l’exécution des workloads dans les environnements Kubernetes, en particulier pour les workloads ML utilisant des outils comme Kubeflow
Plutôt que de remplacer cluster-autoscaler et kube-scheduler, il fonctionne avec eux et se concentre sur l’admission des jobs selon l’ordre, les quotas, la priorité et la prise en compte de la topologie

79. MCPScan.ai

MCPScan.ai est un scanner de sécurité pour les serveurs Model Context Protocol (MCP) qui fonctionne selon deux modes : scan et proxy
En mode scan, il analyse la configuration et les descriptions d’outils pour détecter des vulnérabilités connues comme le prompt injection, l’empoisonnement d’outils et les toxic flows
En mode proxy, MCPScan.ai sert de pont entre les systèmes d’agents et les serveurs MCP, tout en surveillant en continu le trafic à l’exécution
Ce mode applique aussi des règles de sécurité et des garde-fous personnalisés, notamment la validation des appels d’outils, la détection de PII et des contraintes sur les flux de données

80. oRPC

oRPC (OpenAPI Remote Procedure Call) fournit des API end-to-end type-safe en TypeScript tout en respectant pleinement la spécification OpenAPI
Génère automatiquement une spécification OpenAPI complète, ce qui peut simplifier l’intégration et la documentation
Alors que des alternatives comme tRPC et ElysiaJS nécessitent souvent l’adoption de nouveaux frameworks pour obtenir la sûreté de typage, oRPC s’intègre de façon fluide aux frameworks Node.js existants, notamment Express, Fastify, Hono, et Next.js
Cette flexibilité en fait un excellent choix pour les équipes qui veulent adopter une sûreté de typage end-to-end sur des API existantes sans refactoring disruptif

81. Power user for dbt

Power user for dbt est une extension pour Visual Studio Code qui s’intègre directement aux environnements dbt et dbt Cloud
Comme dbt reste l’un de nos outils préférés, tout ce qui améliore son ergonomie est un ajout bienvenu à l’écosystème
Auparavant, les développeurs dépendaient de plusieurs outils hors de l’IDE pour valider le code SQL ou inspecter la lignée des modèles
Avec cette extension, ces fonctionnalités sont désormais intégrées à VS Code, avec autocomplétion du code, résultats de requêtes en temps réel, et visualisation de la lignée des modèles et des colonnes

82. Serena

Serena est un puissant toolkit de développement qui offre à des agents de code comme Claude Code des capacités proches d’un IDE pour la recherche et l’édition sémantiques de code
En opérant au niveau des symboles et en comprenant la structure relationnelle du code, Serena améliore fortement l’efficacité en tokens
Au lieu de lire des fichiers entiers ou de s’appuyer sur des remplacements de chaînes rudimentaires, les agents de code peuvent utiliser des outils Serena précis comme find_symbol, find_referencing_symbols et insert_after_symbol pour localiser et modifier le code
Sur de petits projets, l’impact est limité, mais à mesure que la base de code grandit, cette efficacité devient très précieuse

83. SweetPad

L’extension SweetPad permet aux développeurs d’utiliser VS Code ou Cursor pour l’ensemble du cycle de vie du développement d’applications Swift sur les plateformes Apple
Elle intègre des outils essentiels comme xcodebuild, xcode-build-server et swift-format, supprimant le besoin de basculer constamment vers Xcode
Les développeurs peuvent gérer les simulateurs et déployer sur des appareils, tout en compilant, exécutant et déboguant des applications Swift pour iOS, macOS et watchOS directement depuis l’IDE sans ouvrir Xcode

84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)

Tape/Z (Tools for Assembly Program Exploration for Z/OS) est un toolkit en évolution pour l’analyse de code mainframe HLASM (High-Level Assembler)
Développé par des Thoughtworkers, il propose des fonctionnalités comme le parsing, la construction de graphes de flux de contrôle, le suivi des dépendances et la visualisation de logigrammes
Nous signalons depuis longtemps la rareté, dans l’univers mainframe, d’outils ouverts et portés par la communauté, la plupart des options étant propriétaires ou liées à l’écosystème d’un fournisseur
Tape/Z aide à combler ce manque en apportant des capacités d’analyse accessibles et scriptables

[Languages and Frameworks]

Adopt

85. Fastify

Nous continuons d’avoir une expérience positive avec Fastify — un framework web rapide, peu prescriptif et à faible surcoût pour Node.js
Il fournit toutes les fonctionnalités essentielles d’un framework web minimal, dont le parsing, la validation et la sérialisation, ainsi qu’un système de plugins robuste et un fort soutien de la communauté
Les équipes n’ont pas constaté d’inconvénient majeur à utiliser Fastify par rapport à des alternatives comme Express.js, et ont aussi obtenu des gains de performance mesurables, ce qui en fait un choix attrayant pour le développement web minimal en Node.js

86. LangGraph

LangGraph est un framework d’orchestration destiné à construire des applications multi-agents avec état à l’aide de LLM
Il fournit des primitives bas niveau comme les nœuds et les arêtes, ainsi que des fonctionnalités intégrées donnant aux développeurs un contrôle fin sur les workflows d’agents, la gestion de la mémoire et la persistance de l’état
Cela signifie que les développeurs peuvent commencer avec de simples graphes préconstruits puis évoluer vers des architectures d’agents complexes et changeantes
Avec la prise en charge de motifs de résilience comme le streaming, la gestion avancée du contexte, le fallback de modèles et la gestion des erreurs d’outils, LangGraph permet de construire des applications d’agents robustes, de niveau production

87. vLLM

vLLM est un moteur d’inférence à haut débit et économe en mémoire pour les LLM, exécutable dans le cloud ou on-premise
Il prend en charge plusieurs architectures de modèles ainsi que des modèles open source populaires
Les équipes ont déployé des workers vLLM conteneurisés sur des plateformes GPU comme NVIDIA DGX et Intel HPC afin d’héberger des modèles, dont Llama 3.1 (8B et 70B), Mistral 7B et Llama-SQL, pour l’assistance au code des développeurs, la recherche de connaissances et l’interaction avec des bases de données en langage naturel
vLLM est compatible avec le standard OpenAI SDK, ce qui permet un model serving cohérent

Trial

88. Crossplane

Depuis sa dernière apparition dans le Radar, l’adoption de Crossplane a continué à progresser, notamment pour l’extension de clusters Kubernetes
Dans nos travaux, nous avons constaté que Crossplane excelle dans des cas d’usage spécifiques plutôt qu’en tant qu’outil d’infrastructure as code (IaC) généraliste
Notre observation précédente reste valable : Crossplane fonctionne mieux comme compagnon des workloads déployés dans Kubernetes et non comme substitut complet à des outils comme Terraform
Les équipes qui ont misé entièrement sur Crossplane comme solution IaC principale ont souvent rencontré des difficultés, tandis que celles qui l’ont utilisé de façon pragmatique — pour des cas d’usage custom ciblés — ont obtenu de bons résultats

89. DeepEval

DeepEval est un framework d’évaluation open source basé sur Python pour mesurer les performances des LLM
Il peut servir à évaluer des applications de retrieval-augmented generation (RAG) et d’autres applications construites avec LlamaIndex ou LangChain, ainsi qu’à établir des modèles de référence et des benchmarks
DeepEval évalue l’exactitude, la pertinence et la cohérence afin de fournir des évaluations plus fiables en situation réelle, au-delà des simples scores de correspondance de mots
Il inclut des métriques comme la détection d’hallucinations, la pertinence des réponses et l’optimisation d’hyperparamètres, et prend en charge GEval pour créer des métriques custom adaptées à des cas d’usage spécifiques

90. FastMCP

Le Model Context Protocol (MCP) s’impose rapidement comme un standard pour fournir du contexte et des outils aux applications LLM
Cependant, l’implémentation d’un serveur MCP inclut généralement une quantité importante de boilerplate pour la configuration, la gestion du protocole et la gestion des erreurs
FastMCP est un framework Python qui simplifie ce processus en abstrahant la complexité du protocole et en permettant aux développeurs de définir des ressources et outils MCP via des décorateurs Python intuitifs
Cette abstraction permet aux équipes de se concentrer sur la logique métier, ce qui aboutit à des implémentations MCP plus propres et plus faciles à maintenir

91. LiteLLM

LiteLLM est un SDK offrant une intégration fluide avec plusieurs fournisseurs de LLM via un format d’API OpenAI standardisé
Il prend en charge un large éventail de fournisseurs et de modèles, et fournit une interface unifiée pour la complétion de texte, les embeddings et la génération d’images
En abstrahant les différences d’API propres à chaque fournisseur, LiteLLM simplifie l’intégration et route automatiquement les requêtes vers le bon endpoint de modèle
Il inclut aussi, via son framework proxy, des fonctionnalités de niveau production comme les guardrails, le caching, la journalisation, la limitation de débit et le load balancing

92. MLForecast

MLForecast est un framework et une bibliothèque Python pour la prévision de séries temporelles appliquant des modèles de machine learning à grande échelle
Il simplifie le processus souvent complexe d’ingénierie de features automatisée, incluant les retards, les statistiques glissantes et les fonctionnalités basées sur les dates
C’est l’une des rares bibliothèques à offrir une prise en charge native de frameworks de calcul distribué comme Spark et Dask, garantissant la scalabilité
Il prend aussi en charge la prévision probabiliste via des méthodes comme la conformal prediction, fournissant une mesure quantitative de l’incertitude des prévisions

93. Nuxt

Nuxt est un méta-framework orienté opinion, construit au-dessus de Vue.js, pour créer des applications web full stack, souvent présenté comme le « Next.js pour Vue.js »
Comme son équivalent dans l’écosystème React, Nuxt fournit des fonctionnalités favorables au SEO comme le pré-rendu, le server-side rendering (SSR) et la gestion des métadonnées
Nuxt est soutenu par Vercel, la même entreprise derrière Next.js, et bénéficie d’une forte communauté ainsi que d’un écosystème de modules officiels et tiers
Ces modules simplifient l’intégration de fonctionnalités comme le traitement d’images, les sitemaps et Tailwind CSS

94. Phoenix

L’expérience avec Phoenix continue d’être positive — un framework web MVC côté serveur écrit en Elixir
Phoenix s’appuie sur les enseignements de Ruby on Rails en matière de développement rapide d’applications et d’expérience développeur, tout en évoluant dans un paradigme de programmation fonctionnelle
Dans ce volume, la sortie de Phoenix LiveView 1.0 est mise en avant
LiveView est une solution HTML-over-the-wire similaire à HTMX ou Hotwire, qui permet aux développeurs de créer des expériences utilisateur riches et en temps réel avec un HTML entièrement rendu côté serveur

95. Presidio

Presidio est un SDK de protection des données destiné à identifier et anonymiser les données sensibles dans des textes structurés et non structurés
Il détecte les informations personnelles identifiables (PII), comme les numéros de carte bancaire, les noms et les lieux, à l’aide de la reconnaissance d’entités nommées, d’expressions régulières et de logique basée sur des règles
Presidio prend en charge des reconnaisseurs d’entités personnalisés ainsi que des pipelines d’anonymisation, afin que les organisations puissent l’adapter à leurs propres exigences en matière de confidentialité et de conformité
Les équipes utilisent Presidio lors de l’intégration avec des LLM dans des environnements d’entreprise où les contrôles stricts de partage des données sont indispensables

96. Pydantic AI

Pydantic AI continue de faire ses preuves comme framework open source stable et bien pris en charge pour construire des agents GenAI en production
Construit sur la base fiable de Pydantic, il offre une forte sûreté de typage, une observabilité de premier ordre via OpenTelemetry et des outils d’évaluation intégrés
La sortie de la version 1.0 le 4 septembre 2025 marque un jalon important de maturité
Depuis, il s’est imposé par sa simplicité et sa facilité de maintenance comme une option fiable et largement adoptée, rejoignant les rangs d’autres frameworks d’agents populaires comme LangChain et LangGraph

97. Tauri

Tauri est un framework permettant de créer des applications desktop haute performance à partir d’une base de code unique pour l’interface web
Contrairement aux wrappers web traditionnels comme Electron, Tauri est construit sur Rust et exploite le webview natif du système d’exploitation, ce qui permet d’obtenir des binaires plus légers et une sécurité renforcée
Tauri avait été évalué pour la première fois il y a quelques années, et s’est depuis étendu au-delà du desktop avec la prise en charge d’iOS et d’Android
Les versions récentes introduisent un modèle d’autorisations et de portée plus flexible, remplaçant l’ancienne liste de permissions, ainsi qu’une couche IPC renforcée qui prend en charge le transfert de données brutes et améliore les performances

Assess

98. Agent Development Kit (ADK)

Agent Development Kit (ADK) est un framework de développement et de déploiement d’agents IA qui applique des pratiques modernes d’ingénierie logicielle plutôt que de se reposer uniquement sur le prompting
Il introduit des abstractions familières comme les classes, les méthodes, les patterns de workflow et la prise en charge du CLI
Comparé à des frameworks comme LangGraph ou CrewAI, le point fort d’ADK réside dans son intégration profonde avec l’infrastructure IA de Google, offrant des capacités de grounding prêtes pour l’entreprise, d’accès aux données et de monitoring
Il est conçu pour l’interopérabilité, avec la prise en charge des wrappers d’outils et du protocole A2A pour la communication inter-agents

99. Agno

Agno est un framework pour construire, exécuter et gérer des systèmes multi-agents
Il offre la flexibilité de créer des agents entièrement autonomes ou des workflows contrôlés par étapes, avec une prise en charge intégrée du human-in-the-loop, de la gestion de session, de la mémoire et des connaissances
Son accent sur l’efficacité est particulièrement apprécié, avec des temps de démarrage des agents impressionnants et une faible consommation mémoire
Agno est fourni avec son propre runtime, AgentOS, une application FastAPI dotée d’un plan de contrôle unifié pour simplifier les tests, le monitoring et la gestion des systèmes d’agents

100. assistant-ui

assistant-ui est une bibliothèque open source TypeScript et React pour les interfaces de chat IA
Elle gère les aspects complexes de l’implémentation d’une UI de chat, comme le streaming, la gestion d’état et les fonctionnalités UX courantes pour l’édition des messages et le changement de branche, tout en permettant aux développeurs de concevoir leurs propres composants à l’aide des primitives Radix
Elle prend en charge l’intégration avec des runtimes populaires, dont le Vercel AI SDK et LangGraph, et fournit des solutions de runtime personnalisables pour les cas d’usage complexes
Des interfaces de chat simples ont été construites avec succès avec assistant-ui, et le résultat s’est avéré satisfaisant

101. AutoRound

AutoRound d’Intel est un algorithme de quantification avancé destiné à compresser de grands modèles d’IA comme les LLM et les vision language models (VLM), tout en minimisant la perte de précision
Il utilise une optimisation par sign-gradient descent pour réduire la taille des modèles à des largeurs de bits ultra-faibles (2 à 4 bits) et applique des largeurs de bits mixtes sur l’ensemble des couches pour une efficacité optimale
Ce processus de quantification est également très rapide : il peut quantifier un modèle de 7 milliards de paramètres en quelques minutes sur un seul GPU
AutoRound s’intègre à des moteurs d’inférence populaires comme vLLM et Transformers, ce qui en fait une option attrayante pour la quantification de modèles

102. Browser Use

Browser Use est une bibliothèque Python open source qui permet à des agents basés sur des LLM de piloter un navigateur web et d’interagir avec des applications web
Elle permet la navigation, la saisie de données et l’extraction de texte, et peut gérer plusieurs onglets afin d’orchestrer des tâches entre différentes applications
La bibliothèque est particulièrement utile lorsque des agents IA doivent accéder à des informations, les manipuler ou les récupérer depuis du contenu web
Elle prend en charge divers LLM et s’appuie sur Playwright pour combiner compréhension visuelle et extraction de la structure HTML afin d’enrichir les interactions web

103. DeepSpeed

DeepSpeed est une bibliothèque Python qui optimise le deep learning distribué, aussi bien pour l’entraînement que pour l’inférence
Pour l’entraînement, elle intègre des techniques comme Zero Redundancy Optimizer (ZeRO) et le parallélisme 3D afin d’étendre efficacement les modèles sur des milliers de GPU
Pour l’inférence, elle combine le parallélisme tensoriel, pipeline, expert et ZeRO avec des kernels personnalisés et des optimisations de communication afin de minimiser la latence
DeepSpeed propulse certains des plus grands modèles de langage au monde, notamment Megatron-Turing NLG (530B) et BLOOM (176B)

104. Drizzle

Drizzle est un ORM TypeScript léger
Contrairement à Prisma ORM, il offre aux développeurs à la fois une API simple de type SQL et une interface de requêtes plus proche du style ORM traditionnel
Il prend également en charge l’extraction de schéma depuis des bases de données existantes, rendant possibles aussi bien les approches database-first que code-first
Drizzle a été conçu en pensant aux environnements serverless, avec une petite taille de bundle et la prise en charge des prepared statements

105. Java post-quantum cryptography

Les ordinateurs quantiques continuent de progresser rapidement, et des offres SaaS comme AWS Braket donnent désormais accès à des algorithmes quantiques sur plusieurs architectures
Depuis mars, Java 24 introduit la Java post-quantum cryptography, ajoutant la prise en charge d’algorithmes de cryptographie post-quantique comme ML-KEM et ML-DSA
.Net 10 étend également sa prise en charge
Le conseil est simple : si vous développez des logiciels dans ces langages, commencez dès maintenant à adopter des algorithmes quantum-safe pour pérenniser vos systèmes

106. kagent

Kagent est un framework open source pour exécuter de l’IA agentique au sein de clusters Kubernetes
Il permet à des agents basés sur des LLM de planifier et d’exécuter des tâches opérationnelles, comme diagnostiquer des problèmes, corriger des configurations ou interagir avec des outils d’observabilité, via des API natives Kubernetes et l’intégration de Model Context Protocol (MCP)
L’objectif est d’introduire l’« AgentOps » dans l’infrastructure cloud native en combinant gestion déclarative et raisonnement autonome
En tant que projet CNCF Sandbox, Kagent doit être adopté avec prudence, en particulier au vu des risques liés à l’attribution de capacités de gestion opérationnelle à des LLM, et des techniques comme la toxic flow analysis peuvent être particulièrement utiles pour évaluer et atténuer ces risques

107. LangExtract

LangExtract est une bibliothèque Python qui utilise des LLM pour extraire des informations structurées à partir de texte non structuré selon des instructions personnalisées
Elle traite des contenus spécialisés comme des notes cliniques et des rapports afin d’identifier et d’organiser les détails essentiels, tout en conservant la traçabilité de chaque donnée extraite jusqu’à sa source
Les entités extraites peuvent être exportées dans des fichiers .jsonl (format standard pour les données de modèles de langage) et visualisées via une interface HTML interactive pour examiner le contexte
L’équipe a évalué LangExtract pour extraire des entités afin d’alimenter des graphes de connaissances métier, et l’a jugé efficace pour transformer des documents complexes en représentations structurées et lisibles par machine

108. Langflow

Langflow est une plateforme open source low-code destinée à construire et visualiser des workflows LLM
Construite sur LangChain, elle permet aux développeurs de chaîner prompts, outils, bases de données vectorielles et composants de mémoire via une interface drag-and-drop, tout en prenant en charge du code Python personnalisé pour la logique avancée
Elle est particulièrement utile pour prototyper des applications agentiques sans avoir à écrire tout le code backend
Cependant, Langflow reste relativement nouveau, comporte encore quelques aspérités pour un usage en production, et les précautions générales applicables aux plateformes low-code valent aussi ici

109. LMCache

LMCache est une solution de cache clé-valeur (KV) qui accélère les infrastructures de serving de LLM
Elle agit comme une couche de cache spécialisée à l’échelle de pools entiers de moteurs d’inférence LLM et stocke des entrées de cache KV pré-calculées pour des textes susceptibles d’être traités plusieurs fois, comme des historiques de chat ou des collections de documents
En conservant ces valeurs sur disque, elle décharge du GPU les calculs de prefill, réduit le time-to-first-token (TTFT) et baisse les coûts d’inférence sur des charges exigeantes comme les pipelines RAG, les applications de chat multi-tour et les systèmes d’agents
Il est possible d’intégrer LMCache à des serveurs d’inférence majeurs comme vLLM ou NVIDIA Dynamo, et cela mérite d’être évalué selon votre configuration

110. Mem0

Mem0 est une couche mémoire conçue pour les agents IA
Les approches naïves consistent souvent à stocker l’intégralité de l’historique de chat dans une base de données puis à le réutiliser dans de futures conversations, ce qui entraîne une consommation excessive de tokens
Mem0 remplace cela par une architecture plus sophistiquée qui sépare la mémoire entre rappel à court terme et couche long terme intelligente, laquelle n’extrait et ne stocke que les faits et relations saillants
Cette architecture combine un vector store pour la similarité sémantique et un graphe de connaissances pour comprendre les données temporelles et relationnelles

111. Open Security Control Assessment Language (OSCAL)

Open Security Controls Assessment Language (OSCAL) est un format ouvert et lisible par machine d’échange d’informations, conçu pour accroître l’automatisation en matière de conformité et de gestion des risques, et aider les équipes à s’éloigner d’approches manuelles fondées sur du texte
Piloté par le National Institute of Standards and Technology (NIST) des États-Unis, OSCAL fournit des représentations standard en XML, JSON et YAML pour exprimer des contrôles de sécurité liés à des frameworks sectoriels comme SOC 2 et PCI, ainsi qu’à des frameworks gouvernementaux comme FedRAMP aux États-Unis, le Cybersecurity Control Catalogue à Singapour et l’Information Security Manual en Australie
Bien qu’OSCAL ne soit pas encore largement adopté en dehors du secteur public et que son écosystème soit encore en phase de maturation, son potentiel est enthousiasmant pour simplifier les évaluations de sécurité, réduire la dépendance aux tableurs et aux exercices de cases à cocher, et permettre une conformité automatisée lorsqu’il est intégré à des plateformes de compliance-as-code et de continuous compliance

112. OpenInference

OpenInference est un ensemble de conventions et de plugins conçu pour observer les applications d’IA en complément d’OpenTelemetry
Il fournit une instrumentation standardisée pour les frameworks et bibliothèques de machine learning afin d’aider les développeurs à suivre les appels LLM avec leur contexte périphérique, comme les recherches dans des vector stores ou les appels à des outils externes tels que des API et des moteurs de recherche
Les spans peuvent être exportés vers n’importe quel collecteur compatible OTEL, garantissant l’alignement avec les pipelines de télémétrie existants
Nous avions déjà blippé Langfuse, une plateforme de visibilité LLM largement utilisée, et le SDK OpenInference peut enregistrer des traces dans Langfuse ainsi que dans d’autres plateformes de visibilité compatibles OpenTelemetry

113. Valibot

Valibot est une bibliothèque de validation de schémas pour TypeScript
Comme d’autres bibliothèques populaires de validation TypeScript telles que Zod et Ajv, elle offre l’inférence de types, mais se distingue par sa conception modulaire
Cette architecture permet aux bundlers d’effectuer un tree shaking et un découpage de code efficaces, afin de n’inclure que les fonctions de validation réellement utilisées
Valibot peut réduire la taille du bundle jusqu’à 95 % par rapport à Zod dans les scénarios optimaux, ce qui en fait un choix attractif pour la validation de schémas dans des environnements où la taille du bundle compte, comme la validation côté client ou les fonctions serverless

114. Vercel AI SDK

Vercel AI SDK est une boîte à outils open source full-stack pour créer des applications et des agents basés sur l’IA dans l’écosystème TypeScript
Il se compose de deux éléments principaux : AI SDK Core standardise les appels LLM de manière indépendante du modèle, avec prise en charge de la génération de texte, de la génération d’objets structurés et des appels d’outils
AI SDK UI, à l’instar de assistant-ui, simplifie le développement frontend dans React, Vue, Next.js et Svelte grâce au streaming, à la gestion d’état et aux mises à jour d’interface en temps réel
Pour les équipes qui travaillent déjà dans les écosystèmes TypeScript et Next.js, Vercel AI SDK offre un moyen rapide et fluide de créer des applications d’IA avec une expérience client riche

Publication de Thoughtworks Technology Radar, Volume 33

Adoption de l’orchestration d’infrastructure pour l’IA

Essor des agents fondés sur MCP

Workflows de développement assistés par l’IA

Apparition de nouveaux anti-patterns de l’IA

ThoughtWorks Technology Radar Volume 33

[Techniques]

Adopt

Trial

Assess

Hold

[Platforms]

Adopt

Trial

Assess

[Tools]

Adopt

Trial

Assess

[Languages and Frameworks]

Adopt

Trial

Assess

À lire aussi

Aucun commentaire pour le moment.