Publication de Thoughtworks Technology Radar, Volume 33
(thoughtworks.com)- Visualisation et explication des dernières tendances dans les domaines techniques/outils/plateformes/langages de développement et frameworks selon quatre niveaux : Adopt (adoption recommandée), Trial (essai), Assess (évaluation), Hold (prudence)
- 4 thèmes majeurs : orchestration de l’infrastructure IA, essor des agents fondés sur MCP, workflows de développement assistés par l’IA, apparition d’anti-patterns de l’IA
Adoption de l’orchestration d’infrastructure pour l’IA
- Les charges de travail IA imposent aux organisations une orchestration de flottes de GPU à grande échelle pour l’entraînement et l’inférence
- Avec la multiplication des grands modèles dépassant les limites de capacité HBM (80 Go) d’un GPU unique, l’entraînement distribué et l’inférence multi-GPU deviennent indispensables
- Les équipes plateforme construisent des pipelines complexes à plusieurs étapes et ajustent en continu le débit et la latence
- Télémétrie de flotte à distance avec Nvidia DCGM Exporter, et planification sensible à la topologie pour placer les tâches là où la bande passante d’interconnexion est la plus élevée
- Kubernetes reste la base essentielle pour gérer les charges de travail IA à grande échelle, mais des plateformes alternatives comme microVM (Firecracker) et Uncloud attirent aussi l’attention
- Les stratégies de placement évoluent avec la gestion des files d’attente et des quotas via Kueue, la planification sensible à la topologie (topology-aware scheduling), le gang scheduling et d’autres approches tenant compte des communications rapides entre liens GPU
- Placement des tâches multi-GPU à l’intérieur d’« îlots » continus de datacenter (rack ou pod) dotés de liens GPU haut débit comme NVLink/NVSwitch et de RDMA
- Les récentes améliorations des API Kubernetes pour les environnements multi-GPU et sensibles au NUMA renforcent ces capacités, avec une meilleure bande passante inter-périphériques, une réduction de la tail latency et une hausse du taux d’utilisation effectif
- Avec la hausse de la demande pour les workflows de développement assistés par l’IA et l’essor d’agents améliorés par MCP, une innovation rapide est attendue dans l’infrastructure IA
- L’orchestration orientée GPU devient une exigence de base, et la topologie s’impose désormais comme un critère de planification de premier ordre
Essor des agents fondés sur MCP
- La montée en puissance simultanée de MCP et des agents, ainsi que l’expansion de l’écosystème de protocoles et d’outils construit autour d’eux, constituent l’un des grands thèmes de cette édition du Radar
- MCP s’impose comme le protocole d’intégration ultime pour piloter les agents et leur permettre de fonctionner efficacement de manière semi-autonome
- Presque tous les grands fournisseurs ajoutent la prise en charge de MCP, et les workflows centrés sur les agents connaissent une croissance rapide
- Une innovation continue est observée dans les workflows d’agents, et le context engineering s’affirme comme un levier clé pour optimiser le comportement des modèles et l’efficacité des ressources
- De nouveaux protocoles comme A2A (Agent-to-Agent) et AG-UI réduisent la complexité de création d’applications collaboratives multi-agents
- Des techniques comme AGENTS.md, Anchoring coding agents et le serveur MCP Context7 sont adoptées dans de vrais workflows de développement
- Compte tenu de la nature de l’écosystème IA, de nouvelles innovations surgissent de manière explosive à chaque édition du Radar
— la fois précédente, c’était le RAG ; cette fois, ce sont les workflows d’agents et l’ensemble grandissant (constellation) d’outils, de techniques et de plateformes qui les soutiennent- Et certains anti-patterns de l’IA notables commencent aussi à apparaître
Workflows de développement assistés par l’IA
- L’IA transforme la manière de construire et de maintenir les logiciels, et c’est devenu un thème dominant des discussions récentes
- De l’usage de l’IA pour comprendre des bases de code legacy à la GenAI pour le forward engineering, elle s’intègre stratégiquement à l’ensemble de la chaîne de valeur logicielle
- Les équipes apprennent à fournir plus efficacement des connaissances aux agents de développement
- Les équipes expérimentent de nouvelles pratiques, comme la définition d’instructions personnalisées via des fichiers AGENTS.md et l’intégration avec des serveurs MCP comme Context7 pour récupérer une documentation à jour des dépendances
- La prise de conscience progresse que l’IA doit amplifier non seulement les contributeurs individuels, mais aussi l’ensemble de l’équipe
- Des instructions partagées et curées ainsi que des commandes personnalisées émergent pour garantir une diffusion équitable des connaissances
- L’environnement outillage évolue rapidement :
- Les designers utilisent UX Pilot et AI Design Reviewer, tandis que les développeurs recourent à v0 et Bolt pour un prototypage UI en self-service permettant de produire rapidement des prototypes
- Le débat se poursuit sur la portée du développement piloté par les spécifications, son niveau de granularité et sa capacité à servir de source unique de vérité pour une livraison progressive
- Malgré l’enthousiasme, la complaisance vis-à-vis du code généré par l’IA reste une inquiétude récurrente, rappelant que si l’IA peut accélérer l’ingénierie, le jugement humain demeure indispensable
Apparition de nouveaux anti-patterns de l’IA
- L’accélération de l’adoption de l’IA dans toute l’industrie fait émerger, en plus de pratiques efficaces, des anti-patterns émergents
- Tout en reconnaissant l’utilité évidente de concepts comme le prototypage UI jetable en self-service à l’aide de GenAI, les organisations prennent conscience de leur potentiel à les entraîner vers l’anti-pattern de Shadow IT accéléré par l’IA
- Avec l’attention croissante portée à MCP (Model Context Protocol), de nombreuses équipes tombent dans l’anti-pattern d’une conversion naïve d’API vers MCP
- L’efficacité des solutions Text-to-SQL reste inférieure aux attentes initiales, et la complaisance vis-à-vis du code généré par l’IA demeure une préoccupation persistante
- Même dans des pratiques émergentes comme le développement piloté par les spécifications, il existe un risque de retomber dans des anti-patterns classiques du génie logiciel
— en particulier une spécification excessive en amont et un biais en faveur des livraisons en big bang
- Même dans des pratiques émergentes comme le développement piloté par les spécifications, il existe un risque de retomber dans des anti-patterns classiques du génie logiciel
- Comme la GenAI progresse à une vitesse et à une échelle sans précédent, de nouveaux anti-patterns devraient apparaître rapidement
- Les équipes doivent rester vigilantes face à des schémas qui semblent efficaces au départ mais qui, avec le temps, dégradent les performances, ralentissent le feedback, nuisent à l’adaptabilité ou brouillent la responsabilité
ThoughtWorks Technology Radar Volume 33
[Techniques]
Adopt
1. Continuous compliance
- Pratique visant à garantir que le processus de développement logiciel et les technologies respectent en continu les exigences réglementaires et les standards de sécurité grâce à l’automatisation
- Intégration d’outils de policy-as-code comme Open Policy Agent, génération de SBOM dans le pipeline CD pour détecter et résoudre dès les premières étapes les problèmes de conformité conformément aux directives SLSA
- En codifiant règles et bonnes pratiques, il devient possible d’imposer des standards cohérents à l’échelle de l’équipe sans créer de goulets d’étranglement
- Avec la hausse du risque de complaisance vis-à-vis du code généré par l’IA, intégrer la conformité au processus de développement est plus important que jamais
2. Curated shared instructions for software teams
- Pour les équipes qui utilisent activement l’IA dans la livraison logicielle, il faut aller au-delà du prompting individuel et passer à des instructions curées
- La manière la plus intuitive de les mettre en œuvre consiste à versionner directement dans le dépôt du projet des fichiers d’instructions comme AGENTS.md
- La plupart des outils de développement assisté par l’IA, notamment Cursor, Windsurf et Claude Code, prennent en charge le partage d’instructions via des commandes slash personnalisées ou des workflows
- Dès qu’un prompt est amélioré, toute l’équipe en bénéficie, ce qui garantit un accès cohérent aux meilleures instructions IA
3. Pre-commit hooks
- Les Git hooks existent depuis longtemps, mais restent encore sous-exploités
- Avec la montée de l’assistance IA et du développement par agents, le risque de committer accidentellement des secrets ou du code problématique augmente
- Il existe de nombreux mécanismes de vérification du code, comme la continuous integration, mais les hooks pre-commit sont une protection simple et efficace que davantage d’équipes devraient adopter
- Il est préférable de les garder légers et ciblés, en se concentrant sur les risques capturés le plus efficacement à cette étape du workflow, comme le secret scanning
4. Utiliser la GenAI pour comprendre des bases de code legacy
- L’utilisation de la GenAI pour comprendre des bases de code legacy accélère fortement la compréhension de systèmes complexes à grande échelle
- Des outils comme Cursor, Claude Code, Copilot, Windsurf, Aider, Cody, Swimm, Unblocked, PocketFlow-Tutorial-Codebase-Knowledge aident à faire émerger les règles métier, à résumer la logique et à identifier les dépendances
- Utilisée avec des frameworks open source et du prompting direct de LLM, cette approche réduit drastiquement le temps nécessaire pour comprendre une base de code legacy
- L’effort de mise en place d’approches avancées comme GraphRAG varie notamment selon la taille et la complexité de la base de code analysée, mais l’impact sur la productivité est constant et important
Trial
5. AGENTS.md
- Un format commun pour fournir des instructions aux agents de codage IA travaillant sur un projet
- Il s’agit essentiellement d’un fichier README pour les agents, sans champs obligatoires ni format imposé au-delà de Markdown
- Repose sur la capacité des agents de codage basés sur des LLM à interpréter des instructions rédigées et lisibles par des humains
- Il est courant d’y inclure des conseils d’utilisation des outils dans l’environnement de développement, des consignes de test et des pratiques privilégiées pour la gestion des commits
6. IA pour les migrations de code
- Les migrations de code prennent de nombreuses formes, de la réécriture de langage aux mises à niveau de dépendances ou de frameworks, et nécessitent souvent plusieurs mois de travail manuel
- Une équipe de montée de version de .NET framework version expérimente l’usage de l’IA pour raccourcir le processus
- Par le passé, elle utilisait des outils de refactoring déterministes basés sur des règles comme OpenRewrite ; l’IA seule est coûteuse et les échanges ont tendance à s’éparpiller
- Au lieu de déléguer l’intégralité de la mise à niveau, le processus est décomposé en étapes plus petites et vérifiables, comme l’analyse des erreurs de compilation, la génération de diff de migration et la validation itérative des tests
- Des cas industriels comme la migration massive int32-to-int64 migration de Google reflètent aussi cette tendance
7. Delta Lake liquid clustering
- Une technologie pour les tables Delta Lake qui sert d’alternative au partitionnement et au Z-ordering
- Historiquement, l’optimisation des performances de lecture des tables Delta nécessitait de définir des partitions et des clés de Z-order lors de la création de la table, en fonction des schémas de requête anticipés
- Le liquid clustering utilise un algorithme basé sur des arbres pour regrouper les données selon des clés spécifiées
- Il peut être modifié progressivement sans réécrire l’ensemble des données, ce qui offre une plus grande flexibilité pour prendre en charge divers schémas de requête
- Databricks Runtime for Delta Lake prend en charge le liquid clustering automatique en analysant les charges de requêtes passées, en identifiant les colonnes optimales puis en clusterisant les données en conséquence
8. Prototypage UI en self-service avec la GenAI
- Des outils comme Claude Code, Figma Make, Miro AI, v0 permettent aux product managers de créer directement, à partir de prompts textuels, des prototypes interactifs pouvant être testés par des utilisateurs
- Au lieu de produire manuellement des wireframes, les équipes peuvent générer en quelques minutes des artefacts HTML, CSS et JS fonctionnels
- Ces prototypes « jetables » troquent le niveau de finition contre une capacité d’apprentissage rapide, ce qui les rend idéaux pour une validation précoce lors des design sprints
- Une fidélité plus élevée peut entraîner une focalisation excessive sur les détails ou des attentes irréalistes quant à l’effort de mise en production, d’où l’importance d’un cadrage clair et d’une bonne gestion des attentes
9. Sortie structurée des LLM
- Une pratique consistant à contraindre les LLM à générer des réponses dans un format prédéfini, comme du JSON ou une classe de programmation spécifique
- Elle transforme le texte généralement imprévisible des LLM en contrats de données déterministes et lisibles par machine, ce qui est essentiel pour construire des applications de production fiables
- Les approches vont du simple formatage piloté par prompt et des model-native structured outputs à des méthodes de constrained decoding plus robustes avec des outils comme Outlines et Instructor
- Elle est utilisée avec succès pour extraire des données complexes et non structurées de différents types de documents et les convertir en JSON structuré pour la logique métier en aval
10. TCR (Test && Commit || Revert)
- Un workflow de programmation dérivé du test-driven development qui favorise des étapes très petites et continues grâce à une règle simple
- Après chaque modification, si les tests passent, les changements sont commités ; s’ils échouent, ils sont annulés
- Sa mise en œuvre est simple, puisqu’il suffit de définir des scripts automatisant ce cycle dans la base de code
- Introduit pour la première fois dans l’article officiel de Kent Beck, TCR renforce des pratiques de codage positives comme YAGNI et KISS
Assess
11. Tests UI pilotés par l’IA
- Dans un précédent Radar, les tests UI basés sur l’IA étaient surtout axés sur les tests exploratoires, et il était mentionné que le caractère non déterministe des LLM pouvait engendrer de l’instabilité
- Avec la montée en puissance de MCP, les principaux frameworks de test UI comme Playwright et Selenium ont introduit leurs propres serveurs MCP (playwright-mcp, mcp-selenium)
- En fournissant une automatisation du navigateur fiable via des technologies natives, ils permettent aux assistants de codage de générer des tests UI fiables dans Playwright ou Selenium
- L’équipe se dit enthousiaste face à des développements comme Playwright Agents dans les dernières versions de Playwright et s’attend à l’émergence de recommandations plus pratiques et de retours d’expérience terrain
12. Ancrer les agents de code à une application de référence
- Par le passé, nous avons blippé le pattern des tailored service templates, qui aide les organisations adoptant les microservices à amorcer de nouveaux services et à s’intégrer sans friction à l’infrastructure existante
- Avec le temps, à mesure que de nouvelles dépendances, de nouveaux frameworks et de nouveaux patterns d’architecture apparaissent, la dérive du code entre ces templates et les services existants a tendance à augmenter
- À l’ère des agents de code, nous expérimentons anchoring coding agents to a reference application afin de préserver les bonnes pratiques et la cohérence architecturale
- Un serveur Model Context Protocol (MCP) expose à la fois le code du template de référence et les
diffde commit, afin que les agents puissent détecter la dérive et proposer des corrections
13. Context engineering
- Conception et optimisation systématiques des informations fournies au LLM pendant le raisonnement afin de produire de manière fiable la sortie souhaitée
- Inclut la structuration, la sélection et l’ordonnancement d’éléments de contexte tels que les prompts, les données récupérées, la mémoire, les instructions et les signaux de l’environnement
- Contrairement au prompt engineering, qui se concentre uniquement sur la formulation du prompt, le context engineering prend en compte l’ensemble de la construction du contexte
- Aujourd’hui, les ingénieurs utilisent diverses techniques distinctes que l’on peut regrouper en trois domaines : Context setup, Context management for long-horizon tasks, Dynamic information retrieval
14. GenAI for forward engineering
- Technique émergente pour moderniser les systèmes legacy grâce à des descriptions de codebases legacy générées par l’IA
- Introduit une étape explicite centrée sur ce que fait le code legacy (la spécification), tout en masquant délibérément la manière dont il est actuellement implémenté
- Lié au spec-driven development, mais appliqué spécifiquement à la modernisation du legacy
- En suivant la boucle reverse-engineering → design/solutioning → forward-engineering, humains comme agents IA peuvent raisonner à un niveau plus élevé avant de s’engager dans l’implémentation
15. GraphQL comme pattern d’accès aux données pour les LLM
- Approche émergente visant à créer une couche d’accès aux données uniforme et compatible avec les modèles pour améliorer le context engineering
- Permet d’exposer des données structurées et interrogeables sans accorder au modèle un accès direct à la base de données
- Contrairement aux API REST, qui nécessitent de nouveaux endpoints ou filtres pour chaque cas d’usage, GraphQL permet au modèle de ne récupérer que les données dont il a besoin
- Un schéma GraphQL bien défini fournit des métadonnées que le LLM peut utiliser pour raisonner sur les entités et relations disponibles
16. Les flux de connaissances plutôt que les stocks de connaissances
- On nous demande souvent « comment améliorer la manière dont l’information est partagée entre les équipes »
- Le concept de knowledge flows and knowledge stocks, une perspective empruntée à la pensée systémique, est précieux
- Il encourage à considérer la connaissance organisationnelle comme un système : les stocks représentent les connaissances accumulées, et les flux la manière dont la connaissance circule et évolue dans l’organisation
- Augmenter le flux de connaissances externes vers l’organisation tend à stimuler l’innovation, et créer des communities of practice est un moyen éprouvé d’améliorer ces flux
17. LLM as a judge
- L’usage d’un LLM comme juge pour évaluer la sortie d’autres systèmes (généralement des générateurs basés sur des LLM) a attiré l’attention pour son potentiel à fournir une évaluation scalable et automatisée en IA générative
- Ce blip passe de Trial à Assess afin de refléter des complexités et des risques nouvellement reconnus
- L’évaluation est vulnérable au position bias, au verbosity bias et à une faible robustesse ; un problème plus grave encore est la scaling contamination
- Pour répondre à ces défauts, des techniques améliorées sont explorées, comme LLMs as a jury (utiliser plusieurs modèles pour parvenir à un consensus) ou le raisonnement chain-of-thought pendant l’évaluation
18. On-device information retrieval
- Technique permettant d’exécuter entièrement sur l’appareil de l’utilisateur (mobile, desktop ou edge device) la recherche, la contextualisation et la retrieval-augmented generation (RAG)
- Donne la priorité à la confidentialité et à l’efficacité de calcul, en combinant des bases de données locales légères avec des modèles optimisés pour l’inférence on-device
- Une implémentation prometteuse associe sqlite-vec (extension SQLite qui prend en charge la recherche vectorielle dans une base de données embarquée) et EmbeddingGemma (modèle d’embedding de 300 millions de paramètres basé sur l’architecture Gemma 3)
- Recommandé pour évaluation dans les applications local-first ainsi que dans d’autres cas d’usage où la souveraineté des données, la faible latence et la confidentialité sont essentielles
19. SAIF
- SAIF (Secure AI Framework) est un framework développé par Google pour fournir un guide pratique de gestion des risques de sécurité liés à l’IA
- Il traite systématiquement des menaces courantes comme l’empoisonnement des données et l’injection de prompt, au moyen d’une cartographie claire des risques, d’une analyse des composants et de stratégies d’atténuation pragmatiques
- Son attention portée aux risques en évolution liés à la construction de systèmes agentiques est particulièrement opportune et précieuse
- Il fournit un playbook concis et actionnable pour renforcer les pratiques de sécurité autour de l’usage des LLM et des applications basées sur l’IA
20. Service mesh sans sidecar
- Alors que les coûts et la complexité opérationnelle des service meshes basés sur des sidecars persistent, nous sommes enthousiastes à l’idée de voir apparaître des options de service mesh sans sidecar, comme l’Istio ambient mode
- L’ambient mode introduit une architecture en couches qui sépare les responsabilités entre deux composants principaux : un proxy L4 par nœud (
ztunnel) et un proxy L7 par namespace (Waypoint proxy) ztunnelgarantit que le trafic L3 et L4 est transmis de manière efficace et sécurisée, récupère les certificats pour toutes les identités du nœud et gère la redirection du trafic vers les workloads compatibles ambient- Le Waypoints proxy est un composant optionnel de l’ambient mode qui active des fonctionnalités Istio plus riches, comme la gestion du trafic, la sécurité et l’observabilité
21. Small language models
- Au fil de plusieurs volumes du Technology Radar, observation d’une progression constante des small language models (SLMs)
- L’intérêt croissant pour la création de solutions agentiques renforce les preuves que les SLM peuvent faire fonctionner efficacement l’IA agentique
- La plupart des workflows agentiques actuels se concentrent sur des tâches étroites et répétitives ne nécessitant pas de raisonnement avancé, ce qui les rend bien adaptés aux SLM
- Les progrès continus de SLM comme Phi-3, SmolLM2 et DeepSeek leur donnent des capacités suffisantes pour ce type de tâches
22. Spec-driven development
- Approche émergente des workflows de développement assisté par l’IA, dont la définition du terme continue d’évoluer
- Désigne généralement un workflow qui commence par une spécification fonctionnelle structurée, puis la décompose en plusieurs étapes en éléments plus petits, solutions et tâches
- Kiro d’Amazon guide l’utilisateur à travers trois étapes de workflow : exigences, conception et génération de tâches
- Le spec-kit de GitHub suit un processus similaire en trois étapes, mais ajoute une orchestration plus riche, des prompts configurables et une « constitution » définissant des principes invariants à toujours respecter
23. Team of coding agents
- Technique dans laquelle le développeur orchestre plusieurs agents IA de codage, chacun ayant un rôle distinct comme architecte, spécialiste back-end ou testeur
- Des outils comme Claude Code, Roo Code et Kilo Code prennent en charge des sous-agents et plusieurs modes de fonctionnement
- En s’appuyant sur le principe démontré selon lequel attribuer un rôle et une persona spécifiques à un LLM améliore la qualité du résultat, la coordination de plusieurs agents spécialisés donne de meilleurs résultats que le recours à un seul agent généraliste
- Marque une transition vers des pipelines de développement assisté par l’IA, orchestrés et multiétapes
24. Topology-aware scheduling
- Les GPU et LPU ne sont plus des appareils indépendants, mais des réseaux d’accélérateurs étroitement couplés dont les performances dépendent du placement et de la topologie
- Dans des systèmes à l’échelle du rack comme le NVL72 de NVIDIA, 72 GPU partagent plus de 13 To de VRAM et fonctionnent comme un seul accélérateur, mais lorsque la charge de travail traverse des îlots de commutation, les opérations collectives deviennent un goulet d’étranglement
- L’architecture de Groq, planifiée par logiciel au moment de la compilation, repose sur un déplacement déterministe des données ; une planification aléatoire casse ces hypothèses et cette prévisibilité
- Les ordonnanceurs naïfs qui ignorent la topologie répartissent souvent arbitrairement les charges multi-GPU, ce qui allonge le temps par étape et réduit l’efficacité
25. Toxic flow analysis for AI
- La blague bien connue selon laquelle le S de MCP signifie « security » masque un problème très réel
- Lorsque des agents communiquent entre eux via des appels d’outils ou d’API, ils peuvent rapidement se retrouver face à ce qu’on appelle la lethal trifecta : accès à des données privées, exposition à du contenu non fiable et capacité de communication externe
- Un agent qui possède ces trois caractéristiques est très vulnérable, et comme les LLM ont tendance à suivre les instructions présentes dans les entrées, un contenu provenant d’une source non fiable et contenant des consignes d’exfiltration de données peut facilement provoquer une fuite
- La toxic flow analysis examine le graphe des flux d’un système agentique afin d’identifier des chemins de données potentiellement dangereux nécessitant une enquête plus poussée
Hold
26. AI-accelerated shadow IT
- L’IA abaisse les barrières qui empêchaient les non-développeurs de créer et d’intégrer eux-mêmes des logiciels, au lieu d’attendre le service IT
- Enthousiasme pour le potentiel que cela débloque, mais vigilance face aux premiers signes d’AI-accelerated shadow IT
- Les plateformes no-code d’automatisation de workflows prennent désormais en charge l’intégration d’API d’IA, par exemple OpenAI ou Anthropic, ce qui crée la tentation d’utiliser l’IA comme du ruban adhésif pour relier des intégrations auparavant impossibles
- Dans le même temps, les assistants de codage IA deviennent plus agentiques, au point que des non-développeurs ayant reçu une formation de base peuvent créer des applications utilitaires internes
27. Capacity-driven development
- La clé du succès des pratiques modernes de développement logiciel est de conserver l’attention sur le flux de travail
- Les équipes stream-aligned se concentrent sur un seul flux de valeur significatif, comme un parcours utilisateur ou un produit, afin de livrer efficacement de la valeur de bout en bout
- Mais une tendance préoccupante est observée : lorsque ces équipes alignées de cette manière disposent de capacité disponible, elles prennent en charge des fonctionnalités d’autres produits ou flux, ce qui relève du capacity-driven development
- À court terme, cela peut sembler efficace, mais il s’agit d’une optimisation locale surtout adaptée à l’absorption de pics de demande, et sa normalisation augmente la charge cognitive ainsi que la dette technique
28. Complacency with AI-generated code
- Alors que les assistants et agents de codage IA attirent l’attention, de plus en plus de données et de recherches soulignent les inquiétudes autour de la complacency with AI-generated code
- Il existe suffisamment de preuves que ces outils peuvent accélérer le développement, mais les recherches montrent que la qualité du code peut se dégrader avec le temps
- Dans la recherche 2024 de GitClear, le code dupliqué et le code churn ont augmenté davantage que prévu, tandis que l’activité de refactoring dans l’historique des commits a diminué
- La recherche de Microsoft sur les travailleurs du savoir montre que la confiance apportée par l’IA se fait souvent au détriment de la pensée critique
29. Naive API-to-MCP conversion
- Les organisations sont tentées de convertir de manière fluide et directe leurs API internes vers le Model Context Protocol (MCP) afin de permettre aux agents IA d’interagir avec les systèmes existants
- Des outils comme MCP link et FastAPI-MCP sont de plus en plus nombreux à chercher à faciliter cette conversion
- Opposition à cette naive API-to-MCP conversion, car les API sont généralement conçues pour des développeurs humains et se composent d’opérations atomiques fines qui, une fois enchaînées par une IA, peuvent entraîner une consommation excessive de tokens, une pollution du contexte et une dégradation des performances de l’agent
- Ces API exposent aussi souvent des données sensibles ou autorisent des opérations destructrices, en particulier dans le cas des API internes
30. Équipes d’ingénierie data autonomes
- Organiser une équipe d’ingénierie data distincte qui développe et possède des pipelines et des produits de données séparément du domaine métier auquel elle fournit des flux ordonnés constitue un antipattern, qui mène à des inefficacités et à de faibles résultats métier
- Cette structure répète les erreurs du passé consistant à séparer les fonctions DevOps, de test ou de déploiement, créant des silos de connaissances, des goulets d’étranglement et du gaspillage d’efforts
- Sans collaboration étroite, les ingénieurs data manquent souvent du contexte métier et domaine nécessaire pour concevoir des produits de données pertinents, ce qui limite à la fois l’adoption et la valeur
- À la place, les équipes de plateforme data devraient se concentrer sur la maintenance d’une infrastructure partagée, tandis que les équipes métier pluridisciplinaires devraient construire et posséder leurs propres data products selon les principes du data mesh
31. Text to SQL
- Le Text to SQL utilise des LLM pour traduire le langage naturel en SQL exécutable, mais sa fiabilité est souvent en deçà des attentes
- Ce blip a été déplacé vers Hold afin de ne pas recommander son utilisation dans des workflows non supervisés — par exemple lorsque la sortie est masquée ou quand des requêtes générées par les utilisateurs sont converties dynamiquement de manière automatisée
- Dans ces cas, les LLM hallucinent souvent en raison d’une compréhension limitée du schéma ou du domaine, avec un risque d’extraction de données erronées ou de modification involontaire des données
- Pour l’agentic business intelligence, il vaut mieux éviter l’accès direct à la base de données et utiliser à la place une couche sémantique d’abstraction des données gérée, comme Cube ou dbt's semantic layer
[Platforms]
Adopt
32. Arm dans le cloud
- Les instances de calcul Arm dans le cloud sont devenues de plus en plus populaires ces dernières années grâce à leur efficacité en matière de coût et d’énergie par rapport aux instances traditionnelles basées sur x86
- Les principaux fournisseurs cloud, dont AWS, Azure et GCP, proposent désormais de solides options Arm
- De nombreuses équipes ont migré avec succès vers Arm des workloads comme les microservices, les bases de données open source et même le calcul haute performance, avec des changements de code minimes et seulement quelques ajustements des scripts de build
- Des outils modernes comme les images Docker multi-arch simplifient la build et le déploiement à la fois dans des environnements Arm et x86
Trial
33. Apache Paimon
- Apache Paimon est un format open source de data lake conçu pour rendre possible une architecture lakehouse
- Il s’intègre de manière fluide avec des moteurs de traitement comme Flink et Spark pour prendre en charge à la fois les traitements en streaming et en batch
- L’un des principaux avantages de l’architecture de Paimon est la fusion entre les formats standard de data lake et la structure LSM (log-structured merge tree)
- Cette combinaison répond aux défis traditionnels des data lakes : des mises à jour hautes performances et une lecture à faible latence
34. DataDog LLM Observability
- Datadog LLM Observability fournit du tracing, du monitoring et du diagnostic de bout en bout pour les workflows d’applications à base de grands modèles de langage et d’agents
- Il mappe chaque prompt, appel d’outil et étape intermédiaire à des spans et des traces, suit la latence, l’usage des tokens, les erreurs et les métriques de qualité, et s’intègre à la vaste suite de produits APM et de visibilité de Datadog
- Les organisations qui utilisent déjà Datadog et connaissent sa structure de coûts peuvent constater que ses fonctionnalités de visibilité LLM constituent un moyen intuitif d’obtenir de la visibilité sur les workloads IA, à condition de pouvoir instrumenter ces workloads
- Configurer et utiliser l’instrumentation LLM exige de la prudence ainsi qu’une bonne compréhension du workload et de son implémentation, et une collaboration étroite entre ingénieurs data et équipes d’exploitation est recommandée lors du déploiement
35. Delta Sharing
- Delta Sharing est un standard ouvert et un protocole de partage de données sécurisé, cross-platform, développé par Databricks et la Linux Foundation
- Indépendant du cloud, il permet aux organisations de partager des données en direct entre fournisseurs cloud et environnements on-premise sans copier ni répliquer les données
- À l’aide d’une simple API REST, il émet des URL présignées de courte durée afin que les destinataires puissent récupérer de grands jeux de données avec des outils comme pandas, Spark ou Power BI
- Il prend en charge le partage de tables de données, de vues, de modèles IA et de notebooks, tout en fournissant une gouvernance centralisée robuste et des capacités d’audit
36. Dovetail
- La plateforme Dovetail s’attaque au défi persistant de la gestion de données de recherche qualitative dispersées
- Elle fournit un référentiel centralisé pour les entretiens utilisateurs, les transcriptions et les insights, transformant les données brutes en actifs structurés et analysables
- Elle est particulièrement utile dans les workflows de product discovery pour créer une traçabilité des preuves reliant directement les citations clients et les thèmes synthétisés aux hypothèses produit et au ROI attendu
- Ce faisant, Dovetail renforce le rôle des données qualitatives dans la prise de décision produit
37. Langdock
- Langdock est une plateforme qui permet aux organisations de développer et d’exécuter des agents d’IA générative et des workflows pour leurs opérations internes
- Elle fournit un environnement intégré avec un assistant de chat interne, une couche API pour se connecter à plusieurs LLM, et des outils de création de workflows d’agents qui s’intègrent à des systèmes comme Slack, Confluence et Google Drive
- La plateforme met l’accent sur la souveraineté des données en proposant des options d’hébergement on-premise et dans l’UE, avec des standards de conformité de niveau entreprise
- Les organisations qui déploient Langdock doivent néanmoins accorder une attention particulière à la gouvernance des données et utiliser des techniques comme la toxic flow analysis pour éviter le lethal trifecta
38. LangSmith
- LangSmith est la plateforme hébergée de l’équipe LangChain, qui fournit visibilité, traçabilité et évaluation pour les applications LLM
- Elle capture des traces détaillées des chaînes, outils et prompts afin de permettre aux équipes de déboguer et mesurer le comportement des modèles, de suivre les régressions de performance et de gérer des jeux de données d’évaluation
- LangSmith est une plateforme SaaS propriétaire avec une prise en charge limitée des workflows non-LangChain, ce qui la rend surtout attractive pour les équipes déjà investies dans cet écosystème
- Son support intégré pour l’évaluation des prompts et l’expérimentation est particulièrement plus abouti que celui d’alternatives open source comme Langfuse
39. Model Context Protocol (MCP)
- Le Model Context Protocol (MCP) est un standard ouvert qui définit la manière dont les applications et agents LLM s’intègrent à des sources de données et des outils externes
- MCP se distingue du protocole Agent2Agent (A2A), qui gère la communication entre agents, en se concentrant sur le contexte et l’accès aux outils
- Depuis le dernier blip, l’adoption de MCP a fortement accéléré, avec l’arrivée dans l’écosystème de grandes entreprises comme JetBrains (IntelliJ) et Apple, aux côtés de frameworks émergents comme FastMCP
- Le standard de préversion MCP Registry prend désormais en charge la découverte d’outils publics et propriétaires
40. n8n
- n8n est une plateforme d’automatisation de workflows sous licence fair-code, comparable à Zapier ou Make (anciennement Integromat), mais conçue pour les développeurs qui veulent des options auto-hébergées, extensibles et contrôlables par le code
- Elle propose une approche low-code et visuelle de la création de workflows, davantage qu’Apache Airflow, tout en prenant en charge du code personnalisé en JavaScript ou Python
- Son principal cas d’usage consiste à intégrer plusieurs services dans des workflows automatisés, mais elle peut aussi connecter des LLM à des sources de données, des mémoires et des outils configurables
- De nombreuses équipes utilisent n8n pour prototyper rapidement des workflows d’agents déclenchés par des applications de chat ou des webhooks, en exploitant souvent les fonctions d’import et d’export pour générer des workflows avec l’aide de l’IA
41. OpenThread
- OpenThread est une implémentation open source du protocole réseau Thread développée par Google
- Il prend en charge toutes les fonctionnalités majeures de la spécification Thread, y compris les couches réseau comme IPv6, 6LoWPAN et LR-WPAN, ainsi que les capacités de réseau maillé permettant aux appareils de fonctionner comme nœuds et border routers
- OpenThread fonctionne sur un large éventail de plateformes matérielles en s’appuyant sur une couche d’abstraction flexible et des hooks d’intégration permettant aux fournisseurs d’intégrer leurs propres fonctions radio et cryptographiques
- Ce protocole mature est largement utilisé dans des produits commerciaux et, d’après notre expérience, il est fiable pour construire des solutions IoT variées, allant des appareils basse consommation alimentés par batterie à de grands réseaux maillés de capteurs
Assess
42. AG-UI Protocol
- AG-UI est un protocole ouvert et une bibliothèque conçus pour standardiser les interfaces utilisateur riches et la communication entre agents
- Il se concentre sur les agents directement orientés vers l’utilisateur, tout en se généralisant à tous les frontends et backends via des intégrations middleware et client
- Le protocole définit une manière cohérente pour les agents backend de communiquer avec les applications frontend, rendant possible une collaboration en temps réel avec conservation d’état entre l’IA et les utilisateurs humains
- Il prend en charge plusieurs protocoles de transport, dont SSE et WebSockets, et fournit des types d’événements standardisés représentant les différents états d’exécution des agents
43. Agent-to-Agent (A2A) Protocol
- Agent2Agent (A2A) est un protocole qui définit un standard pour la communication et les interactions entre agents dans des workflows multi-agents complexes
- Il décrit les éléments essentiels de la communication entre agents, notamment la découverte des capacités et le transport au moyen d’Agent Cards, ainsi que les spécifications des schémas de sécurité
- A2A complète le Model Context Protocol (MCP) en se concentrant sur la communication entre agents sans exposer de détails internes tels que l’état, la mémoire ou les internes de l’agent
- Le protocole encourage les bonnes pratiques comme une approche async-first pour les tâches de longue durée, des réponses en streaming pour des mises à jour progressives, ainsi qu’un transport sécurisé via HTTPS, l’authentification et l’autorisation
44. Amazon S3 Vectors
- Amazon S3 Vectors étend le stockage objet S3 avec des capacités vectorielles natives, offrant un stockage de vecteurs intégré et des fonctions de recherche de similarité
- Il s’intègre de manière fluide à l’écosystème AWS, notamment Amazon Bedrock et OpenSearch, et apporte des fonctionnalités supplémentaires comme le filtrage de métadonnées et la gouvernance via IAM
- Bien qu’il soit encore en préversion et présente des limitations, sa proposition de valeur est attrayante : cette approche économique et accessible du stockage vectoriel ouvre la voie à diverses applications impliquant de gros volumes de données, lorsque la faible latence n’est pas la préoccupation principale
45. Ardoq
- Ardoq est une plateforme d’architecture d’entreprise (EA) qui permet aux organisations de construire, gérer et faire évoluer une base de connaissances d’architecture afin de mieux planifier l’avenir
- Contrairement à la documentation statique traditionnelle, sujette à la dérive et au cloisonnement, l’approche pilotée par les données d’Ardoq récupère des informations depuis les systèmes existants pour créer un graphe de connaissances dynamique qui reste à jour à mesure que le paysage évolue
- Une fonctionnalité particulièrement utile est Ardoq Scenarios, qui permet de modéliser et définir visuellement des états futurs hypothétiques à l’aide d’une approche de branchement et fusion semblable à Git
- Les organisations engagées dans une transformation architecturale devraient évaluer des plateformes EA dédiées comme Ardoq pour leur potentiel à simplifier et accélérer ce processus
46. CloudNativePG
- CloudNativePG est un opérateur Kubernetes qui simplifie l’hébergement et la gestion de clusters PostgreSQL hautement disponibles sur Kubernetes
- Exécuter des services stateful comme PostgreSQL sur Kubernetes peut être complexe, car cela nécessite une connaissance approfondie à la fois de Kubernetes et de la réplication PostgreSQL
- CloudNativePG abstrait l’essentiel de cette complexité en traitant l’ensemble du cluster PostgreSQL comme une ressource déclarative unique et configurable
- Il fournit une architecture primary/standby fluide reposant sur la réplication native en streaming, ainsi que des fonctions de haute disponibilité prêtes à l’emploi, dont l’auto-réparation, le basculement automatique avec promotion de la réplique la plus à jour et la recréation automatique des répliques en échec
47. Coder
- Coder est une plateforme qui provisionne rapidement des environnements de développement standardisés, conformément à la pratique development environments in the cloud décrite précédemment
- Par rapport à des outils similaires comme Gitpod (désormais rebaptisé Ona) et GitHub Codespaces, Coder offre un contrôle plus poussé sur la personnalisation des postes de travail via Terraform
- Il héberge les workstations sur votre propre infrastructure dans le cloud ou dans votre datacenter, plutôt que sur les serveurs du fournisseur
- Cette approche offre davantage de flexibilité, y compris pour exécuter des agents de codage IA et accéder aux systèmes internes de l’organisation
48. Graft
- Graft est un moteur de stockage transactionnel qui permet une synchronisation des données fortement cohérente et efficace dans des environnements edge et distribués
- Il utilise la lazy replication pour ne synchroniser les données qu’en cas de besoin, la partial replication pour minimiser la consommation de bande passante, et la serializable snapshot isolation pour garantir l’intégrité des données
- Nous avons déjà mentionné Electric dans le Radar pour des cas d’usage similaires, mais Graft se distingue en transformant le stockage objet en système transactionnel sans imposer de format de données et en prenant en charge des mises à jour cohérentes au niveau des pages
- Il convient bien à l’alimentation d’applications mobiles local-first, à la gestion d’une synchronisation cross-platform complexe, ainsi qu’au rôle de socle pour des répliques stateless dans des systèmes serverless ou embarqués
49. groundcover
- groundcover est une plateforme cloud native d’observabilité qui unifie logs, traces, métriques et événements Kubernetes dans une interface unique
- En s’appuyant sur eBPF, elle capture des données d’observabilité granulaires avec une instrumentation zero-code, sans insérer d’agent ni de SDK dans le code applicatif
- Les capteurs eBPF de groundcover s’exécutent sur des nœuds dédiés de chaque cluster surveillé, ce qui leur permet de fonctionner indépendamment des applications observées
- Parmi les principales fonctionnalités : une observabilité approfondie au niveau du kernel, une architecture bring-your-own-cloud (BYOC) pour la confidentialité des données, et un modèle tarifaire indépendant du volume de données afin de garder des coûts prévisibles
50. Karmada
- Karmada (« Kubernetes Armada ») est une plateforme d’orchestration de workloads à travers plusieurs clusters Kubernetes, clouds et data centers
- De nombreuses équipes déploient aujourd’hui à l’échelle de plusieurs clusters en combinant des outils GitOps comme Flux ou ArgoCD avec des scripts personnalisés, d’où l’intérêt d’une solution dédiée
- Karmada s’appuie sur des API natives Kubernetes, ce qui évite d’avoir à modifier les applications déjà construites pour des environnements cloud native
- Offre des capacités avancées de scheduling pour la gestion multicloud, la haute disponibilité, la reprise après incident et l’ordonnancement du trafic
51. OpenFeature
- À mesure que l’activité se développe, la gestion des feature flags devient souvent de plus en plus complexe, et les équipes ont besoin d’une couche d’abstraction allant au-delà des simples feature toggles
- OpenFeature fournit cette couche via une spécification d’API indépendante des fournisseurs et portée par la communauté, qui standardise la façon dont les feature flags sont définis et consommés
- Le CLI offre un large support de plusieurs schémas de définition, allant de configurations de base avec variables d’environnement ou configuration in-memory jusqu’à des plateformes matures comme ConfigCat ou LaunchDarkly
- Une mise en garde importante demeure toutefois : les équipes doivent gérer séparément et avec rigueur les différentes catégories de flags afin d’éviter la prolifération des flags, la complexité applicative et une surcharge excessive de tests
52. Oxide
- Construire et exploiter une infrastructure privée est complexe, ce qui explique en grande partie pourquoi le cloud public est le choix par défaut de la plupart des organisations
- Mais pour celles qui en ont besoin, Oxide propose une alternative consistant à assembler et intégrer matériel et logiciel dès le départ
- Propose des racks préconstruits comprenant calcul, réseau et stockage, exécutant un logiciel système entièrement intégré
- Les équipes peuvent gérer les ressources via l’API IaaS d’Oxide en utilisant Terraform et d’autres outils d’automatisation — ce qu’Oxide appelle une infrastructure élastique on-premise
53. Restate
- Restate est une plateforme d’exécution persistante conçue pour résoudre les défis complexes des systèmes distribués lors de la création d’applications stateful et tolérantes aux pannes
- Grâce au journaling d’exécution, elle enregistre chaque étape pour garantir la tolérance aux pannes, une reprise fiable et une communication exactly-once entre services
- Le principal avantage architectural de la plateforme est de séparer la logique applicative en trois types de services persistants : Basic Services pour les fonctions stateless, Virtual Objects pour modéliser des entités stateful concurrentes, et Workflows pour orchestrer des processus complexes en plusieurs étapes
- Restate est évalué avec soin dans un système d’assurance à grande échelle, et jusqu’à présent les performances donnent entière satisfaction
54. SkyPilot
- SkyPilot est une plateforme open source pour exécuter et faire monter en charge des workloads IA on-premise ou dans le cloud
- Développé par le Sky Computing Lab de l’UC Berkeley, SkyPilot agit comme un courtier intelligent en trouvant et provisionnant automatiquement les GPU les moins chers et disponibles à travers les principaux clouds et clusters Kubernetes, ce qui réduit souvent les coûts de calcul
- Pour les équipes infrastructure, il simplifie l’exécution de l’IA sur Kubernetes grâce à des fonctionnalités comme une facilité d’usage comparable à Slurm, la robustesse cloud native, l’accès SSH direct aux pods, le gang scheduling et le support multicluster
- Prend en charge l’extension fluide des workloads d’entraînement ou d’inférence
55. StarRocks
- StarRocks est une base de données analytique qui redéfinit la business intelligence en temps réel en combinant la rapidité des systèmes OLAP traditionnels et la flexibilité des data lakehouses modernes
- Son moteur d’exécution optimisé SIMD, son stockage en colonnes et son optimiseur sophistiqué basé sur les coûts lui permettent d’atteindre une latence de requête inférieure à la seconde à très grande échelle
- Cette architecture haute performance permet aux utilisateurs d’exécuter directement des analyses complexes sur des formats de données ouverts comme Apache Iceberg, sans précalcul ni copie de données
- L’espace compte de nombreuses plateformes, mais StarRocks apparaît comme un candidat solide pour une solution rentable exigeant à la fois une concurrence extrême et une fraîcheur des données constamment à jour
56. Uncloud
- Uncloud est un outil léger d’orchestration et de clustering de conteneurs qui permet aux développeurs de faire passer des applications Docker Compose en production
- Il offre une expérience simple et proche du cloud, sans la surcharge opérationnelle de Kubernetes
- Il permet la montée en charge entre plusieurs machines et les déploiements sans interruption en configurant automatiquement un réseau mesh sécurisé WireGuard pour les communications et en utilisant le reverse proxy Caddy pour fournir automatiquement HTTPS et l’équilibrage de charge
- Le principal avantage architectural d’Uncloud est sa conception entièrement distribuée, qui élimine le besoin d’un plan de contrôle centralisé et garantit que le fonctionnement du cluster reste intact même si certaines machines passent hors ligne
[Tools]
Adopt
57. ClickHouse
- ClickHouse est une base de données OLAP distribuée, open source et orientée colonnes pour l’analytique en temps réel
- Son moteur très performant et scalable est arrivé à maturité pour traiter l’analyse de données à très grande échelle
- Les vues matérialisées incrémentales, un moteur de requête efficace et une forte compression des données en font une solution idéale pour les requêtes interactives
- Le support intégré des fonctions d’agrégation approximative permet d’arbitrer entre précision et performance, ce qui est particulièrement utile pour les analyses à haute cardinalité
58. NeMo Guardrails
- NeMo Guardrails est la boîte à outils open source de NVIDIA pour ajouter facilement des mécanismes programmables de sécurité et de contrôle aux applications conversationnelles basées sur des LLM
- Il permet de définir et d’appliquer des règles de comportement afin de garantir que les sorties restent sûres, pertinentes et conformes
- Les développeurs utilisent Colang, un langage dédié, pour créer des flux conversationnels flexibles, gérer les conversations et imposer des chemins prédéfinis ainsi que des procédures opérationnelles
- NeMo Guardrails fournit une API asynchronous-first pour les performances, ainsi qu’un support de garde-fous pour la sûreté du contenu, la sécurité et l’alignement des entrées et des sorties
59. pnpm
- Depuis le dernier Radar, nous continuons à recevoir des retours positifs des équipes sur pnpm
- pnpm est un gestionnaire de paquets Node.js qui offre des gains de performance significatifs par rapport aux alternatives, à la fois en vitesse et en efficacité d’utilisation de l’espace disque
- Il prend en charge l’optimisation incrémentale au niveau des fichiers, qui améliore encore les performances en créant des liens physiques vers les paquets dupliqués présents dans les dossiers
node_modulesde plusieurs projets vers un emplacement unique sur le disque - pnpm est devenu le choix par défaut pour la gestion des paquets Node.js, car il offre une boucle de feedback nettement plus rapide avec un minimum de problèmes de compatibilité
60. Pydantic
- Pydantic est une bibliothèque Python qui utilise les indications de type standard pour définir des modèles de données et appliquer les schémas de données à l’exécution
- À l’origine, les annotations de type ont été ajoutées à Python pour l’analyse statique, mais leur diversité croissante a conduit à des usages bien plus larges, y compris la validation à l’exécution
- Construit sur un cœur Rust rapide, il fournit une validation, un parsing et une sérialisation efficaces des données
- Il est devenu indispensable dans les applications LLM et est couramment utilisé avec la technique structured output from LLMs pour gérer la nature imprévisible des LLM
Trial
61. AI Design Reviewer
- AI Design Reviewer est un plugin Figma destiné à réaliser des audits de design ou des évaluations heuristiques, et à recueillir des retours exploitables sur des designs existants ou nouveaux
- Les audits couvrent les critiques UX, les incohérences UI, les lacunes en accessibilité, la qualité du contenu et les scénarios de cas limites
- Au-delà de l’identification des problèmes, il fournit des recommandations tenant compte du domaine, qui aident les équipes à construire un vocabulaire de design partagé et à expliciter les raisons derrière les choix de design
- Les équipes utilisent AI Design Reviewer pour analyser des designs legacy, identifier les expériences positives à conserver et les expériences négatives à corriger, afin d’éclairer les objectifs UX d’une refonte
62. Barman
- Barman (Backup and Recovery Manager) est un outil open source de gestion des sauvegardes et de la reprise après sinistre pour les serveurs PostgreSQL
- Il simplifie la création de sauvegardes physiques via différentes méthodes, les organise dans un catalogue complet et prend en charge l’ensemble du processus de reprise après sinistre, y compris la restauration de sauvegardes sur des serveurs en production avec des capacités de restauration à un instant donné
- Nous avons constaté que Barman est robuste et simple à utiliser, et avons été particulièrement impressionnés par la rapidité des opérations de restauration à un instant donné lors des activités de migration
- Il est également très compétent pour les sauvegardes planifiées et sait gérer des configurations de planification et de rétention complexes et hybrides
63. Claude Code
- Claude Code d’Anthropic est un outil de codage IA agentique qui fournit une interface en langage naturel et un modèle d’exécution agentique pour planifier et mettre en œuvre des workflows complexes en plusieurs étapes
- Bien qu’il ait été lancé il y a moins d’un an, il est déjà largement adopté par les développeurs, à l’intérieur comme à l’extérieur de Thoughtworks, ce qui lui vaut sa place en Trial
- Des agents de codage en console comme Codex CLI d’OpenAI, Gemini CLI de Google et l’open source OpenCode ont été lancés, tandis que des assistants intégrés aux IDE comme Cursor, Windsurf et GitHub Copilot incluent désormais un mode agentique
- Nous voyons des équipes l’utiliser non seulement pour écrire et modifier du code, mais aussi comme agent IA généraliste pour gérer les spécifications, les user stories, la configuration, l’infrastructure et la documentation
64. Cleanlab
- Dans le paradigme de l’IA centrée sur les données, améliorer la qualité des jeux de données apporte souvent un gain de performance supérieur à celui obtenu en ajustant le modèle lui-même
- Cleanlab est une bibliothèque Python open source conçue pour traiter ce problème, en identifiant automatiquement des problèmes de données courants tels que les erreurs d’étiquetage, les valeurs aberrantes et les doublons dans des jeux de données textuels, d’images, tabulaires et audio
- Fondé sur les principes du confident learning, Cleanlab exploite les probabilités de prédiction du modèle pour estimer le bruit des labels et quantifier la qualité des données
- Cette approche indépendante du modèle permet aux développeurs de diagnostiquer et corriger les erreurs de jeu de données, puis de réentraîner les modèles pour améliorer leur robustesse et leur précision
65. Context7
- Context7 est un serveur MCP qui s’attaque aux inexactitudes du code généré par l’IA
- Là où les LLM s’appuient sur des données d’entraînement obsolètes, Context7 garantit la génération d’un code exact, à jour et spécifique aux versions des bibliothèques et frameworks utilisés dans le projet
- Il récupère directement depuis les dépôts source des frameworks la documentation la plus récente et des exemples de code fonctionnels, puis les injecte dans la fenêtre de contexte du LLM au moment du prompt
- D’après notre expérience, Context7 réduit fortement les hallucinations de code et la dépendance à des données d’entraînement obsolètes
66. Data Contract CLI
- Data Contract CLI est un outil en ligne de commande open source conçu pour travailler avec la spécification Data Contract
- Il permet de créer et modifier des contrats de données et, surtout, de valider les données par rapport aux contrats, ce qui est essentiel pour garantir l’intégrité et la qualité des produits de données
- Le CLI offre une prise en charge étendue de plusieurs définitions de schéma (Avro, SQL DDL, Open Data Contract Standard, entre autres) et permet de comparer différentes versions d’un contrat afin de détecter immédiatement les changements majeurs
- Nous l’avons trouvé particulièrement utile, surtout dans l’espace du data mesh, pour opérationnaliser la gouvernance des contrats entre produits de données via l’intégration CI/CD
67. Databricks Assistant
- Databricks Assistant est un outil conversationnel alimenté par l’IA, directement intégré à la plateforme Databricks, qui joue le rôle de pair programmer contextuel pour les spécialistes de la donnée
- Contrairement aux assistants de codage généralistes, il bénéficie d’une compréhension native de l’environnement Databricks et du contexte des données, y compris les métadonnées de Unity Catalog
- L’Assistant va au-delà de la génération d’extraits de code : il peut rédiger des requêtes SQL et Python complexes en plusieurs étapes, diagnostiquer des erreurs et fournir des explications détaillées propres à l’espace de travail
- Pour les organisations déjà investies dans l’écosystème Databricks, il peut accélérer la productivité et abaisser la barrière d’entrée pour les tâches data complexes
68. Hoppscotch
- Hoppscotch est un outil open source léger pour le développement, le débogage, le test et le partage d’API
- Il prend en charge plusieurs protocoles, dont HTTP, GraphQL et WebSocket, et propose des clients multiplateformes pour le web, le desktop et l’environnement CLI
- Alors que l’espace des outils API est déjà encombré d’alternatives comme Postman, Insomnia et Bruno, Hoppscotch se distingue par sa faible empreinte et son design respectueux de la vie privée
- En renonçant à l’analytics, en utilisant un stockage local-first et en prenant en charge l’auto-hébergement, il constitue un choix solide pour les organisations qui cherchent un moyen intuitif de partager des scripts API tout en maintenant une forte confidentialité des données
69. NVIDIA DCGM Exporter
- NVIDIA DCGM Exporter est un outil open source qui aide les équipes à surveiller à grande échelle l’entraînement distribué sur GPU
- Il convertit la télémétrie propriétaire de NVIDIA Data Center GPU Manager (DCGM) dans un format ouvert compatible avec les systèmes de supervision standard
- Il expose des métriques critiques en temps réel sur les GPU et les serveurs hôtes, telles que l’utilisation GPU, la température, la consommation électrique et le nombre d’erreurs ECC
- Cette visibilité est essentielle pour les organisations qui affinent des LLM personnalisés ou exécutent des tâches d’entraînement longues et intensives en GPU
70. RelationalAI
- Lorsque de grands volumes de données variées sont ingérés dans Snowflake, les relations uniques et les règles implicites présentes dans ces données peuvent devenir floues
- RelationalAI, construit comme une Snowflake Native App, permet aux équipes de bâtir des modèles sophistiqués capables de capturer des concepts pertinents, de définir les principales entités métier et d’intégrer directement une logique complexe aux tables Snowflake
- Grâce à un puissant Graph Reasoner, les utilisateurs peuvent créer, analyser et visualiser des graphes de connaissances relationnels à partir de ces modèles
- Pour les organisations qui gèrent des jeux de données volumineux et en évolution rapide, la construction de graphes de connaissances peut être essentielle pour la surveillance proactive et la production d’insights plus riches et exploitables
71. UX Pilot
- UX Pilot est un outil d’IA qui prend en charge plusieurs étapes du processus de design UX, du wireframing au design visuel haute fidélité et à la revue
- Il accepte des entrées textuelles ou visuelles et peut générer automatiquement des écrans, des flux et des mises en page
- La fonctionnalité Autoflow génère des transitions de parcours utilisateur, et Deep Design produit des résultats plus riches et plus détaillés
- UX Pilot inclut aussi un plugin Figma qui permet d’exporter les designs générés pour les affiner dans les outils de design standard
72. v0
- v0 a évolué depuis sa dernière présentation dans le Radar
- Il inclut désormais un mode design qui permet aux product managers de créer et d’ajuster plus facilement des prototypes d’interface en self-service
- La dernière version introduit son propre modèle avec une grande fenêtre de contexte et des capacités multimodales, ce qui permet à v0 de générer et d’améliorer des interfaces à partir d’entrées textuelles comme visuelles
- Autre ajout notable : un mode agent qui permet au système de décomposer des tâches plus complexes et de sélectionner le modèle approprié pour chacune d’elles
Assess
73. Augment Code
- Augment Code est un assistant de codage IA qui fournit une assistance profondément contextuelle sur de vastes bases de code
- Il se distingue par un context engineering avancé qui permet des mises à jour rapides de l’index du code et une recherche rapide, même lorsque le code change fréquemment
- Augment prend en charge des modèles comme Claude Sonnet 4 et 4.5 ainsi que GPT-5, s’intègre à GitHub, Jira et Confluence, et prend en charge le Model Context Protocol (MCP) pour l’interopérabilité avec des outils externes
- Il fournit un guidage étape par étape pour des modifications complexes d’une base de code, du refactoring et des mises à niveau de dépendances jusqu’aux mises à jour de schéma
74. Azure AI Document Intelligence
- Azure AI Document Intelligence (anciennement Form Recognizer) extrait le texte, les tableaux et les paires clé-valeur de documents non structurés pour les convertir en données structurées
- Il utilise des modèles de deep learning préentraînés pour interpréter la mise en page et la sémantique, et permet d’entraîner des modèles personnalisés via une interface no-code pour des formats spécifiques
- L’une des équipes indique qu’ADI a fortement réduit la saisie manuelle de données, amélioré la précision des données et accéléré le reporting, ce qui a conduit à des décisions plus rapides fondées sur les données
- Comme Amazon Textract et Google Document AI, il offre un traitement de documents de niveau entreprise grâce à une solide compréhension de la mise en page
75. Docling
- Docling est une bibliothèque open source en Python et TypeScript pour le traitement avancé de documents à partir de données non structurées
- Il s’attaque au problème souvent négligé du « dernier kilomètre » consistant à convertir des documents réels comme des PDF et des PowerPoint en formats propres et lisibles par machine
- Contrairement aux extracteurs traditionnels, Docling utilise une approche fondée sur la computer vision pour interpréter la mise en page des documents et leur structure sémantique, ce qui rend sa sortie particulièrement précieuse pour les pipelines de retrieval-augmented generation (RAG)
- Il convertit des documents complexes en formats structurés comme JSON ou Markdown, ce qui prend en charge des techniques comme les structured output from LLMs
76. E2B
- E2B est un outil open source permettant d’exécuter du code généré par l’IA dans des sandboxes sécurisées et isolées dans le cloud
- Les agents peuvent utiliser ces sandboxes, construites sur des microVM Firecracker, pour exécuter du code en toute sécurité, analyser des données, mener des recherches ou faire tourner des machines virtuelles
- Cela permet de créer et de déployer des agents IA de niveau entreprise avec un contrôle total sur l’environnement d’exécution et la sécurité
77. Helix editor
- On a assisté à une sorte de retour des éditeurs de texte simples en ligne de commande qui cherchent à remplacer le favori des utilisateurs du terminal, Vim
- Helix est l’un des concurrents dans cet espace encombré, aux côtés de Neovim et, plus récemment, de Kakoune
- Se décrivant avec une certaine malice comme un éditeur de texte postmoderne, Helix propose notamment plusieurs curseurs, la prise en charge de Tree-sitter et un support intégré du Language Server Protocol (LSP), ce qui a d’abord attiré notre attention
- Activement développé avec un système de plugins en cours, c’est globalement un éditeur modal léger qui semblera familier aux utilisateurs de Vim tout en ajoutant quelques commodités modernes
78. Kueue
- Kueue est un contrôleur natif Kubernetes pour les files d’attente de jobs qui gèrent les quotas et la consommation de ressources
- Il fournit des API pour traiter des workloads Kubernetes avec différents niveaux de priorité et besoins en ressources, et agit comme un gestionnaire au niveau du job qui décide quand admettre ou retirer des tâches
- Conçu pour une gestion efficace des ressources, la priorisation des jobs et l’ordonnancement avancé, Kueue aide à optimiser l’exécution des workloads dans les environnements Kubernetes, en particulier pour les workloads ML utilisant des outils comme Kubeflow
- Plutôt que de remplacer cluster-autoscaler et kube-scheduler, il fonctionne avec eux et se concentre sur l’admission des jobs selon l’ordre, les quotas, la priorité et la prise en compte de la topologie
79. MCPScan.ai
- MCPScan.ai est un scanner de sécurité pour les serveurs Model Context Protocol (MCP) qui fonctionne selon deux modes : scan et proxy
- En mode scan, il analyse la configuration et les descriptions d’outils pour détecter des vulnérabilités connues comme le prompt injection, l’empoisonnement d’outils et les toxic flows
- En mode proxy, MCPScan.ai sert de pont entre les systèmes d’agents et les serveurs MCP, tout en surveillant en continu le trafic à l’exécution
- Ce mode applique aussi des règles de sécurité et des garde-fous personnalisés, notamment la validation des appels d’outils, la détection de PII et des contraintes sur les flux de données
80. oRPC
- oRPC (OpenAPI Remote Procedure Call) fournit des API end-to-end type-safe en TypeScript tout en respectant pleinement la spécification OpenAPI
- Génère automatiquement une spécification OpenAPI complète, ce qui peut simplifier l’intégration et la documentation
- Alors que des alternatives comme tRPC et ElysiaJS nécessitent souvent l’adoption de nouveaux frameworks pour obtenir la sûreté de typage, oRPC s’intègre de façon fluide aux frameworks Node.js existants, notamment Express, Fastify, Hono, et Next.js
- Cette flexibilité en fait un excellent choix pour les équipes qui veulent adopter une sûreté de typage end-to-end sur des API existantes sans refactoring disruptif
81. Power user for dbt
- Power user for dbt est une extension pour Visual Studio Code qui s’intègre directement aux environnements dbt et dbt Cloud
- Comme dbt reste l’un de nos outils préférés, tout ce qui améliore son ergonomie est un ajout bienvenu à l’écosystème
- Auparavant, les développeurs dépendaient de plusieurs outils hors de l’IDE pour valider le code SQL ou inspecter la lignée des modèles
- Avec cette extension, ces fonctionnalités sont désormais intégrées à VS Code, avec autocomplétion du code, résultats de requêtes en temps réel, et visualisation de la lignée des modèles et des colonnes
82. Serena
- Serena est un puissant toolkit de développement qui offre à des agents de code comme Claude Code des capacités proches d’un IDE pour la recherche et l’édition sémantiques de code
- En opérant au niveau des symboles et en comprenant la structure relationnelle du code, Serena améliore fortement l’efficacité en tokens
- Au lieu de lire des fichiers entiers ou de s’appuyer sur des remplacements de chaînes rudimentaires, les agents de code peuvent utiliser des outils Serena précis comme find_symbol, find_referencing_symbols et insert_after_symbol pour localiser et modifier le code
- Sur de petits projets, l’impact est limité, mais à mesure que la base de code grandit, cette efficacité devient très précieuse
83. SweetPad
- L’extension SweetPad permet aux développeurs d’utiliser VS Code ou Cursor pour l’ensemble du cycle de vie du développement d’applications Swift sur les plateformes Apple
- Elle intègre des outils essentiels comme xcodebuild, xcode-build-server et swift-format, supprimant le besoin de basculer constamment vers Xcode
- Les développeurs peuvent gérer les simulateurs et déployer sur des appareils, tout en compilant, exécutant et déboguant des applications Swift pour iOS, macOS et watchOS directement depuis l’IDE sans ouvrir Xcode
84. Tape/Z (Tools for Assembly Program Exploration for Z/OS)
- Tape/Z (Tools for Assembly Program Exploration for Z/OS) est un toolkit en évolution pour l’analyse de code mainframe HLASM (High-Level Assembler)
- Développé par des Thoughtworkers, il propose des fonctionnalités comme le parsing, la construction de graphes de flux de contrôle, le suivi des dépendances et la visualisation de logigrammes
- Nous signalons depuis longtemps la rareté, dans l’univers mainframe, d’outils ouverts et portés par la communauté, la plupart des options étant propriétaires ou liées à l’écosystème d’un fournisseur
- Tape/Z aide à combler ce manque en apportant des capacités d’analyse accessibles et scriptables
[Languages and Frameworks]
Adopt
85. Fastify
- Nous continuons d’avoir une expérience positive avec Fastify — un framework web rapide, peu prescriptif et à faible surcoût pour Node.js
- Il fournit toutes les fonctionnalités essentielles d’un framework web minimal, dont le parsing, la validation et la sérialisation, ainsi qu’un système de plugins robuste et un fort soutien de la communauté
- Les équipes n’ont pas constaté d’inconvénient majeur à utiliser Fastify par rapport à des alternatives comme Express.js, et ont aussi obtenu des gains de performance mesurables, ce qui en fait un choix attrayant pour le développement web minimal en Node.js
86. LangGraph
- LangGraph est un framework d’orchestration destiné à construire des applications multi-agents avec état à l’aide de LLM
- Il fournit des primitives bas niveau comme les nœuds et les arêtes, ainsi que des fonctionnalités intégrées donnant aux développeurs un contrôle fin sur les workflows d’agents, la gestion de la mémoire et la persistance de l’état
- Cela signifie que les développeurs peuvent commencer avec de simples graphes préconstruits puis évoluer vers des architectures d’agents complexes et changeantes
- Avec la prise en charge de motifs de résilience comme le streaming, la gestion avancée du contexte, le fallback de modèles et la gestion des erreurs d’outils, LangGraph permet de construire des applications d’agents robustes, de niveau production
87. vLLM
- vLLM est un moteur d’inférence à haut débit et économe en mémoire pour les LLM, exécutable dans le cloud ou on-premise
- Il prend en charge plusieurs architectures de modèles ainsi que des modèles open source populaires
- Les équipes ont déployé des workers vLLM conteneurisés sur des plateformes GPU comme NVIDIA DGX et Intel HPC afin d’héberger des modèles, dont Llama 3.1 (8B et 70B), Mistral 7B et Llama-SQL, pour l’assistance au code des développeurs, la recherche de connaissances et l’interaction avec des bases de données en langage naturel
- vLLM est compatible avec le standard OpenAI SDK, ce qui permet un model serving cohérent
Trial
88. Crossplane
- Depuis sa dernière apparition dans le Radar, l’adoption de Crossplane a continué à progresser, notamment pour l’extension de clusters Kubernetes
- Dans nos travaux, nous avons constaté que Crossplane excelle dans des cas d’usage spécifiques plutôt qu’en tant qu’outil d’infrastructure as code (IaC) généraliste
- Notre observation précédente reste valable : Crossplane fonctionne mieux comme compagnon des workloads déployés dans Kubernetes et non comme substitut complet à des outils comme Terraform
- Les équipes qui ont misé entièrement sur Crossplane comme solution IaC principale ont souvent rencontré des difficultés, tandis que celles qui l’ont utilisé de façon pragmatique — pour des cas d’usage custom ciblés — ont obtenu de bons résultats
89. DeepEval
- DeepEval est un framework d’évaluation open source basé sur Python pour mesurer les performances des LLM
- Il peut servir à évaluer des applications de retrieval-augmented generation (RAG) et d’autres applications construites avec LlamaIndex ou LangChain, ainsi qu’à établir des modèles de référence et des benchmarks
- DeepEval évalue l’exactitude, la pertinence et la cohérence afin de fournir des évaluations plus fiables en situation réelle, au-delà des simples scores de correspondance de mots
- Il inclut des métriques comme la détection d’hallucinations, la pertinence des réponses et l’optimisation d’hyperparamètres, et prend en charge GEval pour créer des métriques custom adaptées à des cas d’usage spécifiques
90. FastMCP
- Le Model Context Protocol (MCP) s’impose rapidement comme un standard pour fournir du contexte et des outils aux applications LLM
- Cependant, l’implémentation d’un serveur MCP inclut généralement une quantité importante de boilerplate pour la configuration, la gestion du protocole et la gestion des erreurs
- FastMCP est un framework Python qui simplifie ce processus en abstrahant la complexité du protocole et en permettant aux développeurs de définir des ressources et outils MCP via des décorateurs Python intuitifs
- Cette abstraction permet aux équipes de se concentrer sur la logique métier, ce qui aboutit à des implémentations MCP plus propres et plus faciles à maintenir
91. LiteLLM
- LiteLLM est un SDK offrant une intégration fluide avec plusieurs fournisseurs de LLM via un format d’API OpenAI standardisé
- Il prend en charge un large éventail de fournisseurs et de modèles, et fournit une interface unifiée pour la complétion de texte, les embeddings et la génération d’images
- En abstrahant les différences d’API propres à chaque fournisseur, LiteLLM simplifie l’intégration et route automatiquement les requêtes vers le bon endpoint de modèle
- Il inclut aussi, via son framework proxy, des fonctionnalités de niveau production comme les guardrails, le caching, la journalisation, la limitation de débit et le load balancing
92. MLForecast
- MLForecast est un framework et une bibliothèque Python pour la prévision de séries temporelles appliquant des modèles de machine learning à grande échelle
- Il simplifie le processus souvent complexe d’ingénierie de features automatisée, incluant les retards, les statistiques glissantes et les fonctionnalités basées sur les dates
- C’est l’une des rares bibliothèques à offrir une prise en charge native de frameworks de calcul distribué comme Spark et Dask, garantissant la scalabilité
- Il prend aussi en charge la prévision probabiliste via des méthodes comme la conformal prediction, fournissant une mesure quantitative de l’incertitude des prévisions
93. Nuxt
- Nuxt est un méta-framework orienté opinion, construit au-dessus de Vue.js, pour créer des applications web full stack, souvent présenté comme le « Next.js pour Vue.js »
- Comme son équivalent dans l’écosystème React, Nuxt fournit des fonctionnalités favorables au SEO comme le pré-rendu, le server-side rendering (SSR) et la gestion des métadonnées
- Nuxt est soutenu par Vercel, la même entreprise derrière Next.js, et bénéficie d’une forte communauté ainsi que d’un écosystème de modules officiels et tiers
- Ces modules simplifient l’intégration de fonctionnalités comme le traitement d’images, les sitemaps et Tailwind CSS
94. Phoenix
- L’expérience avec Phoenix continue d’être positive — un framework web MVC côté serveur écrit en Elixir
- Phoenix s’appuie sur les enseignements de Ruby on Rails en matière de développement rapide d’applications et d’expérience développeur, tout en évoluant dans un paradigme de programmation fonctionnelle
- Dans ce volume, la sortie de Phoenix LiveView 1.0 est mise en avant
- LiveView est une solution HTML-over-the-wire similaire à HTMX ou Hotwire, qui permet aux développeurs de créer des expériences utilisateur riches et en temps réel avec un HTML entièrement rendu côté serveur
95. Presidio
- Presidio est un SDK de protection des données destiné à identifier et anonymiser les données sensibles dans des textes structurés et non structurés
- Il détecte les informations personnelles identifiables (PII), comme les numéros de carte bancaire, les noms et les lieux, à l’aide de la reconnaissance d’entités nommées, d’expressions régulières et de logique basée sur des règles
- Presidio prend en charge des reconnaisseurs d’entités personnalisés ainsi que des pipelines d’anonymisation, afin que les organisations puissent l’adapter à leurs propres exigences en matière de confidentialité et de conformité
- Les équipes utilisent Presidio lors de l’intégration avec des LLM dans des environnements d’entreprise où les contrôles stricts de partage des données sont indispensables
96. Pydantic AI
- Pydantic AI continue de faire ses preuves comme framework open source stable et bien pris en charge pour construire des agents GenAI en production
- Construit sur la base fiable de Pydantic, il offre une forte sûreté de typage, une observabilité de premier ordre via OpenTelemetry et des outils d’évaluation intégrés
- La sortie de la version 1.0 le 4 septembre 2025 marque un jalon important de maturité
- Depuis, il s’est imposé par sa simplicité et sa facilité de maintenance comme une option fiable et largement adoptée, rejoignant les rangs d’autres frameworks d’agents populaires comme LangChain et LangGraph
97. Tauri
- Tauri est un framework permettant de créer des applications desktop haute performance à partir d’une base de code unique pour l’interface web
- Contrairement aux wrappers web traditionnels comme Electron, Tauri est construit sur Rust et exploite le webview natif du système d’exploitation, ce qui permet d’obtenir des binaires plus légers et une sécurité renforcée
- Tauri avait été évalué pour la première fois il y a quelques années, et s’est depuis étendu au-delà du desktop avec la prise en charge d’iOS et d’Android
- Les versions récentes introduisent un modèle d’autorisations et de portée plus flexible, remplaçant l’ancienne liste de permissions, ainsi qu’une couche IPC renforcée qui prend en charge le transfert de données brutes et améliore les performances
Assess
98. Agent Development Kit (ADK)
- Agent Development Kit (ADK) est un framework de développement et de déploiement d’agents IA qui applique des pratiques modernes d’ingénierie logicielle plutôt que de se reposer uniquement sur le prompting
- Il introduit des abstractions familières comme les classes, les méthodes, les patterns de workflow et la prise en charge du CLI
- Comparé à des frameworks comme LangGraph ou CrewAI, le point fort d’ADK réside dans son intégration profonde avec l’infrastructure IA de Google, offrant des capacités de grounding prêtes pour l’entreprise, d’accès aux données et de monitoring
- Il est conçu pour l’interopérabilité, avec la prise en charge des wrappers d’outils et du protocole A2A pour la communication inter-agents
99. Agno
- Agno est un framework pour construire, exécuter et gérer des systèmes multi-agents
- Il offre la flexibilité de créer des agents entièrement autonomes ou des workflows contrôlés par étapes, avec une prise en charge intégrée du human-in-the-loop, de la gestion de session, de la mémoire et des connaissances
- Son accent sur l’efficacité est particulièrement apprécié, avec des temps de démarrage des agents impressionnants et une faible consommation mémoire
- Agno est fourni avec son propre runtime, AgentOS, une application FastAPI dotée d’un plan de contrôle unifié pour simplifier les tests, le monitoring et la gestion des systèmes d’agents
100. assistant-ui
- assistant-ui est une bibliothèque open source TypeScript et React pour les interfaces de chat IA
- Elle gère les aspects complexes de l’implémentation d’une UI de chat, comme le streaming, la gestion d’état et les fonctionnalités UX courantes pour l’édition des messages et le changement de branche, tout en permettant aux développeurs de concevoir leurs propres composants à l’aide des primitives Radix
- Elle prend en charge l’intégration avec des runtimes populaires, dont le Vercel AI SDK et LangGraph, et fournit des solutions de runtime personnalisables pour les cas d’usage complexes
- Des interfaces de chat simples ont été construites avec succès avec assistant-ui, et le résultat s’est avéré satisfaisant
101. AutoRound
- AutoRound d’Intel est un algorithme de quantification avancé destiné à compresser de grands modèles d’IA comme les LLM et les vision language models (VLM), tout en minimisant la perte de précision
- Il utilise une optimisation par sign-gradient descent pour réduire la taille des modèles à des largeurs de bits ultra-faibles (2 à 4 bits) et applique des largeurs de bits mixtes sur l’ensemble des couches pour une efficacité optimale
- Ce processus de quantification est également très rapide : il peut quantifier un modèle de 7 milliards de paramètres en quelques minutes sur un seul GPU
- AutoRound s’intègre à des moteurs d’inférence populaires comme vLLM et Transformers, ce qui en fait une option attrayante pour la quantification de modèles
102. Browser Use
- Browser Use est une bibliothèque Python open source qui permet à des agents basés sur des LLM de piloter un navigateur web et d’interagir avec des applications web
- Elle permet la navigation, la saisie de données et l’extraction de texte, et peut gérer plusieurs onglets afin d’orchestrer des tâches entre différentes applications
- La bibliothèque est particulièrement utile lorsque des agents IA doivent accéder à des informations, les manipuler ou les récupérer depuis du contenu web
- Elle prend en charge divers LLM et s’appuie sur Playwright pour combiner compréhension visuelle et extraction de la structure HTML afin d’enrichir les interactions web
103. DeepSpeed
- DeepSpeed est une bibliothèque Python qui optimise le deep learning distribué, aussi bien pour l’entraînement que pour l’inférence
- Pour l’entraînement, elle intègre des techniques comme Zero Redundancy Optimizer (ZeRO) et le parallélisme 3D afin d’étendre efficacement les modèles sur des milliers de GPU
- Pour l’inférence, elle combine le parallélisme tensoriel, pipeline, expert et ZeRO avec des kernels personnalisés et des optimisations de communication afin de minimiser la latence
- DeepSpeed propulse certains des plus grands modèles de langage au monde, notamment Megatron-Turing NLG (530B) et BLOOM (176B)
104. Drizzle
- Drizzle est un ORM TypeScript léger
- Contrairement à Prisma ORM, il offre aux développeurs à la fois une API simple de type SQL et une interface de requêtes plus proche du style ORM traditionnel
- Il prend également en charge l’extraction de schéma depuis des bases de données existantes, rendant possibles aussi bien les approches database-first que code-first
- Drizzle a été conçu en pensant aux environnements serverless, avec une petite taille de bundle et la prise en charge des prepared statements
105. Java post-quantum cryptography
- Les ordinateurs quantiques continuent de progresser rapidement, et des offres SaaS comme AWS Braket donnent désormais accès à des algorithmes quantiques sur plusieurs architectures
- Depuis mars, Java 24 introduit la Java post-quantum cryptography, ajoutant la prise en charge d’algorithmes de cryptographie post-quantique comme ML-KEM et ML-DSA
- .Net 10 étend également sa prise en charge
- Le conseil est simple : si vous développez des logiciels dans ces langages, commencez dès maintenant à adopter des algorithmes quantum-safe pour pérenniser vos systèmes
106. kagent
- Kagent est un framework open source pour exécuter de l’IA agentique au sein de clusters Kubernetes
- Il permet à des agents basés sur des LLM de planifier et d’exécuter des tâches opérationnelles, comme diagnostiquer des problèmes, corriger des configurations ou interagir avec des outils d’observabilité, via des API natives Kubernetes et l’intégration de Model Context Protocol (MCP)
- L’objectif est d’introduire l’« AgentOps » dans l’infrastructure cloud native en combinant gestion déclarative et raisonnement autonome
- En tant que projet CNCF Sandbox, Kagent doit être adopté avec prudence, en particulier au vu des risques liés à l’attribution de capacités de gestion opérationnelle à des LLM, et des techniques comme la toxic flow analysis peuvent être particulièrement utiles pour évaluer et atténuer ces risques
107. LangExtract
- LangExtract est une bibliothèque Python qui utilise des LLM pour extraire des informations structurées à partir de texte non structuré selon des instructions personnalisées
- Elle traite des contenus spécialisés comme des notes cliniques et des rapports afin d’identifier et d’organiser les détails essentiels, tout en conservant la traçabilité de chaque donnée extraite jusqu’à sa source
- Les entités extraites peuvent être exportées dans des fichiers
.jsonl(format standard pour les données de modèles de langage) et visualisées via une interface HTML interactive pour examiner le contexte - L’équipe a évalué LangExtract pour extraire des entités afin d’alimenter des graphes de connaissances métier, et l’a jugé efficace pour transformer des documents complexes en représentations structurées et lisibles par machine
108. Langflow
- Langflow est une plateforme open source low-code destinée à construire et visualiser des workflows LLM
- Construite sur LangChain, elle permet aux développeurs de chaîner prompts, outils, bases de données vectorielles et composants de mémoire via une interface drag-and-drop, tout en prenant en charge du code Python personnalisé pour la logique avancée
- Elle est particulièrement utile pour prototyper des applications agentiques sans avoir à écrire tout le code backend
- Cependant, Langflow reste relativement nouveau, comporte encore quelques aspérités pour un usage en production, et les précautions générales applicables aux plateformes low-code valent aussi ici
109. LMCache
- LMCache est une solution de cache clé-valeur (KV) qui accélère les infrastructures de serving de LLM
- Elle agit comme une couche de cache spécialisée à l’échelle de pools entiers de moteurs d’inférence LLM et stocke des entrées de cache KV pré-calculées pour des textes susceptibles d’être traités plusieurs fois, comme des historiques de chat ou des collections de documents
- En conservant ces valeurs sur disque, elle décharge du GPU les calculs de prefill, réduit le time-to-first-token (TTFT) et baisse les coûts d’inférence sur des charges exigeantes comme les pipelines RAG, les applications de chat multi-tour et les systèmes d’agents
- Il est possible d’intégrer LMCache à des serveurs d’inférence majeurs comme vLLM ou NVIDIA Dynamo, et cela mérite d’être évalué selon votre configuration
110. Mem0
- Mem0 est une couche mémoire conçue pour les agents IA
- Les approches naïves consistent souvent à stocker l’intégralité de l’historique de chat dans une base de données puis à le réutiliser dans de futures conversations, ce qui entraîne une consommation excessive de tokens
- Mem0 remplace cela par une architecture plus sophistiquée qui sépare la mémoire entre rappel à court terme et couche long terme intelligente, laquelle n’extrait et ne stocke que les faits et relations saillants
- Cette architecture combine un vector store pour la similarité sémantique et un graphe de connaissances pour comprendre les données temporelles et relationnelles
111. Open Security Control Assessment Language (OSCAL)
- Open Security Controls Assessment Language (OSCAL) est un format ouvert et lisible par machine d’échange d’informations, conçu pour accroître l’automatisation en matière de conformité et de gestion des risques, et aider les équipes à s’éloigner d’approches manuelles fondées sur du texte
- Piloté par le National Institute of Standards and Technology (NIST) des États-Unis, OSCAL fournit des représentations standard en XML, JSON et YAML pour exprimer des contrôles de sécurité liés à des frameworks sectoriels comme SOC 2 et PCI, ainsi qu’à des frameworks gouvernementaux comme FedRAMP aux États-Unis, le Cybersecurity Control Catalogue à Singapour et l’Information Security Manual en Australie
- Bien qu’OSCAL ne soit pas encore largement adopté en dehors du secteur public et que son écosystème soit encore en phase de maturation, son potentiel est enthousiasmant pour simplifier les évaluations de sécurité, réduire la dépendance aux tableurs et aux exercices de cases à cocher, et permettre une conformité automatisée lorsqu’il est intégré à des plateformes de compliance-as-code et de continuous compliance
112. OpenInference
- OpenInference est un ensemble de conventions et de plugins conçu pour observer les applications d’IA en complément d’OpenTelemetry
- Il fournit une instrumentation standardisée pour les frameworks et bibliothèques de machine learning afin d’aider les développeurs à suivre les appels LLM avec leur contexte périphérique, comme les recherches dans des vector stores ou les appels à des outils externes tels que des API et des moteurs de recherche
- Les spans peuvent être exportés vers n’importe quel collecteur compatible OTEL, garantissant l’alignement avec les pipelines de télémétrie existants
- Nous avions déjà blippé Langfuse, une plateforme de visibilité LLM largement utilisée, et le SDK OpenInference peut enregistrer des traces dans Langfuse ainsi que dans d’autres plateformes de visibilité compatibles OpenTelemetry
113. Valibot
- Valibot est une bibliothèque de validation de schémas pour TypeScript
- Comme d’autres bibliothèques populaires de validation TypeScript telles que Zod et Ajv, elle offre l’inférence de types, mais se distingue par sa conception modulaire
- Cette architecture permet aux bundlers d’effectuer un tree shaking et un découpage de code efficaces, afin de n’inclure que les fonctions de validation réellement utilisées
- Valibot peut réduire la taille du bundle jusqu’à 95 % par rapport à Zod dans les scénarios optimaux, ce qui en fait un choix attractif pour la validation de schémas dans des environnements où la taille du bundle compte, comme la validation côté client ou les fonctions serverless
114. Vercel AI SDK
- Vercel AI SDK est une boîte à outils open source full-stack pour créer des applications et des agents basés sur l’IA dans l’écosystème TypeScript
- Il se compose de deux éléments principaux : AI SDK Core standardise les appels LLM de manière indépendante du modèle, avec prise en charge de la génération de texte, de la génération d’objets structurés et des appels d’outils
- AI SDK UI, à l’instar de assistant-ui, simplifie le développement frontend dans React, Vue, Next.js et Svelte grâce au streaming, à la gestion d’état et aux mises à jour d’interface en temps réel
- Pour les équipes qui travaillent déjà dans les écosystèmes TypeScript et Next.js, Vercel AI SDK offre un moyen rapide et fluide de créer des applications d’IA avec une expérience client riche
Aucun commentaire pour le moment.