Les 28 outils d’IA que j’aimerais voir exister

(sharif.io)

19 points par GN⁺ 2025-10-02 | 2 commentaires | Partager sur WhatsApp

En septembre 2025, de puissants modèles d’IA comme Claude Opus 4.1, GPT-5 et Nano Banana ont fait leur apparition, ouvrant un âge d’or du développement logiciel
Dans le contexte actuel de l’IA, l’auteur propose 28 outils d’IA innovants qui n’existent pas encore, mais qu’il aimerait voir apparaître
Les idées proposées couvrent des domaines variés comme la productivité personnelle, le développement logiciel, la santé et la création de contenu
Les points communs mis en avant sont la prise en compte du contexte, la personnalisation utilisateur et l’amélioration via des boucles automatisées d’apprentissage et de feedback
Plutôt que les agents généralistes d’aujourd’hui, l’auteur propose le concept d’agents d’IA spécialisés à objectif unique ainsi qu’une place de marché permettant de les échanger

Les 28 outils d’IA proposés

1. Une app caméra basée sur Nano Banana

Une application qui transforme une photo iPhone ordinaire pour lui donner l’apparence d’un cliché pris avec un Leica

2. Agent d’ajout automatique des modes clair/sombre

Ajoute automatiquement à tout projet frontend la prise en charge du mode clair, du mode sombre et des thèmes personnalisés
Utilise la vision pour vérifier les changements d’interface et procède à des corrections itératives à partir du rendu de l’UI

3. Agent de décompilation et de débogage de code obfusqué

Décompile du code minifié pour le transformer en une base de code lisible, puis le débogue
Nécessite une puissante boucle code-débogage

4. Un hybride de l’app Strong et de ChatGPT

Le modèle accède aux données d’entraînement physique pour proposer des améliorations et du coaching
Possibilité de discuter avec un modèle qui connaît un contexte détaillé, jusqu’au temps entre chaque série

5. Moteur de recommandation

Analyse l’historique de navigation pour identifier les billets de blog ou articles lus le plus longtemps
Explore le web chaque nuit pour trouver des contenus à lire et fournit un digest de liens le matin
Améliore le digest du lendemain grâce aux retours sur les bonnes et mauvaises recommandations

6. App de chat pour le suivi des calories

Une app de chat fondée sur une base de données nutritionnelle
Réduit au minimum l’effort cognitif nécessaire pour enregistrer les repas

7. App minimaliste pour écrire des contenus longs

Le modèle met en évidence des passages et laisse des commentaires dans la marge
Possibilité de configurer différents « personas » pour relire ce qui a été écrit

8. Agent constructeur d’agents d’IA spécialisés

Reçoit une description de tâche comme « crée-moi un agent de décompilation de code » et génère automatiquement un agent ultra-spécialisé

9. Lecteur d’ebooks minimaliste

En lisant un ebook, l’utilisateur peut surligner un passage et le modèle l’explique plus en profondeur à côté
Le modèle adopte le persona de l’auteur
L’expérience doit ressembler à une extension du livre, et non à une instance de chat séparée

10. Agent de Deep Research qui raisonne pendant plusieurs jours

Capable de recevoir des requêtes très complexes
Crée des centaines de sous-agents et raisonne pendant 3 jours avant de renvoyer une réponse

11. App de création de films en mode paint-by-number

Aide à brainstormer une idée de court métrage et le modèle génère un storyboard détaillé
L’utilisateur n’a plus qu’à filmer chaque scène du storyboard avec son smartphone
Sert de petites roues pour la réalisation cinématographique

12. App d’enregistrement d’écran et de résumé sémantique

Utilise un modèle local pour produire un résumé sémantique détaillé de tout ce qui a été fait sur l’ordinateur dans la journée
Peut être fourni comme contexte à une app de chat : « À qui ai-je oublié de répondre hier ? »
L’auteur a utilisé Rewind pendant un an, mais l’a trouvé moins utile qu’espéré

13. Filtre sémantique pour Twitter/X/YouTube

Permet d’écrire des filtres ouverts comme « masquer les tweets susceptibles de m’énerver »
Retire du fil les contenus conçus pour provoquer de la colère
En façonnant notre fil, nous nous façonnons nous-mêmes

14. Agent de génération de cursus sur mesure pour des sujets de niche

Reçoit une demande du type « je veux apprendre tout ce que nous savons sur la science du progrès »
Cherche sur le web des personnalités, blogs, vidéos YouTube, essais et manuels
Lit tout le contenu et fournit un cursus qui guide du niveau débutant à expert

15. Un très bon moteur de recommandation de livres

Commence par un quiz sur les lectures passées, les objectifs et les types de livres appréciés
Une fois beaucoup d’informations collectées, d’autres agents simulent la manière dont l’utilisateur réagirait aux suggestions de l’agent principal
Ne fait remonter que les livres ayant de très fortes chances de plaire

16. Moteur de recherche sémantique pour TikTok et Instagram Reels

Donne accès aux informations utiles enfermées dans les vidéos courtes
Nécessite une vraie fonction de recherche interrogeable

17. App fitness du sommeil

Intègre les données de l’Apple Watch (fréquence cardiaque, VO₂), d’Eight Sleep, de l’Oura Ring et des apps d’entraînement
Fournit des recommandations concrètes pour améliorer le sommeil et la récupération
Envoie proactivement des messages du type : « Votre HRV a baissé cette semaine, êtes-vous peut-être en surentraînement ? »

18. Grande bibliothèque de composants

Conçue pour être rendue directement dans une interface de chat
Les bibliothèques existantes proposent des primitives trop bas niveau
Met l’accent sur des widgets de haut niveau plutôt que sur la personnalisation

19. Assistant vocal minimaliste pour Apple Watch

Pour les questions trop complexes pour Siri mais adaptées à ChatGPT
Fournit des réponses très courtes, de quelques mots

20. App d’écriture qui propose une bibliographie de lecture

Recherche sur le web le sujet en cours de rédaction et constitue une liste de ressources utiles
L’app d’écriture ne doit pas écrire à la place de l’utilisateur

21. App de running

Génère des plans personnalisés, suit l’allure et la fréquence cardiaque
Ajuste itérativement le programme d’entraînement à partir des données réelles

22. Super app de retouche photo Nano Banana

Propose des centaines de templates sans avoir à écrire de prompt
Permet d’essayer différentes coiffures, de prédire à quoi ressemblerait un enfant avec son partenaire, de se donner l’apparence de The Rock, etc.

23. Recherche de vidéos YouTube dans le style de Same.energy

On entre une URL et l’outil trouve des vidéos à l’ambiance similaire
L’algorithme actuel de YouTube se concentre surtout sur la maximisation de l’engagement de l’utilisateur moyen

24. Appareil de style Sony Walkman pour enfants

Un appareil voice-first permettant de poser des questions à un LLM
Un appareil sans aucun écran, centré sur l’explication
Encore mieux s’il est pensé offline-first

25. Moteur de recherche biographique

Requête basée sur un questionnaire concernant les problèmes actuels, l’étape de vie, le domaine, etc.
Retourne en résultat des chapitres de biographies ou autobiographies de grandes figures historiques traitant de situations similaires

26. Agent d’audit de consommation de contenu via enregistrement d’écran

Observe l’usage de l’ordinateur et du smartphone
Audite chaque jour le contenu consommé
Screen Time n’est pas suffisamment précis
Il faut connaître la valeur nutritionnelle exacte des tokens que l’on consomme

27. Marketplace d’agents d’IA pour tâches de niche

Des agents conçus pour des cas d’usage précis seraient meilleurs que des agents généralistes
Un catalogue d’agents ultra-spécialisés pour des tâches de niche comme trouver un appartement en location à San Francisco
Il faut des dizaines de milliers d’agents utilisables via le web ou une API

28. Fonction de demande de critique à un écrivain célèbre

« Que dirait Hemingway de ce billet de blog ? »
Identifier les parties qui l’auraient dérouté et celles qu’il aurait aimées

2 commentaires

shakespeares 2025-10-07

Les points 2 et 3, ce serait vraiment bien si ça pouvait se faire automatiquement.
Ça semble faire partie de ces tâches répétitives pénibles qu’il faut ajouter une par une en permanence.

GN⁺ 2025-10-02

Commentaire Hacker News

Je pense qu’il faut vraiment être très prudent avec le point « 24. donner aux enfants un appareil de style Sony Walkman leur permettant de poser des questions à un LLM »
- Tant qu’on n’est pas à l’AGI, les réponses qu’un enfant entendra seront en majorité très exactes, mais un tout petit nombre de réponses erronées ou de malentendus subtils peut avoir un impact catastrophique sur son parcours d’apprentissage
- Même si c’était un LLM parfait qui ne commet jamais d’erreur, cela réduirait au final le besoin de communiquer avec d’autres personnes, donc les occasions de développer des capacités de coopération diminueraient
- Du point de vue des parents, on peut vouloir un petit moment de répit, mais si l’enfant s’habitue à un appareil qui répond toujours instantanément, ces précieux moments de lien passés à chercher la réponse ensemble disparaîtront. L’enfant pourrait peu à peu s’éloigner de ses parents. Il faut réfléchir aux valeurs qui seront transmises à l’enfant
- Les parents qui équipent leur enfant d’un tel système partent du principe que leur vision du monde et leurs valeurs y sont correctement reflétées. Les parents sur HN ont peut-être une vision centrée sur la science, mais dans d’autres pays ou régions, cet appareil pourrait devenir un outil de propagande politique, religieuse ou culturelle. Le risque est grand qu’un tel outil soit détourné en arme de lavage de cerveau
- Je pense qu’on peut obtenir des résultats bien meilleurs qu’en demandant à un professeur à l’école
- Il y a deux jours, j’ai demandé à ChatGPT d’expliquer le système de valeur de position (place-value system) de manière compréhensible pour un enfant de six ans. Or il a confondu la valeur de position et la valeur du chiffre, et a donc donné une mauvaise explication. J’ai repéré l’erreur et ChatGPT s’est excusé, mais si l’enfant avait posé la question lui-même, il ne l’aurait probablement pas remarquée.
  Je me demande combien d’informations erronées mon enfant finirait par croire vraies avec un appareil de ce genre
À propos du point 19, j’en ai fabriqué un moi-même il y a quelques semaines avec iOS Shortcut

C’est un assistant vocal minimaliste pour Apple Watch. Siri gère mal les questions complexes, mais pour ChatGPT ça va. Les réponses sont reçues sous forme de phrases courtes et concises de moins de 150 caractères
J’utilise l’action Dictate Text pour capter la voix, puis je l’envoie à l’API OpenAI avec le prompt système suivant
« CRITICAL: la réponse ne sera affichée que dans une notification push iOS ou sur l’écran de la montre, donc réponds de façon concise en moins de 150 caractères. Pas de Markdown, uniquement du texte brut. Utilise un vocabulaire et une ponctuation sobres mais soignés.
L’utilisateur ne peut pas poser de question de suivi. Une seule phrase à la fois, et si nécessaire tu dois aussi faire des hypothèses sur la question ; si elles sont fausses, l’utilisateur devra redemander. »
Ça fonctionne plutôt bien. Le plus gros défaut, c’est qu’il faut 5 à 20 secondes pour recevoir une réponse. Mais l’envoi de la question est quasi instantané (pas besoin d’ouvrir une app), donc j’en suis très satisfait
Ce que je ressens face à beaucoup d’idées et d’articles, c’est qu’ils ne « thinking with portals » pas à propos des LLM. On a une technologie au niveau du « portal gun » (c’est ainsi qu’elle est vendue), mais on a l’impression de ne l’utiliser que comme une meilleure porte
- Ce que les LLM savent faire, au fond, c’est prolonger du texte de manière logiquement cohérente. Les possibilités d’application sont larges, mais dans la pratique il est difficile d’aller au-delà d’un éditeur de texte avancé. Par exemple, si on veut les utiliser pour le montage vidéo, il faut créer un langage de script, puis synchroniser les fonctionnalités avec l’éditeur. Pour un grand groupe comme Adobe, la valeur par rapport aux effectifs mobilisés est discutable, et une startup doit affronter Adobe dans une longue bataille de fonctionnalités et de verrouillage utilisateur. Dans les deux cas, l’intérêt reste limité à moins que le LLM ne soit vraiment révolutionnaire. En plus, un LLM ne peut pas voir directement le rendu vidéo et, à l’heure actuelle, c’est au mieux « passable »
- Je suis d’accord avec ce point de vue. Si tu as des ressources de référence sur « thinking with portals », je serais curieux que tu les partages
- S’il y a un exemple de pensée « façon portails », j’aimerais bien que tu en partages un simple et facile à comprendre
À propos du point 22, j’aimerais qu’il existe un moteur qui analyse mon historique de navigation, comprenne les types de blogs et d’articles que je lis le plus longtemps, puis me trouve chaque soir du contenu recommandé que je n’ai pas encore vu
ChatGPT Pulse existe de manière assez similaire. Ce service n’utilise pas l’historique du navigateur mais l’historique ChatGPT, ce qui en fait une recommandation potentiellement plus fiable pour les utilisateurs réguliers de ChatGPT
https://openai.com/index/introducing-chatgpt-pulse/
- On peut dire qu’en pratique presque tous les fils algorithmiques des réseaux sociaux jouent déjà ce rôle
Je pense que la plupart des idées proposées dans cet article reviennent surtout à demander une meilleure couche UI/UX sur un LLM de base
J’ai l’impression qu’il y a ici une confusion de catégorie fondamentale
Par exemple, il y a la fonctionnalité « Qu’aurait pensé Hemingway de mon texte ? », mais en réalité la réponse produite vient de cette IA, pas d’un véritable jugement de Hemingway
Si on pose la question à 100 modèles, on obtiendra 100 réponses différentes, et il est impossible de reconstituer entièrement la manière de penser ou la personnalité réelle de Hemingway à partir de quelques centaines de milliers de mots de ses œuvres.
Au fond, la vraie question est : « est-ce que cela peut vraiment sonner comme quelque chose que cette personne aurait dit ? »
Si nous voulons entendre l’évaluation d’une célébrité, c’est parce qu’elle porte le point de vue d’une vraie personne vivante. L’imitation par une IA, c’est comme essayer de manger une photo de sandwich au lieu d’un vrai sandwich
Le fait que beaucoup de gens n’arrivent pas à tracer plus clairement la limite de cette illusion me met mal à l’aise
- Je suis d’accord à 100 %
  Cela dit, en lisant ce commentaire, j’ai pensé au holodeck de Star Trek TNG. On y reconstitue des personnages célèbres comme Einstein ou Freud, et même à 15 ans, en tant que spectateur, je ne me suis jamais dit : « ce ne sont que des réponses aléatoires sorties d’un ordinateur »
  Il y a même un épisode où la tentative de recréer un personnage réel à partir d’archives se trompe (https://www.imdb.com/title/tt0708682/), puis plus tard on voit à quel point le résultat diffère réellement (https://www.imdb.com/title/tt0708720/)
  En résumé,
  1. j’ai vraiment eu l’impression que ces épisodes étaient en avance sur leur temps
  2. je n’ai jamais ressenti le moindre malaise face à ces fausses reconstitutions de personnages historiques, donc je me demande moi-même pourquoi cela me gêne dans le contexte des LLM. Est-ce simplement parce que tout le monde sait dès le départ que c’est 100 % faux, ou y a-t-il autre chose ?...
    Ce billet m’a fait réfléchir à beaucoup de choses
- On peut expliquer simplement pourquoi un AI Hemingway n’est pas vraiment nécessaire. En pratique, il existait déjà il y a environ 10 ans de bons guides d’écriture comme hemingwayapp https://hemingwayapp.com/
  Avec des règles simples, ils corrigent la grammaire et poussent vers des formulations plus simples. Le fait de ne pas tout réécrire automatiquement est peut-être même meilleur pour apprendre par soi-même
- Quand je vois beaucoup d’idées du type « une mini-app de retouche photo comme Banana, avec des centaines de templates sans prompt... », j’ai l’impression qu’au fond on voit surtout le désir humain de vivre de manière toujours plus paresseuse. « Qu’est-ce que Hemingway aurait pensé ? » me donne une sensation similaire
- Le cœur du sujet, c’est « est-ce que cette réponse plausible dans le style de cette personne peut tromper un humain ? », mais en réalité cela peut déjà être utile en soi
  Si l’humain est conscient de la tromperie, on appelle ça make-believe, ou suspension volontaire de l’incrédulité
  On passe par ce processus chaque fois qu’on joue le rôle de quelqu’un, ou qu’on essaie de réfléchir depuis un autre point de vue. C’est pareil quand on essaie d’apprendre à partir des archives d’une personne réelle ou d’un personnage de fiction
  Dire « je veux entendre l’avis de Steve Jobs/Hemingway parce que c’est un vrai humain » me semble presque l’inverse de ce qui se passe réellement
  En pratique, ce qui compte dans l’interlocuteur, ce n’est pas tant l’être humain réel que la personnalité résumée du célèbre personnage ou du caractère que nous imaginons. Très peu de gens s’attachent à la personne réelle telle qu’elle était
  Le « Hemingway célébrité » mythifié est en lui-même plus attirant. Il est même plus utile et plus intéressant que le vrai
  Donc, comme dans l’exemple de Star Trek TNG, je pense au contraire que ce genre de simulation de personnage virtuel fonctionne très bien conformément à son intention initiale
- Feynman disait que « le tout premier principe en science est de ne pas se tromper soi-même », et je pense que cela s’applique aussi aux résultats produits par les LLM
C’est vraiment intéressant
Nous avons tous vu énormément de démos de cette liste ou de technologies similaires, et beaucoup de startups investissent déjà depuis des années des centaines de millions de dollars pour construire des produits
Pourtant, on voit très peu de produits réellement utiles, et ceux qu’on croise au quotidien ne fonctionnent pas aussi bien que dans les démos
Je me demande vraiment ce qui est en train de se passer.
Autrement dit : est-ce que les produits existent bel et bien mais que presque personne ne les utilise, ou bien est-ce que les modèles suffisamment bons coûtent trop cher à faire tourner, ou encore est-ce simplement beaucoup plus facile de fabriquer une démo impressionnante qu’un vrai produit... J’aimerais comprendre les différentes possibilités
- Le coût pour atteindre des utilisateurs cibles bien précis est beaucoup trop élevé
  En discutant avec une agence de publicité pour apps fintech, on m’a expliqué qu’il faut brûler environ 20 000 dollars par mois pendant trois mois pour comprendre comment le système fonctionne ; ce n’est qu’après cela que le CAC baisse et qu’on commence à toucher les bons utilisateurs
  Dès qu’on coupe la pub, la notoriété du produit s’efface à nouveau et le flux de nouveaux utilisateurs s’arrête. On n’a alors plus aucun moyen de faire savoir que le produit existe
Une bonne partie de ces idées suppose de comprendre les goûts, les habitudes, la communication, l’emploi du temps et les données de santé de l’utilisateur
Apple pourrait avoir un vrai avantage dans ce domaine.
Comme le téléphone et la montre sont les appareils qui en savent le plus sur les données personnelles, Apple pourrait combiner intelligemment de nombreux contextes autour des LLM, à condition de garantir la protection de la vie privée
J’ai cliqué sur ce lien et j’ai été déçu de découvrir que ce n’était pas un véritable outil, mais plutôt une simple collection d’idées d’apps sans rapport concret
« un appareil de style Sony Walkman permettant aux enfants de poser des questions vocales à un LLM »
Ce n’est pas une correspondance parfaite à 100 %, mais ce produit https://www.aliexpress.com/item/1005009196849357.html y ressemble pas mal.
Ce n’est pas hors ligne, mais il est à peine plus gros qu’une balle de ping-pong
Je l’ai fait prendre en main à mes petits-enfants (5 et 3 ans) en deux minutes, puis ils ont bombardé l’appareil de questions comme « raconte-moi l’histoire de Bob la licorne » ou « est-ce qu’un chien et un singe peuvent être amis ? », et il a produit des réponses plausibles en quelques secondes à chaque fois
J’ai l’impression que ce genre de produit sera intégré dans des jouets d’ici Noël, et dès que cela arrivera, j’en achèterai un