Qui fixera le prix de l’intelligence ?

(x.com/JayaGup10)

2 points par GN⁺ 3 시간 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp

L’IA transforme l’intelligence en ressource tarifée, et toutes les couches du marché se disputent désormais le contrôle de ce prix
Les labs d’IA veulent que l’usage transite par eux, les applications cherchent à prouver qu’elles peuvent mieux allouer l’intelligence que les labs, et les États veulent que l’intelligence devienne assez bon marché pour constituer une infrastructure nationale
Le coût de l’intelligence n’est plus seulement une variable d’entrée du logiciel, mais un axe qui reconfigure les entreprises, les marchés et la géopolitique
Si l’investissement dans l’IA diffère de l’investissement logiciel, c’est parce qu’il y a davantage de variables, que ces variables sont couplées de manière inégale, et que chacune se décompose en sous-variables évoluant selon leur propre courbe
Il s’agit d’analyser un système dont l’équation elle-même est réécrite chaque heure, une recomposition continue où n’importe quelle variable, si elle bouge assez, change la signification de toutes les autres

Pourquoi l’investissement dans l’IA diffère de l’investissement logiciel

Dans le logiciel, le pattern matching fonctionnait, même imparfaitement, et le coût de distribution déterminait l’efficacité de l’acquisition client tandis que le coût de changement décidait de la rétention et de l’expansion
- CAC payback, NDR, magic number et Rule of 40 ne sont tous que des conséquences secondaires de ces deux forces
L’IA fait voler cela en éclats pour trois raisons
- Le système comporte davantage de variables
- Les variables sont couplées de manière inégale
- Chaque variable se décompose en sous-variables évoluant selon sa propre courbe
Dès que capability, cost, latency, deployment, regulation ou talent bouge, la signification des autres change aussi, et quand une contrainte est levée, la contrainte importante suivante change à son tour

Ce que chaque variable change

Les variables déjà familières et largement discutées sont capability, cost et latency
Les variables plus difficiles sont les unlocks issus de la recherche et du produit, dont la nature et la profondeur sont difficiles à modéliser à l’avance, et dont le rythme d’arrivée continue d’accélérer
Des contraintes que le logiciel traitait comme des constantes deviennent dans l’IA des choix stratégiques : geopolitics, deployment, talent
Capability
- Elle se décompose en reasoning, context, multimodality, tool use, planning, memory et controllability, chacun évoluant violemment selon sa propre courbe
  - Le context est passé en 3 ans de 4 000 tokens à plus d’1 million de tokens
  - Le reasoning a évolué de simple astuce de prompting vers une classe de modèles à part entière
- Elle a absorbé des infrastructures comme les retrieval pipelines, output parsers et prompt scaffolds, qui étaient des prothèses destinées à compenser les faiblesses des modèles
- Un modèle capable d’embarquer un prompt et un modèle capable d’embarquer une base de code ou l’historique client sont deux produits différents, et l’amélioration des performances ne fait pas progresser toutes les applications de façon égale, elle déplace le goulot d’étranglement
Cost
- La baisse des coûts ne fait pas qu’améliorer les marges, elle change qui peut concurrencer
  - Des workflows qui nécessitaient autrefois une API frontier migrent vers des modèles open-weight bon marché, des modèles spécialisés fine-tunés, ou des stacks routées, et des produits premium retombent au rang de commodity feature
- DeepSeek montre de manière encore plus brutale qu’un changement d’anticipation des coûts dans la couche modèle peut rediriger les poches de marge situées au-dessus
Latency
- Elle devient une variable à mesure que l’IA passe du prompting asynchrone à des workflows en temps réel
  - Un modèle lent convient pour rédiger une note, mais s’effondre dans un sales call, une conversation de support, une session de tutorat ou une réponse de sécurité
- Dès lors qu’un humain attend de l’autre côté, la latency n’est plus un détail de performance mais une condition de viabilité du marché
  - La voice a franchi cette ligne quand qualité, gestion des interruptions et prix à quelques centimes par minute sont arrivés ensemble
- La baisse de la latency ne rend pas seulement le même produit plus rapide, elle ouvre de nouvelles surfaces d’usage
Nouvelles courbes
- Il y a 2 ans, on n’aurait pas pu mettre sur la liste l’inference-time compute, le task horizon, ni l’IA comme input de sa propre production
- Inference-time compute
  - Le fait de pouvoir dépenser 10x plus de compute pour obtenir une meilleure réponse est un élément vraiment nouveau, absent du logiciel précédent, et transforme le coût par résultat en choix délibéré
    - Une requête de 10 secondes et une requête de 10 minutes sur le même modèle sont deux produits différents à deux prix différents, et la marge dépend moins du prix du modèle que du jugement du système
  - C’est la contre-attaque de la couche applicative face aux labs : plus les modèles frontier absorbent de logique produit, plus chaque entreprise doit affirmer qu’elle alloue mieux les tokens du client
  - Les labs sont incités à augmenter l’usage, tandis que les applications sont incitées à ne dépenser que là où cela produit une valeur mesurable
- Task horizon
  - Si l’inference-time compute est le cadran de la profondeur, le task horizon est le cadran de la longueur : le temps pendant lequel l’IA fonctionne seule avant intervention humaine
    - L’unité passe de l’appel au workflow
    - Des agents peuvent fonctionner pendant des heures, créer des sous-agents et consommer des millions de tokens par chemin de décision, si bien que l’usage n’est plus proportionnel au nombre de seats
  - Longueur multipliée par profondeur, et l’on obtient la facture de tokens que tous les CFO du Fortune 500 demandent désormais
- L’IA comme input de sa propre production
  - L’IA sert à générer des synthetic data, écrire du code, produire des evals et compresser les cycles d’expérimentation
    - Chaque génération réduit le temps nécessaire à construire la suivante, ce qui rend le rythme du changement endogène
  - Cette récursivité a raccourci le cycle du changement sous celui du fundraising, et réduit au passage la demi-vie de certaines thèses
Geopolitics
- C’est là que la guerre devient explicite, et la Chine est structurellement poussée vers l’efficacité et la publication open-weight
  - Un accès limité aux puces et l’exclusion de certaines parties de la stack frontier rendent cette stratégie rationnelle
- Les États-Unis peuvent encore rester compétitifs avec des modèles frontier open-weight, mais n’ont pas encore produit la même réponse structurelle
- Le logiciel n’avait pas besoin d’entraînements à plusieurs milliards de dollars, mais des open weights frontier exigent du compute financing, du patient capital, une gouvernance de release, une serving infrastructure et des instruments de compétition pour les talents
  - Certains groupes américains devront justifier ce coût d’entraînement via de la fédération ou du financial engineering
- Les labs frontier, convaincus que la technologie est risquée, défendent une régulation fondée sur les capabilities et bénéficient d’un monde où l’accès frontier est contrôlé, audité, mesuré et maintenu derrière une API
- DeepSeek n’est pas seulement la publication d’un modèle, mais un coup de feu dans la guerre autour de la fixation du prix de l’intelligence
Deployment
- La valeur ne revenant pas entièrement au cloud, tout reste encore fluide
  - L’inférence se déplace vers l’endroit le moins cher tant que cela ne casse pas le produit : le reasoning frontier va dans le cloud, la latency à l’edge, la confidentialité et la personnalisation on-device, et les workflows qui exigent les trois deviennent hybrides
- Comme les modèles n’archivent pas seulement des données mais raisonnent sur le context, la memory, les documents, la voice, le code, le comportement et les permissions d’entreprise des utilisateurs, la confidentialité devient encore plus importante que dans le SaaS
- L’endroit où l’inférence a lieu détermine qui capte la marge, qui possède le context et à qui le client fait confiance
Talent
- Dans le SaaS, le talent était une variable d’exécution : de meilleures équipes construisaient plus vite, vendaient mieux et opéraient avec plus de discipline
- Dans l’IA, le talent est une matière première de production, car un petit nombre de chercheurs peut changer l’architecture, le data mixture, le régime d’evals, et la courbe coût-capability elle-même
  - L’équipe ne se contente plus d’exécuter selon le marché, elle peut changer la forme du marché
- Ce n’est plus seulement la qualité opérationnelle qui compte, mais aussi le research taste comme composante de l’actif

La menace n’est plus le concurrent

Dans le SaaS, on mourait généralement face à une autre entreprise : un concurrent mieux financé, une équipe plus rapide, un acteur établi étendant son territoire
- Il existait une exception : les entreprises bâties au-dessus d’une plateforme tierce pouvaient disparaître sans concurrent direct à cause d’un changement de prix ou de conditions
- L’IA fait de cette exception la règle par défaut
La menace dans l’IA est la migration de couche : dès qu’une variable comme capability, cost, latency, deployment, regulation ou trust change suffisamment, le travail se déplace
- Il peut migrer vers le modèle, vers une alternative open-weight, vers la plateforme de données du client, vers un runtime agentique, ou vers l’appareil lui-même
Une autre variable est la demande : les acheteurs bougent lentement, mais ne sont pas naïfs, et comme ils comprennent le coût du lock-in, l’arbitrage lié à ce délai se referme

La façon de construire une entreprise s’inverse aussi

Les anciennes hypothèses et les conseils traditionnels du VC disparaissent
- Si le SaaS vendait de la productivité et de la bonne humeur, l’IA vend de plus en plus des outcomes et des services, une activité moins indulgente où le produit n’est bon que si le résultat fonctionne, et où l’entreprise ne fonctionne que si ce résultat est produit avec assez d’efficacité
Divergence entre Consumer et Enterprise
- Côté consumer, l’ampleur suffit : rapide, bon marché, utile à large échelle, et pardonnable en cas d’échec
- Côté enterprise, les critères sont différents : il faut fonctionner à l’intérieur d’un workflow précis, en intégrant le context, les permissions, les données et la tolérance au risque du client
  - C’est pourquoi un modèle frontier seul n’est pas un produit enterprise ; la valeur se loge dans les couches d’application, d’orchestration, de services et de données propriétaires qui rendent le modèle utile à l’intérieur de l’entreprise
Distribution et Talent
- Le modèle d’hier peut rendre possible un nouveau produit, ce qui permet à une entreprise de se repositionner dès le mardi suivant
  - Certaines entreprises ont déjà changé le profil de leurs forces de vente pour recruter des personnes capables de vendre une cible mouvante
  - Dans certains cas, partir top-down fonctionne d’emblée
Structure économique
- Le services-as-software change la tarification, et les partenariats avec des intégrateurs systèmes arrivent plusieurs années plus tôt que dans les playbooks classiques
- Le marché se divise : certains investisseurs, voyant des portefeuilles où le produit est sans cesse reconstruit, concluent que le produit compte peu et que les services sont la vraie activité ; d’autres rejettent tout ce qui ressemble au conseil
- La vérité plus inconfortable est que dans l’IA, product, services, deployment et distribution sont en train d’être recombinés différemment selon les entreprises
Innovation des fondateurs
- ICP étroit, un seul wedge, construction lente, recrutements prévisibles, rétention product-led : rien de cela ne suffit sur un marché où les variables ne restent pas stables et où les clients ne veulent pas de point solutions
- Ce qui semble gagner, ce sont des boucles de feedback rapides, de petites équipes disposant d’autorité, et une aisance à se réorganiser en fonction du changement plutôt qu’en suivant un plan vieux de 6 mois

Le défi désormais posé aux fondateurs et aux États

Dans l’IA, la valeur n’est pas captée une fois pour toutes avant d’être défendue ; elle est revalorisée et redéployée en continu, et les variables servent à lire la direction et la vitesse de ce redéploiement
- Toute entreprise IA repose sur une pile d’hypothèses, et les entreprises solides savent sur quelles hypothèses elles sont longues et sur lesquelles elles sont courtes
Investir et construire dans l’IA ressemble moins à l’analyse d’acquisition d’une entreprise logicielle qu’à la gestion d’un trading book
- On est long sur certaines courbes, short sur d’autres, avec une exposition à des corrélations qui peuvent casser au moment le plus critique
Il faut choisir sur quelles variables parier, savoir quelles variables peuvent vous tuer, et construire l’entreprise pour récupérer plus vite avant qu’un mauvais pari ne se compose
Dimension politique
- Le gouvernement américain serait mieux placé s’il parvenait à traiter deux variables à la fois : contrôler la frontier dangereuse, sans rendre l’intelligence si chère que seuls les labs fermés et les pays concurrents puissent définir l’avenir
- Le pays gagnant ne sera ni celui qui régule le plus ni celui qui ouvre le plus, mais celui qui trouvera comment rendre l’intelligence assez sûre pour être digne de confiance et assez bon marché pour se diffuser

Qui fixera le prix de l’intelligence ?

Pourquoi l’investissement dans l’IA diffère de l’investissement logiciel

Ce que chaque variable change

Capability

Cost

Latency

Nouvelles courbes

Inference-time compute

Task horizon

L’IA comme input de sa propre production

Geopolitics

Deployment

Talent

La menace n’est plus le concurrent

La façon de construire une entreprise s’inverse aussi

Divergence entre Consumer et Enterprise

Distribution et Talent

Structure économique

Innovation des fondateurs

Le défi désormais posé aux fondateurs et aux États

Dimension politique

À lire aussi

Aucun commentaire pour le moment.