- Présentation d’Ahmad Khan, responsable de la stratégie AI/ML chez Snowflake
Monétiser les données « non structurées »
- Plus de 80 % des données des entreprises sont des « données non structurées » comme des documents Word, des images, des fichiers audio/vidéo
- Pourtant, la plupart des entreprises exploitent très peu ces informations, ce qui signifie qu’elles utilisent moins de 20 % des données disponibles pour prendre des décisions métier
- Placer ces données non structurées à côté de grands modèles de langage pour créer efficacement des chatbots peut aider à interpréter et analyser d’énormes volumes d’informations aujourd’hui sous-exploitées
- Le potentiel pour créer des modèles adaptés au secteur spécifique de ces entreprises est immense
Confidentialité et sécurité
- Les entreprises sont de plus en plus préoccupées par le fait que leurs données puissent être utilisées pour entraîner des modèles accessibles à d’autres sociétés, y compris leurs concurrentes
- En conséquence, elles se contentent souvent de produits moins performants offrant une meilleure sécurité, ce qui crée un marché pour des produits plus sûrs
- Par exemple, Llama 2 n’est pas le grand modèle de langage le plus performant, mais les clients le choisissent malgré tout plutôt que des modèles offrant moins de contrôle comme Chat GPT
- De nombreuses entreprises tirent leur avantage de l’unicité de leurs données et veulent donc éviter qu’elles soient exposées sur l’internet public
Obtenir un avantage concurrentiel grâce à une expérience utilisateur exceptionnelle
- Comment une startup peut-elle rivaliser avec l’échelle des grandes entreprises ?
- Il propose de se concentrer sur la création d’une expérience utilisateur agréable, notamment via une interface utilisateur attrayante
- C’est l’approche adoptée par Snowflake
- En particulier, comme la plupart de ses propres services ne peuvent pas rivaliser avec des fournisseurs cloud comme Amazon Web Services, l’entreprise s’est concentrée sur une expérience utilisateur supérieure capable de justifier des tarifs élevés
Se concentrer sur le vertical
- Une autre façon pour David de vaincre Goliath est de viser des secteurs précis comme l’industrie manufacturière, la finance, la santé ou le divertissement, plutôt que des applications généralistes
- Il conseille de « comprendre ce que recherchent les entreprises de ce secteur, puis de fournir des services qui répondent à ces besoins »
- Par exemple, Google développera probablement un grand modèle de langage pour la santé, mais il est peu probable qu’il traite ce domaine avec une profondeur particulière, ce qui laisse aux petites entreprises l’opportunité de construire ce type de modèle
La demande pour l’attribution des données augmente fortement
- Possibilité de nouveaux modèles capables de suivre les contenus protégés par le droit d’auteur et de rémunérer leurs créateurs d’origine, afin de les inciter à produire davantage
- Khan cite plusieurs cas où les modèles open source ne peuvent pas être utilisés pour des raisons juridiques, et donne l’exemple d’un studio de cinéma qui ne souhaite pas recourir à un modèle open source pour la génération d’images
- Ce studio utilise un modèle entraîné sur les données de Getty Images, avec licence et paiement
- À l’avenir, le marché de modèles similaires utilisant des jeux de données avec attribution devrait continuer à croître
Aucun commentaire pour le moment.