Démos IA de Meta

(aidemos.meta.com)

1 points par GN⁺ 2025-02-10 | 1 commentaires | Partager sur WhatsApp

Meta rassemble ses dernières expériences IA et démos technologiques en un seul endroit pour permettre d’essayer de nouveaux outils en avant-première
L’espace présente des idées à la croisée de la recherche, de la créativité et de la technologie, y compris des expériences issues de FAIR et d’autres équipes de recherche de Meta
Les démos sont réparties entre des outils fondés sur les derniers modèles, des outils liés à Segment Anything, des démos ludiques et légères, et des démos techniques centrées sur les résultats de recherche
Les utilisateurs peuvent tester de nouveaux outils d’IA tout en contribuant au processus de développement des technologies IA
Certaines technologies pourraient être intégrées plus tard dans les produits Meta, ce qui en fait une vitrine pour découvrir à l’avance des fonctionnalités encore au stade expérimental

Espace d’exploration des expériences IA de Meta

AI Demos rassemble et présente les dernières expériences IA et démos technologiques créées par Meta
Des démos créées par FAIR et par d’autres équipes de recherche de Meta y sont incluses
Les utilisateurs peuvent bénéficier d’un accès anticipé à de nouveaux outils d’IA et les tester eux-mêmes

Composition des démos

Featured Experiments
- Permet de découvrir des outils propulsés par les capacités des derniers modèles
Featured Segment Anything tools
- Les outils liés à Segment Anything sont regroupés dans une catégorie distincte
Playful Ideas
- Présente des démos légères dédiées à la créativité et au jeu
Technical Explorations
- Comprend des démos techniques mettant en avant de nouveaux résultats de recherche
- Les tests des utilisateurs peuvent contribuer au développement des technologies IA, et certaines d’entre elles pourront être intégrées plus tard aux produits Meta

1 commentaires

GN⁺ 2025-02-10

Commentaires sur Hacker News

C’est une collection d’outils de démo, et Segment Anything 2 permet de créer des détourages vidéo et des effets visuels en quelques clics
Seamless Translation fait entendre votre propre voix dans une autre langue, Animated Drawings donne vie à des croquis dessinés à la main sous forme d’animations, et Audiobox permet de créer des histoires audio avec des voix et des sons générés par l’IA
- Il est indiqué que « cette démo de recherche n’est pas accessible aux résidents de l’Illinois ou du Texas, ni aux personnes s’y connectant »
  L’accès est impossible depuis l’Illinois ou le Texas, probablement à cause des lois liées à l’IA autour de la transformation vocale
  J’aimerais que les législateurs voient aussi les cas d’usage bénéfiques et ajustent la loi pour viser les abus, plutôt que de bloquer grossièrement toute l’IA générative
Seamless Translation est assez impressionnant
J’ai essayé avec l’anglais et l’espagnol, en enregistrant une phrase en anglais puis en écoutant la sortie en espagnol, et c’était assez proche de mon espagnol
Bien sûr, mon espagnol contient davantage de tournures castillanes, mais je ne m’attendais pas à ce que l’outil le sache
- Le vrai test serait sans doute de le faire essayer à un ami originaire de Mendoza, en Argentine
  Je suis bilingue, mais je n’arrive toujours pas à le comprendre, et je ne suis même pas sûr que la moitié de ce qu’il dit soit de vrais mots
- Je l’ai essayé, et ça ne ressemblait pas du tout à ma voix ; c’était juste une voix masculine « générique » qui traduisait ce que j’avais dit en allemand
  Ma femme a dit : « bof, ça ne ressemble pas du tout à ta voix », et ça me suffit
- La vraie question, c’est de savoir si la voix ressemble réellement à la vôtre, et dans mon cas, pas du tout
- On peut encore débattre de savoir si la traduction a « atteint ce niveau », mais à un moment elle sera considérée comme assez bonne pour la plupart des usages pratiques, et les barrières linguistiques disparaîtront de fait
  À ce moment-là, cela commencera forcément à avoir un certain impact sur la langue parlée, ce qui est à la fois inquiétant et fascinant
- J’ai trouvé les exemples fournis trop médiocres et trop robotiques
  Ça m’a coupé l’envie d’essayer moi-même, mais je pourrais peut-être revoir mon avis
Je me demande si, comme dans le titre HN, ils ont volontairement écrit Aidemos, ou si le bon intitulé est AI Demos
- Comme HN réajuste automatiquement les majuscules et minuscules dans les titres soumis, il est possible que le titre d’origine ait été « AIDemos by Meta »
La démo Seamless Translation est excellente
La voix traduite ressemble suffisamment à ma vraie voix, et si cela devient possible en temps réel, ce sera énorme
- C’est déjà possible
  Kyutai a présenté la semaine dernière une démo de traduction vocale en temps réel exécutée sur l’appareil ; pour l’instant, seule la traduction français→anglais fonctionne sur iPhone 16 Pro : https://x.com/neilzegh/status/1887498102455869775
  Le code d’inférence et les poids ont aussi été publiés, et sont visibles sur GitHub : https://github.com/kyutai-labs/hibiki
Je ne comprends pas bien ce que Meta cherche à obtenir avec l’IA
Ils semblent faire beaucoup de recherche, mais leur objectif final reste flou ; je comprends Google ou MSFT, mais Meta me parle moins
- Meta semble considérer qu’au bout de la course à l’IA, l’argent ne sera pas dans les datacenters ni dans les modèles, mais dans un écosystème fermé et des données monopolistiques
  Tant que les modèles et les datacenters restent des facteurs limitants, ils feront tout leur possible pour empêcher quiconque de déstabiliser Meta
  C’est similaire à Google, qui a rendu plus difficile la monétisation de la couche applicative du web afin d’empêcher l’émergence d’un écosystème fermé qui bloquerait la recherche
  Si, au terme de la concurrence, les modèles et le hardware deviennent des commodités, Meta disposera de profils psychologiques complets au niveau individuel et collectif, pourra les étudier et fournir des contenus d’une précision extrême
  Le véritable concurrent pourrait être une app façon her qui retire les gens des réseaux sociaux pour les envoyer dans leurs propres mondes isolés ; d’une certaine manière, Discord est un monde alternatif à l’écosystème Meta, en tant que petite communauté hyperciblée et accessible sur invitation seulement
- https://gwern.net/complement
  Le grand schéma du business technologique décrit par Joel Spolsky en 2002, c’est la commoditisation des compléments
  Au lieu d’une intégration verticale, la stratégie consiste, dans un produit composé de plusieurs couches essentielles, à dominer une couche tout en encourageant la concurrence au-dessus et en dessous pour éviter qu’un monopole concurrent n’émerge, puis à faire baisser ailleurs dans la stack les prix jusqu’au coût marginal afin de réduire le prix global et stimuler la demande
  Même si le produit d’origine a de la valeur et pourrait être monétisé, il peut être plus avantageux de le rendre gratuit si cela augmente les profits ailleurs
  L’exemple classique est le monopole de Microsoft sur l’OS, qui a transformé le hardware PC en commodité, au détriment d’IBM et au bénéfice de Microsoft
  Ce schéma explique aussi pourquoi les grandes entreprises tech se lancent dans des domaines qui paraissent sans rapport, voire autodestructeurs. Le taux élevé de contribution open source des entreprises Internet, ou les cas de Google investissant dans la fabrication de smartphones, le développement de navigateurs web, les logiciels statistiques, les réseaux de fibre optique, le WiFi municipal, les enchères de fréquences radio ou le DNS, peuvent tous être vus comme une tentative d’avance pour commoditiser d’autres entreprises de la stack, ou comme une défense pour éviter de subir cela soi-même
- Je me posais la même question, mais pour l’instant cela ressemble surtout à une phase d’exploration
  Un peu comme à l’époque où ils ont touché un peu à la crypto, puis mené les expérimentations “metaverse” aujourd’hui presque terminées. Bien sûr, même cette exploration coûte parfois énormément d’argent
  Ces démos montrent où l’IA pourrait être utilisée, mais il reste à voir si c’est vraiment assez important pour bouleverser le business de Meta, ou même si c’est une bonne chose pour les utilisateurs ordinaires
  Les interfaces vieillissantes et médiocres de Facebook et Instagram n’ont presque pas changé depuis plus de 10 ans, et malgré une entreprise de 70 000 personnes, on a l’impression qu’ils se concentrent désormais davantage sur l’injection toujours plus agressive de pubs que sur l’utilité
  Même si leur activité continue à se résumer au vieux Facebook de 20 ans, plein de bugs, et à l’app Instagram vieille de plus de 10 ans, si Meta contribue au progrès des modèles open source comme à l’époque de React, ce sera globalement bénéfique
- Après l’échec du ‘metaverse’, ils sont peut-être surtout impatients de dépenser de l’argent ailleurs, sur quelque chose qui pourrait devenir le prochain The Future(TM)
  Même si l’on pense que les LLM ont peu de chances d’être la prochaine grande vague, cela peut rester assez rationnel du point de vue de Meta. Ils ont énormément d’argent et de revenus, donc ils peuvent se permettre de monter dans chaque nouvelle tendance pour ne pas être distancés si l’une d’elles devient la vraie, tout en pouvant encaisser si ce n’est pas le cas
  Je soupçonne que, pour la plupart des Big Tech, l’intérêt pour les LLM relève au fond surtout de la gestion du risque
- D’après ce que j’ai entendu de quelqu’un concerné, l’objectif de Meta avec l’IA est d’améliorer le ciblage publicitaire
  Une meilleure classification et un meilleur clustering, de meilleures “recommandations” pour les annonceurs, y compris pour les éléments visuels, les textes et même les vidéos
  Ces démos sont un effet secondaire, ou relèvent presque du “greenwashing”. Le cœur de métier de Meta, et son unique vrai business, c’est la publicité ; toutes les autres tentatives de monétisation ont échoué
La démo Segment Anything est assez impressionnante, et je me demande si elle est intégrée quelque part dans un vrai produit
Je fais un peu de montage vidéo simple pour des amis comme hobby, et ça a l’air assez utile
[0] https://sam2.metademolab.com/
- Photoroom [0] vient de Y Combinator, et le produit ressemble essentiellement à SAM avec beaucoup de peaufinage et une bonne UX par-dessus
  Je ne sais pas s’ils l’utilisent réellement, mais si ce n’est pas le cas, ils devraient
  [0] https://www.photoroom.com/
- SwarmUI, un frontend pour les modèles de génération d’images, intègre SAM2 pour permettre de masquer rapidement certaines parties d’une image dans des tâches comme l’inpainting
  C’est vraiment bien
- C’est probablement déjà utilisé, mais sans doute pas présenté comme tel
Pour ceux que ça intéresse, Meta FAIR signifiait “Facebook Artificial Intelligence Research”, puis le nom a été changé en “Meta AI”[1]
[1]: https://en.wikipedia.org/wiki/Meta_AI
La liste n’est pas exhaustive
Par exemple, il manque la démo de Meta Motivo, un modèle de contrôle pour humanoïdes : https://metamotivo.metademolab.com/
Meta comprend profondément l’impact de la différence entre GPT-3 et ChatGPT
Le modèle n’est que le point de départ ; c’est l’expérience utilisateur qui fait ressortir l’intelligence de ce qu’on peut faire avec ce modèle
C’est particulièrement visible avec les modèles visuels : dire que SAM2 peut “voir n’importe quoi” est intéressant, mais voir qu’après avoir cliqué sur un ballon de football il le suit de manière fluide dans toute la vidéo, même lorsqu’il est occulté, c’est impressionnant
« Le site n’est actuellement pas disponible dans cette région » s’affiche
- Les réglementations sur l’IA diffèrent entre les marchés internationaux et certains États américains, donc les entreprises doivent gérer les produits d’IA avec beaucoup de prudence
  C’est pourquoi les modèles de pointe sont parfois proposés plus tard dans certaines régions
  Vérifier et documenter toute la conformité pour chaque petite démo aurait sans doute un coût disproportionné par rapport à sa valeur, donc ils ont probablement indiqué que c’était autorisé seulement aux États-Unis et dans quelques régions
- Ce message s’affiche aussi aux États-Unis
- J’ai vu ce message depuis les États-Unis, mais j’ai pu le contourner en réglant mon VPN sur LA
  Peut-être parce que les ingénieurs de Meta sont là-bas ¯\(ツ)/¯
  Une fois connecté, il y avait cette mention :
  « Cette démo de recherche n’est pas accessible aux résidents de l’Illinois ou du Texas, ni aux personnes qui s’y connectent »
  Je suis au Texas

Démos IA de Meta

Espace d’exploration des expériences IA de Meta

Composition des démos

Featured Experiments

Featured Segment Anything tools

Playful Ideas

Technical Explorations

À lire aussi

1 commentaires

Commentaires sur Hacker News