12 points par GN⁺ 2023-12-27 | 1 commentaires | Partager sur WhatsApp

Apple veut faire tourner l’IA directement sur le matériel, plutôt que dans le cloud

  • Apple a récemment présenté, via des travaux de recherche, une méthode pour exécuter de grands modèles de langage sur smartphone, révélant ainsi son intention de rattraper ses concurrents dans le domaine de l’intelligence artificielle
  • L’article de recherche "LLM in a Flash" propose une solution aux goulets d’étranglement actuels du calcul et ouvre la voie à une inférence efficace des LLM sur des appareils à mémoire limitée
  • Cette approche ouvre la voie à une manière dont de vastes dépôts de données, qui alimentent des applications comme ChatGPT, peuvent répondre aux questions des utilisateurs, autrement dit raisonner

Recherche d’Apple en IA et perspectives du marché

  • Apple montre de nouveaux mouvements dans la recherche en IA, notamment en permettant à un modèle de génération d’images comme Stable Diffusion de fonctionner sur ses propres puces
  • Les fabricants de smartphones et de puces espèrent que les nouvelles fonctions d’IA relanceront le marché des smartphones, et selon Counterpoint Research, plus de 100 millions de smartphones centrés sur l’IA devraient être expédiés en 2024
  • Bien qu’Apple ait lancé Siri en 2011, l’entreprise est perçue comme étant restée quelque peu à l’écart de l’engouement pour l’intelligence artificielle qui a balayé la Silicon Valley après le lancement de ChatGPT par OpenAI

Défis techniques et protection de la vie privée

  • Faire fonctionner de grands modèles d’IA comme ChatGPT ou Bard de Google sur des appareils personnels constitue un défi technique majeur, les smartphones ne disposant pas des immenses ressources de calcul et de l’énergie d’un centre de données
  • Résoudre ce problème permettrait aux assistants IA de répondre plus vite que via le cloud et de fonctionner hors ligne ; en répondant aux questions directement sur l’appareil personnel, il ne serait plus nécessaire d’envoyer les données vers le cloud, ce qui pourrait aussi renforcer la protection de la vie privée

Conclusion de l’article

  • Les chercheurs d’Apple déclarent ce qui suit dans la conclusion de l’article

    « Notre recherche ne se contente pas d’apporter une solution aux goulets d’étranglement actuels de l’informatique, elle établit également un précédent pour les recherches à venir. À mesure que l’échelle et la complexité des LLM continuent d’augmenter, nous pensons que des approches comme celle-ci seront essentielles pour exploiter pleinement le potentiel des LLM sur un large éventail d’appareils et d’applications. »

L’avis de GN⁺

  • Cette recherche d’Apple ouvre la possibilité d’offrir aux utilisateurs de smartphones une expérience IA plus rapide et plus personnelle.
  • Compte tenu des inquiétudes des utilisateurs concernant la protection de la vie privée, traiter les données sur l’appareil personnel plutôt que dans le cloud peut constituer une alternative attrayante pour beaucoup.
  • Si cette technologie est commercialisée, les utilisateurs pourront accéder à des fonctions IA avancées même sans connexion Internet, ce qui devrait nettement améliorer l’utilité et le confort d’usage des smartphones.

1 commentaires

 
GN⁺ 2023-12-27
Avis Hacker News
  • Dire qu’Apple est en retard dans le domaine de l’intelligence artificielle (IA) est absurde.

    • OpenAI attire l’attention, mais la recherche repose sur les liens sponsorisés et la vente de données, ce qui la rend moins prometteuse pour l’IA.
    • Aujourd’hui, la « grande » IA est freinée par les coûts cloud liés à l’entraînement, et les grands acteurs s’efforcent de transférer le logiciel vers le matériel.
    • OpenAI collabore avec des partenaires commerciaux dans le monde entier et parle d’AGI (intelligence artificielle générale), mais cela n’est pas plus réaliste qu’une cryptomonnaie censée remplacer les banques centrales.
    • Pendant ce temps, Apple intègre des processeurs neuronaux dans ses appareils depuis plus de quatre ans, et les fonctions IA sont présentes dans toutes ses campagnes marketing.
    • La réalité augmentée de VisionOS ouvre un nouveau champ pour les usages de l’IA, avec des objectifs qui visent non seulement le divertissement, mais aussi le travail où le télétravail devient la norme.
    • Apple est le seul écosystème existant qui soit à la fois sûr et respectueux de la vie privée.
  • Je suis heureux que l’IA fasse partie des dernières versions d’iOS et s’exécute directement sur le matériel.

    • Quelqu’un partage une expérience où Siri a décrit avec précision le contenu d’une photo après la réception d’un message en conduisant.
    • Comme cette fonction est chiffrée de bout en bout (E2E), l’identification a probablement eu lieu en local, et non pendant la transmission du message.
    • C’est intéressant comme mise à jour d’amélioration de la qualité, et il y a de l’enthousiasme quant à son potentiel à mesure que l’IA pourra traiter davantage de choses sur le matériel.
  • Il est recommandé d’essayer Mistral 7B sur un appareil mobile.

    • Quelqu’un dit avoir utilisé l’application sur un iPhone 15 et juge les performances très bonnes.
    • L’inconvénient est que l’application nécessite presque toute la mémoire du téléphone, et si l’on passe à une autre application puis qu’on revient, l’état est réinitialisé et il faut recharger le modèle depuis le début.
  • Dans le monde actuel, où les téléphones et appareils sont puissants, exécuter l’IA sur l’appareil semble être l’étape suivante.

    • Quelqu’un utilise un téléphone aux spécifications solides datant de 2021 et pense qu’Apple voudra déporter les applications d’IA coûteuses vers ces appareils utilisateurs puissants.
    • Cela apparaît comme une victoire pour la vie privée pour ceux qui ne veulent pas que leurs données personnelles soient utilisées pour l’entraînement, et qui préfèrent garder le contrôle sur le modèle utilisé et l’éthique qu’il applique.
  • La bibliothèque CoreML d’Apple existe depuis plusieurs années et inclut des modèles BERT.

    • Il y a l’espoir de voir arriver sur iOS et iPadOS des modèles transformeurs plus avancés que BERT.
    • L’iPad Pro dispose de 16 Go de RAM et peut exécuter un modèle 13B.
    • Après avoir acheté un Mac Mini 32 Go, quelqu’un estime que les modèles qu’il peut faire tourner se sont nettement améliorés en six semaines.
    • Les attentes pour l’avenir sont élevées.
  • Il est intéressant de voir que l’IA pourrait créer un nouveau cycle de mise à niveau des smartphones.

    • Il reste à voir si les fonctions IA justifieront réellement une mise à niveau, et si elles affectent l’autonomie, la proposition de valeur pourrait ne pas beaucoup changer.
  • Quand l’IA pose des risques pour la confidentialité, l’exécution en local semble être la meilleure approche.

    • Quelqu’un veut à l’avenir multiplier par dix ses capacités cognitives grâce à l’IA, ce qui exigerait un échange d’informations en temps réel avec le cerveau.
    • Il ne voudrait pas être connecté à une synchronisation cloud permettant aux annonceurs et aux agences de renseignement d’espionner ses pensées.
  • Apple réduit les coûts d’exploitation de l’infrastructure nécessaire pour proposer des options IA/ML aux utilisateurs d’iPhone.

    • Cela permet d’économiser en répartissant le calcul et en tirant parti des dépenses déjà engagées pour fabriquer les appareils.
    • Cela offre aussi de la confidentialité aux consommateurs, puisque les données ne quittent pas le téléphone.
  • Il est intéressant de se demander comment des entreprises comme OpenAI réagiront si l’IA sur appareil devient dominante.

    • Comme leur modèle économique repose sur l’accès par API, elles pourraient commencer à vendre des modèles hors ligne.
    • Mais cela pourrait alors entraîner des problèmes de piratage.
  • Apple a exprimé explicitement son intention d’exécuter l’IA sur l’appareil, alors même que, dans la dernière génération, l’entreprise n’a presque pas alloué de surface de silicium supplémentaire au Neural Engine.

    • Il existe plusieurs explications possibles, et il serait intéressant d’avoir l’avis de quelqu’un qui connaît mieux le sujet.
    • Apple pense peut-être que le matériel existant est déjà suffisamment puissant, ou que l’utilisation de l’ANE ne justifie pas davantage de ressources.
    • L’entreprise prévoit peut-être aussi de généraliser davantage les calculs IA via des opérations vectorielles et autres approches similaires.
    • Dans le scénario le plus pessimiste, elle garde peut-être une grosse progression en réserve pour le moment où elle aura besoin de forcer les mises à niveau.