- Apple annonce une nouvelle fonctionnalité pour iOS et macOS exploitant un modèle de langage Transformer : fournir des suggestions de texte prédictif pendant que l’utilisateur tape
- L’un des premiers modèles basés sur un Transformer qu’Apple reconnaît publiquement, et qui doit être intégré au système d’exploitation
- Une fonction similaire à la saisie semi-automatique de Gmail, capable de compléter des mots individuels et parfois de suggérer plus de deux mots à la fois
- Le modèle de texte prédictif a été découvert dans AppleSpell, une application interne de macOS qui vérifie les fautes d’orthographe et de grammaire pendant la saisie
- Le modèle se trouve dans
/System/Library/LinguisticData/RequiredAssets_en.bundle/AssetData/en.lm/unilm.bundle, qui contient plusieurs fichiers de modèle Espresso utilisés pendant la saisie
- Le vocabulaire du modèle de texte prédictif se compose de 15 000 tokens, y compris des tokens spéciaux, des abréviations et des émojis
- L’architecture du modèle de texte prédictif semble basée sur GPT-2, avec des embeddings de tokens, un encodage positionnel, une série de blocs de décodeur et une couche de sortie
- Le modèle de texte prédictif d’Apple compte environ 34 millions de paramètres et 512 unités cachées, ce qui le rend bien plus petit que la plus petite version de GPT-2
- Grâce à sa petite taille, le modèle peut être exécuté rapidement et fréquemment sans trop consommer la batterie de l’appareil, améliorant ainsi l’expérience utilisateur
- En raison de ses limites de taille, il manque de capacités pour rédiger des phrases ou des paragraphes entiers, mais il est suffisamment performant pour proposer le mot suivant, ou parfois les deux suivants, lorsqu’il en a une forte certitude
- Pour celles et ceux qui veulent tester directement la fonctionnalité de texte prédictif, l’auteur fournit un script sur GitHub
1 commentaires
Avis Hacker News
unilm.bundleétait le nouveau modèle de prédiction de texte en observant les logs de la console du simulateur iOS.UnilmCtrlest supposé suggérer une dépendance au modèle CTRL de Socher, mais cela n’a pas été confirmé. Certains utilisateurs affirment qu’ils respecteraient davantage Apple si l’entreprise travaillait depuis plus longtemps dans le domaine du NLP.