Collection de lectures d'articles sur le NLP
- Cette collection de lectures consacrée au traitement automatique du langage naturel (NLP) se compose de 22 éléments.
- Cette collection a été récemment mise à jour et est utile pour comprendre les dernières tendances de la recherche dans le domaine du NLP.
- Le NLP est une technologie qui permet aux ordinateurs de comprendre et de traiter le langage humain, avec de nombreuses applications comme la traduction automatique, l'analyse de sentiments et les systèmes de questions-réponses.
L'avis de GN⁺
- Cette collection constitue une ressource très utile pour les chercheurs et développeurs intéressés par le NLP, car elle offre une vue d'ensemble des recherches les plus récentes dans ce domaine.
- Le NLP est un domaine qui évolue particulièrement vite parmi les technologies d'IA, et cette collection permet de découvrir les dernières tendances ainsi que des idées innovantes.
- Les technologies de traitement automatique du langage sont profondément intégrées à notre vie quotidienne, et cette collection permet d'entrevoir leur direction d'évolution ainsi que leurs possibilités futures.
1 commentaires
Avis sur Hacker News
Il m’a fallu du temps pour comprendre cet article, car il s’appuie sur les techniques du papier « Deja Vu » et traite de méthodes complexes exploitant la sparsité :
matmul, ce slot de vecteur aura une valeur négative avant ReLU, alors on peut ne pas charger cette colonne de matrice et produire 0 ».J’espérais trouver dans la conclusion du papier une section expliquant comment cette fonctionnalité serait exposée à l’utilisateur, mais cette discussion est peut-être hors du périmètre.
Je me demande quelle part du modèle peut ne pas être chargée avant qu’on commence à voir une vraie différence de performances.
Il est intéressant de noter que les appareils Apple ont très peu de RAM par rapport aux appareils équivalents de la concurrence.
Ma compréhension du sujet est limitée, mais je me demande si cette technique permettrait d’exécuter un LLM en mode hors ligne sur un téléphone mobile.
J’apprécie que les articles récents parlent de « LLM » plutôt que d’« IA ».
Je suis un peu surpris que ce papier ne mentionne pas FlashAttention.
Apple a racheté une entreprise iranienne ?
Par exemple, le modèle OPT 6.7B présenterait 97 % de sparsité dans les couches FFN.
J’espère que cette technique sera intégrée à llama.cpp et candle.