- Un récent article de MIT Technology Review présente l’idée de comparer les LLM locaux à une sauvegarde hors ligne de Wikipédia
- Une comparaison directe est faite entre la taille des principaux fichiers de modèles LLM de la bibliothèque Ollama et celle des bundles Wikipédia hors ligne proposés par Kiwix
- Les fichiers LLM et les données de Wikipédia ont des objectifs, des forces et des faiblesses différents, ce qui rend une comparaison simple difficile, mais des écarts intéressants apparaissent en termes de taille
- Certains LLM (modèles de 1 à 4 Go) sont plus volumineux qu’une version simple de Wikipédia en anglais (environ 1 Go), tandis que l’intégralité de Wikipédia (57 Go) est plus grande que de gros LLM (20 à 32 Go)
- Au-delà de la taille des fichiers, il faut tenir compte d’aspects concrets comme la mémoire et les besoins CPU, et le choix peut varier selon l’usage réel
Comparaison entre les LLM locaux et Wikipédia hors ligne
Introduction et origine de la comparaison
- MIT Technology Review a récemment présenté un article intitulé "How to run an LLM on your laptop"
- L’article souligne qu’en exécutant un LLM en local, il devient possible d’exploiter des connaissances même dans un environnement hors ligne
- La métaphore de Simon Willison — « un LLM hors ligne ressemble à une version résumée et incomplète de Wikipédia, mais en situation d’apocalypse, avoir juste une clé USB pourrait aider à redémarrer la société » — est particulièrement marquante
Comparaison de la taille des modèles et des données
- Plusieurs modèles LLM de la bibliothèque Ollama sont comparés à la taille des fichiers des bundles Wikipédia hors ligne fournis par Kiwix
- Pour cette comparaison, l’analyse se limite à des modèles pouvant tourner sur du matériel grand public courant, ainsi qu’à des données Wikipédia sans images
- Les principaux résultats sont les suivants :
- Les plus petites versions résumées
- Best of Wikipedia (top 50 000, résumé) : 356.9MB
- Simple English Wikipedia (résumé) : 417.5MB
- Modèles LLM représentatifs (petits)
- Qwen 3 0.6B : 523MB
- Deepseek-R1 1.5B : 1.1GB
- Llama 3.2 1B : 1.3GB
- Modèles LLM représentatifs (moyens à grands)
- Deepseek-R1 8B / Qwen 3 8B : 5.2GB
- Gemma3n e4B : 7.5GB
- Deepseek-R1 14B : 9GB
- Qwen 3 14B : 9.3GB
- Wikipédia dans son intégralité
- Wikipedia (intégral) : 57.18GB
- Les 50 000 articles les plus importants de Wikipédia tiennent dans 356.9MB, ce qui est très léger
- Le plus petit LLM (0.6B, Qwen) fait 523MB, soit plus qu’une simple version résumée de Wikipédia
- L’intégralité de Wikipédia (57.18GB) est bien plus volumineuse que le plus gros LLM (20GB)
Limites de la comparaison et points à considérer
- Une comparaison directe est difficile : une encyclopédie (des données) et un LLM (un modèle génératif) diffèrent fondamentalement par leur objectif et leur structure
- La taille du fichier n’est pas le seul critère important : au-delà de sa taille, un LLM demande aussi beaucoup de mémoire et de ressources CPU à l’exécution. Wikipédia hors ligne est plus facile à utiliser sur des appareils modestes
- Utilité selon l’usage réel : on peut par exemple ne télécharger que le domaine de la chimie, ou utiliser un LLM optimisé pour un matériel donné
- Subjectivité des critères de sélection : le choix des éléments retenus pour la comparaison reste subjectif
Conclusion et enseignements
- Les 50 000 articles les plus importants de Wikipédia et le modèle Llama 3.2 3B se situent à peu près au même niveau en taille de fichier
- Les plus petits bundles Wikipédia sont même plus petits que le plus petit LLM, tandis que le fichier Wikipédia complet est plus grand que le plus gros LLM
- Dans un environnement disposant d’un espace de stockage suffisant, il peut être pertinent de télécharger et utiliser à la fois un LLM et les données de Wikipédia
1 commentaires
Avis Hacker News
gpgkeypointait vershttp, ce qui ruinait la sécurité.wikipedia_en_all_maxi_2024-01.zim, avec l’idée d’extraire les pages via libzim pour les relier à un LLM. Le fichier zim stocke les pages en HTML et pèse environ 100 Go. La raison, c’est que je veux faire correspondre une grande liste de jeux stockée sur HDD (uniquement les titres, sans catégories séparées) avec des articles Wikipédia afin de les organiser par genre ou autres informations. Mes essais montrent qu’un LLM (Mistral Small 3.2 quantized) remet étonnamment bien de l’ordre dans ce chaos. On peut aussi le faire tourner rapidement via un script personnalisé avec llama.cpp.Qwen3 32Bpourrait servir d’aide au code, donc ce sera peut-être exploitable un jour.$1-distill-$2» (parfois sans «-distill») sont des modèles$2entraînés sur les sorties de$1dans un processus de « distillation des connaissances » ; contrairement à ce que leur nom laisse penser, ce ne sont donc pas réellement$1. Des modèles cités dans l’article comme «Deepseek-R1 1.5B» n’existent pas réellement en tant que tels ; ils relèvent de ce type de dénomination.