MCP YouTube Intelligence — serveur MCP pour analyser efficacement les vidéos YouTube en tokens
(github.com/JangHyuckYun)Il s’agit d’un serveur MCP qui traite les sous-titres YouTube côté serveur (résumé / entités / sujets / analyse de sentiment)
et ne transmet au client LLM que des résultats compressés.
Pourquoi je l’ai créé :
J’ai examiné environ 80 serveurs MCP YouTube existants, et ils envoient tous les sous-titres bruts
au LLM tels quels. Là où une seule vidéo de 20 minutes consomme environ 15 000 tokens,
ce serveur ramène cela à environ 200 à 500 tokens pour le résumé, et à environ 3 000 tokens
pour le rapport complet.
J’ai aussi prévu une utilisation via CLI pour pouvoir l’employer avec Claude skills.
Fonctionnalités principales :
- Rapport structuré (résumé + sujets + entités + commentaires en une seule fois)
- 9 outils MCP + CLI (
mcp-yt) - Résumé LLM gratuit via intégration Ollama/vLLM
- Surveillance RSS de chaîne
- Dictionnaire de plus de 200 entités en coréen/anglais
- Cache SQLite
pip install mcp-youtube-intelligence
Connexion directe possible avec Claude Desktop, Cursor et Claude Code.
GitHub: https://github.com/JangHyuckYun/mcp-youtube-intelligence
PyPI: https://pypi.org/project/mcp-youtube-intelligence/
4 commentaires
Il semble qu’il y ait forcément un compromis en réduisant le nombre de tokens, mais je n’ai rien trouvé à ce sujet dans le README !
En ce moment, le contexte de base est de 200k, donc je suis curieux de connaître la dégradation de qualité due à la compression avec perte.
Bonjour !
Le résumé extractif (sans LLM) donne, de façon empirique, un résultat d’environ 6/10 par rapport à l’original. Il extrait bien les phrases clés, mais le lien entre les idées reste faible.
Le résumé par LLM (Ollama, etc.) est bien meilleur, et après l’avoir testé sur quelques vidéos de présentation et des vidéos liées au développement, j’ai eu l’impression qu’il permettait tout à fait de comprendre le contenu. En revanche, il arrive que des chiffres précis ou des nuances subtiles soient perdus.
Avec un contexte de 200k, pour une seule vidéo relativement courte, de 30 minutes à 1 heure par exemple, l’original reste préférable,
mais pour traiter en masse plusieurs centaines de vidéos ou faire des analyses répétées, je pense qu’on peut consommer moins de tokens tout en n’extrayant que l’essentiel.
(par ex. : analyse complète de la chaîne d’un concurrent, analyse de 100 vidéos de YouTubeurs spécialisés en économie, etc.)
Je vais aussi tester le README avec une plus grande variété de vidéos, et y ajouter des résultats de benchmark ainsi qu’une explication plus claire des compromis !
Merci beaucoup pour votre réponse si attentionnée !! J’espère que le projet portera ses fruits !!
Haha, oui merci !