26 points par skg09203 2026-02-18 | 4 commentaires | Partager sur WhatsApp

Il s’agit d’un serveur MCP qui traite les sous-titres YouTube côté serveur (résumé / entités / sujets / analyse de sentiment)
et ne transmet au client LLM que des résultats compressés.

Pourquoi je l’ai créé :
J’ai examiné environ 80 serveurs MCP YouTube existants, et ils envoient tous les sous-titres bruts
au LLM tels quels. Là où une seule vidéo de 20 minutes consomme environ 15 000 tokens,
ce serveur ramène cela à environ 200 à 500 tokens pour le résumé, et à environ 3 000 tokens
pour le rapport complet.
J’ai aussi prévu une utilisation via CLI pour pouvoir l’employer avec Claude skills.

Fonctionnalités principales :

  • Rapport structuré (résumé + sujets + entités + commentaires en une seule fois)
  • 9 outils MCP + CLI (mcp-yt)
  • Résumé LLM gratuit via intégration Ollama/vLLM
  • Surveillance RSS de chaîne
  • Dictionnaire de plus de 200 entités en coréen/anglais
  • Cache SQLite

pip install mcp-youtube-intelligence
Connexion directe possible avec Claude Desktop, Cursor et Claude Code.

GitHub: https://github.com/JangHyuckYun/mcp-youtube-intelligence
PyPI: https://pypi.org/project/mcp-youtube-intelligence/

4 commentaires

 
bohblue23 2026-02-19

Il semble qu’il y ait forcément un compromis en réduisant le nombre de tokens, mais je n’ai rien trouvé à ce sujet dans le README !

En ce moment, le contexte de base est de 200k, donc je suis curieux de connaître la dégradation de qualité due à la compression avec perte.

 
skg09203 2026-02-19

Bonjour !

Le résumé extractif (sans LLM) donne, de façon empirique, un résultat d’environ 6/10 par rapport à l’original. Il extrait bien les phrases clés, mais le lien entre les idées reste faible.
Le résumé par LLM (Ollama, etc.) est bien meilleur, et après l’avoir testé sur quelques vidéos de présentation et des vidéos liées au développement, j’ai eu l’impression qu’il permettait tout à fait de comprendre le contenu. En revanche, il arrive que des chiffres précis ou des nuances subtiles soient perdus.

Avec un contexte de 200k, pour une seule vidéo relativement courte, de 30 minutes à 1 heure par exemple, l’original reste préférable,
mais pour traiter en masse plusieurs centaines de vidéos ou faire des analyses répétées, je pense qu’on peut consommer moins de tokens tout en n’extrayant que l’essentiel.
(par ex. : analyse complète de la chaîne d’un concurrent, analyse de 100 vidéos de YouTubeurs spécialisés en économie, etc.)

Je vais aussi tester le README avec une plus grande variété de vidéos, et y ajouter des résultats de benchmark ainsi qu’une explication plus claire des compromis !

 
bohblue23 2026-02-19

Merci beaucoup pour votre réponse si attentionnée !! J’espère que le projet portera ses fruits !!

 
skg09203 2026-02-19

Haha, oui merci !