Édition — LLM diskscan, le scanner de disque qui repère les fichiers en double et vous dit quel type d’utilisateur vous êtes
Dans l’édition, l’une des tâches les plus difficiles au quotidien est le rangement des fichiers et des dossiers. Comme il arrive très souvent de dupliquer un même projet dans plusieurs dossiers pour avancer, ces dossiers identiques ne se retrouvent pas seulement sur mon disque, mais aussi en grand nombre sur ceux des employés.
Je l’avais déjà développé en Python il y a un an, puis j’en ai fait une application en go whails, et cette fois-ci j’ai renforcé cette fonctionnalité en la réécrivant en Rust. L’outil analyse aussi les formats de fichiers et les fichiers cachés pour produire un rapport indiquant quel type d’utilisateur de disque vous êtes.
Sur Mac, Windows, Linux, NAS et dans le cloud, il compare les fichiers et projets en double pour déterminer s’il s’agit du même fichier, si une version est plus récente, et supprime tous les fichiers inutiles parmi les fichiers de travail, comme ._.
Il effectue des comparaisons de doublons à l’échelle du disque et génère des rapports, avec une comparaison de l’original basée sur le hachage.
Il propose aussi une fonction de « lecture » du disque et génère un rapport sur le type de nouveaux travaux ou de projets en cours. C’est un programme local, et vous pouvez choisir entre des LLM locaux comme Ollama et LMStudio, ainsi que GeminiAPI et l’API OpenAI.
Téléchargement
Mac
https://drive.google.com/file/d/…
Installateur Windows
1 commentaires
La partie qui organise les fichiers en double sur la base de hachages semble être une approche fiable.
J’ai rencontré un problème similaire en pratique :
même quand les noms de fichiers sont identiques, il arrive que leur contenu réel soit différent,
ou que des fichiers de travail intermédiaires (
.tmp,._, etc.) soient mélangés,donc un simple comparatif ne permettait pas vraiment de faire le tri correctement.
La partie où le LLM produit aussi un rapport sur le type d’utilisateur est intéressante,
mais selon quels critères ce rapport est-il généré ?
Par exemple, est-ce basé sur la structure des fichiers ou sur la répartition des extensions ?