25 points par xguru 2025-10-18 | 2 commentaires | Partager sur WhatsApp
  • App macOS native développée avec SwiftUI, elle enregistre l’écran à 1 FPS et effectue une analyse IA toutes les 15 minutes pour générer automatiquement une chronologie et des résumés
    • Il est possible de rejouer un timelapse pour revoir visuellement le déroulement de la journée
  • Vise une conception légère et peu gourmande avec un objectif d’environ 25 Mo pour l’app, ~100 Mo de RAM et <1 % de CPU, tout en offrant une UX centrée sur le local sans dépendances distribuées
  • L’IA peut traiter les données via Gemini (avec votre propre clé) ou des modèles locaux (Ollama·LM Studio)
  • Les données enregistrées sont supprimées automatiquement après 3 jours pour optimiser la gestion des ressources et protéger la vie privée
  • Coming Soon
    • Tableau de bord personnalisable à l’infini : posez n’importe quelle question, transformez les résultats en tuiles et suivez-les dans la durée
    • Journal quotidien : enregistrement des temps forts rétrospectifs, prise en compte de prompts guidés, et conservation de captures d’écran et notes avec la chronologie
  • Fonctionnement
    • Capture : enregistrement de l’écran à 1 FPS en segments de 15 secondes
    • Analyze : toutes les 15 minutes, les segments récents sont envoyés au fournisseur IA sélectionné pour analyse
    • Generate : création de cartes récapitulatives d’activité pour construire une chronologie ordonnée dans le temps
    • Display : affichage du déroulement de la journée via une interface de chronologie visuelle
    • Cleanup : suppression automatique des enregistrements après 3 jours pour gérer l’espace de stockage

2 commentaires

 
oh3vci 2025-10-21

Je l’utilise en local, et j’ai l’impression qu’il analyse mal le coréen. D’après ce qui est enregistré, on dirait que seules les parties écrites en anglais sont prises en compte.

 
GN⁺ 2025-10-18
Commentaires sur Hacker News
  • Je pense que ce produit aurait beaucoup de succès auprès des avocats ou des professions qui facturent à l’heure, car il permettrait de reconstituer le travail manqué dans la journée et d’éviter les pertes de facturation, ce qui les rendrait probablement prêts à payer cher

    • Cela dit, je me dis aussi que ça pourrait révéler à quel point les avocats travaillent peu par rapport au temps facturé
    • Moi aussi, en tant que prestataire logiciel, j’ai toujours voulu cette fonctionnalité, et je suis justement en train d’en faire un prototype simple sous Linux
    • Au Royaume-Uni, ce n’est même pas à l’heure qu’on facture, mais par tranches de 6 minutes, ce qui en dit long sur la culture professionnelle
  • Très bon produit ! J’utilise actuellement ActivityWatch sur PC pour suivre mon activité
    Voici ce que j’aimerais dans ce type de logiciel

    • Une fonction qui identifie le point de départ d’une distraction : par exemple, j’ouvre ma messagerie pour consulter un email précis, puis je finis par lire des emails sans rapport et je pars sur autre chose pendant 5 à 15 minutes ; avoir cette information aide à passer à l’action pour réduire les distractions ; par exemple, après avoir installé une extension qui masque les vidéos recommandées sur YouTube, j’ai réellement été moins distrait, et je ferme aussi toutes les fenêtres inutiles pour éviter que mon attention ne parte ailleurs
    • Repérer les tâches récurrentes et leur fréquence : par exemple, si je rédige manuellement une facture presque identique chaque semaine pour un cas d’exception particulier, je peux alors me demander si ce travail est automatisable
    • Enregistrer l’état émotionnel avant, pendant et après une tâche : c’est la question la plus large et la plus difficile à définir, mais je pense qu’il y a là un vrai potentiel pour améliorer la procrastination et faciliter le démarrage du travail
    • Ce serait vraiment bien d’avoir des fonctions qui aident à comprendre les schémas de distraction propres à chacun ; moi aussi, j’utilise cette même extension YouTube
  • Ma première pensée a été que ce genre de produit pourrait aussi énormément aider les personnes avec un TDAH
    On pourrait identifier ce qui déclenche les distractions et quels schémas récurrents existent (par exemple : ouvrir Hacker News à chaque git commit et y perdre 15 minutes)
    Le fait de pouvoir revoir automatiquement l’historique capturé est vraiment énorme ; à l’époque, j’avais eu beaucoup de succès avec TimeRescue pour mesurer précisément le temps facturé aux clients
    Mais les outils qui demandent une saisie manuelle finissent toujours par casser la concentration ou par être oubliés, donc je ne les utilise jamais longtemps
    En allant un cran plus loin, ce serait bien d’avoir une fonction qui m’avertit en temps réel, malgré la latence de traitement, que je suis en train de me disperser ; on pourrait imaginer que l’utilisateur définisse lui-même ce qu’est une distraction, ou que le système devienne plus intelligent grâce au feedback
    Je trouve le produit très séduisant, et même si j’aimais bien l’idée de Windows Recall, je suis content de voir ici une approche centrée sur la confidentialité

  • J’aime beaucoup le concept du produit, mais le fait que le développeur ait sorti soudainement une application qui pourrait facilement devenir un spyware alors que son GitHub était presque vide m’inquiète, surtout sur les aspects de sécurité comme les mots de passe

    • Si le code source est déjà sur GitHub, il est facile de lever ces inquiétudes en vérifiant directement le code plutôt qu’en se focalisant sur le profil
  • Je ne suis pas à l’aise avec l’idée d’envoyer à Gemini des données sensibles comme mes informations bancaires ou mes mots de passe
    Je me demande quelle différence de performance il y aurait avec un modèle local

    • Si je devais noter d’après mon expérience et mes évaluations, Gemini 2.5 pro serait à A-, et qwen2.5vl autour de B-/C+ ; comme les résultats ne sont pas toujours déterministes, il est difficile de garantir la qualité
      Les derniers articles semblent indiquer qu’avec des techniques de distillation, des modèles locaux peuvent aussi atteindre des performances SOTA, donc je compte faire moi-même des essais dans cette direction
    • Si vous utilisez Gemini grand public et non une version enterprise, toutes les informations sensibles présentes dans les prompts et les réponses sont exposées à Google à 100 %
    • Google a déjà mes emails, mon navigateur, l’OS de mon smartphone et même certains de mes mots de passe, donc je pars du principe que toutes mes données confidentielles ont déjà été compromises
    • Normalement, les mots de passe ne s’affichent pas à l’écran et passent directement du gestionnaire de mots de passe vers un champ de saisie masqué, donc ils ne devraient pas apparaître à l’écran
  • Le concept est similaire à screenpipe, mais screenpipe offre davantage de personnalisation
    github.com/mediar-ai/screenpipe

    • Je suis le fondateur de screenpipe, et je serais ravi de voir plus de produits de ce genre ; idéalement en OSS, en local, sans vendor lock-in, et compatibles API/MCP
      Ce qui est dommage, c’est qu’il ne prend actuellement en charge que macOS ; de mon côté, j’utilise surtout Windows ces temps-ci
  • Super projet ! J’ai eu une expérience similaire avec Rewind, avec des inquiétudes liées à la confidentialité
    Pour info, Rewind effectue l’OCR en local et n’envoie que les données textuelles
    Si l’objectif est de se concentrer sur macOS, il est possible d’utiliser VNRecognizeTextRequest pour éviter toute la complexité d’un pipeline OCR
    Surtout si vous utilisez une IA cloud, vous pouvez employer un modèle léger comme BERT pour détecter et masquer les informations sensibles

    • Je ne connaissais pas VNRecognizeTextRequest, c’est vraiment impressionnant, merci pour la découverte
  • Je me demande si, lors d’un Zoom ou d’une visioconférence, faire une capture plutôt qu’un enregistrement oblige légalement à signaler qu’il s’agit d’un « enregistrement »
    J’aimerais aussi savoir si la présence de sous-titres en direct ou d’une fonction de transcription change les obligations légales

    • Dans mon État, capturer un écran Zoom sans signaler qu’on enregistre est en général illégal ; je ne suis pas totalement sûr, mais le point essentiel semble être le fait d’enregistrer une vidéo à 1 fps, pas de savoir s’il y a ensuite un résumé par IA
  • Ce produit est vraiment excellent, et la charge mentale est bien plus faible qu’avec les time trackers classiques qu’il faut alimenter soi-même
    J’aime aussi le fait qu’il y ait une option locale et une option BYO key, ce qui laisse un vrai choix en matière de confidentialité
    On a l’impression que ce type de produit aurait dû exister plus tôt, et celui-ci donne vraiment le sentiment d’être très bien exécuté

  • Moi aussi, je serais prêt à l’utiliser uniquement avec des modèles locaux ; c’est vraiment un très beau produit

    • Mes amis et moi sommes partagés à parts égales entre local et cloud ; c’est bien que chacun puisse choisir entre qualité et confidentialité selon ses préférences