20 points par xguru 2025-04-05 | 1 commentaires | Partager sur WhatsApp
  • Fournit des informations à partir des fichiers, dossiers et sites web de l’utilisateur, et fonctionne même entièrement hors ligne
  • Intègre un moteur d’inférence de modèles installé localement ; si nécessaire, il est aussi possible de connecter une clé d’API compatible OpenAI pour utiliser des modèles externes
  • Conçu pour permettre au LLM de fournir des réponses plus précises en s’appuyant sur les informations de contexte
  • Basé sur llama.cpp

Fonctionnalités principales

  • Chatbot local-first

    • Toutes les conversations se déroulent hors ligne, sans risque de fuite de données
    • Recherche directe d’informations dans les fichiers, dossiers et sites web, sans installation supplémentaire
    • Utilisable sans aucune connaissance préalable des prompts GPT ou des réglages
    • Moteur d’inférence intégré pour une exécution rapide sur Apple Silicon
  • Gestion du contexte basée sur des experts (Expert System)

    • Création possible d’experts par sujet (Computer Science, History, etc.)
    • Possibilité d’associer à chaque expert une quantité illimitée de ressources (basé sur le RAG)
    • Ajout simple de documents par glisser-déposer
    • Possibilité d’inclure aussi une recherche web pour refléter les informations les plus récentes
  • Prise en charge de nombreux modèles

    • Compatible avec divers modèles locaux d’inférence, comme QwQ-32B d’Alibaba et DeepSeek-R1
    • Possibilité d’appeler des modèles externes en saisissant une clé d’API compatible OpenAI
  • Interpréteur de code intégré

    • Le modèle peut exécuter directement le code qu’il génère et intégrer le résultat
    • Amélioration de la précision sur les questions mathématiques ou logiques
  • Canvas

    • Permet de générer et modifier visuellement des sites web, du code et du texte
    • Après sélection de texte, possibilité de demander au LLM une édition ciblée
  • Génération d’images

    • Génération automatique d’images à partir de prompts textuels
    • Reconnaissance automatique à partir du prompt seul, sans changement de mode
    • Fonctionne sur une base CoreML à partir de macOS 15.2
  • Assistant d’écriture en ligne

    • Assistance inline disponible dans n’importe quelle application avec Command + Control + I
    • Possibilité de saisir une question de devoir dans Microsoft Word et d’obtenir automatiquement une réponse
  • Rendu Markdown avancé

    • Prise en charge du rendu des formules LaTeX
    • Visualisation de données : génération automatique de graphiques à partir de tableaux (histogrammes, courbes, camemberts, etc.)
    • Prise en charge de la coloration syntaxique du code, ainsi que de la copie/export du code
  • Boîte à outils Toolbox

    • Detector : détection de contenu généré par IA et guide de réécriture
    • Diagrammer : création de diagrammes de relations complexes à partir d’un prompt
    • Slide Studio : création de présentations à partir d’une seule ligne de prompt, avec export en PDF/PowerPoint
  • Optimisation des performances et de l’inférence

    • Inférence basée sur llama.cpp pour une très grande rapidité sur Apple Silicon
    • Speculative decoding pour améliorer encore la vitesse
    • Propose une meilleure autonomie sur MacBook et des fonctions de répartition des calculs

Installation et prérequis

  • Mac + Apple Silicon (M1 ou supérieur)
  • 8 Go de RAM ou plus
  • Télécharger le fichier .dmg depuis la page Releases puis l’exécuter

Objectifs du projet

  • Un assistant IA local personnel facile à utiliser pour tous
  • Un système entièrement hors ligne fonctionnant sans connexion Internet
  • Reconnaissance immédiate des dossiers, fichiers et sites web, sans configuration
  • Protection de la vie privée, aucun suivi des conversations
  • Un projet open source garantissant transparence et extensibilité

1 commentaires

 
galadbran 2025-04-06

Je vais essayer de l’installer et de l’utiliser.