- Assistant IA utilisant la voix et la vision, utilisable dans toutes les applications de macOS
- Appuyez sur un raccourci clavier et posez une question à l’oral : une réponse vocale est alors fournie en fonction du contexte actuel
- Une capture d’écran de la fenêtre active est créée puis envoyée à OpenAI GPT Vision
- La question est transcrite avec l’API OpenAI Whisper, puis envoyée avec le texte
- La réponse texte reçue est convertie en voix avec OpenAI TTS puis restituée
- Développé avec NodeJS/Electron
- Le raccourci clavier par défaut est Cmd + Shift + '
1 commentaires
Avis Hacker News
Question sur le fait qu’il serait préférable d’utiliser le terme « macOS » plutôt que « OSX » dans le prompt, ou si ce choix initial n’avait pas fait l’objet d’une grande réflexion.
Suggestion d’ajouter une option de texte en streaming à la place du TTS dans la réponse.
Mention d’un script similaire écrit pour une configuration Linux.
Recommandation de définir une limite de dépenses lors de l’utilisation de l’API OpenAI.
Réaction positive au projet.
Question sur l’intention éventuelle de faire fonctionner le projet avec des LLMs locaux plutôt qu’avec « open »AI.
Avis disant vouloir construire quelque chose directement intégré au terminal.
Réaction négative à l’information selon laquelle « macOSpilot utilise NodeJS/Electron ».
Partage d’une expérience d’utilisation avec la station audionumérique Ableton Live.
Partage d’une réflexion imaginaire sur la productivité pendant l’attente du résultat de la commande
ls.