1 points par GN⁺ 2023-11-16 | 1 commentaires | Partager sur WhatsApp

Comment configurer un GPT

  • Un GPT est une configuration nommée de ChatGPT, comprenant un nom, un logo et une courte description.
  • Il inclut des instructions personnalisées qui définissent le comportement du GPT, l’équivalent d’un « system prompt ».
  • Il peut proposer, de manière optionnelle, jusqu’à 4 exemples de prompts pour démarrer une conversation.
  • Il est possible d’importer plusieurs fichiers pour fournir du contexte supplémentaire et aider à générer les réponses.
  • On peut activer ou désactiver Code Interpreter, le mode Browse et DALL-E 3.
  • Il est possible de configurer des « Actions » optionnelles, c’est-à-dire des endpoints API que le GPT peut appeler.

Fonctionnement du builder de GPT

  • Le builder de GPT est un chatbot qui crée automatiquement un GPT à travers une conversation avec l’utilisateur.
  • L’onglet « Create » permet de créer un GPT via la conversation, mais en pratique il remplit automatiquement le formulaire « Configure ».
  • Beaucoup recommandent d’éviter l’onglet « Create » après avoir créé leur premier GPT.

Exemples intéressants de GPT

  • Dejargonizer : un GPT qui interprète le jargon technique en analysant un texte pour en définir les termes spécialisés.
  • JavaScript Code Interpreter : un GPT capable d’exécuter du code JavaScript en s’appuyant sur un runtime Deno attaché.
  • Dependency Chat : analyse la documentation des dépendances d’un projet GitHub et répond aux questions associées.
  • Add a walrus : un GPT qui ajoute un morse à une image en utilisant GPT-Vision et DALL-E.
  • Animal Chefs : un GPT où des chefs animaux proposent des recettes accompagnées d’histoires personnelles.
  • Talk to the datasette.io database : un GPT qui répond aux questions en exécutant des requêtes SQL.
  • Just GPT-4 : un GPT qui désactive toutes les fonctions supplémentaires pour offrir une expérience GPT-4 pure.

La fonction de connaissance des GPT

  • Lorsqu’un fichier est joint à un GPT, celui-ci tente de répondre aux questions en s’appuyant sur ce fichier.
  • Cela ressemble à une implémentation de Retrieval Augmented Generation (RAG).
  • OpenAI partage peu d’informations détaillées sur cette fonctionnalité, ce qui rend son usage efficace difficile pour les utilisateurs.

Le modèle de paiement des GPT

  • Les GPT sont réservés aux abonnés ChatGPT Plus à 20 $/mois, ce qui limite leur diffusion.
  • Ils permettent de déployer des projets reposant sur la plateforme OpenAI sans que l’utilisateur ait à fournir sa propre clé API.

Importance de la sécurité des prompts et de l’ouverture

  • Avec suffisamment d’efforts, les documents et prompts ajoutés à un GPT peuvent fuiter.
  • Il vaut mieux partir du principe que les prompts finiront par fuiter et choisir plutôt de les rendre publics.

Attentes pour l’avenir des GPT

  • Sont attendues des améliorations comme une meilleure documentation de la fonction de connaissance, l’accès via API, la possibilité de proposer des GPT aux non-abonnés et le paramétrage de limites budgétaires.

L’avis de GN⁺

Le point le plus important de cet article est l’exploration des nouvelles fonctionnalités et possibilités des GPTs, un sujet particulièrement intéressant pour les personnes travaillant dans le génie logiciel et l’intelligence artificielle. La possibilité pour les utilisateurs de créer leur propre GPT et d’interagir avec d’autres utilisateurs ouvre une nouvelle manière de construire des interfaces conversationnelles sur mesure. En outre, l’intégration de diverses capacités comme l’exécution de code, la recherche documentaire et la génération d’images montre le potentiel d’amélioration de l’expérience utilisateur.

1 commentaires

 
GN⁺ 2023-11-16
Avis Hacker News
  • En tant qu’utilisateur de GPT, je me suis rendu compte que si je ne peux pas voir le prompt, je n’ai pas envie d’utiliser le GPT. Je ne veux pas utiliser un ChatGPT dans lequel un inconnu peut injecter des comportements étranges à mon insu.
    • J’aimerais qu’OpenAI ajoute une option « voir la source » aux GPT. Je pense qu’elle devrait être activée par défaut, même si j’imagine que ce pourrait être une décision impopulaire.
  • J’ai tendance à éviter les chatbots basés sur des GPT. Je n’ai pas envie d’être subtilement manipulé par des instructions personnalisées que j’ignore.
    • L’ajout d’une option « voir la source » ferait passer cette fonctionnalité de « bof » à « ça vaut la peine de payer ».
    • Je passe désormais l’essentiel de mon temps sur Kagi et j’envisage de résilier GPT Plus, mais ce changement me ferait conserver mon abonnement.
  • Ma façon de découvrir les nouvelles fonctionnalités d’OpenAI :
    1. Je parcours sur Twitter des titres qui annoncent bruyamment quelque chose de nouveau.
    2. Je reçois ensuite un nombre écrasant de tweets de la part d’influenceurs Twitter à ce sujet.
    3. J’ignore tout ça et j’attends que simonw l’explique.
    4. Je lis ensuite le billet de blog où simonw a déjà testé la fonctionnalité de multiples façons et en a rédigé une explication claire avec une critique pertinente. Et là, tout devient immédiatement compréhensible.
  • Il est vrai que ce n’est « qu’un pré-prompt dans ChatGPT ».
    • Il est également vrai que ce ne sont « que des Custom Instructions avec une bonne UI ».
    • Mais il ne faut jamais sous-estimer l’impact transformateur d’une « bonne UI ». GPT-3 était disponible depuis des années, mais presque personne ne le connaissait vraiment ni ne s’en souciait avant qu’une bonne UI n’apparaisse.
    • Cela ressemble à un « petit ajustement » d’utilisabilité, mais l’effet est comparable à un « saut quantique ».
  • Certaines personnes me demandent souvent mon avis sur les GPT/l’IA. Je leur demande si elles les ont essayés. « Non. » « Vous savez que c’est gratuit ? » « Oui. » J’ai du mal à comprendre cette attitude. Est-ce la peur de l’inconnu ? De la paresse ? Le besoin d’une preuve sociale avant d’essayer quelque chose ?
  • Je ne peux pas voir les prompts d’OpenAI, et peut-être que même l’auteur ne le peut pas, mais j’ai quand même envie d’utiliser les GPT d’OpenAI.
    • Il y a là un vrai saut de confiance. Je me demande si OpenAI a une feuille de route concrète en matière de fiabilité ou de cohérence.
  • J’ai l’intégralité du prompt du Custom GPT Builder : [lien GitHub fourni]
  • Merci à simonw d’avoir documenté tout cela en temps réel et d’avoir créé des outils faciles à comprendre et accessibles (llm en ligne de commande, etc.).
    • J’avais l’impression que l’API de recherche ne fournissait pas de citations correctes et faisait donc mal son travail ; c’est rassurant de voir que je ne suis pas le seul.
  • J’aimerais en savoir plus sur la manière dont openAI a implémenté la fonctionnalité de « base de connaissances » RAG. Mais les détails manquent.
    • J’ai pu téléverser tout le texte de grugbrain.dev et discuter avec un grug brain très raisonnable : [lien de chat OpenAI fourni]
  • Je travaille récemment sur « synbiogpt », et c’est là que j’ai pris conscience des limites des custom GPT.
    • Les données de séquences biologiques sont généralement très longues. Les données dans un fichier passent encore, mais dès qu’il faut interagir avec une API pour une fonctionnalité avancée (par ex. l’optimisation des codons), il faut envoyer ces données sur le réseau. Résultat, la fenêtre de contexte de l’appel API se remplit de données de séquence et tout échoue.
    • Il est impossible d’injecter des dépendances. Parfois, le GPT essaie de faire sa propre implémentation, mais c’est souvent faux.
    • Quand GPT-4 pense savoir de quoi il parle, l’API de recherche n’arrive souvent pas à ouvrir le fichier. Quand je parle d’une partie d’un gène, je veux être très précis sur une partie spécifique de ma bibliothèque, pas sur celle que GPT-4 imagine.
    • J’ai résolu la plupart des problèmes en créant mon propre environnement de scripting lua (les fonctions biologiques sont en golang, et j’utilise gopher-lua pour exécuter l’environnement lua). J’injecte des exemples de lua montrant comment utiliser les fonctions de script, ainsi que ma petite bibliothèque actuelle de fragments de gènes, puis je lui demande de générer du lua qui exécute une tâche donnée sur les fichiers fournis. GPT-4 ne voit jamais les fichiers ; mon application interne en golang exécute le lua scripté. Cette méthode fonctionne à merveille et est bien plus rapide que les custom GPT.
    • Mon plus gros problème actuellement, c’est la partie frontend. J’aimerais avoir un clone open source de ChatGPT capable d’extraire les pièces jointes et de modifier l’entrée utilisateur initiale. Jusqu’ici, je n’ai pas trouvé de bonne option.
  • À propos de la manière d’obtenir de meilleurs résultats avec le RAG.
    • J’ai eu quelques succès dans ce domaine.
    • J’utilise l’Assistant API, que je considère comme différent des GPT. J’ai essayé cela via l’interface web.
    • J’ai plus de 100 fichiers PDF passés à l’OCR avec Tesseract. J’ai ensuite demandé à ChatGPT d’écrire un script pour combiner tous les fichiers en un seul fichier txt en conservant la mise en page.
    • J’ai téléversé le fichier et commencé à poser des questions. Il contient des données très techniques sur des réglementations de construction dans une langue autre que l’anglais, donc le modèle n’est probablement pas familier avec ce type de langage.
    • Malgré cela, les résultats étaient étonnamment bons. Il pouvait répondre aux questions, et les réponses étaient bonnes. Il aurait dû annoter la provenance des réponses, mais cela ne fonctionnait pas correctement.
    • J’ai essayé de téléverser des PDF, des fichiers JSON, des CSV, etc. Jusqu’à présent, le texte brut est ce qui fonctionne le mieux.
  • La remarque sur la fonctionnalité RAG de « connaissance » est intéressante.
    • Au fil des conversations et de l’expérience, les gens découvrent que la recherche RAG est très spécifique au métier et au modèle de données. Il n’existe pas de solution universelle. L’étape suivante d’un client dans un CMS n’a rien à voir avec la génération de SQL à partir d’un schéma. Et cela n’a rien à voir non plus avec l’exploration d’un catalogue e-commerce.
    • Fondamentalement, il s’agit de problèmes liés à la recherche. En réalité, c’est encore plus difficile. Ces problèmes sont notoirement complexes.