5 points par xguru 1 일 전 | Aucun commentaire pour le moment. | Partager sur WhatsApp
  • Composant de contrôle vocal pour React/navigateurs construit sur la Realtime API
  • Permet d’implémenter des widgets capables de répondre à la voix, depuis la saisie de formulaires jusqu’à divers types d’actions
  • Fournit un pattern de tool-constrained UI qui limite l’assistant aux seules actions autorisées par l’application
  • Un contrôleur unique gère de bout en bout la connexion de session, le traitement audio, l’exécution des outils et l’assemblage des transcriptions, évitant aux développeurs d’avoir à manipuler directement WebRTC ou le protocole Realtime
  • Lors de l’intégration à une application existante, l’application reste l’unique source de vérité (source of truth), tandis que la couche vocale se contente d’appeler des handlers d’application limités
  • Il s’agit d’un package opinionated spécialisé dans les flux UI du navigateur, et non d’un framework d’orchestration générique ; si vous avez besoin d’un runtime non-React ou d’une orchestration d’agents, il est recommandé d’utiliser Raw Realtime ou openai-agents-js
  • Pour l’intégration dans une application existante, un guide en 9 étapes est fourni : proxy de l’endpoint /session → création d’un wrapper d’adaptateur vocal → enregistrement des outils → remontée du contrôleur → montage du widget
  • Le contrôleur utilise server_vad par défaut et, dans les sessions tool-only, est configuré avec interruptResponse: false afin qu’un appel d’outil en cours ne soit pas annulé par une nouvelle entrée vocale
  • L’application de démonstration permet d’explorer divers scénarios d’intégration, notamment le changement de thème, un formulaire multi-étapes, un flux d’échecs à état partagé et des expérimentations autour du wake word
  • Licence Apache-2.0

Aucun commentaire pour le moment.

Aucun commentaire pour le moment.