- De nouvelles fonctionnalités vocales et d’image sont disponibles dans ChatGPT.
- Il devient possible de converser naturellement par la voix et de poser des questions en joignant des images.
- La voix est convertie en texte via Whisper, et les réponses sont transformées en voix de comédien professionnel grâce à un nouveau modèle de TTS.
- Ce nouveau modèle de TTS peut reproduire fidèlement la voix d’une personne à partir de seulement quelques secondes d’échantillon vocal.
- Ce modèle est également utilisé pour la fonctionnalité de traduction de podcasts de Spotify, qui traduit en plusieurs langues tout en conservant la voix du podcasteur.
- Plusieurs images peuvent être jointes en une seule fois, et le système reconnaît en détail non seulement le texte présent dans les images, mais aussi les objets.
- Il est possible de demander comment utiliser un outil ou un appareil, ou de discuter de recettes à partir des ingrédients présents dans un réfrigérateur.
- Il devient également possible d’analyser des graphiques ou de résoudre des problèmes de mathématiques.
- Dans l’application mobile, un outil de dessin permet d’indiquer une zone précise de l’image sur laquelle se concentrer.
- Pour des raisons de sécurité et de protection de la vie privée, les fonctions d’analyse ou de commentaire sur des personnes sont fortement limitées.
- Le déploiement commencera dans les deux prochaines semaines, d’abord pour les utilisateurs Plus et Enterprise.
- La voix fonctionne uniquement sur iOS et Android, tandis que la pièce jointe d’images est disponible sur toutes les plateformes.
4 commentaires
Skynet arrive...
L’OS du film Her va donc devenir possible.
C’était brièvement apparu lors de la toute première sortie de GPT-4, mais le fait qu’il ne se contente pas de reconnaître des images et qu’il les comprenne, c’est vraiment fascinant.
Dans les exemples, il y a un passage où l’on demande comment régler la selle d’un vélo,
et on dirait que ce n’est pas juste de la reconnaissance d’image, mais presque comme s’il consultait le manuel pour trouver l’outil adapté...
Je me demandais s’il fallait un abonnement Plus, mais là, ça change quand même un peu la donne... Je suis trop curieux.
Résumé IA du fil HN