Une semaine d’utilisation de Gemini Pro 1.5 : c’est vraiment fantastique

xguru · 2024-02-26T11:16:01+09:00

Gemini Pro 1.5, le nouveau LLM bêta privé de Google, affiche des performances largement améliorées par rapport aux modèles précédents Gemini 1.5 Pro peut lire un roman entier et décrire en détail une scène cachée au milieu lire l’ensemble d’une base de code et suggérer où ajouter une nouvelle fonctionnalité, avec du code d’exemple lire tous les passages surlignés de lecture dans Readwise et sélectionner ceux à utiliser pour rédiger un essai Il peut traiter jusqu’à 1 million de tokens avec un seul prompt comparé aux autres modèles, la fenêtre de contexte de Gemini Pro 1.5 est bien plus grande (GPT-4 Turbo est à 128000, soit environ 8 fois moins) même avec une grande fenêtre de contexte, il gère remarquablement bien les prompts de grande taille alors que les autres modèles voient leurs performances baisser à mesure que la taille du prompt augmente, Gemini ne présente pas ce problème Points à noter Gemini Pro 1.5 est encore en bêta privée, et ses performances peuvent changer lors de sa sortie publique Gemini Pro 1.5 est lent à traiter, surtout pour les requêtes de grande taille OpenAI a du terrain à rattraper, et les fonctions de recherche d’information restent importantes

(every.to)

10 points par xguru 2024-02-26 | 3 commentaires | Partager sur WhatsApp

Gemini Pro 1.5, le nouveau LLM bêta privé de Google, affiche des performances largement améliorées par rapport aux modèles précédents
Gemini 1.5 Pro peut
- lire un roman entier et décrire en détail une scène cachée au milieu
- lire l’ensemble d’une base de code et suggérer où ajouter une nouvelle fonctionnalité, avec du code d’exemple
- lire tous les passages surlignés de lecture dans Readwise et sélectionner ceux à utiliser pour rédiger un essai
Il peut traiter jusqu’à 1 million de tokens avec un seul prompt
- comparé aux autres modèles, la fenêtre de contexte de Gemini Pro 1.5 est bien plus grande (GPT-4 Turbo est à 128000, soit environ 8 fois moins)
- même avec une grande fenêtre de contexte, il gère remarquablement bien les prompts de grande taille
- alors que les autres modèles voient leurs performances baisser à mesure que la taille du prompt augmente, Gemini ne présente pas ce problème
Points à noter
- Gemini Pro 1.5 est encore en bêta privée, et ses performances peuvent changer lors de sa sortie publique
- Gemini Pro 1.5 est lent à traiter, surtout pour les requêtes de grande taille
- OpenAI a du terrain à rattraper, et les fonctions de recherche d’information restent importantes

3 commentaires

dahada 2024-03-20

J’ai collé un roman et essayé de discuter avec, mais dès qu’une expression un peu osée apparaît, le traitement est refusé. Même en abaissant le niveau de filtrage, certains romans ne passent toujours pas. Il semble avoir privilégié la sécurité à l’extensibilité.

ajh508 2024-02-27

Jusqu’ici, à chaque nouvelle sortie on a eu droit à beaucoup d’emballement, mais j’ai l’impression qu’aucune n’a vraiment dépassé openAI..
Personnellement, j’aimerais qu’un LLM ayant remplacé tous ses backbones par Mamba sorte rapidement

xguru 2024-02-26

Avis sur Hacker News

J’aime l’idée de faire ingérer à une IA le texte complet d’un livre. Il m’arrive souvent de lire un roman sans me souvenir d’un personnage, et j’aimerais pouvoir surligner un nom sur une liseuse pour qu’elle sache que je suis à la page 85 de Neuromancer et me réponde sans spoiler. Ou avoir un manuel qui puisse m’aider et me donner des indices quand je bloque sur un exercice, comme un bon partenaire d’étude.
Peut-on être certain qu’à cause de la politique identitaire de Google, ils ne modifieront pas les faits d’un livre ? Ajustent-ils le contenu quand on lui donne un livre jugé problématique ? Pour moi, pour cette raison, c’est totalement inutilisable.
Un article qui présente des exemples précis de ce qu’on peut faire avec ce genre de sujet, ainsi qu’un point de vue équilibré et des mises en garde, tout en révélant ses intérêts personnels (par ex. être investisseur dans LlamaIndex)
Ce qui m’enthousiasme le plus, c’est de voir ce que donnerait l’usage d’une immense fenêtre de contexte en combinaison avec le RAG, sans l’abandonner. Si l’on peut parser un livre entier pour identifier les passages pertinents et mettre le livre complet dans la fenêtre de contexte, cela signifie qu’on peut aussi y mettre les parties pertinentes de toute une bibliothèque de référence, ce qui est très prometteur.
D’après les retours de quelques personnes qui y ont déjà eu accès pendant plusieurs jours, il ne s’agit pas seulement d’une avancée en longueur, mais d’un véritable progrès dans l’exploitation de la fenêtre de contexte. Il l’utilise bien mieux que les autres modèles. C’est dommage qu’ils n’aient pas expliqué comment c’est possible.
Est-ce que cela ne va pas coûter une fortune ? Avec gpt-4, si on pousse déjà au maximum, une seule interaction coûte $1.28 ! Gemini est-il bien moins cher ?
À la NSA, ils doivent déjà se frotter les mains devant les possibilités qu’ouvre cette technologie. Ils pourraient s’en servir pour interroger les données qu’ils stockent assidûment depuis des années
Il lit l’intégralité d’une base de code, suggère où ajouter une nouvelle fonctionnalité et propose même du code d’exemple. J’espère que ce ne sera pas comme l’invention de la voiture qui a remplacé la calèche, mais plutôt comme celle de la boîte à rythmes, qui n’a pas fait disparaître les batteurs.
Ces modèles se comportent souvent différemment (et moins bien) une fois rendus publics, et on ne sait pas encore ce qu’il adviendra de Gemini à l’échelle de Google. J’espère sincèrement que Google saura tirer les leçons de la réputation déclinante de ChatGPT et trouvera un moyen de préserver les meilleures performances du modèle. Qu’ils limitent l’accès, augmentent les prix, ou les deux, je veux pouvoir bénéficier de ce modèle et d’une expérience de grande qualité lorsqu’il sera public.

Une semaine d’utilisation de Gemini Pro 1.5 : c’est vraiment fantastique

À lire aussi

3 commentaires

Avis sur Hacker News