Lors d’un premier cours d’informatique, quelqu’un a reçu pour devoir de créer « quelque chose » avec un Raspberry Pi, sans expérience en programmation ni encadrement.
Trois membres de l’équipe ont eu l’idée d’acheter un capteur d’humidité pour construire un système de détection d’inondation, l’installer sous un pont et envoyer un e-mail aux personnes concernées en cas de crue.
Lors de la démonstration, ils ont simplement exécuté un script affichant des messages comme « en attente d’humidité » ou « humidité détectée », puis ont fait comme si un e-mail avait été envoyé, ce qui leur a permis de terminer le projet avec succès.
Expression d’une déception face au fait que Google, bien qu’ayant inventé le Transformer, se fasse distancer par ses concurrents dans plusieurs domaines.
Google Docs, les services cloud et les technologies de conduite autonome cèdent du terrain à Microsoft, Amazon, Tesla et d’autres.
Sundar Pichai a posé au modèle d’IA des questions dont il est difficile de vérifier la véracité, ce qui soulève des doutes sur sa précision.
Les résultats des benchmarks ne montraient pas de nette amélioration, mais la démonstration donnait l’impression de fournir des informations exactes.
Même si les modèles multimodaux sont considérés comme importants pour les progrès de l’IA, il faut encore démontrer si le modèle représente réellement des relations de causalité.
La page web de Gemini et son contenu donnent l’impression d’imiter le marketing d’Apple.
L’usage d’un langage exagéré, l’accent excessif mis sur la diversité et les animations superflues donnent l’impression qu’une petite entreprise essaie de paraître plus grande qu’elle ne l’est.
Il est souligné que Google a affirmé que son modèle pouvait accepter des entrées vidéo et audio, alors qu’en réalité il s’agissait d’une démonstration montée.
La partie sur la génération musicale n’était pas non plus une vraie sortie du modèle, mais une simple description.
Critique de Google pour avoir manipulé les benchmarks et les démonstrations, et pour se concentrer uniquement sur une promotion exagérée destinée aux actionnaires.
Partage d’une longue expérience d’utilisation de la méthode de saisie de texte Swype.
Au début, cela peut sembler peu familier, mais une fois qu’on s’y habitue, c’est très efficace.
Tous les produits peuvent rencontrer des difficultés au départ, mais avec le temps, leurs avantages deviennent plus évidents.
Signalement que la page Bloomberg liée via Twitter a été retirée.
Il est indiqué sur la nouvelle page qu’une partie du contenu avait été manipulée.
La question de la confiance envers la vidéo, l’audio et les images, et de savoir s’ils sont réels ou non, est soulevée.
Doute exprimé sur la manière de vérifier si un travailleur à distance est un véritable humain ou une entité partiellement générée.
Même s’il peut y avoir de mauvaises interprétations des fonctionnalités de Gemini, on s’attend à ce que l’interaction en temps réel soit bientôt incluse dans l’application.
Il peut y avoir des malentendus au sujet des fonctions d’IA, mais la vidéo comporte une clause de non-responsabilité sur le montage.
Comme de bonnes technologies de reconnaissance vocale et de synthèse vocale existent déjà, cette partie n’est pas considérée comme problématique.
La principale question porte sur la partie liée au jeu des gobelets, avec une interrogation sur le fait de savoir si le modèle reçoit bien une courte entrée vidéo.
1 commentaires
Avis Hacker News
Lors d’un premier cours d’informatique, quelqu’un a reçu pour devoir de créer « quelque chose » avec un Raspberry Pi, sans expérience en programmation ni encadrement.
Expression d’une déception face au fait que Google, bien qu’ayant inventé le Transformer, se fasse distancer par ses concurrents dans plusieurs domaines.
Sundar Pichai a posé au modèle d’IA des questions dont il est difficile de vérifier la véracité, ce qui soulève des doutes sur sa précision.
La page web de Gemini et son contenu donnent l’impression d’imiter le marketing d’Apple.
Il est souligné que Google a affirmé que son modèle pouvait accepter des entrées vidéo et audio, alors qu’en réalité il s’agissait d’une démonstration montée.
Partage d’une longue expérience d’utilisation de la méthode de saisie de texte Swype.
Signalement que la page Bloomberg liée via Twitter a été retirée.
La question de la confiance envers la vidéo, l’audio et les images, et de savoir s’ils sont réels ou non, est soulevée.
Même s’il peut y avoir de mauvaises interprétations des fonctionnalités de Gemini, on s’attend à ce que l’interaction en temps réel soit bientôt incluse dans l’application.
Il peut y avoir des malentendus au sujet des fonctions d’IA, mais la vidéo comporte une clause de non-responsabilité sur le montage.