1 commentaires

 
GN⁺ 2023-12-08
Avis Hacker News
  • Lors d’un premier cours d’informatique, quelqu’un a reçu pour devoir de créer « quelque chose » avec un Raspberry Pi, sans expérience en programmation ni encadrement.

    • Trois membres de l’équipe ont eu l’idée d’acheter un capteur d’humidité pour construire un système de détection d’inondation, l’installer sous un pont et envoyer un e-mail aux personnes concernées en cas de crue.
    • Lors de la démonstration, ils ont simplement exécuté un script affichant des messages comme « en attente d’humidité » ou « humidité détectée », puis ont fait comme si un e-mail avait été envoyé, ce qui leur a permis de terminer le projet avec succès.
  • Expression d’une déception face au fait que Google, bien qu’ayant inventé le Transformer, se fasse distancer par ses concurrents dans plusieurs domaines.

    • Google Docs, les services cloud et les technologies de conduite autonome cèdent du terrain à Microsoft, Amazon, Tesla et d’autres.
  • Sundar Pichai a posé au modèle d’IA des questions dont il est difficile de vérifier la véracité, ce qui soulève des doutes sur sa précision.

    • Les résultats des benchmarks ne montraient pas de nette amélioration, mais la démonstration donnait l’impression de fournir des informations exactes.
    • Même si les modèles multimodaux sont considérés comme importants pour les progrès de l’IA, il faut encore démontrer si le modèle représente réellement des relations de causalité.
  • La page web de Gemini et son contenu donnent l’impression d’imiter le marketing d’Apple.

    • L’usage d’un langage exagéré, l’accent excessif mis sur la diversité et les animations superflues donnent l’impression qu’une petite entreprise essaie de paraître plus grande qu’elle ne l’est.
  • Il est souligné que Google a affirmé que son modèle pouvait accepter des entrées vidéo et audio, alors qu’en réalité il s’agissait d’une démonstration montée.

    • La partie sur la génération musicale n’était pas non plus une vraie sortie du modèle, mais une simple description.
    • Critique de Google pour avoir manipulé les benchmarks et les démonstrations, et pour se concentrer uniquement sur une promotion exagérée destinée aux actionnaires.
  • Partage d’une longue expérience d’utilisation de la méthode de saisie de texte Swype.

    • Au début, cela peut sembler peu familier, mais une fois qu’on s’y habitue, c’est très efficace.
    • Tous les produits peuvent rencontrer des difficultés au départ, mais avec le temps, leurs avantages deviennent plus évidents.
  • Signalement que la page Bloomberg liée via Twitter a été retirée.

    • Il est indiqué sur la nouvelle page qu’une partie du contenu avait été manipulée.
  • La question de la confiance envers la vidéo, l’audio et les images, et de savoir s’ils sont réels ou non, est soulevée.

    • Doute exprimé sur la manière de vérifier si un travailleur à distance est un véritable humain ou une entité partiellement générée.
  • Même s’il peut y avoir de mauvaises interprétations des fonctionnalités de Gemini, on s’attend à ce que l’interaction en temps réel soit bientôt incluse dans l’application.

  • Il peut y avoir des malentendus au sujet des fonctions d’IA, mais la vidéo comporte une clause de non-responsabilité sur le montage.

    • Comme de bonnes technologies de reconnaissance vocale et de synthèse vocale existent déjà, cette partie n’est pas considérée comme problématique.
    • La principale question porte sur la partie liée au jeu des gobelets, avec une interrogation sur le fait de savoir si le modèle reçoit bien une courte entrée vidéo.