11 points par GN⁺ 2024-07-21 | 2 commentaires | Partager sur WhatsApp
  • OpenAI a récemment annoncé le modèle gpt-4o mini
  • Le prix est de 0,15 $ par million de tokens en entrée et de 0,60 $ par million de tokens en sortie
  • Ce modèle d’IA à bas coût a désormais franchi un tournant qui permet de créer du contenu dynamique généré par IA pour des revenus publicitaires

Combien un éditeur peut-il gagner avec les impressions publicitaires ?

  • Les revenus générés par les impressions publicitaires varient fortement selon le support d’affichage et la catégorie de contenu
  • Il est possible d’estimer un revenu approximatif via le calculateur de revenus estimés AdSense de Google
  • Par exemple, en entrant 50 000 pages vues par mois et la catégorie finance, le revenu annuel potentiel est de 2 000 $
  • En prenant la valeur médiane de toutes les catégories, on peut estimer un revenu annuel de 1 550 $ pour 50 000 pages vues par mois
  • Cela correspond à environ 0,0026 $ de revenu par page vue

Combien coûte la génération de contenu par IA ?

  • Imaginons un blog qui génère du contenu en fonction de ce que l’utilisateur saisit dans la barre de recherche
  • L’article recherché par l’utilisateur est généré en temps réel, et voici le prompt qui encadre la requête saisie par l’utilisateur

You are an excellent blog writer. You write blogs that rank well in search engines because you know about SEO and how to use highly relevant and popular keywords. Your blog posts are informative, and help users achieve what they are looking for. You will receive queries from users searching for blog posts. You will create blog posts that matches their query, that are helpful, and that answer or are relevant to whatever they are searching for. Respond with only the blog post.

  • Selon l’outil Playground d’OpenAI, ce prompt et la requête utilisateur nécessitent 119 tokens d’entrée
  • La réponse générée par gpt-4o mini contient 829 tokens de sortie.

Article généré : "# How to Make Your MacBook Audibly Greet You When You Flip It Open"

  • En calculant le coût nécessaire pour générer ce billet de blog, on obtient un total de 0,00051525 $, pour un résultat plutôt correct

Impressions publicitaires vs coût de l’IA

  • Avec ce billet de blog, une seule page vue issue d’une requête utilisateur peut désormais générer ~0,0026 $ de revenu
  • En revanche, la génération du billet de blog lui-même a coûté 0,00051525 $
  • Le bénéfice net est donc de 0,0026 $ - 0,00051525 $ = ~0,002 $. Soit 2/10 de centime

Est-ce que cela va réellement arriver ?

  • L’internet du futur sera-t-il rempli de blogs IA générés dynamiquement selon les requêtes des utilisateurs ? Rien n’est moins sûr
  • Mais internet est déjà sur une pente descendante
  • Une grande partie du web deviendra probablement du spam de blogs SEO produit par des rédacteurs à bas coût

Est-ce que quelqu’un fait déjà cela aujourd’hui ?

  • Fait intéressant, il existe un projet appelé Websim.
  • C’est un « simulateur de web » qui utilise des LLM pour générer dynamiquement un internet alternatif. Il n’y a toutefois pas encore de publicité

La synthèse de GN⁺

  • Le modèle gpt-4o mini d’OpenAI a franchi un tournant qui permet de générer du contenu IA dynamique à très faible coût.
  • En comparant les revenus publicitaires et le coût de génération de contenu par IA, on constate qu’il est possible d’obtenir un léger bénéfice par page vue.
  • Il est possible que l’avenir d’internet soit rempli de contenu généré par IA, mais cela pourrait aggraver les problèmes d’un web déjà en déclin.
  • Des projets comme Websim proposent un internet alternatif généré par IA, mais n’ont pas encore adopté de modèle de revenus publicitaires.

2 commentaires

 
dhy0613 2024-07-23

Je considère que l’obtention d’informations via la recherche Google est déjà à moitié cassée.

Pour les recherches en coréen, il n’y a plus qu’une multitude de blogs Tistory qui réécrivent différemment exactement les mêmes informations,
et pour les recherches en anglais, on ne trouve même pas ces mêmes informations : il n’y a partout que des blogs dont le contenu n’a absolument rien à voir avec leur titre.

 
GN⁺ 2024-07-21
Commentaires sur Hacker News
  • Certains estiment que Google finira par indexer principalement les sorties des LLM

    • Ils utilisent Kagi pour poser des questions et obtenir des réponses comme mode de recherche
    • Il y a une inquiétude sur l’épuisement du contenu généré par des humains, ce qui conduirait les nouveaux modèles à être entraînés sur les sorties d’autres LLM
    • Certains prédisent qu’un snapshot du Web de 2023 sera le dernier contenu original
  • Certains estiment que les clients d’OpenAI peuvent désormais atteindre leur seuil de rentabilité

    • Mais cela signifie aussi un déferlement massif de contenu de mauvaise qualité
  • Certains trouvent que cet article est un étrange clickbait

    • Cela repose sur l’hypothèse que des entrepreneurs du SEO sont prêts à générer des sites de millions de pages
    • En réalité, le contenu généré de cette manière ne fonctionne pas très bien dans les moteurs de recherche
    • Certains pensent que la génération d’images et de vidéos par IA offrira de meilleurs revenus
  • Certains partent du principe que l’avenir reposera encore sur des utilisateurs dépendants des moteurs de recherche

    • Ils se demandent si le comportement des utilisateurs évoluera vers l’identification et l’évitement des contenus générés par IA
  • Certains notent qu’on peut observer une dégradation de la qualité en réinjectant la sortie de ChatGPT comme entrée

    • On peut gagner de l’argent avec la publicité, mais il y a la crainte qu’au final on n’obtienne plus que des réponses du type "baaa baaa baaa"
  • Il y a aussi des critiques visant des personnes incapables de faire même de l’arithmétique élémentaire

    • Il est souligné que le calcul du revenu par page vue est erroné
  • Certains estiment que l’offre n’est pas fixe et qu’elle va augmenter

    • Ils prédisent donc une baisse du prix par impression
    • Il y a la crainte que le contenu généré par des humains devienne moins rentable
  • À propos de la question de savoir si l’avenir d’Internet sera rempli de blogs IA répondant aux requêtes des utilisateurs

    • Certaines personnes prennent toujours plaisir à commenter sur HN et à écrire leurs idées sur leurs blogs
    • Il pourrait devenir nécessaire de considérer comme généré par IA tout contenu qui ne porte pas la signature d’une personne de confiance
    • Certains avancent aussi que le contenu généré par IA pourrait être meilleur que celui produit par des humains
  • Certains rappellent qu’il est déjà possible depuis très longtemps de générer du contenu à la volée

    • Il existe depuis longtemps des méthodes consistant à utiliser des scripts pour récupérer des résultats Google et du contenu de Wikipedia, puis à permuter les mots
    • Certains estiment que les modèles à bas coût ont abaissé la barrière à l’entrée
  • Certains soulignent que c’était déjà possible depuis plus d’un an sans utiliser l’API d’OpenAI