Les fonctionnalités souhaitées sont les suivantes.
- Saisir un lien Hacker News en entrée
- Résumer les commentaires puis les traduire en coréen. Pour la traduction coréenne, il serait préférable que les phrases se terminent par des formes concises de type « fait », « en cours » ou « devenu ».
Si vous partagez cela, il semble que davantage d’articles pourraient être publiés sur GeekNews !
Merci.
4 commentaires
Comme la quantité d’informations mises à jour sur la page d’accueil de Hacker News est importante, j’ai quelques inquiétudes à l’idée d’utiliser un LLM.
Cela dit, le
gpt-4.1-nanodéployé cette fois affiche le prix complètement fou de 0,1 $ pour 1 M de tokens en entrée, donc il semble possible de tout faire à bas coût : résumé, traduction et catégorisation.Ce tarif est tellement invraisemblable que j’ai publié sur mon blog une comparaison entre les prix de l’API de traduction et du modèle 4.1-nano.
Si ça vous intéresse, ça peut valoir le coup d’y jeter un œil : https://dev-wiki.dev/reading/tech/16
Honnêtement, pour l’utilisation du modèle nano, je pars du principe que pour l’extraction, le résumé et la catégorisation à partir d’informations nettoyées, plutôt que d’y mettre tout le bloc de balises HTML, c’est pratiquement gratuit, donc je l’utilise comme ça.
Si vous activez le partage de tokens, ce sera probablement gratuit jusqu’à 2,5 millions de tokens. Pour 4.1 mini et nano.
Est-il facile d’identifier une position précise de commentaire dans le HTML ?
J’ai l’impression que si on utilise quelque chose comme firecrawl jusqu’à cette étape, ce sera un énorme gaspillage d’argent.
Si on peut la cibler en manipulant correctement les balises HTML, j’ai l’impression qu’ensuite on pourra utiliser le corps du texte avec un modèle nano pour faire ce qu’on veut.