Et à quoi servent donc tous ces nombreux frameworks ? Ce n’est probablement pas parce qu’elles les ignoraient que les dizaines de milliers d’entreprises qui ont échoué jusqu’ici ont échoué. Cela dit, je pense que c’est utile pour étudier : revue rapide, propositions, etc.
Tu as au moins lu les règles de Hacker News..? Il vaut mieux éviter ce genre de billet ; cette mentalité du style « lui aussi fait de la merde, alors pourquoi on ne s’en prend qu’à moi ? » est franchement puérile.
La demande pour créer quelque chose à bas coût et en faire la promotion est énorme,
mais quand on découvre de bonnes choses, on a tendance à les garder pour soi, à les enregistrer et à les gérer seul.
J’ai l’impression qu’à l’origine, il n’est tout simplement pas facile pour les bonnes informations ou les actualités de bien circuler.
Ce serait bien de pouvoir comparer différents langages à travers une seule grande expérience,
mais comme ce genre de test n’est pas mené à l’échelle d’une entreprise et qu’il est réalisé par un membre de la communauté, il est sans doute difficile d’obtenir une expérimentation vraiment précise.
J’ai cherché un peu partout, mais il n’est vraiment pas facile de trouver des informations satisfaisantes.
Et c’est assez logique : qui serait prêt à dépenser son propre argent pour concevoir correctement une expérience afin de déterminer quel langage est meilleur ?..
Moi aussi, je pensais que c’était une expérience avec beaucoup de limites, mais j’ai tout de même trouvé positif de voir au moins une tentative..^^
Cela semble être un bon exemple de ce qui se passe lorsqu’on ne fournit même pas de success criteria simples liés aux performances. Les agents de codage que j’ai utilisés jusqu’à présent cherchent surtout à résoudre le problème lui-même, mais sans prompt explicite en amont ni boucle de validation, ils n’optimisent presque jamais les performances par eux-mêmes. Il faut donner des consignes à l’IA comme si l’on proposait un problème de test de code. Surtout, même lorsqu’il existe une baseline comme dans ce cas, ne pas préciser les contraintes de performance tout en espérant un résultat optimal peut aussi être considéré comme une forme de négligence de la part de la personne qui utilise l’IA.
Malheureusement, comme l’écrasante majorité est constituée de consommateurs, c’est une mauvaise nouvelle...
Même Samsung subit déjà des dégâts du côté des produits finis.
Il existe un écart entre la possibilité théorique et les domaines d’usage réels -> les benchmarks utilisés pour calculer la possibilité théorique ont des limites, et les workflows existants n’ont pas encore été optimisés pour l’IA, ce qui relève d’un phénomène de décalage culturel. Personnellement, je pense que les benchmarks ont probablement des limites.
Baisse du taux d’entrée dans les nouveaux emplois -> cela suggère que les métiers du développement sont devenus moins intensifs en main-d’œuvre.
C’était un marché aux puces d’artisanat, mais depuis un certain temps, j’ai l’impression que plus de la moitié des articles sont des produits récupérés sur AliExpress ou Temu.
Je ne sais pas encore si ce sera une autre méthode éphémère, comme les erreurs du point intermédiaire,
mais je partage un outil qui permet de comprendre le code et de corriger des bugs tout en faisant des PR reviews avec l’IA.
Je l’utilise sur mes side projects quand je ne comprends pas les modifications de code effectuées par l’IA.
« Dans cet article, l’auteur dissèque un texte généré par l’IA puis met au jour les 6 principaux signes de l’“AI slop” et la structure cachée qui les sous-tend. Il ne s’agit pas d’une simple liste de mots : des excès de vocabulaire comme “delve” ou “tapestry” aux tournures de phrase qui fabriquent une fausse profondeur, il explique pourquoi cela n’écrit pas comme un humain. L’essentiel consiste à retrouver une écriture variée et imparfaite. »
Merci pour votre soutien.
Merci infiniment même pour le café, haha.
Je ferai de mon mieux !
Et à quoi servent donc tous ces nombreux frameworks ? Ce n’est probablement pas parce qu’elles les ignoraient que les dizaines de milliers d’entreprises qui ont échoué jusqu’ici ont échoué. Cela dit, je pense que c’est utile pour étudier : revue rapide, propositions, etc.
Tu as au moins lu les règles de Hacker News..? Il vaut mieux éviter ce genre de billet ; cette mentalité du style « lui aussi fait de la merde, alors pourquoi on ne s’en prend qu’à moi ? » est franchement puérile.
La demande pour créer quelque chose à bas coût et en faire la promotion est énorme,
mais quand on découvre de bonnes choses, on a tendance à les garder pour soi, à les enregistrer et à les gérer seul.
J’ai l’impression qu’à l’origine, il n’est tout simplement pas facile pour les bonnes informations ou les actualités de bien circuler.
Haha, il faut garder à l’esprit que je peux être légèrement partial, puisque je suis committer du langage Ruby.
Ce serait bien de pouvoir comparer différents langages à travers une seule grande expérience,
mais comme ce genre de test n’est pas mené à l’échelle d’une entreprise et qu’il est réalisé par un membre de la communauté, il est sans doute difficile d’obtenir une expérimentation vraiment précise.
J’ai cherché un peu partout, mais il n’est vraiment pas facile de trouver des informations satisfaisantes.
Et c’est assez logique : qui serait prêt à dépenser son propre argent pour concevoir correctement une expérience afin de déterminer quel langage est meilleur ?..
Moi aussi, je pensais que c’était une expérience avec beaucoup de limites, mais j’ai tout de même trouvé positif de voir au moins une tentative..^^
Merci pour cette excellente ressource. Je vous ai aussi offert un café sur Wikidocs.
J’utilise la 27B sur un HX370, et les résultats sont plutôt bons.
Cela semble être un bon exemple de ce qui se passe lorsqu’on ne fournit même pas de success criteria simples liés aux performances. Les agents de codage que j’ai utilisés jusqu’à présent cherchent surtout à résoudre le problème lui-même, mais sans prompt explicite en amont ni boucle de validation, ils n’optimisent presque jamais les performances par eux-mêmes. Il faut donner des consignes à l’IA comme si l’on proposait un problème de test de code. Surtout, même lorsqu’il existe une baseline comme dans ce cas, ne pas préciser les contraintes de performance tout en espérant un résultat optimal peut aussi être considéré comme une forme de négligence de la part de la personne qui utilise l’IA.
Malheureusement, comme l’écrasante majorité est constituée de consommateurs, c’est une mauvaise nouvelle...
Même Samsung subit déjà des dégâts du côté des produits finis.
À voir les commentaires, vous étiez donc parti à ce moment-là pour créer KakaoTalk.
À ma connaissance, l’orientation de l’implémentation est différente de celle d’OpenCode.
Quelques conjectures sont possibles.
C’était un marché aux puces d’artisanat, mais depuis un certain temps, j’ai l’impression que plus de la moitié des articles sont des produits récupérés sur AliExpress ou Temu.
Faut-il y voir une bonne nouvelle pour l’industrie coréenne… hein.
https://app.devin.ai/review
Je ne sais pas encore si ce sera une autre méthode éphémère, comme les erreurs du point intermédiaire,
mais je partage un outil qui permet de comprendre le code et de corriger des bugs tout en faisant des PR reviews avec l’IA.
Je l’utilise sur mes side projects quand je ne comprends pas les modifications de code effectuées par l’IA.
« Dans cet article, l’auteur dissèque un texte généré par l’IA puis met au jour les 6 principaux signes de l’“AI slop” et la structure cachée qui les sous-tend. Il ne s’agit pas d’une simple liste de mots : des excès de vocabulaire comme “delve” ou “tapestry” aux tournures de phrase qui fabriquent une fausse profondeur, il explique pourquoi cela n’écrit pas comme un humain. L’essentiel consiste à retrouver une écriture variée et imparfaite. »
L’expérience sera meilleure qu’avec opencode ?
Waouh... toi, vraiment, **tu as visé juste.**J’utilise Zed pour sortir de l’écosystème basé sur VSCode.