Est-ce que cela ne dépend pas du domaine auquel on l’applique ?
Dans le cas de mon travail en cours, comme rhwp, quand il faut corriger et traiter des écarts de rendu de 1 mm, utiliser Codex casse tout. Pour l’instant, sur les tâches de très haute difficulté, Claude Code reste devant, mais pour le développement d’apps web où il suffit d’aller jusqu’à un certain niveau en suivant une procédure et avec un workflow et un framework bien établis, j’ai le sentiment qu’utiliser Codex est meilleur pour la santé mentale.
J’ai plutôt eu l’impression que le fait que le edge de Cloudflare assure le rôle de relais DERP de Tailscale en faisait un concurrent encore plus redoutable. Tailscale aussi envoie les communications via un relais DERP quand le P2P ne fonctionne pas. Le passage « si les PoP (Point of Presence) de l’infrastructure de relais sont limités, une part importante du trafic passe par le relais, ce qui entraîne de la latence et une baisse de fiabilité » m’a particulièrement fait penser à Tailscale. Je pense que j’utiliserai les deux en parallèle. Je vais tester ça tout de suite.
Moi aussi, je l’utilise comme ça. Cela dit, plutôt que d’attribuer un rôle à un modèle fixe, j’ai tendance à confier d’abord la tâche au modèle le plus puissant tout en ayant le quota le plus large.
Je fais pareil. Un peu plus en détail, j’ai configuré Claude à 100 dollars et Codex à 200 dollars, puis avec Claude Code Opus je fais : planification -> implémentation avec Sonnet -> review par Codex -> vérification de la review avec Opus -> nouvelle implémentation avec Sonnet -> review par Codex (et ainsi de suite). J’en ai même fait une compétence pour que ça tourne en continu, et j’en suis satisfait.
Lorsque model_context_window=800000 est utilisé, il y a un problème à partir du moment où 50 % du contexte est consommé : les réponses aux questions se mettent à suivre les réponses aux questions précédentes. À noter.
Je suis d’accord sur le fait que Codex est plus minutieux. Je recommande de coder avec Claude puis de faire la revue avec Codex. Cela prend beaucoup de temps, mais si on le lance avant d’aller aux toilettes ou avant une réunion, le taux d’achèvement est assez élevé.
L’IA sait bien répondre au « comment », mais elle ne sait pas pourquoi il faut faire les choses. Chercher à comprendre la finalité fondamentale d’un travail, avoir la curiosité d’explorer de nouvelles voies au prix d’essais et d’erreurs, et choisir une direction en fonction d’un objectif, voilà ce que seuls les humains peuvent faire. Le sens des responsabilités ne consiste pas seulement à poursuivre un résultat, mais à garder l’objectif en vue tout au long du processus, en continuant à questionner et à explorer.
J’utilise l’offre free tier d’Oracle Cloud. Avec 4 vCPU, 24 Go de RAM et 200 Go, et à part quelques incompatibilités occasionnelles liées à l’architecture ARM, c’est un super jouet.
Lorsqu’on évalue la capacité d’une personne à travailler, il y a un élément qu’on appelle l’« attitude ». Au-delà des consignes de travail et des ordres du supérieur, la manière dont on aborde soi-même son travail compte. Cette attitude se manifeste par un intérêt constant pour le travail, de la perspicacité et un sens des responsabilités. Parmi ces éléments, le sens des responsabilités est particulièrement important. L’IA peut imiter beaucoup de choses, mais elle n’a pas de sens des responsabilités. L’IA peut évaluer un résultat, mais elle ne peut pas évaluer le sens des responsabilités dans le processus.
J’ai essayé les deux et j’avais plutôt l’impression inverse, mais apparemment ce n’est pas le cas.
Quand je l’utilisais, Codex ignorait assez souvent les consignes.
J’ai aussi l’impression que ça a changé récemment parce qu’Anthropic a baissé les performances de 4.6 Opus.
On dit aussi que les technologies permettant de découvrir des vulnérabilités de sécurité ont fait des progrès révolutionnaires.
Le fait d’avoir découvert ces vulnérabilités signifie aussi qu’il devient nécessaire de trouver des moyens de les sécuriser,
il semble donc que les méthodes de sécurité vont elles aussi s’améliorer.
Est-ce que cela ne dépend pas du domaine auquel on l’applique ?
Dans le cas de mon travail en cours, comme
rhwp, quand il faut corriger et traiter des écarts de rendu de 1 mm, utiliser Codex casse tout. Pour l’instant, sur les tâches de très haute difficulté, Claude Code reste devant, mais pour le développement d’apps web où il suffit d’aller jusqu’à un certain niveau en suivant une procédure et avec un workflow et un framework bien établis, j’ai le sentiment qu’utiliser Codex est meilleur pour la santé mentale.Je pense que c’est vraiment une expression qui va droit à l’essentiel.
Pour commencer, les non-spécialistes ne sauront probablement même pas que ces choses existent, ni pourquoi elles sont nécessaires.
HKUDS crée plein de choses intéressantes
https://github.com/HKUDS/nanobot aussi
J’ai plutôt eu l’impression que le fait que le edge de Cloudflare assure le rôle de relais DERP de Tailscale en faisait un concurrent encore plus redoutable. Tailscale aussi envoie les communications via un relais DERP quand le P2P ne fonctionne pas. Le passage « si les PoP (Point of Presence) de l’infrastructure de relais sont limités, une part importante du trafic passe par le relais, ce qui entraîne de la latence et une baisse de fiabilité » m’a particulièrement fait penser à Tailscale. Je pense que j’utiliserai les deux en parallèle. Je vais tester ça tout de suite.
Il ne suffit pas de définir le DNS parent de Tailscale sur AdGuard ?
Moi aussi, je l’utilise comme ça. Cela dit, plutôt que d’attribuer un rôle à un modèle fixe, j’ai tendance à confier d’abord la tâche au modèle le plus puissant tout en ayant le quota le plus large.
Je fais pareil. Un peu plus en détail, j’ai configuré Claude à 100 dollars et Codex à 200 dollars, puis avec Claude Code Opus je fais : planification -> implémentation avec Sonnet -> review par Codex -> vérification de la review avec Opus -> nouvelle implémentation avec Sonnet -> review par Codex (et ainsi de suite). J’en ai même fait une compétence pour que ça tourne en continu, et j’en suis satisfait.
Lorsque
model_context_window=800000est utilisé, il y a un problème à partir du moment où 50 % du contexte est consommé : les réponses aux questions se mettent à suivre les réponses aux questions précédentes. À noter.Je suis d’accord sur le fait que Codex est plus minutieux. Je recommande de coder avec Claude puis de faire la revue avec Codex. Cela prend beaucoup de temps, mais si on le lance avant d’aller aux toilettes ou avant une réunion, le taux d’achèvement est assez élevé.
L’IA sait bien répondre au « comment », mais elle ne sait pas pourquoi il faut faire les choses. Chercher à comprendre la finalité fondamentale d’un travail, avoir la curiosité d’explorer de nouvelles voies au prix d’essais et d’erreurs, et choisir une direction en fonction d’un objectif, voilà ce que seuls les humains peuvent faire. Le sens des responsabilités ne consiste pas seulement à poursuivre un résultat, mais à garder l’objectif en vue tout au long du processus, en continuant à questionner et à explorer.
J’utilise l’offre free tier d’Oracle Cloud. Avec 4 vCPU, 24 Go de RAM et 200 Go, et à part quelques incompatibilités occasionnelles liées à l’architecture ARM, c’est un super jouet.
La capacité à trouver de manière créative d’autres approches que le manuel et les consignes découle elle aussi d’une attitude responsable.
Lorsqu’on évalue la capacité d’une personne à travailler, il y a un élément qu’on appelle l’« attitude ». Au-delà des consignes de travail et des ordres du supérieur, la manière dont on aborde soi-même son travail compte. Cette attitude se manifeste par un intérêt constant pour le travail, de la perspicacité et un sens des responsabilités. Parmi ces éléments, le sens des responsabilités est particulièrement important. L’IA peut imiter beaucoup de choses, mais elle n’a pas de sens des responsabilités. L’IA peut évaluer un résultat, mais elle ne peut pas évaluer le sens des responsabilités dans le processus.
Ne faudrait-il pas déjà que Google fasse quelque chose contre les publicités NSFW, pour commencer ? -_-
Disney, ce n’est pas plutôt les personnages que les revenus des médias ?
J’ai essayé les deux et j’avais plutôt l’impression inverse, mais apparemment ce n’est pas le cas.
Quand je l’utilisais, Codex ignorait assez souvent les consignes.
J’ai aussi l’impression que ça a changé récemment parce qu’Anthropic a baissé les performances de 4.6 Opus.
On dit aussi que les technologies permettant de découvrir des vulnérabilités de sécurité ont fait des progrès révolutionnaires.
Le fait d’avoir découvert ces vulnérabilités signifie aussi qu’il devient nécessaire de trouver des moyens de les sécuriser,
il semble donc que les méthodes de sécurité vont elles aussi s’améliorer.
Le problème chronique de Claude Code, vous ne l’avez apparemment jamais rencontré. Même sur Reddit, ça fait constamment polémique.Pour moi, codex a offert une meilleure expérience.