Il semble que le serveur ait été surchargé après l’assouplissement, il y a quelques jours, des réglages de protection anti-crawler
À l’origine, c’était une mesure destinée à éviter que des utilisateurs légitimes soient bloqués, mais l’assouplissement a sans doute été trop important
J’ai reçu une alerte PagerDuty à 5 h 24 et, quand j’ai vérifié HN, tout avait l’air correct, donc j’ai marqué le problème comme résolu, mais en réalité j’étais juste en train de dormir
Je pense en savoir plus dans l’après-midi
C’est drôle, c’est maintenant officiel que Dang administre HN à moitié endormi
Il ne faut pas trop s’inquiéter. Au final, ce n’est qu’un site pour lire des articles et poster des commentaires
Il faut dormir suffisamment. Quelques heures d’indisponibilité, ce n’est pas grave. Merci comme toujours
Quand HN ne s’est pas ouvert la première fois, j’ai cru à une panne mondiale
J’ai vérifié sur downforeveryoneorjustme.com/hacker-news et il y avait eu 52 signalements en peu de temps
Je me demande qui a autant crawlé. Un DDoS, ou bien de la collecte de données par une entreprise d’IA ?
HN a déjà une API et même des jeux de données, donc c’est intéressant de se demander pourquoi crawler malgré tout
Une politique d’exploitation consistant à couper temporairement les alertes pendant les heures de sommeil aux États-Unis pourrait aussi être une bonne idée
HN est important, mais le risque n’est pas assez grand pour justifier de se réveiller en pleine nuit
J’ai appris par expérience que le coût du manque de sommeil est assez élevé
Pas besoin de s’excuser. C’était l’occasion pour nous tous d’interrompre un moment les tâches qu’on repoussait
Quand HN est tombé, je suis entré dans une boucle infinie
« HN est down → je vais vérifier la panne sur HN → HN est down », en boucle
Pareil pour moi. Je me suis dit « ça va revenir d’ici peu » et j’ai continué à rafraîchir pendant des heures
Heureusement que la boucle est maintenant cassée
J’ai pris l’habitude inconsciente de rouvrir le navigateur et de vérifier la page d’accueil de HN deux ou trois fois
C’est drôle, moi je tombe dans la boucle HN même quand ce n’est pas down
En me réveillant ce matin, je me suis demandé si je m’étais réveillé en enfer
J’ai demandé sur un serveur Discord Linux en pensant qu’il y avait eu un incident majeur. Genre : « HN est down, il y a une grosse panne ? »
Ce que j’ai découvert aujourd’hui, c’est que ma main a un réflexe conditionné qui ouvre Hacker News automatiquement
C’est en lisant les commentaires ici que j’apprends le plus. C’est sans doute comme ça que cette addiction est née
Heureusement, je ne suis pas le seul. Il me suffit de taper « n » dans la barre d’adresse du navigateur pour que HN apparaisse en autocomplétion
J’utilise LeechBlock pour mettre un minuteur de 5 secondes à l’ouverture d’un nouvel onglet HN
Si je perds le focus, le minuteur échoue, donc ça aide vraiment à ralentir Lien LeechBlock
J’ai dépassé ce stade, j’ai créé 4 apps, et maintenant mon ARR approche les 500 millions de dollars
J’ai activé le mode no procrast mode pour n’autoriser HN que 10 minutes par heure, et c’était assez efficace
Sans HN dans ma routine du matin, il manquait quelque chose
Ça a eu plus d’impact sur ma journée qu’une panne AWS ou Cloudflare
Je me demandais si le compte Twitter HNStatus était encore utile
Sans connexion, on ne voit qu’un fil non chronologique, donc c’est presque inutilisable
Quelqu’un demandait s’il existait un meilleur moyen de vérifier l’état du service
Nous n’y postons que si nous savons qu’il y a une panne et qu’elle dure plus de quelques minutes
Cette fois-ci, nous ne le savions pas. Voir ce commentaire
xcancel.com/HNStatus conserve l’ordre chronologique uniquement après le tweet épinglé
Remplacer un lien x.com par xcancel.com est beaucoup plus propre
Dans l’app mobile, si on change le tri de l’onglet « Following » en « most recent », on retrouve un fil chronologique
Le réglage est aussi conservé sur le web
hn.hund.io est aussi une page de statut, mais cette fois elle n’a rien détecté
Il y a aussi le problème que le texte gris donne peu envie de lire
La blague disant qu’il fallait dépenser le budget d’erreur (error budget) avant la fin de l’année m’a fait rire
Ça m’a rappelé les budgets « à utiliser avant expiration » en fin d’année, quand on traitait en urgence des demandes qui avaient auparavant été refusées
Au final, on avait surtout l’impression de ne pas s’en être vraiment servi pendant six mois
Fait intéressant, le site continuait à s’ouvrir quand on n’était pas connecté
Quand c’est tombé, je me suis dit : « Bon, aujourd’hui va enfin être une journée productive »
La prochaine fois, il suffit d’ouvrir en navigation privée
La plupart des pannes HN n’affectent que les requêtes d’utilisateurs connectés
On peut aussi supprimer les cookies, mais il faudra se reconnecter après le rétablissement
hahaha
Le web ne s’ouvrait pas, mais mon outil HN en CLI pouvait encore accéder au site en lecture seule Lien hnterminal
Plusieurs services de détection d’incident n’ont pas bien fonctionné cette fois
On a l’impression qu’il faudrait un tableau de bord de fiabilité
J’ai l’impression qu’ils se sont fait piéger par le cache. Les pages pour utilisateurs déconnectés étaient fortement mises en cache, donc elles semblaient répondre normalement
Donc maintenant, il nous faut aussi un détecteur de panne des détecteurs de panne
En gros, il nous faudrait quelque chose comme downdetectorsdowndetector.com
1 commentaires
Avis sur Hacker News
Il semble que le serveur ait été surchargé après l’assouplissement, il y a quelques jours, des réglages de protection anti-crawler
À l’origine, c’était une mesure destinée à éviter que des utilisateurs légitimes soient bloqués, mais l’assouplissement a sans doute été trop important
J’ai reçu une alerte PagerDuty à 5 h 24 et, quand j’ai vérifié HN, tout avait l’air correct, donc j’ai marqué le problème comme résolu, mais en réalité j’étais juste en train de dormir
Je pense en savoir plus dans l’après-midi
Il faut dormir suffisamment. Quelques heures d’indisponibilité, ce n’est pas grave. Merci comme toujours
J’ai vérifié sur downforeveryoneorjustme.com/hacker-news et il y avait eu 52 signalements en peu de temps
Je me demande qui a autant crawlé. Un DDoS, ou bien de la collecte de données par une entreprise d’IA ?
HN a déjà une API et même des jeux de données, donc c’est intéressant de se demander pourquoi crawler malgré tout
HN est important, mais le risque n’est pas assez grand pour justifier de se réveiller en pleine nuit
J’ai appris par expérience que le coût du manque de sommeil est assez élevé
Quand HN est tombé, je suis entré dans une boucle infinie
« HN est down → je vais vérifier la panne sur HN → HN est down », en boucle
Heureusement que la boucle est maintenant cassée
Ce que j’ai découvert aujourd’hui, c’est que ma main a un réflexe conditionné qui ouvre Hacker News automatiquement
Si je perds le focus, le minuteur échoue, donc ça aide vraiment à ralentir
Lien LeechBlock
Sans HN dans ma routine du matin, il manquait quelque chose
Je me demandais si le compte Twitter HNStatus était encore utile
Sans connexion, on ne voit qu’un fil non chronologique, donc c’est presque inutilisable
Quelqu’un demandait s’il existait un meilleur moyen de vérifier l’état du service
Cette fois-ci, nous ne le savions pas. Voir ce commentaire
Remplacer un lien x.com par xcancel.com est beaucoup plus propre
Le réglage est aussi conservé sur le web
Il y a aussi le problème que le texte gris donne peu envie de lire
La blague disant qu’il fallait dépenser le budget d’erreur (error budget) avant la fin de l’année m’a fait rire
Au final, on avait surtout l’impression de ne pas s’en être vraiment servi pendant six mois
Il semble que la panne ait duré environ 3 heures
Voir le lien incident,
ainsi que downforeveryoneorjustme.com/hacker-news
Étrangement, il n’y avait aucune trace sur statuspal
Lien statuspal
Quand c’est tombé, je me suis dit : « Bon, aujourd’hui va enfin être une journée productive »
La plupart des pannes HN n’affectent que les requêtes d’utilisateurs connectés
On peut aussi supprimer les cookies, mais il faudra se reconnecter après le rétablissement
Le web ne s’ouvrait pas, mais mon outil HN en CLI pouvait encore accéder au site en lecture seule
Lien hnterminal
Plusieurs services de détection d’incident n’ont pas bien fonctionné cette fois
On a l’impression qu’il faudrait un tableau de bord de fiabilité