Advent of SysAdmin 2025

(sadservers.com)

12 points par GN⁺ 2025-12-02 | 2 commentaires | Partager sur WhatsApp

Le calendrier de l’Avent 2025 pour les administrateurs système est une série de défis Linux et DevOps sur 12 jours qui se déroule du 1er au 12 décembre
- Chaque jour, un nouveau scénario de défi d’un niveau de difficulté différent est publié
Les participants peuvent suivre leur progression via la création gratuite d’un compte (un compte est nécessaire pour gérer les scores et le classement)
Un scénario accessible sans inscription est également proposé, afin que tout le monde puisse l’essayer immédiatement
L’accent est mis sur le renforcement des compétences en administration système et en résolution de problèmes dans un environnement DevOps réaliste

Exemple de scénario : “Auderghem: containers miscommunication”

Nom du scénario : “Auderghem: containers miscommunication”
- Difficulté : Easy
- Type : Fix
- Mode d’accès : vérification par e-mail requise
- Limite de temps : 30 minutes
Description du problème :
- Un conteneur Docker nginx doit recevoir le trafic sur le port 80 et le rediriger vers deux autres conteneurs (statichtml1, statichtml2), mais cela ne fonctionne pas
- Le participant doit corriger ce problème
- Tous les conteneurs peuvent être redémarrés, mais il est interdit de les arrêter ou de les supprimer
Conditions de test :
- curl http://localhost → “Welcome to nginx”
- curl http://localhost/1 → “HelloWorld;1”
- curl http://localhost/2 → “HelloWorld;2”
- Le bouton “Check My Solution” exécute le script /home/admin/agent/check.sh pour valider le résultat

Informations sur la plateforme SadServers

SadServers, l’éditeur du service, est une plateforme qui propose des scénarios pratiques et d’entretien axés sur la résolution de problèmes dans des environnements Linux et DevOps

2 commentaires

roxie 2025-12-03

C’était donc l’histoire d’un serveur triste ! C’est vraiment une excellente plateforme.

GN⁺ 2025-12-02

Avis Hacker News

Cela récapitule 12 défis réels de Sysadmin/DevOps rencontrés au travail
1. Empêcher les utilisateurs de se connecter en root
2. Mettre fin à l’habitude où tous les utilisateurs partagent un seul compte et mot de passe sur tous les serveurs
3. Faire en sorte que quelqu’un mette à jour les dépendances de son application vers une version postérieure à 2010
4. Faire utiliser un outil de gestion de configuration au lieu de balancer des fichiers de config d’un laptop vers un serveur avec scp
5. Faire adopter des images immuables (immutable images) contenant la configuration, plutôt que la gestion de configuration
6. Faire abandonner Jenkins pour passer à GitHub Actions
7. Mettre fin à la situation où toutes les clés secrètes de production sont regroupées dans un seul fichier sur S3, et faire adopter un système de gestion des secrets
8. Convaincre la direction et les utilisateurs qui disent « il n’y a eu aucun problème depuis des années, pourquoi faudrait-il un nouveau serveur ? », puis faire approuver l’achat de nouveaux serveurs en expliquant qu’en réalité tout le matériel est sur le point de lâcher côté alimentation, disque, NIC et RAM, et qu’il n’y a plus de pièces
9. Obtenir de la direction l’autorisation de forcer la rotation de clés d’accès AWS qui n’ont pas changé depuis pas moins de 8 ans
10. Faire cesser cette situation absurde où une application utilise les clés d’accès du compte root AWS
11. Faire en sorte que les utilisateurs buildent leurs applications sous forme de conteneurs
12. Faire en sorte que les utilisateurs déploient eux-mêmes sans votre aide
Il suffit de boire un verre de scotch à chaque défi accompli. Joyeuses fêtes !
- À propos du point 6 sur GitHub Actions, il y avait un problème où un worker authentifié disparaissait du pool après environ 5 jours d’inactivité
  Ils avaient mis en place un workflow de PR complexe, et s’il n’y avait pas de PR pendant quelques jours, tout cassait soudainement
  GitHub ne fournissait ni information ni alternative à ce sujet. À mon avis, d’autres solutions sont bien meilleures pour la CI
- La première étape de ce genre de problème consiste à expliquer pourquoi c’est important de manière concrète et documentée
  La plupart de ces points semblent évidents, mais ils ne le sont pas pour tout le monde
- Passer de Jenkins à GitHub Actions… je ne vois vraiment pas pourquoi il faudrait faire ça
- À la phrase « Sysadmin/DevOps, c’est désormais synonyme », quelqu’un a plaisanté en disant l’avoir signalée aux autorités
- Les points 5 et 6 relèvent des préférences et des compromis, mais pour le reste je suis totalement d’accord
Notre entreprise utilise Sad Servers pour évaluer les candidats DevOps/SRE
Il y a des retours disant que c’est un peu stressant pendant l’entretien, mais qu’au final tout le monde trouve que c’était une bonne expérience
Il suffit d’envoyer le lien dans le chat Zoom et de partager l’écran, et ça fonctionne immédiatement, donc c’est très efficace pour les entretiens
- Ça me fait plaisir d’entendre ça, et moi aussi je vais commencer aujourd’hui le défi quotidien de Sad Servers
  J’ai de l’expérience en home lab et comme tech lead dans de petites entreprises, mais pas encore dans des environnements à grande échelle
  En ce moment, je me concentre sur le comblement de mes lacunes et la préparation de certifications
Quand on a le moral dans les chaussettes et rien à faire au monde, résoudre des problèmes Sad Server comme si on les hackait a l’air amusant
Imaginez appuyer sur Ctrl+w pour effacer un mot dans le terminal, alors qu’en fait vous êtes dans la fenêtre du navigateur et que l’onglet se ferme… c’est la tristesse absolue
- J’avais déjà lancé un terminal dans le navigateur avec gotty, et toute l’équipe avait remappé Ctrl+w en Ctrl+`
  Après un an et demi à développer dans cet environnement, j’ai encore peur que le vrai terminal se ferme chaque fois que j’appuie sur Ctrl+w
- Ça rappelle à quel point la séparation de la touche Command sur macOS est appréciable
- Cela dit, on peut rouvrir l’onglet récemment fermé avec Ctrl+Shift+T
- (Créateur) Désolé. Il suffit de recliquer sur le bouton « Open the Server Terminal in a New Window »
- Je compatis. Ça m’arrive souvent aussi avec un KVM
De nos jours, on appelle apparemment ça SRE
Je n’aime pas qu’on ne fasse que changer le nom pour créer un buzzword
- Ma définition préférée était : « le SRE, c’est traiter l’exploitation comme un problème logiciel »
- Moi non plus je n’aime pas les buzzwords, mais le SRE est clairement un rôle différent
- Le SRE a pour rôle de faire en sorte que les applications continuent de tourner sur la plateforme
  Cela implique divers outils comme la collecte de métriques ou l’automatisation du déploiement
  Dans les petites entreprises, le Sysadmin cumule souvent aussi le rôle de SRE, mais à plus grande échelle la séparation est nette
On dirait que la progression n’est pas sauvegardée
- (Créateur) Il conseille de vérifier le dashboard et, si ça ne marche toujours pas, de le contacter par email ou via le formulaire du site
J’adore vraiment Sad Servers, et j’attends une version Windows
- (Créateur) Merci, et il dit qu’une version Windows est envisagée pour un jour
Je me dis que ce serait bien d’avoir une plateforme de ce type aussi pour l’écosystème de conteneurs comme k8s ou Docker
- (Créateur de Sad Servers) Il existe déjà des scénarios basés sur k8s
  Il y a une version qui tourne sur une VM unique, et des expérimentations sont aussi en cours pour l’exécuter par pod sur un cluster k8s de PoC
  Des scénarios podman sont aussi prévus à l’avenir
Sans spoiler, j’ai résolu le problème mais le script de vérification ne passe pas
curl fonctionnait bien, mais le script imposait une manière précise de configurer les choses
Pour ce genre de cas, je pense qu’une validation fondée uniquement sur le résultat final, comme dans un CTF, est préférable
- (Créateur) Merci pour le retour, une nouvelle image a maintenant été déployée pour ne vérifier que l’objectif
  Une vérification parfaite est difficile, mais des améliorations sont en cours pour minimiser les faux négatifs
(Discussion autour d’un commentaire supprimé)
- Il avait été mentionné qu’Advent of Code exige lui aussi un compte
- (Créateur) Sur la plateforme, il suffit de cliquer deux fois sur Home → « give me a server » pour obtenir immédiatement une VM
  Il pense qu’il existe très peu de SaaS qui fournissent une VM sans inscription
  Merci pour le retour, et il dit avoir ajouté un bouton explicite sur la page /advent
- Il y a aussi eu une réponse à moitié en plaisantant : « Alors, comment voudrais-tu que ça fonctionne, tu es vraiment sysadmin ? »