3 points par GN⁺ 2025-11-10 | 2 commentaires | Partager sur WhatsApp
  • Une bande UNIX V4 de Bell Labs datant de 1973 a été découverte dans une réserve de l’université de l’Utah, ouvrant la possibilité de restaurer des données originales des débuts d’Unix
  • Cette version est un document rare d’Unix dont le noyau et les utilitaires de base ont été écrits pour la première fois en langage C, et dont aucune copie complète n’est connue à ce jour
  • La bande porte une étiquette manuscrite indiquant « UNIX Original From Bell Labs V4 », dont l’écriture a été identifiée comme celle du regretté professeur Jay Lepreau
  • La bande retrouvée est un original que Martin Newell, l’inventeur de la “Utah teapot”, avait reçu d’AT&T, et son transfert vers le Computer History Museum (CHM) est en préparation
  • Al Kossow du CHM est chargé de la restauration et prévoit de lire les données avec un équipement de conversion analogique-numérique ; la bande est considérée comme une source majeure pour la reconstitution des premières recherches sur Unix

Découverte de la bande Unix V4

  • En rangeant une salle de stockage du département d’informatique de l’université de l’Utah, une bobine de bande 9 pistes portant une étiquette UNIX V4 (1973) de Bell Labs a été retrouvée
    • L’étiquette comporte, écrite à la main, la mention « UNIX Original From Bell Labs V4 (See Manual for format) »
    • L’écriture a été identifiée comme celle du professeur Jay Lepreau, décédé en 2008, selon la confirmation de son ancien élève, le professeur Robert Ricci
  • Ricci a révélé la découverte sur Mastodon, en expliquant qu’il s’agissait d’une version dont aucune copie complète n’est connue
  • Cette bande doit être transportée directement au Computer History Museum (CHM)

Importance historique d’Unix V4

  • UNIX V4 est la version dans laquelle le noyau et une partie des utilitaires essentiels ont été réécrits en C pour la première fois, un tournant majeur dans l’histoire d’Unix
  • À ce jour, il ne subsiste que des fragments du code source du noyau des versions précédentes, quelques pages de man et le manuel du programmeur de novembre 1973
  • Cette découverte est donc considérée comme un élément ouvrant la voie à une restauration complète possible des premières versions d’Unix basées sur C

Provenance de la bande et personnes liées

  • Des recherches supplémentaires ont confirmé que cette bande avait été reçue d’AT&T par Martin Newell
    • Newell est connu dans le domaine de l’infographie comme l’inventeur de la “Utah teapot”, également apparue dans l’économiseur d’écran OpenGL de Windows NT
  • Ricci a ensuite partagé cette information, soulignant que la valeur historique de la bande s’en trouvait encore renforcée

Plan de restauration et approche technique

  • La restauration sera prise en charge par Al Kossow, archiviste logiciel au CHM
    • Il prévoit de fixer un amplificateur de lecture sur la tête, puis d’utiliser un convertisseur analogique-numérique multicanal à haute vitesse pour vider les données dans environ 100 Go de RAM,
      avant de les traiter avec le programme d’analyse readtape écrit par Len Shustek
    • La bande est une bande 9 pistes 3M de 1 200 pieds datant des années 1970, jugée très susceptible d’être restaurable
  • Kossow a indiqué avoir fait remonter ce projet parmi les priorités élevées afin de lancer la restauration

Portée de la découverte

  • Cette découverte est considérée comme une occasion rare de reconstituer le processus d’évolution technique des débuts d’Unix
  • Le CHM et l’équipe de Bitsavers collaborent sur la restauration, attirant l’attention des communautés de préservation de l’open source et de l’histoire informatique
  • The Register estime que ce document précieux « ne pourrait pas être entre de meilleures mains » et affiche son attente d’une restauration réussie

2 commentaires

 
click 2025-11-10

Cette bande a vraiment une excellente capacité de conservation.

 
GN⁺ 2025-11-10
Avis Hacker News
  • Le contenu de la bande comprenait une simple liste de choses à faire
    Par exemple, rendre la sortie d’Emacs plus facile, ou renommer le répertoire temporaire. Les anciens noms, bin ou dev, paraissaient assez drôles tant leur sens était ambigu

    • Moi, j’aime justement cette ambiguïté de bin et dev
      Unix regorge de jeux de mots comme cat, man, more/less. En revanche, etc me semble un peu étrange
  • C’est regrettable de voir à quel point l’informatique oublie son passé
    On reconstitue et on étudie des armes antiques ou les expériences de Galilée, mais les réalisations des hackers des années 60 et 70 tombent dans l’oubli. Pourtant, il y aurait beaucoup à apprendre des contraintes de cette époque

    • L’industrie du cinéma est similaire. Il n’existe pratiquement aucun système de conservation, donc des films classiques brûlent ou disparaissent
      Un légendaire film muet américain a même été retrouvé par hasard dans une bibliothèque espagnole, puis restauré. On dirait que les artistes et les entreprises ne voient que le présent, sans considérer leurs œuvres passées comme faisant partie de l’histoire
    • Je ne suis pas d’accord. L’intérêt pour le rétrocomputing et la demoscene reste très fort
      Des projets autour du déchiffrement de bornes d’arcade des années 90 ou de la restauration bit à bit de jeux classiques sont toujours très actifs
    • En réalité, c’est pareil dans tous les domaines. La majeure partie du passé n’a été préservée que par hasard
      Même les pyramides et les antiquités auraient toutes disparu s’il n’y avait pas eu de contraintes de coût ou d’espace
    • L’informatique est encore trop jeune
      Les archéologues travaillent sur des objets vieux de plusieurs centaines ou milliers d’années. Dans quelques siècles, des inventions comme Unix seront elles aussi reconnues pour leur valeur historique
    • Je ne suis pas d’accord non plus. Beaucoup de gens consacrent déjà d’énormes efforts à la préservation de l’histoire de l’informatique
  • Je possède un lecteur/enregistreur CCT 9 pistes capable de lire des bandes à partir de 1982
    J’ai été surpris que la bande de 1973 soit en 9 pistes, mais après avoir nettoyé les têtes avec un produit désormais illégal, toutes les données ont été récupérées parfaitement. Il s’agissait de bandes provenant de plusieurs systèmes, dont des mini-ordinateurs DEC

    • Le passage au 9 pistes a eu lieu en 1964, quand l’IBM 360 a introduit l’octet sur 8 bits
    • Je suis curieux de savoir ce qu’était ce « produit de nettoyage illégal », pourquoi il a été interdit, et si tu prévois de publier les données récupérées à des fins d’archéologie numérique
  • C’est une découverte vraiment incroyable. Ce serait formidable de pouvoir émuler Unix v4, puis le compiler et l’exécuter à partir de cette source

    • SIMH émule plusieurs des premiers mini- et micro-ordinateurs, y compris le PDP-11
      Sur la liste de diffusion TUHS, ils ont même restauré et exécuté le code source d’une version de Unix de 1972
      Voir le dépôt GitHub associé
    • Ce serait vraiment choquant si ces premières versions cachaient du spyware ou du code publicitaire
    • Quelqu’un a aussi demandé : « qu’est-ce que tu comptes faire avec ça ? »
  • Le fil de discussion original se trouve dans ce post sur discuss.systems

    • Ce post, les commentaires qui ont suivi, ainsi que la discussion sur TUHS, étaient déjà tous liés dans l’article
  • À l’université, j’avais sauvegardé mon projet de compilateur sur une bande en acier UNIVAC UNISERVO II
    C’était une structure à 8 pistes (6 bits de données, 1 bit de parité, 1 bit d’horloge), et je doute qu’il existe encore aujourd’hui un lecteur capable de la lire. Cela dit, physiquement, elle doit probablement encore être en bon état

    • Mais au moment même où on essaierait de la lire, il y aurait un risque de détérioration
  • Belle découverte. Cela rappelle l’époque où les bandes de la mission lunaire avaient disparu. En cherchant un peu plus, on en trouvera peut-être d’autres

  • Le laboratoire de recherche sur les bandes IBM de Tucson avait déjà récupéré les données des bandes de la navette Challenger
    Je pense qu’une bande vieille de 52 ans peut tout à fait être restaurée

  • « Oh, c’est mon article. Merci, Ricardo ! »

  • Avec la version SIMH-classic, cela devrait clairement fonctionner
    Mieux vaut oublier la version v4 commercialisée et utiliser la version ouverte