Comment accéder à des fichiers numériques des années 1990
Une étude de cas par Tessa Walsh
Étape 1 : Prenons d’abord un support médiatique. Il faut l’identifier et savoir quel matériel utiliser pour le lire.
(Ceci est un disque zip1.)
-
Les disques zip sont des disquettes à grande capacité, produites par Iomega, qui étaient couramment utilisées comme outil de sauvegarde et de transfert dans les années 1990. ↩
Étape 2 : Connectez l’unité à BitCurator1 en utilisant un bloqueur en écriture2 matériel pour empêcher toute modification accidentelle du disque.
-
L’environnement BitCurator est une suite d’outils et de logiciels libres et ouverts d’expertise judiciaire en informatique. BitCurator a été mis au point par la University of North Carolina at Chapel Hill spécialement pour être utilisé par les établissements collectionneurs, et est maintenant géré par le BitCurator Consortium, organisme à but non lucratif dont le CCA est membre. ↩
-
Les bloqueurs en écriture sont des appareils qui permettent aux utilisateurs de consulter et de récupérer des données sur des supports numériques d’enregistrement sans modifier leur contenu (c’est-à-dire les fichiers et les métadonnées du système de fichiers comme les dates de dernière modification). ↩
Créez une image disque1 octet par octet de l’unité.
-
Une image disque est un fichier numérique qui reproduit exactement le contenu et la structure d’un support physique d’enregistrement, comme un disque dur ou une disquette. Les images disques conservent toutes les qualités du support d’origine sous une forme logicielle qu’il est plus facile de consulter et de conserver à long terme. ↩
Étape 3 : Analysez l’image disque.
(Dans ce cas-ci, le fait qu’il s’agit d’un disque au format HFS1 indique que les fichiers proviennent d’un Mac.)
-
Les supports d’enregistrement comme les disques durs et les disquettes utilisent des systèmes de fichiers pour garder la trace des fichiers et de leurs métadonnées essentielles (dates, type de fichier, droits d’utilisation, etc.). Le système de fichiers hiérarchique (Hierarchical File System – HFS) est un système exclusif utilisé par Apple sur ses appareils de la période Mac OS « Classic ». ↩
Étape 4 : Caractérisez l’image disque et extrayez les fichiers.
(Pour les images brutes de disques au format HFS, nous pouvons utiliser HFSExplorer1, soit directement, soit à partir de Brunnhilde2.)
-
HFSExplorer est une application qui peut lire et exporter des fichiers à partir de supports d’enregistrement au format Mac, notamment de ceux qui utilisent le système de fichiers HFS. ↩
-
Brunnhilde est un outil de caractérisation libre et ouvert pour les répertoires et les images disques, qui génère des rapports lisibles par l’utilisateur et assimilables par machine afin d’aider au tri et à la description des archives numériques. ↩
Étape 6 : définissez quel traitement apporter.
(Dans ce cas-ci, nous devrions vérifier si le passage sur un Mac moderne nous aide à identifier ces fichiers générés par Mac et à les exploiter. Il est probable que les fichiers .sea soient un certain type de fichiers d’archives1. Nous pouvons voir si la version en ligne de commande2 de The Unarchiver3 sait comment les traiter.)
-
Un fichier d’archives est un fichier numérique qui comprend un ou plusieurs fichiers numériques regroupés à des fins de portabilité et de stockage. Les fichiers d’archives sont souvent compressés, mais pas toujours. ↩
-
Les utilitaires en ligne de commande sont des programmes qui n’ont pas d’interfaces graphiques (c’est-à-dire de fenêtres avec des boutons). À la place, les utilisateurs interagissent avec ces utilitaires en entrant des commandes sous forme de texte sur un terminal. ↩
-
The Unarchiver est un programme de décompilation d’archives pour Mac conçu pour traiter plus de formats de fichiers d’archives que ne peut le faire spontanément Mac OS, avec à la fois des interfaces graphiques et en ligne de commande. ↩
Reprenez l’étape 5 : Étudiez les résultats et déterminez ce que vous avez obtenu.
(Les fichiers .sea sont des fichiers d’archives, plus précisément des archives StuffIt Expander1. Notre Mac reconnaît que certains fichiers contenus dans ces compilations sont d’anciens documents Word et il n’identifie pas les autres.)
-
StuffIt Expander est un utilitaire exclusif de gestion d’archives offrant la possibilité de créer des fichiers d’« archives autoextractibles », qui peuvent en théorie se décompiler sans nécessiter un quelconque logiciel. StuffIt était extrêmement prisé dans les années 1990. Malgré leur nom prometteur, les « archives autodécompactables » ne sont pas toujours capables de se décompiler sur les ordinateurs modernes sans l’aide d’un logiciel supplémentaire. ↩
Reprenez l’étape 6 : Définissez quel traitement apporter.
(Nous pouvons utiliser Siegfried1 pour identifier le format précis et la version du fichier en question.)
-
Siegfried est un outil libre et ouvert d’identification de format de fichiers, basé sur la reconnaissance de signatures, ce qui veut dire qu’il identifie les fichiers en comparant des parties de leur code à des signatures connues regroupées dans des bases de données de registres de formats plutôt que de se fier à leur extension (arbitraire et parfois inexacte). ↩
(Notre fichier est un fichier de traitement de texte ClarisWorks! Peut-être que Word saura quoi en faire… Eh bien, nous nous rapprochons du but, mais pourquoi ce formatage étrange? Peut-être que LibreOffice1 peut permettre de mieux rendre compte du fichier.)
-
LibreOffice est une suite bureautique libre et ouverte dérivée d’OpenOffice et gérée par The Document Foundation. LibreOffice est capable de lire des fichiers créés dans un certain nombre de formats de traitement de texte obsolètes et/ou spécifiques d’une niche commerciale. ↩
(Et voilà! À présent, nous exportons le fichier dans un format adapté à la conservation tel que PDF/A1 pour éviter d’avoir à répéter ce processus tous les dix ans.)
-
PDF/A est une version standardisée ISO du format de fichier PDF très répandu, conçue pour être utilisée dans la conservation et l’archivage à long terme. ↩
Étape 7 : Adaptez l’échelle de votre opération.
(Si nous voulons réaliser ce type de travail d’archéologie ou de conservation numérique à plus grande échelle, disons sur chaque fichier .sea de cette compilation, sur chaque ensemble de fichiers .sea de ce disque, sur cette archive ou sur la totalité de la collection du CCA, nous devons automatiser les processus là où nous le pouvons. Heureusement, nous pouvons utiliser des scripts et des logiciels de conservation numérique comme Archivematica1 pour effectuer des tâches telles que l’identification des formats, la caractérisation et la normalisation des formats les plus courants en lots, ce qui nous permettra de consacrer notre temps aux cas difficiles et intéressants.)
-
Archivematica est un système de conservation numérique libre et ouvert qui gère la caractérisation, la compilation, le stockage, le suivi et la récupération des fichiers numériques dans des archives numériques de grande envergure. Un certain nombre d’établissements en dehors du CCA utilisent Archivematica, notamment les bibliothèques du MIT, la Tate et le Museum of Modern Art. ↩
Ce disque zip fait partie des KOL/MAC Project Records.