8 septembre 2021
par l’équipe d’archives-it
L’Internet Archive est ravi d’annoncer la version préliminaire d’une mise à niveau importante du logiciel Wayback Web Archive Replay que nos partenaires utilisent pour accéder et parcourir leurs collections d’archives Web. La nouvelle version de Wayback est une reconstruction complète de la version antérieure du logiciel utilisé à la fois par Archive-It et les nombreux portails d’accès personnalisés que nous créons et hébergeons au nom de nos utilisateurs mondiaux.
Le nouveau Wayback représente un pas en avant dans la qualité et l’exhaustivité de la relecture d’archives Web. Il facilitera plus facilement les développements de fonctionnalités futurs et continuera l’héritage du logiciel Wayback en tant qu’outil de relecture d’archives Web d’origine, le plus largement utilisé et le plus activement entretenu depuis sa version originale en 2001.
Le nouveau Wayback publié sur nos services d’archivage Web s’intègre également mieux à la version alimentant la machine Wayback, ce qui permettra un partage plus facile des correctifs de relecture et du développement collaboratif. Nous allons déployer le nouveau Wayback pour archiver-it, nos services d’archivage Web de contrat personnalisés et nos portails d’accès hébergés au cours des prochaines semaines. Recherchez plus de nouvelles alors que nous apportons une rediffusion d’archives Web améliorée à tous nos partenaires.

Accès à la machine Wayback sur archive.org en 2001
La «machine de Wayback» Lancé en 2001 En tant que première vue publique sur les archives Web de l’archive d’Internet. Archive-it, la version personnalisée du logiciel d’origine Wayback Replay a connu un développement significatif au fil des ans pour répondre aux besoins des utilisateurs et ajouter de nouvelles fonctionnalités et améliorations. Pendant ce temps, Le Web est devenu un support plus dynamique et complexe à préserver. En réponse, nous avons construit Brozernotre intervêpe Web basée sur un navigateur, pour l’amélioration de l’archivage des sites Web dynamiques, réactifs et riches en médias; La nouvelle version de Wayback facilitera une amélioration similaire dans le rendu du contenu Web archivé.
Le nouveau Wayback a été réécrit complètement dans le langage de programmation Python plus contemporain et comprend le nouveau Moteur de règles de relecturequi est un système plus extensible soutenant les innombrables améliorations de relecture provenant d’années d’efforts d’assurance qualité des partenaires des archives et des correctifs techniques de l’équipe d’archives. Le moteur des règles de relecture permettra également un partage plus large de la communauté et une contribution à une bibliothèque de correctifs de relecture qui peuvent être partagées entre les systèmes. Après la sortie de la production dans nos différents services et plateformes d’archivage Web, et tous les bogues sont écrasés, le nouveau code Wayback sera mis à disposition sous licence open-source sur notre page GitHub.

Un tableau de bord covide conservé par l’IIPC lorsqu’il rejoue dans les environnements de relecture de Wayback hérité (à gauche) et à droite)
Le personnel des archives sur Internet et les partenaires des archives-it ont collaboré au test et à la raffinement du nouveau Wayback, qui a transmis une batterie de mesures de contrôle de la qualité pour atteindre la parité avec la version Java qui sera bientôt basée sur Java. Les testeurs et les partenaires ont documenté les nombreux domaines d’amélioration de la rediffusion par rapport au nouveau Wayback, en particulier ses installations avec le codage de contenu moderne, les URL côté client et la rediffusion des tableaux de bord de données archivés, des lecteurs médiatiques et des sites de presse populaires.
Pour leurs engagements généreux dans les tests bêta, nous sommes endettés et reconnaissants envers les partenaires d’archivage Web de Columbia University Libraries, International Internet Preservation Consortium (IIPC), East Baton Rouge Parish Library, Gates Archive, Harvard University Archives, Library and Archives Canada, National Library of Medicine, New York Art Resources Consortium (NYARC), New York University et University of North Caroline de Chapel Helbary. De l’équipe d’archives Internet, les rejets spéciaux sont consacrés à l’ingénieur logiciel Barbara Miller et à l’archiviste Web Karl-Rainener Blumenthal pour leurs contributions et leur leadership dans le projet, et à diriger l’ingénieur logiciel Kenji Nagahashi pour le développement original pour la machine Wayback.

Un fil d’actualités en direct collecté par la National Library of Medicine alors qu’elle rejoue dans l’héritage (à gauche) et les nouveaux environnements de relecture de Wayback
Idéalement, la mise à niveau vers le nouveau Wayback sera anticlimatique pour nos nombreuses archives et les partenaires rampants gérés – vos archives rejoueront comme prévu et sans perturbation et, dans l’ensemble, les utilisateurs devraient voir à la fois une rediffusion améliorée et une meilleure performance. À l’avenir, notre objectif est de réduire le volume et la complexité des interventions de code personnalisées requises par les partenaires qui collectent des sites Web hautement interactifs et de construire sur cette nouvelle version de Wayback en ajoutant de nouveaux outils et fonctionnalités pour fabriquer l’archivage Web, et consulter les archives Web, plus facile pour tous.
Apprendre encore plus
Vous pouvez regarder le webinaire enregistré ci-dessous pour en savoir beaucoup plus sur la version, y compris plus d’améliorations d’exemples de Archive-IT Partners et Discussion en direct.