14 août 2023
par Karl Blumenthal, archiviste Web, archive Internet
Les bibliothécaires d’art, les archivistes Web, les étudiants et les éducateurs se sont réunis à la National Gallery of Art à Washington, DC, le mois dernier pour explorer les données des ressources artistiques en ligne à grande échelle. Les participants ont quitté l’atelier avec une compréhension des cas d’utilisation de la recherche d’archives Web et de la façon de les soutenir. Ils ont appris les processus de création de collections d’archives Web et de les analyser en tant que données, en les préparant à consulter les professeurs et les chercheurs sur les questions qui utilisent des méthodes de calcul.

Comme l’atelier précédent qui s’est tenu à la conférence de la Société des bibliothécaires d’art des bibliothécaires (ARLIS / NA) à Mexico, cet événement a été soutenu par une généreuse subvention de l’Institut des services de musée et de bibliothèque (IMLS). La subvention IMLS, Un réseau national de bibliothèques d’art créant des archives Websoutient les archives d’art collaboratives (CARTA), qui ont collecté et partagé les exemples de données de collecte d’archives Web de l’atelier.

Gauche: La bibliothécaire exécutif Roger Lawson dirige les participants de l’atelier lors d’une visite de la National Gallery of Art Library. À droite: Karl Blumenthal, archiviste Web pour les archives Internet, visite les participants via le format de fichier WARC.
Les participants à l’atelier ont appris les décisions de conservation et techniques qui prennent une collection d’archives Web, puis ont construit leur propre en réponse aux questions du chercheur et aux besoins institutionnels, en utilisant le service d’archives de l’archive d’Internet pour exécuter leurs premiers rampes Web. Les sujets de collection comprenaient des maisons de vente aux enchères, des espaces d’art alternatifs, des scènes d’art régionales et des jours électroniques de l’histoire de l’art.
S’inspirant des visites de la bibliothèque de NGA et des collections d’art modernes, les participants ont ensuite transformé leurs collections en ensembles de données pour la recherche informatique à l’aide du Hub Calcul (Arch) de la recherche Archives (Arch), le moteur de données développé en collaboration avec le projet Archives Unleashed et le soutien de la Fondation Andrew W. Mellon.

Capture d’écran d’un ensemble de données de texte de page Web à partir du Galeries d’art Collection d’archives Web interprétée par les outils de traitement du langage naturel (NLP) hébergés sur le Voyant plate-forme.
En utilisant la collection d’archives Web des galeries d’art de CARTA comme démonstration, les participants ont examiné le contenu de différents types de jeux de données et pratiqué l’analyse et les lire avec des outils gratuits basés sur un navigateur. Ils ont visualisé et exploré leurs données comme des graphiques de réseau de communication, des référentiels d’objets numériques, des mines de texte, etc.
Le personnel des archives sur Internet continuera d’itérer ces documents d’atelier pour créer plus de formation en direct et de tutoriels à la demande pour soutenir la recherche informatique à l’échelle des archives Web. En attendant, n’importe qui peut trouver les données d’échantillons de cet atelier et des guides courts pour analyser son contenu avec des outils populaires et open source ici dans le nouveau centre d’aide Arch.
Si vous souhaitez voir des tutoriels spécifiques ajouter ou organiser un événement pédagogique, veuillez contacter le programme Arch et l’équipe de développement ici: cambre [at] archive [dot] org Et restez à l’écoute pour plus de mises à jour!