10 février 2022
par l’équipe d’archives-it

Visualisation de la fréquence de chape
Lancé en juillet 2021, le Archives Programme de cohorte déchaîné soutient et facilite l’engagement de la recherche avec les archives Web.
Rassemblant des équipes de recherche multi-institutionnelles et interdisciplinaires, les membres de la cohorte engagent une collaboration d’un an tout en recevant des ressources et un mentorat des archives Unleashed Team (y compris des universitaires et du personnel des archives Internet) pour mener des recherches ciblées en utilisant des archives Web comme objets universitaires.
Les premières équipes de recherche du programme de toute l’Amérique du Nord et de l’Europe ont sélectionné un large éventail de sujets à étudier, notamment la communication de crise, la désinformation de la santé, le discours pandémique, l’activisme des médias féminisme comparatif et le développement de systèmes de commentaires en ligne. Ils sont également le groupe d’inauguration d’utilisateurs à piloter CAMBRE (Recherche d’archives calcule le hub). Arch est une plate-forme pour générer des ensembles de données et une étape importante du travail intégratif entre les archives Unleashed et les collaborateurs d’archives-it.
Au cours des sept derniers mois, cinq équipes de cohorte ont utilisé Arch pour générer des ensembles de données dérivés à partir de collections d’archives-it pour une analyse plus approfondie, afin d’aborder des sujets de recherche interdisciplinaires. De nombreuses équipes ont utilisé des méthodes telles que l’analyse des sentiments, la modélisation de sujets et le codage thématique pour découvrir des modèles, des changements et des répétitions dans le corpus d’une collection d’archives Web à l’aide de l’ensemble de données en texte clair.
Mais nous savons que les archives Web fournissent plus que le texte d’un site Web, et les équipes ont extrait des métadonnées supplémentaires pour explorer les données HTML, les connexions réseau et même la succursale dans l’analyse d’image. Les équipes ont également exprimé leur intérêt à comprendre les éléments temporels des collections – par exemple, comment le discours ou les éléments Web changent au fil du temps.
Dans une récente interview, un membre de la cohorte a décrit Arch comme une «passerelle» – un point d’entrée lorsque vous travaillez avec des volumes de données trop grandes pour Excel. La plate-forme Arch a permis aux équipes d’acquérir une compréhension rapide du contenu de diverses archives Web, tout en inspirant une analyse supplémentaire basée sur ces contenus.
Les équipes ont développé des workflows en utilisant une variété d’outils pour une analyse supplémentaire des ensembles de données dérivés d’Arch, notamment Géphi (graphique réseau), Iramuteq (analyse de texte multidimensionnelle), et Cahiers de jupyter (un outil critique pour l’analyse de calcul à grande échelle). En plus de tester Arch et de fournir des commentaires, la cohorte préliminaire s’est soutenue mutuellement et a partagé les meilleures pratiques de recherche et les solutions créatives.
Présentation des archives 2021
AWAC2 Analyser les archives Web de la crise covide à travers l’ensemble de données du roman du coronavirus IIPC
Membres du projet: Valéririe Schafer (Université du Luxembourg), Frédéric Clavert, (Université du Luxembourg), Karin de Wild (Université de Leiden), Niels Brügger, Université Aarhus, Susan Aasman (Université de Groningen), Sophie Gebeil (Université de Aix-Marseille)
Communication de crise dans la région du Niagara pendant la pandémie covide-19
Membres du projet: Tim Ribaric, David Sharron, Cal Murgu, Karen Louise Smith, Duncan Koerber (Brock University)
Site Web du projet: https://brockdsl.github.io/archives_unleashed/
Cartographie et suivi du développement de systèmes de commentaires en ligne sur les sites Web d’information entre 1996 et 2021
Membres du projet: Anne Helmond (Université d’Amsterdam / Université de Siegen), Johannes Paßmann, Robert Jansma (Université de Siegen), Luca Hammer (Université de Siegen), Lisa Gerzen (Ruhr University Bochum). Contributeurs: Dave Wahl (Université d’Amsterdam), Steffen Reinhard (Ruhr University Bochum) et Theresa Schulte (Université de Siegen)
Tout ce qui est vieux est encore nouveau: une analyse comparative des tactiques médiatiques féministes entre les 2e et 4e vagues
Membres du projet: Shana MacDonald (Université de Waterloo), Aynur Kadir (Université de Waterloo), Brianna Wiens (Université York), Sid Heeg (Université de Waterloo)
Misinformation de la santé virale des géocités à Covid-19
Membres du projet: Shawn Walker, Michael Simeone, Kristy Roschke, Anna Muldoon, Major Brown (Arizona State University)
Pour en savoir plus sur les projets individuels de la cohorte et leurs progrès au cours de leurs sept premiers mois, veuillez consulter les Archives Unleashed Blog Blog: Applications de recherche avec des archives Web: collaboration entre les archives cohortes déchaînées.
Vous pouvez également en savoir plus de ces équipes de première main dans le cadre de la bibliothèque d’Internet Archive en tant que série de laboratoires, à partir de mars. Visitez le blog sur Internet Archive pour En savoir plus et inscrire pour y assister.
Au nom du projet Cohorts and Archives Unleashed, merci spécial aux partenaires des archives et aux employés dédiés dont le travail de conservation a fourni une opportunité d’exploration et de découverte de la recherche:
- Consortium international de préservation Internet
- Mark Graham
- Nick Ruest
- Université Brock
- Université Duke
- Musée national des femmes dans les arts
- Université de New York
- Université d’État de San Jose, École d’information
- Bibliothèque Schlesinger
- Collections spéciales de l’Université du Temple
Si vous souhaitez en savoir plus sur la participation aux archives 2022, une cohorte de déchaînement, mettant en signet Archives Page de l’événement Unleashed. Un appel à des propositions s’ouvrira à la mi-février 2022.