Société

Réseaux sociaux : un miroir de la société à préserver

Anne-Catherine DE BAST

©tippapatt – stock.adobe.com, ©KBR, ©chandlervid85 – stock.adobe.com, ©metamorworks –
stock.adobe.com

Il a beau être éphémère, le contenu des réseaux sociaux n’en mérite pas moins d’être conservé… À KBR, la Bibliothèque Royale de Belgique, on planche sur une stratégie d’archivage de ce patrimoine numérique, témoin de notre belgitude, avant qu’il disparaisse…

 

Chaque seconde, 6 000 tweets et 6 profils Facebook sont publiés dans le monde. Depuis la création d’Instagram en 2010, 50 milliards de photos ont été postées. Aujourd’hui, 8,83 millions de Belges sont actifs sur les réseaux sociaux, d’après la dernière étude de Kepios, We Are Social et Hootsuite, référence pour les statistiques liées à l’usage des réseaux sociaux dans le monde. Cela représente 76% de la population, la presque totalité des personnes actives.

Progressivement, Facebook, Twitter, Tik Tok et les autres se sont fait une place dans notre quotidien. Ils sont devenus la norme. Incontournables. Indispensables, même, pour certains. Et ce, malgré leur caractère éphémère: bien malin qui pourrait annoncer la durée de vie d’un tweet au moment de sa publication ! Et pourtant, tout ce contenu joue un rôle important: il est le reflet de notre société à un instant précis. Un patrimoine immatériel qu’il convient donc de préserver pour éviter qu’il disparaisse.

À KBR, la Bibliothèque Royale de Belgique, on planche sur la question depuis près de 2 ans, au travers du projet BESOCIAL, financé par Belspo. Il regroupe des chercheurs de KBR mais aussi des Universités de Louvain-la-Neuve, Namur et Gand, qui ont donc pour objectif d’archiver les réseaux sociaux. Un véritable défi au vu de la complexité des données, de leur conservation, de leur préservation et de leur accessibilité. Au sein de KBR, le projet est porté par Sophie Vandepontseele, qui en est la promotrice, Fien Messens et Friedel Geeraert. «Nous avons lancé BESOCIAL afin de mettre en place une stratégie d’archivage et de préservation des médias sociaux en Belgique, indique Sophie Vandepontseele, également directrice des collections contemporaines à KBR. Les réseaux sociaux représentent une source d’information importante pour de nombreux chercheurs, dans de nombreux domaines tels que l’histoire, le journalisme, la sociologie, les sciences politiques, la linguistique, les sciences de l’information ou encore l’informatique. Leur préservation est essentielle car ils nous permettent de mieux comprendre comment fonctionne la société. Or, rien n’a été mis en place pour conserver leur contenu sur le long terme. Il n’y aura donc aucune trace de ces activités si personne ne prend acte. Il faut développer d’urgence une politique de conservation sous peine que toutes ces publications disparaissent. C’est intéressant pour la recherche, l’analyse de nos sociétés, mais aussi pour ce que nous sommes, à la fois ponctuellement et à grande échelle

Un département de KBR s’occupe spécifiquement des recherches innovantes et de mener des projets qui ont pour but d’améliorer l’accès aux collections. «Le public perçoit souvent la bibliothèque comme une institution de sauvegarde conservant un patrimoine peu accessible ou à certains initiés. KBR veut changer cela. La bibliothèque compte 8 millions de documents, tant physiques que numériques. Parmi ces derniers, on y trouve des collections patrimoniales qui sont numérisées mais aussi des collections nativement numériques, tels que les e-books, les e-journaux et les bases de données, mais il y a aussi des collections qui proviennent du web. Indiscutablement, le Web est un matériau d’excellence pour la recherche et les chercheurs, mais c’est aussi un média très intéressant pour les citoyens», ajoute Sophie Vandepontseele.

 

En tant que bibliothèque scientifique nationale, KBR (Koninklijke Bibliotheek – Bibliothèque Royale) rassemble toutes les publications parues sur le territoire belge ou publiées à l’étranger par des auteurs belges. Elle conserve, gère et étudie un large patrimoine culturel et historique. Parmi ses missions, elle permet au public d’accéder facilement à l’information, encourage la recherche et propose des expériences culturelles. Aujourd’hui, elle regroupe 8 millions de documents, à la fois physiques et numériques, et se veut ouverte vers le public. «Elle a souvent été perçue comme une institution de sauvegarde du patrimoine peu accessible, déplore Sophie Vandepontseele. Oui, notre objectif est la conservation du patrimoine mais nous voulons aussi le rendre accessible, notamment grâce à Internet. Nous avons aussi par exemple ouvert récemment le KBR Museum, afin de mettre le trésor des Ducs de Bourgogne, qui compte plus 300 manuscrits, à la portée du public. Nous travaillons dans le même esprit pour toutes nos collections aujourd’hui, pour autant que les conditions juridiques soient respectées et le permettent.»

Les collections de KBR sont enrichies par le dépôt légal (qui impose à tout éditeur de transmettre ses publications dans le but de conserver le patrimoine culturel de notre pays pour les générations futures) quand il s’agit d’œuvres imprimées. «Dans le cadre du web, on travaille sur une adaptation de la loi sur le dépôt légal, afin d’intégrer le web, précise Sophie Vandepontseele. Pour l’archivage du Web, c’est KBR qui va aller chercher les informations à archiver. Il y a donc une notion de moissonnage à intégrer dans la loi.»

 

#codeco

Mais concrètement, comment archiver les réseaux sociaux ? Impossible de tout collecter, l’échelle est trop importante. Il faut donc définir des règles de sélection. «Le projet de recherche a pour objectif de proposer une stratégie pour la préservation des réseaux sociaux, précise la promotrice. Sur quels critères nous positionner ?» L’une des manières de définir ceux-ci est le crowdsourcing, autrement dit, l’appel à la créativité du plus grand nombre. «Nous demandons au public de nous soumettre des propositions de comptes ou de hashtags en lien avec la réalité de la Belgique à préserver, poursuit Sophie Vandepontseele. Il est important de faire participer le citoyen pour lui demander son avis, mais aussi parce qu’il pourrait mettre en avant des critères auxquels nous n’aurions pas pensé. Nous voulons favoriser la participation citoyenne, faire du bottom-up. Cela a du sens, les publications sont le reflet de ce qu’était la Belgique à un moment donné. Certaines notions peuvent d’ailleurs ne refléter qu’une époque. On voit par exemple arriver des #codeco ou des #inondations, qui se rapportent à des périodes limitées. Ces hashtags seront répertoriés sur une liste vivante, qui va évoluer au gré des événements.»

En parallèle aux hashtags permettant de définir un domaine ou un événement ponctuel, des comptes appartenant à des institutions, mais aussi à des personnalités publiques répondant aux critères qui seront déterminés, seront également archivés. «Nous pensons à des comptes belges qui ont un lien très fort avec notre core business, en lien avec les traditions de l’écriture, de l’édition, de la littérature. Des comptes en lien avec nos collections, avec ce qui forme notre ADN. Je pense aussi à des personnes comme Angèle ou Stromae, par exemple. Si leur nom ressort du crowdsourcing, on archivera leur compte, car le public nous démontrera que cela capte quelque chose de notre Belgitude. En plus de cette campagne de crowdsourcing, l’équipe de BESOCIAL s’appuie bien sûr sur la contribution du public belge et ajoute une série de hashtags et de comptes, en s’appuyant sur l’expertise de KBR et de notre propre réseau. Pour cela, nous nous sommes basés sur une définition large de la notion «patrimoine». L’équipe a également travaillé sur des collections relatives à la nourriture belge ou les musées belges par exemple.»

  

  

#MoulesFrites #FetesDeWallonie #Codeco @angèle @foirelivrebxl :
quels mots-clés pour représenter la Belgique ?

À l’heure de mettre en place une stratégie pour la préservation de certains contenus de réseaux sociaux, KBR fait appel aux Belges. Quels sont les comptes hashtags qui mériteraient, selon eux, d’être archivés ?

Une manière de garantir une sélection diversifiée et représentative de la Belgique, sachant qu’il est impossible d’archiver l’entièreté des médias sociaux belges, compte tenu du nombre important de données. Deux critères de sélection sont exigés:

1) Le contenu doit être accessible publiquement sur Instagram ou Twitter
(pas de comptes ni de messages privés)

2) Le contenu doit présenter un intérêt pour la société belge (actualités, événements sportifs, festivals, commémorations, littérature, minorités, festivités, régions géographiques, musées, événements artistiques, alimentation, monuments, grèves, médias,… )

Les suggestions sont à soumettre à l’adresse www.kbr.be/fr/socialmedia

 

Un défi juridique 

Au-delà de la préservation et de la conservation se posent les questions juridiques et légales. Il est impératif aujourd’hui de respecter la vie privée, mais aussi l’accès à l’information. Ces questions seront analysées plus en profondeur par le Centre de recherche, Information, Droit et Société (CRIDS) à l’Université de Namur.

Une chose est d’ores et déjà définie: aucun compte privé ne sera archivé. Seuls les comptes publics seront préservés, pour une question de vie privée mais aussi d’accessibilité. Car les chercheurs devront aussi définir comment fournir l’accès à ces contenus, tout en respectant les conditions de droit d’auteur. De plus, il faudra aussi déterminer sous quel format conserver les documents à long terme. «Dans le cadre de ce projet, nous disposons d’un serveur spécifique mis à disposition par le CENTAL (Centre de Traitement Automatique du Langage) de l’UCL. Et plus généralement, nous possédons plusieurs serveurs permettant de conserver les collections numériques. Elles sont consultables localement et répliquées en plusieurs endroits par sécurité. Nous avons une politique de stockage durable grâce à BELSPO mais aussi en interne. Par rapport à la préservation numérique à très long terme, nous mettons également des choses en place, via des outils, des softwares, etc. Il est important de garder en tête qu’il ne faut pas seulement conserver les fichiers, il nous faut aussi les bons lecteurs et les bonnes versions des programmes pour pouvoir les lire !» À l’image des informations autrefois préservées sur disquettes, impossibles à consulter aujourd’hui sans le lecteur adéquat.

Twitter et Instagram en ligne de mire

Mais le projet est également limité par la technique… Instagram et Twitter permettent le transfert des données grâce à une API (Application Programming Interface) présente dans leur système. Cette technologie permet l’échange d’informations en connectant différents logiciels. Néanmoins, la quantité d’informations est limitée. Pour Twitter, seuls 3 200 tweets peuvent être téléchargés par archivage, Instagram limite quant à lui son débit. Il faut donc recommencer le procédé régulièrement. Ces 2 réseaux sociaux sont ainsi les seuls ciblés par le projet BESOCIAL. Facebook ne soutient pas réellement la possibilité d’archiver ses comptes et change régulièrement ses paramètres.

En matière d’archivage des réseaux sociaux, Sophie Vandepontseele constate que tout le monde se pose des questions et rencontre les mêmes problèmes techniques. Au niveau international, mais en Belgique aussi… KBR n’est pas la seule à y réfléchir, des entités fédérées et locales le font également. On a notamment pu l’observer au moment des récentes inondations: comment capter ces instants et ces informations ? Plusieurs initiatives existent déjà, à l’image des projets Best practices for archiving social media in Flanders and Brussels et Archives de quarantaine, mais il manque une dimension nationale.

D’ici quelques mois, BESOCIAL devrait définir des recommandations. En fonction de ses conclusions, KBR prendra attitude. Un colloque international est planifié le 15 septembre prochain afin d’annoncer les résultats et de déterminer la suite qui sera donnée au projet.

DE L’ARCHIVAGE DU WEB À CELUI DES RÉSEAUX SOCIAUX

Le projet BESOCIAL, qui vise l’archivage du contenu des réseaux sociaux, est né à la suite du projet PROMISE (Preserving Online Multiple Information: towards a Belgian strategy), qui avait pour objectif de créer une stratégie fédérale pour la préservation du Web belge à long terme. Un projet important répondant à une nécessité de sauvegarde, pour les générations futures, du Web belge, vu comme le témoin d’une part non négligeable de l’histoire et de l’édition belge.

Aujourd’hui, la phase de recherche est terminée. Un marché public va être lancé dans le but de faire appel à un sous-traitant. «Nous allons externaliser le projet durant les 4 premières années car nous n’avons pas les ressources en interne pour archiver l’ensemble des sites Internet belges, et nous avons envie d’observer la manière de faire d’un partenaire externe, souligne Sophie Vandepontseele. On se rend compte qu’on a besoin d’aide extérieure avant de construire notre propre connaissance technique. 

C’est un énorme chantier, mais c’est aussi une énorme opportunité d’enrichir les collections numériques avec de nouveaux champs de recherche novateurs. Notre ambition est de réaliser un archivage annuel de l’ensemble des sites belges. Il y a des éléments qui restent sur Internet, on pourra les récupérer. Mais les anciennes versions de sites qui ne sont plus en ligne, on ne les aura plus…»

Le projet PROMISE est passé par 4 étapes: identifier les bonnes pratiques en matière d’archivage du Web, mettre en place un projet pilote du Web belge, identifier des cas d’utilisation pour l’étude scientifique et donner des recommandations pour l’implémentation d’un service d’archivage du Web viable. Pendant 2 ans, plusieurs chercheurs ont ainsi travaillé à établir une politique de sélection des sites à archiver, à l’étude de cadres légaux et à développer un prototype de collecte testé et évalué par un panel d’utilisateurs.

Ces résultats servent actuellement à mettre en place l’archivage du Web au sein de KBR, archivage qui devrait être effectif en 2024.

Share This