Éditorial
MasterClass DNDH 3
Classement et lecture des connaissances à l’épreuve de l’indexation et de l’annotation
« [..] La numérisation de l’analogique le met à la portée de tous, et il en va de même des technologies documentiques, de la capacité de production bottom up de métadonnées par l’indexation, c’est-à-dire de faire émerger de nouvelles formes de métalangages, et de la possibilité de former des processus de transindividuation que nous nommerons contributifs et dont les wikis sont des techniques que chacun fréquente à travers Wikipédia. » (Bernard Stiegler, L’école et le numérique de la société qui vient, 2012, p. 195)
Argument de la journée d’études :
Le traitement des hyperdocuments n’implique pas que les instruments lectoriaux de l’écrit doivent reproduire les guides du support papier. En effet, l’Hyperdocument, et plus généralement l’HyperEdition, autorise au contraire un calcul des structures documentaires qui instrumentent la lecture - notamment les index, tables, glossaires, illustrations… - qui rendent possibles différents points de vue sur les textes dans la double perspective d’une interprétation du calcul et de l’apparition d’une herméneutique du digital.
Cette journée d’études se penche sur les potentialités des littératies notamment dans le développement des standards principalement d’indexation et d’annotation, ceci au profit d’une lecture critique qui s’ouvre vers des formes de valorisation des médiations pour les chercheurs, thésards et étudiants.
Avec différents collègues spécialistes du classement des connaissances, la journée interroge les circuits de lecture, de réflexion et d’apprentissage d’une diagrammatisation digitale relative à l’avenir du savoir.
Cette Masterclass est un événement organisé en partenariat avec les laboratoires MICA, LASCO Lab., l’AMO, l’école doctorale Bordeaux-Montaigne et le Master Humanités Digitales (Parcours Document Numérique). Le coordination scientifique en est Franck Cormerais, de l’équipe E3D du MICA.
Présentation de Manuel Zacklad
Manuel Zacklad
Manuel Zacklad est professeur du Conservatoire national des arts et métiers en Sciences de l’information et de la communication. Après une formation en psychologie et en informatique avec une thèse à l’Université de Technologie de Compiègne, Manuel Zacklad a participé à l’introduction en France du courant de recherche en Computer Supported Cooperative Work (CSCW) en 1994. Il a également été ingénieur R&D à France Télécom durant 4 années puis pendant 3 ans de 1998 à 2001, il a fondé Cog-Net pour créer un éditeur de logiciel de groupware innovants. En 1998, il a créé et été directeur du premier laboratoire pluridisciplinaire sur la coopération Tech-CICO (Technologies de la Coopération pour l’Innovation et le Changement Organisationnel) pendant dix ans à l’Université de Technologie de Troyes, où il a été professeur d’informatique de 1998 à 2008.
À son arrivée au CNAM en 2008, il crée avec Ghislaine Chartron le laboratoire Dicen-IDF (Dispositifs d’information et de communication à l’ère du numérique en Ile-de-France), premier laboratoire en Sciences de l’Information et de la Communication du CNAM, qu’il dirige aujourd’hui. De 2014 à 2019, Manuel Zacklad a été Chef de projet Innovation au Centre Michel Serres afin de diriger les projets innovants de groupes d’étudiant interdisciplinaires de l’Université HESAM. De plus, en septembre 2018 il devient Président de la commission pédagogique des Diplômes Nationaux des Métiers d’Art et du Design de l’Ecole Estienne.
Ses recherches ont abouti à des contributions originales à la théorie du document, notamment au sujet de la documentarisation et du concept de documents pour l’action. Elles ont aussi contirbué à la réflexion des approches sociales de l’organisation des connaissances dans le champs du web socio-sémantique, aussi bien qu’à la définition d’un cadre d’analyse de l’action et de l’activité rendant compte du rôle des artefacts médiateurs dans la création de valeur, inhérent à la réflexion sur la sémiotique des transactions coopératives.
Recherches de Manuel Zacklad
Nous vous présenterons ici trois des thèmes de recherche de Manuel Zacklad dont les contributions peuvent enrichir l’exploration du sujet de la deuxième journée de cette 3ème édtion de la MasterClass DNHD, à savoir les enjeux des pratiques de l’indexation et de l’annotation au sein des processus de classement des connaissances.
Organisation et gestion des connaissances
« Les langages et les index qui organisent l’information, sont devenus des technologies intégrées aux dispositifs de stockage et aux usages de recherche de l’information conditionnant de manière déterminante les modalités d’accès à celle-ci dans les contextes professionnel et de loisir. » (Zackad, 2010).
Le questionnement de la conception et des usages des Systèmes d’Organisation des Connaissances (SOC) représente un enjeu majeur dans la gestion de l’information numérique. La notion de SOC vise à regrouper dans une dénomination unique aussi bien les langages documentaires et les schémas de classification, que les langages issus de l’intelligence artificielle. Les SOC se configurent donc comme des ensembles de termes codifiés constituant un lexique disposant ou non de règles d’association explicites et permettant de faciliter les opérations de gestion portant sur des contenus documentaires ou sur les caractéristiques de situations non préalablement documentées.
Les dispositifs qui façonnent l’architecture de l’information sont aujourd’hui si divers qu’il devient difficile d’en distanguer les propriétés. Manuel Zacklad en entreprend une analyse élargissant cette notion au domaine des index de moteurs de recherche, les SOC automatiques et établissant une différence entre ceux qui relèvent d’une forme d’écriture codifiée manuelle, et ceux issus d’une codification automatique effectuée par des algorithmes informatiques de fouille de texte.
Le travail de recherche de Manuel Zacklad ainsi s’intéresse à la circulation et structuration de l’information à travers une variété de supports et de canaux connectés. Ses observations mettent en lumière la compléxité du trafic d’informations caractérisant le Web, qui y est massif, séquencé, asynchrone. En réponse à ces problématiques, Manuel Zacklad étudie les possibilités de coopération entre humains, mais aussi entre humain et machines, notamment par les actes d’écriture et d’enregistrement des documents. Il propose une approche critique de l’intelligence artificielle, attribuant aux machines les caractéristiques et la sémantique humaine. Dans ce domaine, il étudie l’architecture de l’information et sa codification avec différentes formes d’écriture et de représentation de la connaissance (ontologies, taxonomies, cartes conceptuelles…). Le chercheur explore la réaction de notre société à cette ère de l’information, et les stratégies des individus et institutions mises en œuvre dans la consultation, production et échange des documents.
Pour en en savoir en plus : Manuel Zacklad, « Évaluation des systèmes d’organisation des connaissances », Les Cahiers du numérique, 2010⁄3 Vol. 6
Documentarisation et documents pour l’action
« [La documentarisation] consiste à doter ces supports d’attributs spécifiques permettant de faciliter leur gestion parmi d’autres supports, leur manipulation physique, condition d’une navigation sémantique à l’intérieur du contenu sémiotique, et l’orientation des récepteurs. » (Zacklad, 2005, p. 11).
S’intéressant aux dynamiques des activités collaboratives propres aux collectifs, Manuel Zacklad a questionné les documents dans leur dimension de supports à la coopération. Les Documents pour l’Action (DopA) permettent d’aider à la production collective. Lorsqu’ils sont fragmentés, les DopA “en évolution” mettent en exergue des annotations à caractère sémantique, servant à les modéliser. Les forums de discussions appartiennent également aux technologies annotatives de coopération, notamment par les débats qu’ils abritent, ainsi que leur transparence, traçabilité et clarté.
La documentarisation met également en exergue l’exploitation des documents à travers l’approche transactionnelle.
Le contenu d’un document peut donc être réécrit par les auteurs, dotés d’une autonomie accrue par la numérisation. La médiation diffusionnelle représente, telle un flux, le lien avec le destinataire final du contenu, à l’aide de canaux de distribution, appelés réseaux.
La numérisation a permis la modification et la circulation de documents dans les réseaux, mais aussi l’émergence des plateformes de travail collaboratif. Il est désormais possible d’élaborer, de consulter des espaces documentaires numériques (blogs, Wikis), et d’exploiter cette collaboration grâce aux annotations. Ces médias participatifs nécessitent un processus de rédaction distribuée et de documentarisation donnant lieu à des communautés docu-médiatisées assimilables à une communauté virtuelle qui échange et coproduit des documents digitaux. Cette digitalisation du document entraîne l’apparition de nouvelles disciplines telles que l’informatique, le design ou les sciences de l’information. Les recherches et la diffusion des résultats scientifiques des humanités numériques sont impactées, transformées et amplifiées par l’ère de la documentalité transmédia.
Pour en savoir plus : Manuel Zacklad, Processus de documentarisation dans les Documents pour l’Action (DopA) : statut des annotations et technologies de la coopération associées (nouvelle version corrigée). Le numérique : Impact sur le cycle de vie du document pour une analyse interdisciplinaire, 2004, Montreal, Canada.
Le Web Socio-sématique
« Le Web Socio Sémantique (W2S) inscrit les pratiques de recherche et d’élaboration informationnelle des usagers du Web dans des activités de « coopération structurellement ouvertes » (Zacklad 2003a) qui reposent également sur des pratiques communicationnelles intensives et [propose] des outils facilitant l’investissement documentaire de ses usagers et donc la qualité des transactions ultérieures. » (Zacklad, 2005)
Manuel Zacklad a également réalisé des travaux sur les outils de capture sémantique, qui sont codifiés pour répondre aux problématiques documentaires qui surviennent dans les domaines des TIC et des SIC. Comme on l’a déjà évoqué, le chercheur a aussi comparé les différents SOC tels que la classification, les thésaurus, les ontologies formelles, les ontologies sémiotiques et les folksonomies selon différents critères pour évaluer leur pertinence en fonction de la Recherche Ouverte d’Information. Cette recherche se différencie de la recherche d’informations basique grâce à sa capacité d’accéder à des formes de recherche riches et reliées aux usages spécifiques. Manuel Zacklad a d’ailleurs participé à l’innovation Miipa-doc qui permet une nouvelle approche de la classification documentaire, notamment en entreprise avec l’outil de recherche d’information multidimensionnelle, l’hypertagging. Dans cette optique, on peut fusionner le Web social et le Web sémantique, permettant une meilleure indexation, à travers les tags, afin d’assurer une meilleure interaction, ce qui aboutit à la création de ce que l’on peut appeler un Web socio-sémantique.
Cette nouvelle approche du Web est caractérisée par la mobilisation des notions d’ontologie et de sémiotique. L’ontologie fait réference à un modèle de données regroupant divers concepts, termes et propriétés d’un même champ de connaissances, et correspond à la façon dont les données sont représentées dans une base de données, en lien avec l’architecture de l’information. Couplé avec la sémiotique, l’étude des sens, le Web socio-sémantique a donc pour finalité d’interconnecter la machine et l’humain en vue d’établir une coopération.
Pour en savoir en plus : Manuel Zacklad, Vers le Web Socio Sémantique : introduction aux ontologies sémiotiques, 2005.
Présentation des intervenants
Les intervenants
Le vendredi 19 mars interviennent les invités suivants :
David Reymond (Université de Toulon) - Science ouverte et indexation de l’expertise : le dispositif SoVisu
Vendredi 19 mars, 10h - 10h30
David Reymond enseigne l’exploitation de l’information au sein des SHS, des techniques de captation de l’information textuelle jusqu’à la sémantique en recourant au traitement automatique des langues (TAL). Ses travaux s’inscrivent dans le domaine de l’infométrie et ouvrent une réflexion sur les théories et les évolutions de l’information stratégique, technique et scientifique, en abordant notamment les questions des données massives et ouvertes par le biais du traitement, de l’exploitation et de la contextualisation des données humaines.
Vincent Puig (IRI - Centre Pompidou) - Organologie pour un Web herméneutique : focus sur la production d’un glossaire contributif à partir d’annotations de textes
Vendredi 19 mars, 10h30 - 11 h
Vincent Puig est le directeur exécutif de l’équipe de recherche de l’IRI (Institut Recherche et Innovation), équipe fondée en 2006 avec Bernard Stiegler au Centre Pompidou.
En connaisseur du numérique, il développe des projets qui questionnent les conditions de l’avancement du savoir et les instruments de la production de la science.
Fidelia Ibekwe (Université Aix-Marseille) - Indexer, classifier, tagger : instruments de racisme et de domination
Vendredi 19 mars, 11h - 11h30
Le champs de recherche de Fidelia Ibekwe est vaste, allant du traitement automatique des langues (TAL) et la fouille de textes (Text Minig), jusqu’à l’épistémologie et l’histoire des sciences. Professeure des Universités en Sciences de l’Information et de la Communication à Aix-Marseille Université, ses recherches questionnent l’usage des TIC (Technologies de l’Information et Communication) et l’impact des technologies sur la société et sur la science.
Franck Cormerais (E3D MICA Bordeaux Montaigne) - L’enjeu d’une indexation sémantique pour aborder un corpus d’auteur
Vendredi 19 mars, 11h30 - 12h
Franck Cormerais est professeur en Sciences de l’Information à l’Université Montaigne de Bordeaux, responsable de l’axe « Études digitales : des donnés aux dispositifs (E3D) » du Laboratoire MICA, et co-directeur de la revue Études Digitales. Les axes principaux de son activité de recherche portent sur les usages et pratiques des TIC, ainsi que sur l’anthropologie des techniques et l’économie de la connaissance. Son travail explore aussi l’imaginaire de la culture numérique et les mutations d’ordre poétique dues aux nouvelles technologies.
Lucie Vieillecroze (E3D Bordeaux-Montaigne) - Penser, classer : l’indexation dans les rapports scientifiques d’activités
Vendredi 19 mars, 13h30 - 14h
Doctorante en Sciences de l’Information et de la Communication, Lucie Vieillecroze travaille sur sa thèse autour de la documentation du travail de Robert Escarpit, thèse intitulée « Une approche communicationnelle des archives de la recherche à l’heure des Humanités digitales. Le dispositif documentaire Robert Escarpit (1918-2000) au service de l’histoire des Sciences de l’information et de la communication. »
Amar Lakel (E3D MICA, Université Bordeaux-Montaigne) - Cartographier automatiquement les documents web : De la linguistique au traitement automatique du langage
Vendredi 19 mars, 14 h 30 - 15 h
Enseignant-chercheur au sein du groupe de recherche E3D du Laboratoire MICA, Amar Lakel s’est tourné vers la recherche sur les pratiques communicationnelles numériques après une expérience professionnelle de plus de 10 ans dans le conseil en stratégie digitale. Ses travaux portent sur la communication digitale des organisations, l’intelligence numérique et l’impact de la data analyse sur les stratégies d’acteur. Avec son projet MyWebIntelligence, il ouvre de nouvelles perspectives et possibilités à l’analyse du web, en questionnant la gouvernance de l’Internet et la régulation des systèmes d’information et de communication ouverts.
Fabrice Papy (Université de Lorraine) - Débat Clôture avec Manuel Zacklad
Vendredi 19 mars, 15h - 15h30
Fabrice Papy est enseignant-chercheur en Sciences de l’Information et de la Communication à l’Université de Lorraine, et membre permanent de l’Institut Méditerranéen des Sciences de l’Information et de la Communication. Il est aussi le rédacteur en chef des revues « Les Cahiers du Numérique » et « Information, Organisation, Connaissances ».
Programme
Jeudi 18 mars
horaire | intervenant·e·s | intitulé |
---|---|---|
10h - 12h30 | Manuel Zacklad | Carte Blanche de Manuel Zacklad |
Vendredi 19 mars
horaire | intervenant·e·s | intitulé |
---|---|---|
10h - 10h30 | David Reymond | Science ouverte et indexation de l’expertise : le dispositif SoVisu |
10h30 - 11h | Vincent Puig | Organologie pour un Web herméneutique : focus sur la production d’un glossaire contributif à partir d’annotations de textes |
11h - 11h30 | Fidelia Ibekwe | Indexer, classifier, tagger : instruments de racisme et de domination |
11h30 - 12h | Franck Cormerais | L’enjeu d’une indexation sémantique pour aborder un corpus d’auteur |
13h30 - 14h | Lucie Vieillecroze | Penser, classer : l’indexation dans les rapports scientifiques d’activités |
14h30 - 15h | Amar Lakel | Cartographier automatiquement les documents web : De la linguistique au traitement automatique du langage |
15h - 15h30 | Fabrice Papy, Manuel Zacklad | Débat Clôture avec Manuel Zacklad |