Masterclass
DNHD#3

menu

Nous vous présenterons ici trois des thèmes de recherche de Manuel Zacklad dont les contributions peuvent enrichir l’exploration du sujet de la deuxième journée de cette 3ème édtion de la MasterClass DNHD, à savoir les enjeux des pratiques de l’indexation et de l’annotation au sein des processus de classement des connaissances.

Organisation et gestion des connaissances

« Les langages et les index qui organisent l’information, sont devenus des technologies intégrées aux dispositifs de stockage et aux usages de recherche de l’information conditionnant de manière déterminante les modalités d’accès à celle-ci dans les contextes professionnel et de loisir. » (Zackad, 2010).

Le questionnement de la conception et des usages des Systèmes d’Organisation des Connaissances (SOC) représente un enjeu majeur dans la gestion de l’information numérique. La notion de SOC vise à regrouper dans une dénomination unique aussi bien les langages documentaires et les schémas de classification, que les langages issus de l’intelligence artificielle. Les SOC se configurent donc comme des ensembles de termes codifiés constituant un lexique disposant ou non de règles d’association explicites et permettant de faciliter les opérations de gestion portant sur des contenus documentaires ou sur les caractéristiques de situations non préalablement documentées.
Les dispositifs qui façonnent l’architecture de l’information sont aujourd’hui si divers qu’il devient difficile d’en distanguer les propriétés. Manuel Zacklad en entreprend une analyse élargissant cette notion au domaine des index de moteurs de recherche, les SOC automatiques et établissant une différence entre ceux qui relèvent d’une forme d’écriture codifiée manuelle, et ceux issus d’une codification automatique effectuée par des algorithmes informatiques de fouille de texte.

Le travail de recherche de Manuel Zacklad ainsi s’intéresse à la circulation et structuration de l’information à travers une variété de supports et de canaux connectés. Ses observations mettent en lumière la compléxité du trafic d’informations caractérisant le Web, qui y est massif, séquencé, asynchrone. En réponse à ces problématiques, Manuel Zacklad étudie les possibilités de coopération entre humains, mais aussi entre humain et machines, notamment par les actes d’écriture et d’enregistrement des documents. Il propose une approche critique de l’intelligence artificielle, attribuant aux machines les caractéristiques et la sémantique humaine. Dans ce domaine, il étudie l’architecture de l’information et sa codification avec différentes formes d’écriture et de représentation de la connaissance (ontologies, taxonomies, cartes conceptuelles…). Le chercheur explore la réaction de notre société à cette ère de l’information, et les stratégies des individus et institutions mises en œuvre dans la consultation, production et échange des documents.

Pour en en savoir en plus : Manuel Zacklad, « Évaluation des systèmes d’organisation des connaissances », Les Cahiers du numérique, 20103 Vol. 6

Documentarisation et documents pour l’action

« [La documentarisation] consiste à doter ces supports d’attributs spécifiques permettant de faciliter leur gestion parmi d’autres supports, leur manipulation physique, condition d’une navigation sémantique à l’intérieur du contenu sémiotique, et l’orientation des récepteurs. » (Zacklad, 2005, p. 11).

S’intéressant aux dynamiques des activités collaboratives propres aux collectifs, Manuel Zacklad a questionné les documents dans leur dimension de supports à la coopération. Les Documents pour l’Action (DopA) permettent d’aider à la production collective. Lorsqu’ils sont fragmentés, les DopA “en évolution” mettent en exergue des annotations à caractère sémantique, servant à les modéliser. Les forums de discussions appartiennent également aux technologies annotatives de coopération, notamment par les débats qu’ils abritent, ainsi que leur transparence, traçabilité et clarté.
La documentarisation met également en exergue l’exploitation des documents à travers l’approche transactionnelle.

Le contenu d’un document peut donc être réécrit par les auteurs, dotés d’une autonomie accrue par la numérisation. La médiation diffusionnelle représente, telle un flux, le lien avec le destinataire final du contenu, à l’aide de canaux de distribution, appelés réseaux.
La numérisation a permis la modification et la circulation de documents dans les réseaux, mais aussi l’émergence des plateformes de travail collaboratif. Il est désormais possible d’élaborer, de consulter des espaces documentaires numériques (blogs, Wikis), et d’exploiter cette collaboration grâce aux annotations. Ces médias participatifs nécessitent un processus de rédaction distribuée et de documentarisation donnant lieu à des communautés docu-médiatisées assimilables à une communauté virtuelle qui échange et coproduit des documents digitaux. Cette digitalisation du document entraîne l’apparition de nouvelles disciplines telles que l’informatique, le design ou les sciences de l’information. Les recherches et la diffusion des résultats scientifiques des humanités numériques sont impactées, transformées et amplifiées par l’ère de la documentalité transmédia.

Pour en savoir plus : Manuel Zacklad, Processus de documentarisation dans les Documents pour l’Action (DopA) : statut des annotations et technologies de la coopération associées (nouvelle version corrigée). Le numérique : Impact sur le cycle de vie du document pour une analyse interdisciplinaire, 2004, Montreal, Canada.

Le Web Socio-sématique

« Le Web Socio Sémantique (W2S) inscrit les pratiques de recherche et d’élaboration informationnelle des usagers du Web dans des activités de « coopération structurellement ouvertes » (Zacklad 2003a) qui reposent également sur des pratiques communicationnelles intensives et [propose] des outils facilitant l’investissement documentaire de ses usagers et donc la qualité des transactions ultérieures. » (Zacklad, 2005)

Manuel Zacklad a également réalisé des travaux sur les outils de capture sémantique, qui sont codifiés pour répondre aux problématiques documentaires qui surviennent dans les domaines des TIC et des SIC. Comme on l’a déjà évoqué, le chercheur a aussi comparé les différents SOC tels que la classification, les thésaurus, les ontologies formelles, les ontologies sémiotiques et les folksonomies selon différents critères pour évaluer leur pertinence en fonction de la Recherche Ouverte d’Information. Cette recherche se différencie de la recherche d’informations basique grâce à sa capacité d’accéder à des formes de recherche riches et reliées aux usages spécifiques. Manuel Zacklad a d’ailleurs participé à l’innovation Miipa-doc qui permet une nouvelle approche de la classification documentaire, notamment en entreprise avec l’outil de recherche d’information multidimensionnelle, l’hypertagging. Dans cette optique, on peut fusionner le Web social et le Web sémantique, permettant une meilleure indexation, à travers les tags, afin d’assurer une meilleure interaction, ce qui aboutit à la création de ce que l’on peut appeler un Web socio-sémantique.

Cette nouvelle approche du Web est caractérisée par la mobilisation des notions d’ontologie et de sémiotique. L’ontologie fait réference à un modèle de données regroupant divers concepts, termes et propriétés d’un même champ de connaissances, et correspond à la façon dont les données sont représentées dans une base de données, en lien avec l’architecture de l’information. Couplé avec la sémiotique, l’étude des sens, le Web socio-sémantique a donc pour finalité d’interconnecter la machine et l’humain en vue d’établir une coopération.

Pour en savoir en plus : Manuel Zacklad, Vers le Web Socio Sémantique : introduction aux ontologies sémiotiques, 2005.