Déconstruction de l’article scientifique : une nouvelle façon de rechercher l’information ?

Carole Tisserand-Barthole
Bases no
409
publié en
2022.12
1258
Acheter ce no
Tags
information scientifique et technique
Déconstruction de l’article scientifique : une nouvelle ... Image 1

Depuis leur apparition il y a un peu moins de 400 ans, les revues scientifiques ont été confrontées à de nombreuses évolutions : le passage du papier au numérique, l’apparition des preprints, le développement de l’open access et plus largement de l’open science, etc.

Mais s’il y a bien quelque chose qui n’a que très peu changé, c'est la structure même de l’article scientifique. Malgré une transformation digitale, la version numérique de l’article, souvent en PDF, est presque toujours semblable à ce qui existait déjà au format papier.

Certains acteurs commencent à modifier la structure même de l’article scientifique ou tout du moins à proposer un modèle de diffusion qui ne soit plus limité à ce format très codifié et où les différentes parties d’un article peuvent vivre indépendamment les unes des autres.

Et cela ouvre de nouvelles possibilités pour la recherche d’information dans la littérature scientifique et académique. C’est ce que nous allons explorer dans cet article.

L’approche classique des outils de recherche IST face à l’article scientifique

  1. Encore aujourd’hui, on a d’un côté des articles scientifiques qui suivent pratiquement toujours la même structure très codifiée appelée IMRED (Introduction, Méthodes, Résultats et Discussion). A cela s’ajoutent le titre, l’abstract, les noms d’auteurs et affiliations et les éventuels mots-clés en début d’article et la bibliographie en fin d’article. Le contenu même de l’article peut être agrémenté de tableaux, figures et graphiques en tout genre et des références vers la bibliographie sont insérées tout le long de l’article.
  2. De l’autre côté, on a des outils de recherche (moteurs académiques, serveurs et bases de données) qui rassemblent les articles scientifiques dans leur globalité, chaque article correspondant à une pièce d’infor­mation non divisible.

Certes, l’utilisateur peut tradi­tionnellement rechercher sur le titre, l’abstract ou le texte intégral, parfois sur certains champs structurés comme le nom de l’auteur, de la revue (les métadonnées en l’occurrence), mais il n’est pas question de pouvoir faire porter la recherche sur une zone du cœur de l’article lui-même (uniquement la partie méthode par exemple ou uniquement la partie discussion).


Nous avons regardé en détail différents outils de recherche de référence dans le monde de l’IST comme Scopus, Google Scholar, Dimensions, Lens pour vérifier s’ils proposaient de faire porter la recherche sur une partie spécifique de l’article scientifique comme l’introduction, l’hypothèse, la méthode, etc., mais nous n’avons rien trouvé de tel.

  • Scopus permet de rechercher sur une multitude de champs comme le titre, l’abstract, les mots-clés, les affiliations, la langue, le financement, les références (et c’est intéressant), etc., mais jamais dans une partie spécifique de la structure IMRED.
  • Lens a également une centaine de champs sur lesquels on peut faire porter la recherche, mais pas de découpage au niveau de la structure IMRED.
  • Quant à Google Scholar, on ne recherche sur le full-text ou au mieux sur le titre de l’article uniquement avec l’opérateur intitle: et dans Dimensions, les possibilités sont aussi limitées soit au full text, soit aux champs titre et abstract ou au champ DOI.

L’émergence d’un modèle nouveau : les cas d’Octopus et Scholarcy

On a récemment pu voir émerger les prémisses d’un nouveau modèle moins codifié où les différentes étapes de la recherche et leur retranscription dans la littérature pouvaient exister de manière indépendante. Ce nouveau modèle ouvre de nouvelles perspectives pour le professionnel de l’information et notamment la possibilité de rechercher sur des étapes précises du processus de recherche.

À ce jour, nous avons repéré deux acteurs qui s’engagent dans cette nouvelle voie : Octopus et Scholarcy, deux projets avec à la clé des outils très différents en matière de positionnement, offre et fonctionnalités, mais qui proposent tous deux la possibilité de rechercher sur des étapes précises du processus de recherche (méthode, résultats, etc.).

Octopus ou la déconstruction du processus de recherche dans son ensemble

Une approche innovante

La déconstruction de la recherche scientifique en éléments et étapes qui peuvent vivre indépendamment les uns des autres, c’est justement le projet d’Octopus, une organisation britannique qui a lancé la version bêta de son site en juin 2022.

Octopus (https://www.octopus.ac/) veut devenir une référence auprès des cher­cheurs. N’importe quel chercheur, à condition de disposer d’un numéro ORCID (code alphanumérique qui fait office d’identifiant unique pour les chercheurs) peut y publier non pas des articles scientifiques au sens classique du terme, mais des « morceaux de recherche ».

Octopus divise le processus de recherche en 8 contributions possibles :

  • Research Problem (Problématique/sujet de recherche)
  • Rationale / Hypothesis (Justification / Hypothèse)
  • Method (Méthode)
  • Results (Résultats)
  • Analysis (Analyse)
  • Interpretation (Interprétation)
  • Real World Application (Application au monde réel)
  • Peer Review (Examen/revue par les pairs)

Les utilisateurs peuvent publier des éléments dans une ou plusieurs catégories. Il n’est pas nécessaire d’avoir bouclé tout le processus de recherche pour commencer à publier. Un utilisateur peut ainsi déjà publier son sujet de recherche (Research Problem) dans Octopus s’il n’en est qu’au début du processus.

Chaque publication peut ensuite être liée à une autre (cf. Figure 1. Publications/étapes de recherche reliées en elle), formant des chaînes de recherche ramifiées. Si le même auteur publie par la suite d’autres éléments au fur et à mesure de son processus de recherche (Hypothèse, Méthode, Résultats, etc.), il va pouvoir les lier les unes aux autres dans Octopus.

D’autres chercheurs peuvent également repartir d’une publication existante, mener leur propre recherche puis rajouter des publications/pièces de recherche (leur propre pièce d’analyse à partir des résultats publiés par un autre chercheur par exemple). Ces différents éléments seront eux aussi liés les uns aux autres dans Octopus.

Figure 1. Publications/étapes de recherche reliées en elle


Nous avons testé le moteur Octopus

Au-delà de l’approche scientifique qui est résolument innovante, Octopus, c’est aussi aujourd’hui un outil de recherche d’un nouveau genre.

Des internautes ont déjà commencé à intégrer des « morceaux » de recherche sur lesquels il est déjà possible de lancer des requêtes, car Octopus agit comme un moteur académique ou une base de données (cf. Figure 2. Interface du moteur de recherche d’Octopus).

Figure 2. Interface du moteur de recherche d’Octopus

Le moteur permet de rechercher des « publications » ou des « auteurs » grâce à un moteur simple ou de naviguer dans le contenu disponible.

Pour les publications, il est ensuite possible de filtrer par type de publication, c’est-à-dire les 8 types de contributions proposées par Octopus (Research Problem, Rationale/Hypothesis, etc.) et par date.

Notre avis :

A ce stade, le nombre de contributions et de chercheurs ayant publié sur Octopus reste faible.

On recense 7387 publications (dont 7373 correspondent au type de publication « Research Problem », c’est-à-dire à l’étape 1 du processus de recherche, le moment où on définit la problématique) et 300 auteurs.

Il est donc peu probable d’y trouver des contenus vraiment intéressants pour la veille et la recherche d’information. Mais c’est un début.

Si la plateforme gagnait en popularité et surtout en contributions, elle offrirait au professionnel de l’information de nouvelles perspectives :

  • la possibilité de faire porter sa requête sur des étapes de la recherche. À titre d’exemple, si l’on s’intéresse à l’usage des microalgues dans les produits cosmétiques, mais uniquement du point de vue des applications concrètes dans la vie réelle, Octopus nous permet, en principe, de réaliser une telle recherche en spécifiant l’étape « Real world application ». Pas de risque d’avoir des documents qui ne traitent pas d’application concrète ;
  • cette plateforme pourrait être aussi un bon moyen de savoir sur quels sujets travaillent d’autres chercheurs de son domaine ou d’identifier des experts sans avoir à attendre la publication d’un article scientifique qui est un processus long.
  • Cela pourrait être aussi un moyen d’avoir accès à de la recherche qui n’a aucune chance de se transformer un jour en article de recherche. Soit parce que le processus n’a pas abouti, que les résultats ont été négatifs et non concluants, que le chercheur s’est arrêté en cours de route ou qu’aucun éditeur n’a voulu le publier.

Sur la question de la recherche dite « négative » où les tests et expériences menées ne sont pas concluants, nous conseillons la lecture de l’article du BBF intitulé « Datacc, une plateforme pour les chercheurs en physique et chimie : mettre en lumière les résultats négatifs » publié en 2021 (https://bbf.enssib.fr/consulter/bbf-2021-00-0000-056).

Scholarcy : synthétiser et découper l’article scientifique pour gagner du temps

L’outil Scholarcy a une approche complètement différente et se définit comme un outil de résumé automatique d’articles scientifiques.

Le principe de l’outil est simple : l’utilisateur entre un article scientifique avec une URL ou en chargeant le PDF, l’outil se charge de produire automatiquement un résumé très structuré de l’article appelé « Flashcard interactive ».

Cette flashcard se décompose en différentes parties cliquables : concepts-clés, abstract, synopsis, highlights, résumé automatique, analyse comparative, tableaux, figures, résumé de chaque partie (Introduction, Méthodes, Résultats, Discussion, Conclusion), Limitations et Références bibliographiques. Pas besoin de passer en revue l’intégralité de la flashcard, on peut se rendre directement sur la partie qui nous intéresse (regarder uniquement le résumé de la partie « Méthodes » par exemple).

L’utilisateur peut ensuite se créer sa bibliothèque de « Flashcards » avec tous les documents qu’il a fait résumer par Scholarcy.

Et c’est à ce niveau qu’on retrouve cette notion de déconstruction de l’article qui ouvre de nouvelles perspectives de recherche pour le pro de l’info en permettant de rechercher sur une étape précise du processus de recherche.

En 2020, l’outil a en effet introduit des opérateurs de recherche pour chercher précisément sur une partie spécifique de la flashcard d’un article scientifique. On peut par exemple rechercher spécifiquement sur la partie “Méthode” d’une flashcard en entrant methods:motclé1 (cf. Figure 3. Recherche du mot-clé « Logistic Regression » sur la partie Méthodes des documents présents dans sa bibliothèque).

Figure 3. Recherche du mot-clé « Logistic Regression » uniquement dans la partie  « Méthodes » des documents présents dans sa bibliothèque.

Notre avis :

L’idée de pouvoir rechercher sur une étape spécifique de la recherche est intéressante en soi.

Mais dans Scholarcy, il y a une limite qui diminue grandement l’intérêt de cette fonctionnalité.

L’utilisateur ne recherche pas sur le texte intégral de l’article scientifique, mais dans la flashcard qui est un résumé de l’article lui-même. Or pour certains articles, le résumé de certaines parties (méthodes, hypothèse, etc.) se limite parfois à une ligne ou deux. On a donc toutes les chances de ne pas voir apparaître des documents pertinents qui citent pourtant le mot-clé.

Proposer des fonctionnalités permettant une recherche extrêmement précise sur des contenus peu consistants, c’est donc un peu la même chose que de vouloir effectuer une requête complexe sur des tweets de 280 caractères : c’est surdimensionné et au final contre-productif.

On retiendra que la fonctionnalité proposée par Scholarcy est surtout intéressante dans le sens où cela vient confirmer la tendance de la déconstruction de l’article scientifique et une volonté de découpage des étapes de la recherche au niveau de la recherche d’information elle-même.

Et si cette tendance se confirme, on peut imaginer que les serveurs et bases de données professionnels viendront à terme intégrer des fonctionnalités permettant de rechercher sur une étape spécifique de l’article scientifique. L’innovation émerge souvent de nouveaux acteurs de petite taille sur le marché tandis que les grands acteurs en place n’intègrent cette innovation que plus tard en développant leur propre solution,en intégrant ou rachetant l’outil innovant et sa technologie.

À suivre donc !