OpenAlex, un nouveau moteur académique

Carole Tisserand-Barthole

Bases no

413

publié en

2023.04

3795

Acheter ce no

Tags

évaluation outils | moteurs académiques

OpenAlex, un nouveau moteur académique Image 1

OpenAlex est un nouvel outil qui vient se positionner sur le créneau de Google Scholar, Dimensions, Lens.org et les autres. Son but : devenir un catalogue qui recense un maximum de publications scientifiques, mais aussi chercheurs et institutions, une sorte de bibliothèque d’Alexandrie de l’IST version Web.

OpenAlex est un projet de l’organisation à but non lucratif OurResearch financé par Arcadia, un fonds qui œuvre pour la préservation de la culture et la promotion du libre accès.

Nous avons testé la version Alpha (la bêta sortira en juillet prochain) pour savoir ce qu’elle avait à nous offrir et quelle pouvait être sa valeur ajoutée par rapport aux outils déjà en place.

Lire aussi :

De nouveaux moteurs gratuits pour concurrencer Google Scholar (September 2018)

Elicit, un nouveau moteur scientifique au banc d’essai (Bases N° 404 - juin 2022)

Déconstruction de l’article scientifique : une nouvelle façon de rechercher l’information ? (Bases N° 409 - dec 2022)

Recherche bibliographique : moteurs gratuits ou grands serveurs payants, que choisir ? (Bases N° 405 - juil/août 2022)

Comment faire évoluer sa recherche d’information scientifique avec les nouveautés de Google Scholar ? (Bases N° 404 - juin 2022)

Un corpus IST très conséquent

Dans tout moteur académique, la question du corpus est primordiale. OpenAlex indexe 250 millions de contenus, dont 43,8 millions en libre accès, ce qui en fait un des acteurs avec le plus gros corpus après Google Scholar.

Pour se repérer dans la taille des différents corpus, on pourra jeter un coup d’œil au tableau comparatif proposé par OpenAlex sur son site Web et que nous avons reproduit ici en figure 1.

Figure 1. Tableau comparatif publié par OpenAlex.

Les contenus proviennent principalement de Microsoft Academic (qui n’est plus mis à jour) et de Crossref. D’autres sources sont également utilisées comme ORCID, ROR, DOAJ, Unpaywall, Pubmed, Pubmed Central, The ISSN International Centre et des repositories comme arXiv ou Zenodo.

En termes de corpus, OpenAlex présente donc un intérêt certain. Voyons maintenant ce qu’il en est des fonctionnalités de recherche.

Des fonctionnalités de recherche limitées

Nous avons donc testé la version Alpha du moteur qui n’en est qu’à ses débuts et n’est donc pas exempte de bugs.

Une recherche en texte libre trop limitée

Premier constat : le moteur de recherche en texte libre ne recherche que sur les titres des articles, ce qui est restrictif. De plus, il n’est pas possible d’entrer de requêtes booléennes, le moteur ne recherche que des expressions exactes.

Si on veut combiner plusieurs mots-clés dans sa recherche, il faut entrer une première requête avec un mot-clé, entrer une deuxième requête avec un deuxième mot-clé et ainsi de suite. L’ensemble des mots-clés sont ensuite automatiquement combinés par des AND.

De nombreux filtres

Là où l’outil est plus intéressant, c’est au niveau des filtres proposés qui sont nombreux.

On a donc des filtres par type de contenus, année, institution, auteurs, type d’accès, source, localisation, financement, source/corpus d’origine, nombre de citations, concepts, articles rétractés ou non, article avec un abstract ou non, etc.

Des résultats classés par date ou citations

OpenAlex permet de classer les résultats par date (du plus récent au plus ancien) ou par nombre de citations (de l’article qui a été le plus cité à celui qui l’a été le moins).

On notera également une mini fonctionnalité d’analyse qui permet de visualiser sur un graphe le nombre de documents publiés par an par rapport à nos critères de recherche.

Notre avis :

Au final, la grande force d’OpenAlex pour le moment est la taille de son corpus et la possibilité de visualiser les résultats de sa recherche par ordre antéchronologique. Sauf qu’à ce stade, le système « buggue » dès qu’on atteint la 10e page de résultats. La matière et le sourcing sont donc bien présents, mais les possibilités de recherche offertes ne permettent pas encore de l’exploiter pleinement. OpenAlex pourra être interrogé en complément aux moteurs académiques classiques à ce stade, mais on surveillera de près ses futures évolutions.

Pour aller plus loin, on signalera que les contenus d'OpenAlex peuvent aussi être récupérés, grâce au logiciel Harzing Publish or Perish, sous la forme de corpus qui pourront ensuite être analysés par des outils de text mining. Cette possibilité nous a été suggérée par un de nos lecteurs (Cc Mathieu CDOC !) en commentaire de cet article. Nous vous invitons donc à lire ce commentaire pour en savoir plus sur la méthode à suivre.