On pourra citer leurs différents slogans qui sont très révélateurs :
- « Researcher get the right content » pour Scitrus ;
- « Search less, discover more » ou encore « Delivering relevant research straight to your feeds and inbox » pour Meta ;
- « Find all relevant articles » pour CoCites ;
- Seul Sparrho est un peu plus modeste avec son « Making science more discoverable, understandable and sharable », mais il existe depuis bien plus longtemps que ses concurrents, ce qui pourrait expliquer ce recul nécessaire.
Clairement, ces outils viennent marcher sur les plates-bandes des professionnels de l’information…
Pourquoi faudrait-il donc s’y intéresser ?
- D’une part parce qu’ils représentent une façon complémentaire de rechercher de l’information scientifique et technique autrement qu’en utilisant les requêtes booléennes classiques ou encore l’indexation. Malgré leurs défauts, ils méritent d’être intégrés à la panoplie du veilleur et peuvent représenter un complément intéressant ;
- D’autre part, parce qu’il faut apprendre à connaître ses « concurrents ». Nul doute que les chercheurs vont adopter massivement ces outils qui apportent des résultats pertinents (mais loin d’être exhaustifs), proposent des interfaces très intuitives et conviviales proches des réseaux sociaux qu’ils ont l’habitude d’utiliser dans leur vie privée et communiquent très activement sur le Web et les médias sociaux pour faire découvrir leurs produits. Il y aura de fait un gros travail de sensibilisation pour montrer les avantages, mais aussi les inconvénients et limites, de ces nouveaux outils. Comme il avait fallu le faire en son temps avec Google Scholar, que de nombreux chercheurs jugeaient amplement suffisant pour toute revue systématique (dans le domaine médical) et revue de littérature…
Meta, Scitrus, Sparrho et CoCites dans le détail
Meta, Scitrus, Sparrho et CoCites se positionnent tous sur le créneau de la recommandation de contenus scientifiques et techniques. Pour autant, ils ont chacun leurs spécificités et répondront plus ou moins bien aux besoins de professionnels de l’information en fonction de leur secteur d’activité et leurs thématiques de recherche (voir figure 1.).
Nom | Meta | Scitrus | Sparrho | CoCites |
Domaine | Biomédical | Multidisciplinaire | Multidisciplinaire | Biomédical |
Corpus | Pubmed et BiorXiv soit plus de 30 millions de références | Plus de 30 000 sources - Le nombre de références n’est pas disponible | 60 millions de références | Pubmed donc 30 millions de références |
Types de contenus | Articles scientifiques et preprints | Articles scientifiques, preprints, articles de presse, médias sociaux, et conférences | Articles scientifiques et brevets | Articles scientifiques |
Particularités | Une interface intuitive réussie Une bonne intégrations des outils déjà utilisés par les chercheurs (Access Plugins, outils de gestion bibliographique, etc.) |
Plus de possibilités que ses concurrents pour entraîner l’algorithme à repérer les articles pertinents | Mêle plus intelligence artificielle et expertise humaine que ses concurrents | Se base sur les réseaux de co-citations pour faire émerger d’autres articles pertinents |
Figure 1. Comparatif de Meta, Scitrus, Sparrho et CoCites
Voyons maintenant le détail de chacun des outils.
Meta : la recommandation biomédicale
Meta est un outil de recommandation automatique d’articles scientifiques dans le domaine biomédical. Racheté en 2017 par la fondation Chan Zuckerberg, l’outil vient seulement de sortir de sa version bêta privée et est désormais accessible à tous.
Son corpus se compose de l’ensemble des articles de Pubmed et BiorXiv.
Nous avions déjà eu l’occasion de mentionner son existence dans BASES mais n’avions pas encore eu l’occasion de le tester. C’est désormais chose faite.
Meta se définit de la manière suivante : « Meta utilise le machine learning pour analyser, cartographier et regrouper rapidement des dizaines de millions d’articles et de preprints afin que les chercheurs puissent facilement suivre les développements, les intersections ou les tendances émergentes qu’ils ne savent pas forcément rechercher. »
Il se positionne plutôt sur le champ de la veille que sur celui de la recherche d’information ponctuelle. L’idée étant de faire découvrir au fil de l’eau les nouveaux articles dans son champ de recherche.
En termes de design, il reprend les codes des réseaux sociaux et plus particulièrement ceux de Facebook (il ne faut pas oublier que la fondation Chan Zuckerberg a été fondée par la femme du fondateur de Facebook…) ou encore Twitter (voir figure 2.).
Figure 2. Interface d’accueil de Meta
Ce qu’il faut retenir
Création de la requête
- Pour débuter, il suffit de décrire son champ de recherche en entrant au minimum deux termes généraux et deux termes plus spécifiques ;
- On peut par la suite rajouter des termes et concepts, mais également suivre précisément certaines revues ou certains auteurs / chercheurs.
Résultats et filtres
- Le résultat se présente sous la forme d’un flux d’information (semblable à ce qu’on peut trouver sur les réseaux sociaux) avec les nouveaux articles identifiés.
Seul un filtre par type de document est disponible (« preprint », « article scientifique », « essai clinique », « comment/editorial », « correction », « case report », « retraction », « review ») ;
- Les résultats peuvent être classés par impact (score établi par l’outil lui-même) ou par date ;
- Les documents jugés pertinents peuvent être sauvegardés dans la « bibliothèque », bibliothèque qui peut ensuite être synchronisée avec les outils de gestions de références bibliographiques. Pour l’instant seul Mendeley est disponible, mais EndNote et Zotero devraient être ajoutés prochainement ;
- Sous chaque article, Meta propose la liste des références et des citations si disponibles, extrait les différents grands concepts présents dans l’article, propose des flux d’informations Meta qui proposent des articles similaires et des « related articles ».
Accès au texte intégral
Meta propose l’intégration de l’extension Kopernio qui permet de savoir si l’article se trouve en libre accès quelque part sur le Web et renvoie également sur le site de l’éditeur et Pubmed.
Alertes
Meta envoie également une newsletter hebdomadaire reprenant les nouveaux articles identifiés.
SCitrus : la recommandation au sens large
Scitrus a été créé par une société américaine, Atypon, en octobre 2019.
Contrairement à Meta, l’outil ne se limite pas au domaine biomédical et intègre, en plus des articles scientifiques et preprints, des articles de presse, contenus publiés sur les médias sociaux, et conférences.
En termes de corpus, Scitrus reste très vague : l’outil rechercherait sur « plus de 30 000 sources d’autorité présentes sur le Web ». Impossible d’en savoir plus…
Pour ce qui est du design, l’outil reprend également les codes des réseaux sociaux et fait plutôt penser à des outils comme Flipboard ou Paper.li.
Comme Meta, l’outil se positionne plus sur la veille que la recherche ponctuelle.
Ce qu’il faut retenir
Création de la requête
Pour entraîner l’algorithme à retrouver des contenus pertinents, on peut :
- Charger sa bibliothèque de références bibliographiques afin que l’outil analyse son contenu et apprenne à reconnaître ce qui intéresse l’utilisateur ;
- Indiquer son numéro ORCID pour que l’outil analyse sa biographie et ses publications (on rappellera que l’outil s’adresse prioritairement aux chercheurs) ;
- Indiquer des thématiques et concepts clés ;
- Ajouter des noms de revues, auteurs ou organisations.
Résultats et filtres
- Il propose des articles jugés similaires en dessous de chaque article ;
- Il permet de sauvegarder les contenus jugés intéressants dans sa bibliothèque ;
- On peut choisir de visualiser tous les résultats ou 25 %, 50 % ou 75 % des articles les plus pertinents ;
- Il propose un filtre par type de contenus (Journal papers, Conference papers, preprint ou news) ;
- On peut sauvegarder des contenus dans sa bibliothèque.
Accès au texte intégral
Il renvoie uniquement sur le site de l’éditeur.
Alertes
Scitrus envoie également une newsletter hebdomadaire reprenant les nouveaux articles identifiés.
Sparrho : le plus ancien
Même s’il n’a pas la même visibilité que certains de ses concurrents, Sparrho est l’un des pionniers du secteur puisqu’il a été lancé en 2013 par plusieurs étudiants d’Oxford et Cambridge.
Comme pour les autres outils, le point de départ est le même : une frustration vis-à-vis des outils de recherche académiques existants et la volonté de rendre l’accès à la littérature scientifique plus simple et rapide.
Néanmoins, il se démarque des autres outils cités précédemment par son positionnement vis-à-vis de l’intelligence artificielle. Même si elle fait partie intégrante du produit, les créateurs insistent sur l’association entre experts humains et intelligence artificielle.
L’outil s’adresse bien évidemment aux chercheurs, mais il est aussi question des analystes, journalistes ou encore du grand public.
En termes de corpus, ce sont plus de 45 000 journaux et repositories qui sont mis sous surveillance avec plus de 60 millions d’articles scientifiques et brevets dans tous les domaines.
En termes de présentation, les créateurs de Sparrho reprennent également les codes des réseaux sociaux, mais on se rapproche ici plus de Pinterest avec la possibilité de créer des Pinboards et d’y accrocher des contenus.
L’outil se positionne aussi bien sur la veille que la recherche ponctuelle.
Ce qu’il faut retenir
Création de la requête
- La recherche s’effectue ici avec des mots-clés ou des DOI, des noms de revues ou des noms d’auteurs ;
- On peut également exclure des mots-clés ;
- On peut rechercher spécifiquement sur des revues ou des noms d’auteurs ;
- On peut rechercher sur les titres des articles ou n’importe où dans le texte et déterminer le degré de précision de la recherche (« very broad », « quite broad », « balanced », « quite precise », « very precise »).
On voit bien que Sparrho est à mi-chemin entre des outils plus traditionnels et des outils de recommandation automatiques, car l’utilisateur retrouve des fonctionnalités de recherche plus classiques et peut déterminer si l’outil doit rester au plus proche de sa requête (« very precise » qui recherche uniquement sur les mots-clés de la requête) ou bien élargir automatiquement sa requête pour identifier plus de résultats.
Résultats et filtres
- Sous chaque article, Sparrho propose des résultats similaires dans la rubrique « more like this » ;
- Les articles peuvent être sauvegardés dans sa bibliothèque qui reprend ici les codes de Pinterest ;
Accès au texte intégral
Il renvoie sur le site de l’éditeur et pointe vers le texte intégral en accès libre s’il existe ;
Alertes
Il est possible de créer des alertes journalières ou hebdomadaires sur les recherches sauvegardées ou les pinboards .
CoCites : la recommandation par les citations
Le dernier outil, CoCites vient tout juste d’être lancé au mois de mars et est complètement différent des autres outils de recommandations, car il se fonde sur les réseaux de citations.
Il se présente sous la forme d’une extension Chrome ou Firefox utilisable sur Pubmed uniquement.
Son créneau : mettre fin aux longues requêtes booléennes pour arriver à un résultat similaire beaucoup plus simplement et avec beaucoup moins d’efforts.
Selon les créateurs de CoCites, « pour trouver «tous» les articles pertinents, nous construisons des requêtes de recherche exhaustives en utilisant un large éventail de mots-clés et leurs synonymes. Cette stratégie permet de retrouver facilement des milliers d’autres articles, ce qui est à la fois long et inefficace. »
Leur solution : à partir de quelques mots-clés seulement, l’utilisateur arrive à trouver quelques articles de recherche pertinents (en l’occurrence sur Pubmed). Et à partir de ces quelques articles et en explorant les réseaux de co-citations, c’est-à-dire la fréquence à laquelle deux articles sont cités ensemble dans les listes de références d’autres articles, CoCites permettrait d’identifier « tous » les articles pertinents. Le résultat final serait similaire à celui d’une requête exhaustive, mais en y passant beaucoup moins de temps.
Il se positionne sur la recherche ponctuelle plutôt que la veille.
Notre avis : un complément seulement aux outils de recherche traditionnels
Tous ces outils sont intéressants et permettent d’enrichir sa recherche et d’identifier quelques résultats pertinents que l’on aurait pu manquer via une recherche traditionnelle notamment sur des outils proposant peu de fonctionnalités de recherche avancée. Il serait d’ailleurs intéressant d’évaluer le pourcentage de documents pertinents identifiés via ses outils que l’on ne retrouverait pas via une requête sur les serveurs et agrégateurs traditionnels.
Mais il y a un gros décalage entre les discours commerciaux de ces nouveaux produits et ce qu’ils proposent réellement.
Car si la recherche et la veille humaine ont leurs défauts, les outils de recommandations de contenus ont aussi leurs faiblesses.
- Leurs corpus restent restreints. Avec 30 à 60 millions de références bibliographiques, on est encore loin des 150 à 180 millions de Google Scholar et des chiffres équivalents de serveurs comme STN ou Dialog Solutions. Il y a donc tout un pan de la littérature scientifique que ces nouveaux outils de recommandations n’explorent pas.
Lors de la récente conférence EBHC, The Ecosystem of evidence, un des intervenants avait présenté une étude montrant que l’on pouvait manquer jusqu’à 66 % des articles pertinents pour une revue systématique si on se limitait uniquement à Pubmed.
- Ces outils ne sont pas non plus exempts d’erreurs. Nous avons ainsi pu constater sur plusieurs de ces outils que la recherche sur un nom d’auteur ne ramène pas toujours tous les articles écrits par cet auteur par exemple.
- Ces outils mettent en avant leur gratuité, mais l’accès aux documents en texte intégral n’est pas nécessairement gratuit. Les articles qu’ils référencent n’appartiennent pas nécessairement au mouvement de l’open access et il faudra à un moment payer pour pouvoir accéder au texte intégral de ces articles.
- Enfin pour CoCites et l’analyse de co-citations, si cette méthode est intéressante, elle n’est pas pour autant parfaite. Les articles les plus cités ne sont en effet pas nécessairement toujours les plus pertinents.
Une présentation du Symposium 2019 MetaScience montrait ainsi que Google Scholar semblait modifier les schémas de citations d’articles scientifiques. Les citations se concentrent de plus en plus et les mêmes articles sont cités à plusieurs reprises, car de nombreuses personnes citent « paresseusement » les documents que le moteur de recherche classe en tête de liste.
Bref, ces outils ne représentent qu’un complément pour la recherche d’information et la veille scientifique et technique, mais ne sauraient en aucune façon être une solution miracle se substituant aux autres outils et méthodes de recherche.