Pour illustrer l’ordre de grandeur du nombre de liens détectés, on se référera -aux informations de la page d’accueil de la recherche sur la littérature. Le jour de nos tests en mai 2021, il y avait :
- 228 108 724 documents de littérature
- dont 4 438 085 ont été cités dans au moins un des 3 463 464 brevets ayant de telles citations.
Il faut néanmoins prendre garde au fait que ces mises en relation n’ont rien d’exhaustif car, ni le corpus brevet, ni le corpus de littérature ne peuvent être considérés, et de loin, comme exhaustifs.
Cela constitue néanmoins des informations qui peuvent être utiles.
Cas pratique
Pour illustrer ces données sur une recherche simple, sur le terme
airbag
, on trouve :
- 7 379 réponses
- 241 sont cités dans au moins un des 774 brevets citants.
Des fonctionnalités de recherche bien cachées…
Les recherches sur la littérature scientifique peuvent se faire, comme pour les brevets : en utilisant différents opérateurs puis des filtres.
Une recherche avancée est également disponible. Cependant, elle s’écrit de façon un peu compliquée.
A droite des résultats figurent différentes analyses : par affiliation, par date et par auteur. Dans la logique de ce site, on peut trouver des citations dans les deux sens tant pour les brevets que pour la littérature.
En faisant différents tests, nous sommes tombés sur un problème assez fréquent. The Lens récupère les abstracts, parfois les textes complets, souvent dans différentes sources.
Or un nombre non négligeable de sources présentent de sérieux problèmes techniques, à savoir que les mots sont très souvent coupés. Quand The Lens charge un article, il semble n’y avoir aucune vérification de la qualité du texte.
Exemple : Lors d’une recherche sur le terme
parison
(terme anglais désignant l’ébauche des bouteilles de verre, nous avons trouvé dans un simple abstract neuf fois le mot anglaiscomparison
écritcom parison
.
The Lens renvoie souvent aux sources en proposant soit l’abstract soit le texte intégral du document. Il n’est pas rare qu’il y en ait plusieurs, certains avec ce type de faute, d’autres non. Il est clair qu’aucune détection d’erreurs typographiques n’est faite, d’autant que The Lens privilégie les textes en open access, alors que le même article obtenu via un achat, à titre d’exemple, sur ScienceDirect, ne comporte pas ce genre de faute.
Ce type de problème est de nature à limiter ou à biaiser les résultats de recherche, ce qui est tout à fait regrettable et ne contribue certes pas à la qualité du produit.
Par ailleurs, comme l’a déjà signalé Philippe Borne, si les possibilités de recherche sont loin d’être simplistes comme sur d’autres services, en particulier des services gratuits, il y a une dramatique carence de manuel et d’aide performante pour utiliser au mieux le produit. Cela finit par décourager l’utilisateur même s’il est plein de bonne volonté et a priori bien disposé vis-à-vis du produit.
Notre avis :
The Lens est un organisme un peu particulier, proche du concept d’ « entreprise à mission » introduit en France par la loi Pacte. Cette structure fait penser aussi à une sorte d’organisme de bienfaisance financé, en l’occurrence, par des fondations charitables telles que la Bill & Melinda Gates Foundation ou la Rockefeller Foundation.
The Lens définit, en effet, sa mission comme celle de rechercher, fusionner et mettre en lien différents ensembles d’information en libre accès.
Le but de The Lens tel qu’il est décrit est de « permettre à plus de personnes de prendre de meilleures décisions, informés par des « preuves » et inspirés par l’imagination. »
Cette présentation y parle également de la conservation de l’écosystème planétaire, de l’égalité économique et sociale, de la sécurité alimentaire et de la santé globale.
Il faut avouer qu’il est assez rare de trouver un service d’information quasi professionnel financé ainsi et tenant de tels discours.
Cela ne serait pas particulièrement gênant si on ne trouvait en même temps un regrettable manque de rigueur. A moins que cela ne soit lié à la nature de son statut. Ce manque de rigueur se trouve tant dans la vérification du contenu des documents que dans les aides à l’utilisation. Particulièrement complexe à manipuler et rendant très difficile des interrogations performantes que permettraient les possibilités des langages de requête et d’analyse proposés qui sont loin d’être insignifiantes