Les outils de recherche scientifiques et académiques gratuits, qui permettent de rechercher principalement des articles scientifiques mais également des monographies, compte-rendus de conférences ou encore thèses sont en pleine expansion.
Depuis le début de l’année, on a déjà pu voir apparaître deux nouveaux venus assez similaires, Dimensions et 1findr. Et à l’heure où nous écrivons ces lignes, les créateurs d’Unpaywall, l’extension de navigateur qui permet de savoir si un article est disponible ou non en libre accès (voir BASES n 350 – juillet/août 2017) vient d’annoncer le lancement prochain d’un moteur dopé à l’intelligence artificielle permettant de découvrir plus de 20 millions d’articles scientifiques en libre accès appelé Get the Research (http://gettheresearch.org/).
Et c’est sans compter sur Google Scholar qui est un quasi-réflexe pour bon nombre de chercheurs et qui existe quant à lui depuis 2004.
La plupart de ces outils disposent de corpus dont le volume est tout sauf ridicule. Google Scholar indexerait même, d’après les estimations que nous avons détaillées dans notre précédent numéro de BASES (N 360 – juin 2018), un volume de documents du même ordre de grandeur que ce que propose Proquest Dialog ou STN (chiffres vérifiés dans ce cas).
Mais peut-on pour autant confier sa recherche bibliographique ou sa revue de littérature à ces seuls outils gratuits ?
Dans ce même numéro de BASES, nous avions regardé de près la littérature comparant les outils de recherche scientifiques et académiques payants comme les grands serveurs et bases de données et les outils de recherche gratuits comme Google Scholar, 1findr, Dimensions, etc.
On constatait alors que les comparaisons réalisées par les auteurs de ces articles tournaient pratiquement toujours autour du nombre d’articles et de la taille des corpus. Mais un élément crucial, les fonctionnalités de recherche et la capacité à construire des requêtes sophistiquées était systématiquement occulté.
Nous avons donc choisi de réaliser nos propres tests sur deux sujets distincts afin de voir ce qu’il en retournait : le premier nécessitant la création d’une requête un minimum élaborée, couvrant plusieurs disciplines et un second beaucoup plus simple sur une seule thématique.
Déjà abonné ? Connectez-vous...
La première édition de IC-SDV née de la fusion des manifestations ICIC et II-SDV organisées par Christoph Haxel vient d’avoir lieu à Nice, incontestablement plus facile d’accès qu’Heidelberg, mais peu accueillante.
On a retrouvé le format et les caractéristiques des deux manifestations qui avaient fusionné avec légèrement plus de monde, ce qui est logique. Nous avons également remarqué une plus grande fluidité dans les échanges entre les congressistes à leur grande satisfaction.
On pouvait craindre que, comme l’intelligence artificielle est à la mode, la manifestation serait centrée sur l’IA. Ce ne fut heureusement pas le cas même si ce concept était souvent présent en filigrane dans les différentes thématiques abordées lors du congrès. Par ailleurs il y a suffisamment d’autres manifestations qui lui sont spécifiquement consacrées.
Comme à chaque édition et comme dans toute conférence, le choix des conférenciers n’était pas parfait, certains conférenciers étaient excellents et passionnants, d’autres simplement banals faisant l’historique de choses archi-connues ou tout simplement incompréhensibles.
Mais le comité de sélection des conférences a encore quelques progrès à faire car INNOVATIONQ Plus n’avait qu’un stand vendu avec seulement une présentation de produit de 10 mn alors qu’il s’agit d’une vraie innovation qui aurait mérité une conférence plénière.
Nous avons présenté en détail ce produit dans le numéro 358 de BASES (Avril 2018). Rappelons simplement qu’il s’agit d’une joint-venture entre ip.com et IEEE qui propose de rechercher à la fois dans les brevets et la littérature dans les domaines de l’électricité et de l’électronique au sens large.
La première conférence à éveiller notre intérêt a été celle présentée par Patrick Fiévet, de l’Organisation mondiale de la propriété intellectuelle (OMPI) et Jacques Guyot de la Fondation Olanto, une fondation suisse sans but lucratif basée à Genève. L’objectif d’Olanto est de créer et de diffuser des logiciels gratuits dans les domaines de la traduction assistée par ordinateur, de la traduction machine et de la recherche multilingues et d’autres domaines liés au langage.
L’OMPI s’était intéressée dès 2003 à la création d’un système IPCCAT pour aider les utilisateurs à trouver les bonnes classifications d’un brevet mais aussi d’aider les petits offices à mieux classer les brevets et, d’une façon plus générale, d’automatiser ce type de classement.
De 2004 à 2009, l’approche a consisté à développer un système s’appuyant sur des outils puissants de machine learning entraînés par l’analyse de documents classés manuellement.
Cette approche était néanmoins limitée par la puissance informatique disponible et la couverture des niveaux les plus fins de la CIB par les collections d’entraînement disponibles.
En 2017, l’OMPI a décidé de reprendre la recherche sur IPCCAT visant une catégorisation de l’ensemble de la CIB au niveau des sous-groupes au nombre de 72 981 dans la version 2017.01 de la CIB. Précisons qu’un sous-groupe se présente sous la forme H013 3/02 tandis que le groupe principal correspondant à cet exemple s’écrit H013 3/00.
Déjà abonné ? Connectez-vous...
DOSSIER SPECIAL INFORMATION SCIENTIFIQUE ET ACADÉMIQUE
• Google Scholar est-il un véritable outil de recherche scientifique ?
BILLET D’HUMEUR
• La perversité de Google Scholar
PANORAMA
• Recherche et veille sur la littérature scientifique et académique : nouveaux entrants et ressources-clés
Déjà abonné ? Connectez-vous...
Quand il s’agit d’effectuer des recherches bibliographiques ou de réaliser une revue de littérature, Google Scholar apparaît généralement en tête de liste chez les chercheurs, universitaires, étudiants et même certains professionnels de l’information.
Une réalité qui est particulièrement surprenante, la rigueur de la démarche de recherche scientifique semblant a priori incompatible avec le mode de recherche très pauvre, proposé par Google Scholar dans des amas d’informations non structurées, et dont on ne connaît pas les contours.
Lire aussi dans ce dossier :
La perversité de Google Scholar
Recherche et veille sur la littérature scientifique et académique : nouveaux entrants et ressources-clés
Surprenante aussi car les universités, comme les entreprises, avaient déployé, depuis maintenant plusieurs dizaines d’années, des services d’information scientifique et technique de grande qualité. Des services qui ont été souvent décimés mais qui étaient équipés de « vrais » outils : les bases de données spécialisées. Ces bases offraient et offrent toujours, comme le rappellera François Libmann dans son billet « La perversité de Google Scholar » un nombre de références et des possibilités de recherche expertes et structurées, largement supérieurs à celles de Google Scholar.
Une récente enquête sur l’accès des médecins à la documentation électronique menée par la Fédération Francophone de Médecine Polyvalente(FFMP) avec l’aide de la BIU Santé, et dont les résultats ont été présentés en juin 2018 met bien en évidence la prépondérance de Google dans le processus de recherche et d’accès à la littérature scientifique.
A la question sur les méthodes d’accès à la littérature scientifique, 61% des répondants (soit 717 personnes) indiquaient chercher sur Google / Google Scholar, 42% (!) utilisaient des services pirates, tandis que 34% mentionnaient la Bibliothèque Universitaire et 27% les ressources documentaires de l’hôpital.
Une autre enquête menée par la revue Nature en 2014 auprès de 3 000 scientifiques et ingénieurs arrivait sensiblement au même constat avec un peu plus de 60% des répondants qui indiquaient se rendre régulièrement sur Google Scholar.
Si Google Scholar permet d’interroger un corpus toujours plus vaste de ressources scientifiques et académiques et d’accéder en quelques clics au texte intégral d’un nombre important de documents, peut-on aujourd’hui considérer qu’interroger Google Scholar peut suffire pour une veille bibliographique ou une revue de littérature ?
Quelles sont les principales autres ressources multidisciplinaires gratuites et payantes à connaître et leur valeur ajoutée par rapport à Google Scholar ?
Face à l’ampleur du sujet, nous avons choisi de séparer cet article en deux parties :
Déjà abonné ? Connectez-vous...
Le volume important de documents contenus dans Google Scholar fait qu’il est extrêmement rare de ne trouver aucune réponse à n’importe quelle question un tant soit peu scientifique. Parmi ces réponses, le chercheur trouvera bien quelques documents intéressants parmi les premiers de la liste car on serait curieux de savoir combien vont examiner les 1 000 résultats visualisables (c’est la limite).
Ces résultats trouvés à partir d’une ou plusieurs recherches permettent le plus souvent de tirer quelques fils et de trouver quelques documents présentant un intérêt.
Et c’est là toute la perversité du système. Car l’accès à Google Scholar est gratuit et son contenu un des plus importants disponibles.
Lire aussi dans ce dossier :
Google Scholar est-il un véritable outil de recherche scientifique ?
Recherche et veille sur la littérature scientifique et académique : nouveaux entrants et ressources-clés
C’est clairement une solution de facilité qu’adoptent malheureusement trop de chercheurs qui n’utilisent pas d’autres outils de recherche payants, et même gratuits. Et quand un article référencé dans Google Scholar est payant, on laisse souvent tomber et on part à la recherche d’un article gratuit. On frémit à l’idée que quelques services de R&D limitent leurs recherches bibliographiques à Google Scholar...
En effet, même si le nombre de documents présents dans Google Scholar est très important, la pauvreté des fonctionnalités de recherche rend quasi-impossible la réalisation d’une recherche un peu exhaustive sur un sujet précis.
Si les études comparant Google Scholar avec d’autres services ne manquent pas, on s’étonnera de la méconnaissance de leurs auteurs en matière de serveurs scientifiques.
En effet, toutes les comparaisons sont faites avec Scopus et Web of Science et oublient systématiquement l’existence de serveurs comme STN ou Proquest Dialog, ce dernier existant pourtant depuis 1972.
Déjà abonné ? Connectez-vous...
Il convient maintenant de dresser le portrait des principales ressources généralistes et multidisciplinaires pour la veille et la recherche bibliographiques. Et si nombre d’entre elles sont connues depuis longtemps des professionnels de l’information, nous avons également identifié quelques nouveaux acteurs prometteurs apparus au cours des deux dernières années et dont nous n’avons pas encore eu l’occasion de parler dans BASES.
Nous avons choisi ici de nous intéresser aux grandes ressources généralistes et multidisciplinaires proposant des références ou accès aux articles scientifiques et académiques. Sont donc exclues les ressources spécialisées sur une discipline en particulier ou sur certains types de documents qui pourront faire l’objet d’autres articles comme les thèses, mémoires, ouvrages, etc.
Lire aussi dans ce dossier :
Google Scholar est-il un véritable outil de recherche scientifique ?
La perversité de Google Scholar
Une grande partie des ressources présentées dans cet article offrent une recherche gratuite et permettent d’accéder librement aux références des articles mais pas nécessairement au texte intégral. Ces outils gratuits disposent généralement de fonctionnalités de recherche simples contrairement aux outils de recherche payants et il existe de nombreux recouvrements entre ces différentes ressources gratuites.
Nous avons fait le choix de nous focaliser ici sur les contenus proposés par ces différentes ressources et non les fonctionnalités qui seront abordées et testées dans le prochain numéro : Recherche d’information académique : enfin une comparaison concrète entre gratuit et payant.
Au cours de l’année 2018, deux nouvelles plateformes de découvertes et d’accès à la littérature scientifique et académique ont été lancées et méritent qu’on leur accorde un peu d’attention : Dimensionset 1Findr. Si ces deux outils présentent des similarités, ils ont également leurs propres singularités.
Dimensions a été lancé en janvier 2018 par la société Digital Science et permet de rechercher parmi plus de 95 millions d’articles (soit plus que Scopus par exemple) auxquels s’ajoutent des citations, essais cliniques et des brevets (voir figure 1. ci-dessous - Réservé aux abonnés).
Déjà abonné ? Connectez-vous...
I-EXPO 2018
• L’intelligence artificielle va-t-elle tuer ou renforcer les moteurs de recherche ?
• Les bons choix pour réussir une plateforme de veille collaborative, mobile et plus performante
ACTUALITÉS
• Renouveau de Google Actualités : pour le meilleur et pour le pire ?
OUTILS DE VEILLE
• Digimind Social intègre désormais des contenus radio/TV
Déjà abonné ? Connectez-vous...
Dans le précédent numéro de BASES, nous avions eu l’occasion de revenir sur certaines conférences et ateliers ayant eu lieu lors du salon I-Expo qui s’est tenu les 20, 21 et 22 mars derniers.
Nous poursuivons donc dans ce numéro avec le compte-rendu et analyse des conférences suivantes :
- L’intelligence artificielle va-t-elle tuer ou renforcer les moteurs de recherche ? Comment s’assurer de la fiabilité de l’information recherchée à l’heure des bulles de filtres et de la désinformation ?
- Espaces communautaires, RSE, plateforme collaborative : les bons choix pour réussir une plateforme de veille collaborative, mobile et plus performante. Avec les retours d’expérience d’ENGIE, RATP, AEF, LA POSTE
L’intelligence artificielle est le thème phare de l’année 2018. Google, Bing et les autres ne cessent de communiquer sur l’intégration de l’intelligence artificielle dans leurs moteurs. Qu’est-ce que cela change pour les moteurs de recherche Web tels que nous les connaissons ? Qu’est ce que cela signifie pour la recherche d’information Web dans un cadre professionnel ? Comment se dessine l’avenir des moteurs de recherche ?
C’est à toutes ces questions qu’ont répondu les différents intervenants de la table ronde « L’intelligence artificielle va-t-elle tuer ou renforcer les moteurs de recherche ? » animée par Anne-Marie Libmann, directrice opérationnelle de FLA Consultants.
Cette table-ronde regroupait à la fois des experts de la veille et de la recherche d’information et des experts du moteur de recherche Qwant:
Déjà abonné ? Connectez-vous...
La dernière conférence d’I-Expo était consacrée aux réseaux sociaux d’entreprise et plateformes collaboratives avec des retours d’expérience de professionnels à la RATP, ENGIE, La Poste ou encore AEF.
Les présentations ont surpris par l’originalité et les réflexions innovantes autour du développement et de l'implantation de ces plateformes : transformation du rôle des professionnels de l'information, apport de transversalité dans les services, choix de la plateforme avant analyse des besoins, ou encore intégration d'une plus forte valeur ajoutée dans le modèle collaboratif.
Lucie Merckens, responsable de la cellule Veille et Documentation de la RATP est revenue sur la mise en place d’une plateforme collaborative à la RATP et les conséquences que cela a pu avoir sur l’équipe de veille et ses attributions.
Pour tout ce qui a trait à la veille, l’équipe dispose d’une plateforme de veille mais il y a quelques années, il a été décidé de mettre en place une plateforme collaborative qui devait répondre à 3 objectifs :
Dans ce contexte, c’est la plateforme elium (appelée auparavant Knowledge Plaza) qui a été choisie.
La cellule Veille et Documentation de la RATP ne comptant que 3 personnes, il était donc indispensable de s’appuyer sur des interlocuteurs métiers pour réaliser la curation pour la plateforme.
Le service veille n’est pas le fournisseur principal d’information de la plateforme mais son rôle a évolué vers celui de community manager et animateur. Sa valeur ajoutée se situe dans sa connaissance de ses interlocuteurs et dans sa capacité à réaliser des missions d’accompagnement. Lucie Merckens insiste également sur l’importance du relationnel pour la réussite d’un tel projet : il faut sortir de son bureau et aller à la rencontre de ses collègues.
Déjà abonné ? Connectez-vous...
L’interface de Google Actualités (https://news.google.fr) a été profondément remaniée au mois de mai.
L’occasion pour nous de présenter ces nouveautés et évolutions ainsi que leur impact sur la recherche d’information et la veille, en en pesant le pour et le contre du point de vue du professionnel de l'information, sur différents aspects : interface, intégration de l'intelligence artificielle, collection de contenus, accès direct au payant,...
Derrière cette nouvelle version, se cache-t-il un changement de stratégie ?
Tout d’abord visuellement, l’interface est assez différente de ce qu’elle était auparavant. On y trouve désormais :
Figure 1. Nouvelle interface de Google Actualités
Déjà abonné ? Connectez-vous...