On reconnait bien souvent un professionnel de l’information à son utilisation intensive et souvent experte des opérateurs booléens et autres opérateurs avancés.
Chaque question est ainsi décortiquée, traduite en une liste de mots-clés avec leurs variantes et synonymes et combinés entre eux avec des opérateurs booléens et de multiples opérateurs avancés (termes dans la même phrase, termes cités au moins n fois, opérateurs de proximité, etc.).
Les autres professions ont quant à elles généralement tendance à méconnaître ces différentes fonctionnalités et à préférer des requêtes en langage naturel.
L’information scientifique et technique est importante pour une structure de type centre technique. Il est donc nécessaire de remettre périodiquement en cause ses sources d’informations en choisissant le meilleur compromis entre la qualité et le coût.
En 2016, le CETIM a cherché à évaluer la pertinence de ses sources d’informations. Celles-ci ont en effet évolué depuis quelques années, en particulier avec l’apparition de l’offre des éditeurs scientifiques. Le département Veille Technologique et Stratégique du CETIM s’est appuyé sur un projet de fin d’année de Licence Pro en info-doc de Lyon pour évaluer la pertinence des différentes sources d’information.
Le 24 août dernier, Elsevier annonçait le lancement de Datasearch, un moteur de recherche de données scientifiques multisectoriel en libre accès. L’outil fonctionne comme un moteur classique et interroge des sources scientifiques et répertoires institutionnels. Elsevier explique avoir voulu aider les chercheurs à gagner du temps dans leurs recherches car les moteurs de recherche généralistes ne sont pas forcément les plus adaptés pour identifier de l’information très spécialisée et ne se limitent pas à des sources d’information qualifiées et reconnues.
Ainsi, Datasearch indexe pour le moment les tableaux, figures et données supplémentaires associées aux articles publiés sur ScienceDirect, arXiv et PubMed Central ainsi que le contenu de NeuroElectro, Dryad, PetDB, ICPSR, Harvard Dataverse et ThemoML.
Pour le moment Datasearch n’est pas un produit commercial mais Elsevier indique que le business model n’est pas encore finalisé. Impossible donc de savoir comment va évoluer le produit dans les mois et années à venir et s’il va rester en libre accès.
SERVEURS • De nouvelles possibilités avec PatentPak sur STN classique
OPEN DATA
• ScanR : un moteur pour identifier des acteurs de la recherche publique et privée en France
BREVETS
• Orbit fait un premier pas hors des brevets
• De l'intérêt de la presse pour la gestion des marques verbales
BASES DE DONNÉES
• La base EMIS spécialisée sur les marchés émergents évolue
ACTUALITÉS / AGENDA • En bref
SERVEURS • Thomson Reuters se recentre sur la finance
BREVETS
• Le Brexit remet en cause le Brevet Unitaire
• Le CFIB noue un partenariat avec l’IEEPI
A LIRE • La revue du Web de l’été 2016
Depuis quelques temps déjà, la recherche dans le domaine de la chimie se développe et se complexifie.
C’est pourquoi, et comme il y a un vrai marché, les offres déjà conséquentes se développent, se diversifient et apportent de nouvelles possibilités qui aident les chercheurs dans leur travail, en particulier en leur faisant gagner du temps dans le traitement de questions toujours plus complexes.
Curieusement, deux initiatives issues de sociétés plus complémentaires que concurrentes ont apporté des réponses ayant des points communs à des problématiques voisines.
Le Ministère de l’éducation Nationale, de l’Enseignement et de la Recherche vient de lancer en version beta ScanR, un moteur de recherche permettant d’identifier des organismes de recherche publics et privées (petites, moyennes et grandes entreprises).
Quand on connaît la difficulté qu’il y a à localiser des experts ou des acteurs sur une thématique précise, on ne peut que se féliciter du lancement d’un tel produit.
Mais comment fonctionne t-il, quelles sources interroge t-il et quelles sont ses limites ?
Avec sa marque ombrelle Orbit, Questel est depuis de nombreuses années, dans une dynamique d’élargissement de son offre, soit en créant des fonctionnalités nouvelles, soit en rachetant des entreprises offrant des prestations relatives aux brevets par exemple GEM 360 ou Intellixir.
En revanche, tout ce qui concerne les marques a été abandonné comme on le sait en juin 2010, avec la vente de toute l’activité EDITAL à CT Corsearch, filiale de Wolters Kluwer.
Sauf erreur, c’est aujourd’hui la première fois qu’un élargissement de l’offre d’Orbit ne concerne pas les brevets, même si elle est réservée aux clients de la plateforme d’Orbit consacrée aux brevets.
Quiconque souhaite utiliser une marque - le plus souvent commercialement, mais ce n’est pas le seul cas de figure - pense généralement à la déposer.
Avant le dépôt, il fait ou fait faire des recherches plus ou moins sophistiquées dans différents registres nationaux ou européens pour voir si la marque est disponible.
Cela peut parfois s’avérer insuffisant. En effet, une sage précaution consiste, en plus des recherches dans les registres, à effectuer des recherches dans la presse lorsqu’il s’agit de marques verbales. Cela permet de voir si le terme qui a vocation à devenir une marque est déjà utilisé et, si oui, dans quel contexte et avec quelle fréquence. Si c’est le cas, c’est un élément à prendre en compte pour décider de déposer ou non la marque.
EMIS est une base de données spécialisée dans l’information concernant les marchés émergents (données économiques et financières sur les entreprises, les pays et les industries). Elle appartient au groupe Euromoney Institutional Investor plc.
Nous avions déjà eu l’occasion de lui consacrer un article en 2013 qui s’intitulait « EMIS : une clé d’accès aux marchés émergents » (Bases n° 303 - Avril 2013).
Mais en trois ans, le produit a bien changé avec notamment une nouvelle interface et une meilleure couverture.
Use less boolean on Google for better productivity, Sourcecon, 17 Mai 2016, http://bit.ly/29MUXk2
On voit de plus en plus de personnes remettre en cause le principe de recherche sur Google qui utilise la syntaxe traditionnelle à base d’opérateurs booléens.
L’auteur de cet article s’interroge sur l’utilisation de cette syntaxe et se demande si finalement une recherche en langage naturel ne fournirait pas des résultats plus pertinents.
Depuis quelques années, Google a considérablement amélioré ses performances en matière de recherche sémantique. De fait, les opérateurs booléens ont une utilité moindre et pourraient même restreindre la recherche et faire passer l’internaute à côté des résultats les plus pertinents. L’auteur de l’article présente plusieurs tests pour illustrer ses propos.
De ces différents tests, il tire des enseignements intéressants :