CAS FORMULATIONS DATABASE est une nouvelle base exclusivement accessible sur la nouvelle plateforme STNext. Son nom s’abrège en CASFORMULTNS mais CASFORM ou CASFOR sont plus simples et fonctionnent aussi bien.
La matière est sensiblement la même que celle proposée par la banque de données CHEMICAL ABSTRACTS (CA), à savoir des références indexées en détail de brevets et d’articles scientifiques concernant la chimie, la pharmacie, la biochimie, … Mais l’antériorité est bien plus limitée, puisque les brevets en langue anglaise, de même qu’une sélection de brevets chinois, français, allemands, japonais ou coréens ne sont pris en compte que depuis 1996. Les articles ne sont quant à eux pris en compte que depuis 2014.
S’y ajoutent aussi, ce qui est une différence par rapport à CHEMICAL ABSTRACTS (CA), les notices de médicaments lancés sur le marché américain issues de la publication DailyMed produit par la FDA (Food and Drug Administration) et distribuée par la NLM (National Library of Medicine, producteur de Medline/PubMed).
Si donc le contenu, à l’antériorité près, est de nature semblable à celle de CHEMICAL ABSTRACTS (CA), la finalité de cette base est tout à fait différente.
Déjà abonné ? Connectez-vous...
TENDANCES
• Toutes les sources et tous les articles n ont pas la même valeur
SERVEURS • Key Terms : une indexation complémentaire pour les banques de données brevet fulltext sur STN
BASE DE DONNEES • Plusieurs changements discrets dans les banque de données scientifiques spécialisées
MOTEURS • Du nouveau du côté des moteurs académiques
Déjà abonné ? Connectez-vous...
Toute bonne veille ou recherche d’information requiert un corpus de sources qualifiées et représentatives pour un sujet donné sous peine de réaliser des analyses biaisées.
Mais en matière de sources, rien n’est jamais acquis, du moins jamais pour très longtemps.
L’accès aux médias, notamment la presse économique et les revues scientifiques académiques, est de plus en plus « instable » pour les professionnels de l’information avec des modèles d’accès (gratuit, payant, freemium, ouvert, fermé, présent dans des agrégateurs et bases de données, etc.) qui ne cessent d’évoluer.
Lire aussi : Veille et recherche d'information : toutes les sources et tous les articles n ont pas la même valeur
Les professionnels de l’information ne sont pas tous impactés par ces changements d’accès de la même manière.
Il y a tout d’abord ceux qui n’ont pas d’autre choix que de faire de la veille et des recherches d’information avec du tout gratuit. On serait tenté de penser que ce sont eux les plus impactés par l’instabilité des sources. Dès lors qu’une source n’est plus accessible gratuitement, ils n’ont de fait aucun autre moyen d’accéder aux contenus ;
Dans une catégorie intermédiaire, on trouve ceux qui disposent d’un budget pour souscrire quelques abonnements isolés ou peuvent acheter ponctuellement quelques articles, documents ou numéros. Eux aussi ne sont pas épargnés par l’évolution des modèles économiques des sources d’information, notamment celle de la presse ;
Enfin, il y a ceux qui disposent d’un véritable budget dédié à l’achat d’information et qui peuvent ainsi souscrire des abonnements à des serveurs, bases de données et agrégateurs professionnels ainsi qu’à d’autres ressources qualifiées. Longtemps préservés de l’instabilité des sources, ils sont néanmoins eux aussi touchés de plein fouet par certaines évolutions récentes, même si c’est à moins grande échelle.
Nous nous sommes basés sur ces différents profils de veilleurs pour évaluer l’impact des récentes évolutions de l’accès aux sources.
Déjà abonné ? Connectez-vous...
L’évaluation des sources a toujours fait partie du métier de veilleur mais certaines évolutions récentes nous invitent à revoir la façon dont nous considérons chaque catégorie de sources.
Lire aussi : Comment l'instabilité des modèles de la presse en ligne ébranle les dispositifs de veille
On a en effet souvent tendance à accorder plus de crédibilité à des sources « classiques » comme la presse ou la littérature scientifique où il y a, en principe, une vérification des informations ou une validation par les pairs qu’à des sources plus « nouvelles » comme les médias sociaux notamment, où n’importe quel internaute peut dire à peu près ce qu’il veut.
De même, on a tendance à moins s’interroger sur les sources issues d’outils professionnels comme les serveurs, bases de données ou encore agrégateurs de presse qui sont en principe sélectionnées pour leur qualité que pour des sources issues d’outils gratuits (comme Google, Google Scholar, etc.) où la qualité est plus variable.
Malheureusement, ce schéma de pensée est de plus en plus bancal et instable…
Même si elles ne sont pas fondamentalement nouvelles, on parle de plus en plus des revues prédatrices, ces revues qui se revendiquent scientifiques et académiques sont en réalité pas ou peu regardantes sur la qualité des articles. En effet, leur seul but est de gagner de l’argent sur le dos des chercheurs. La qualité des articles publiés dans ces revues est donc très variable.
Déjà abonné ? Connectez-vous...
La recherche dans les brevets en texte intégral, comme d’ailleurs dans le texte intégral de n’importe quel document, n’est pas toujours évidente.
En effet, se limiter aux champs titre ou abstract ou revendications (ces dernières dans le cas des brevets) peut être un petit peu restrictif, mais inclure l’ensemble de la description générera, en général, du bruit.
STN propose maintenant pour ces banques de données un nouveau champ baptisé Key Terms (KT).
Ces Key Terms sont extraits de l’ensemble des champs de la version anglaise du brevet.
Ils sont créés en utilisant des méthodes linguistiques et statistiques ainsi qu’en analysant la structure des documents de brevet.
Un maximum de 30 Key Terms est attaché à chaque brevet/famille de brevets, chaque Key Term étant composé d’un mot ou, plus souvent, d’une expression composée d’un maximum de cinq mots.
Pour illustrer l’effet de l’utilisation des Key Terms, dans une recherche, STN cite l’exemple suivant :
Pour une recherche sur l’expression « transdermal (3A) patch?
» (3A étant un opérateur de proximité, les deux termes se situant à trois mots au maximum l’un de l’autre, dans n’importe quel ordre et ? représentant une troncature illimitée), le nombre de documents trouvés est de :
On voit donc que l’intérêt de l’utilisation des Key Terms est d’augmenter raisonnablement et avec une pertinence certaine le nombre de documents potentiellement les plus intéressants.
Déjà abonné ? Connectez-vous...
Depuis maintenant quelques années, le monde des moteurs académiques est en pleine ébullition.
La famille des moteurs académiques gratuits ne cesse ne s’agrandir. Après Dimensions, 1Findr ou encore Lens, voici un petit nouveau : Scinapse.
Scinapse, un nouveau venu au pays des moteurs académiques, affiche clairement ses ambitions depuis la page d’accueil : « We’re better than Google Scholar. We mean it. »
(« Nous sommes meilleurs que Google Scholar, nous le pensons vraiment »).
Le moteur indique qu’il permet de rechercher sur plus de 200 millions d’articles issus de plus de 48 000 publications scientifiques et académiques. Quand on regarde de plus près, on découvre qu’il utilise 4 grandes sources de données : Microsoft Academic Graph, Semantic Scholar, Pubmed et Springer Nature.
Derrière ce nouveau moteur, on trouve Pluto Network basé en Corée du Sud qui regroupe des ingénieurs et entrepreneurs.
Nous l’avons testé sur plusieurs requêtes et voici nos constats.
Déjà abonné ? Connectez-vous...
Plusieurs banques de données qu’on avait l’habitude de pouvoir interroger presque indifféremment sur les serveurs Dialog ou STN ont connu ces derniers temps des restrictions d’accès.
WSCA (World Surface Coatings Abstracts) chargée en 1996 sur STN correspondait à la publication du même nom produite par la Paint Research Association UK. Elle était aussi accessible sur Dialog et même, il y a fort longtemps, sur Questel avant que ce serveur ne se focalise sur les brevets. Sa mise à jour avait cessé en 2013.
Aujourd’hui, la banque de données WSCA est produite par PRA World Ltd, le nouveau nom de la Paint Research Association et correspond à la banque de données Coatings online réservée aux membres de PRA.
WSCA n’est plus accessible que sur STN. Les mises à jour ont repris et la partie manquante de 2013 à 2018 a été comblée.
Dialog ne serait pas opposé à un rechargement, mais rien n’est fait pour le moment.
Déjà abonné ? Connectez-vous...
PANORAMA
• Optimiser sa veille avec des extensions Chrome ou Firefox
BASE DE DONNÉES
• Les archives de Pascal et Francis en accès libre sans les abstracts
Déjà abonné ? Connectez-vous...
Depuis des années, les extensions de navigateurs (principalement sur Firefox et Chrome) permettent aux veilleurs d’optimiser leurs veilles, leurs recherches et collectes d’informations.
Elles peuvent ainsi jouer un rôle aussi bien au niveau de la surveillance de pages Web, la traduction instantanée de contenu, la détection de flux RSS, l’identification d’articles académiques en libre accès, l’extraction de données, la recherche d’images, etc.
Si les utiliser est souvent un jeu d’enfants, réussir à identifier les plus pertinentes pour son travail quotidien est une autre paire de manches…
Car ces extensions sont très nombreuses - il y en a ainsi plus de 500'000 référencées sur Mozilla par exemple - et il est donc très difficile de repérer spécifiquement celles pouvant avoir un réel intérêt dans un contexte de veille et de recherche d’information.
De plus, nombre d’entre elles disparaissent régulièrement ou deviennent inutilisables à chaque nouvelle version du navigateur et d’autres apparaissent régulièrement sans qu’il n’existe de solution dédiée satisfaisante pour les repérer.
Déjà abonné ? Connectez-vous...
L’histoire des banques de données Pascal et Francis produites par l’INIST a été fortement agitée ces dernières années.
Il en a été de même avec le service de fourniture des documents primaires Refdoc, fort utilisé à une époque mais dont le nombre de commandes avait beaucoup baissé avec le temps (900'000 commandes en 1999 contre une estimation de 100'000 pour l'année 2014 selon les prévisions de l’INIST de l’époque).
Cette baisse était la conséquence du fait qu’un très grand nombre d’éditeurs avaient mis à disposition leurs publications en ligne et surtout, avaient finalement permis l’achat à l’article sans rendre obligatoire l’abonnement à la publication.
Dans un premier temps, le service Refdoc a cessé de fournir des documents aux clients privés.
Cette décision a été provoquée par la conjonction de deux facteurs : l’acharnement de David Forest, un juriste, à faire condamner l’INIST sur des problèmes très juridiques de droit de copie et une sorte de cabale menée par Savoirscom1 et le blogueur Olivier Ertzscheid (Affordance) qui trouvaient insupportable que l’INIST « vende » des articles accessibles gratuitement par ailleurs, ne comprenant malheureusement pas que l’INIST vendait un service plutôt qu’un document et que, de plus, il ne possédait pas le moindre monopole pour cette prestation.
Le pire, si l’on peut dire, est la déclaration de Savoircom1 du 19 décembre 2013 peu après la publication de l’arrêt de la Cour de Cassation clôturant l’affaire sur le fond : « Notre collectif prend acte de la fermeture de ce service (Refdoc, ndlr) même si nous n’avons jamais souhaité sa disparition pure et simple ». Ce niveau d’inconscience et d’inconséquence ne peut que laisser pantois, pour ne pas être plus désagréable.
On trouvera une analyse détaillée de cette calamiteuse affaire dans nos articles « Disparition de Refdoc : un désolant remake » (BASES n° 318, septembre 2014) et « Refdoc/Inist : un peu de bon sens » (BASES n° 298, novembre 2012)
En effet, d’aucuns se demandaient si la vocation de l’INIST était vraiment de produire des banques de données pour un large public, et cela malgré une utilisation loin d’être négligeable tant en France qu’à l’international où Francis présentait une véritable originalité.
Déjà abonné ? Connectez-vous...