L’intelligence économique commence par une veille intelligente

CAS FORMULATIONS DATABASE est une nouvelle base exclusivement accessible sur la nouvelle plateforme STNext. Son nom s’abrège en CASFORMULTNS mais CASFORM ou CASFOR sont plus simples et fonctionnent aussi bien.

La matière est sensiblement la même que celle proposée par la banque de données CHEMICAL ABSTRACTS (CA), à savoir des références indexées en détail de brevets et d’articles scientifiques concernant la chimie, la pharmacie, la biochimie, … Mais l’antériorité est bien plus limitée, puisque les brevets en langue anglaise, de même qu’une sélection de brevets chinois, français, allemands, japonais ou coréens ne sont pris en compte que depuis 1996. Les articles ne sont quant à eux pris en compte que depuis 2014.

S’y ajoutent aussi, ce qui est une différence par rapport à CHEMICAL ABSTRACTS (CA), les notices de médicaments lancés sur le marché américain issues de la publication DailyMed produit par la FDA (Food and Drug Administration) et distribuée par la NLM (National Library of Medicine, producteur de Medline/PubMed).

Si donc le contenu, à l’antériorité près, est de nature semblable à celle de CHEMICAL ABSTRACTS (CA), la finalité de cette base est tout à fait différente.

En effet, elle s’attache à décrire de façon détaillée et exhaustive la formulation d’un produit donné en ne se limitant pas à son principe actif, mais en prenant aussi en compte ses excipients, ses additifs... Ces éléments ont beaucoup moins d’importance dans CHEMICAL ABSTRACTS (CA), ne sont pas toujours indexés et peuvent n’apparaître qu’au détour d’un paragraphe ou d’un tableau du texte intégral de l’article ou du brevet.

Déjà abonné ? Connectez-vous...

Connexion

Sommaire octobre 2019

Rédaction

Bases no

374

publié en

2019.10

970

Acheter ce no

Tags

sommaire

TENDANCES

• Comment l instabilité des modèles de la presse en ligne ébranle les dispositifs de veille

• Toutes les sources et tous les articles n ont pas la même valeur

SERVEURS • Key Terms : une indexation complémentaire pour les banques de données brevet fulltext sur STN

BASE DE DONNEES • Plusieurs changements discrets dans les banque de données scientiﬁques spécialisées

MOTEURS • Du nouveau du côté des moteurs académiques

Déjà abonné ? Connectez-vous...

Connexion

Comment l’instabilité des modèles de la presse en ligne ébranle les dispositifs de veille

Carole Tisserand-Barthole

Bases no

374

publié en

2019.10

1788

Acheter ce no

Tags

presse en ligne | tendances | agrégateurs de presse | revues académiques | open access

Comment l’instabilité des modèles de la presse en ligne ... Image 1

Toute bonne veille ou recherche d’information requiert un corpus de sources qualifiées et représentatives pour un sujet donné sous peine de réaliser des analyses biaisées.

Mais en matière de sources, rien n’est jamais acquis, du moins jamais pour très longtemps.

L’accès aux médias, notamment la presse économique et les revues scientifiques académiques, est de plus en plus « instable » pour les professionnels de l’information avec des modèles d’accès (gratuit, payant, freemium, ouvert, fermé, présent dans des agrégateurs et bases de données, etc.) qui ne cessent d’évoluer.

Comment ces évolutions récentes impactent-elles le veilleur au quotidien et comment peut-il adapter ses pratiques de veille ?

Lire aussi : Veille et recherche d'information : toutes les sources et tous les articles n ont pas la même valeur

Évolution de l’accès aux sources : un impact qui diffère selon le profil du veilleur

Les professionnels de l’information ne sont pas tous impactés par ces changements d’accès de la même manière.

Il y a tout d’abord ceux qui n’ont pas d’autre choix que de faire de la veille et des recherches d’information avec du tout gratuit. On serait tenté de penser que ce sont eux les plus impactés par l’instabilité des sources. Dès lors qu’une source n’est plus accessible gratuitement, ils n’ont de fait aucun autre moyen d’accéder aux contenus ;

Dans une catégorie intermédiaire, on trouve ceux qui disposent d’un budget pour souscrire quelques abonnements isolés ou peuvent acheter ponctuellement quelques articles, documents ou numéros. Eux aussi ne sont pas épargnés par l’évolution des modèles économiques des sources d’information, notamment celle de la presse ;

Enfin, il y a ceux qui disposent d’un véritable budget dédié à l’achat d’information et qui peuvent ainsi souscrire des abonnements à des serveurs, bases de données et agrégateurs professionnels ainsi qu’à d’autres ressources qualifiées. Longtemps préservés de l’instabilité des sources, ils sont néanmoins eux aussi touchés de plein fouet par certaines évolutions récentes, même si c’est à moins grande échelle.

Nous nous sommes basés sur ces différents profils de veilleurs pour évaluer l’impact des récentes évolutions de l’accès aux sources.

Déjà abonné ? Connectez-vous...

Connexion

Veille et recherche d'information : toutes les sources et tous les articles n’ont pas la même valeur

Carole Tisserand-Barthole

Bases no

374

publié en

2019.10

1937

Acheter ce no

Tags

recherche Web | presse en ligne | fake news | tendances | sourcing veille

Veille et recherche d'information : toutes les sources et ... Image 1

L’évaluation des sources a toujours fait partie du métier de veilleur mais certaines évolutions récentes nous invitent à revoir la façon dont nous considérons chaque catégorie de sources.

Lire aussi : Comment l'instabilité des modèles de la presse en ligne ébranle les dispositifs de veille

On a en effet souvent tendance à accorder plus de crédibilité à des sources « classiques » comme la presse ou la littérature scientifique où il y a, en principe, une vérification des informations ou une validation par les pairs qu’à des sources plus « nouvelles » comme les médias sociaux notamment, où n’importe quel internaute peut dire à peu près ce qu’il veut.

De même, on a tendance à moins s’interroger sur les sources issues d’outils professionnels comme les serveurs, bases de données ou encore agrégateurs de presse qui sont en principe sélectionnées pour leur qualité que pour des sources issues d’outils gratuits (comme Google, Google Scholar, etc.) où la qualité est plus variable.

Malheureusement, ce schéma de pensée est de plus en plus bancal et instable…

Des revues prédatrices qui s’immiscent à tous les niveaux et toujours plus difficiles à distinguer

Même si elles ne sont pas fondamentalement nouvelles, on parle de plus en plus des revues prédatrices, ces revues qui se revendiquent scientifiques et académiques sont en réalité pas ou peu regardantes sur la qualité des articles. En effet, leur seul but est de gagner de l’argent sur le dos des chercheurs. La qualité des articles publiés dans ces revues est donc très variable.

Déjà abonné ? Connectez-vous...

Connexion

Key Terms : Une indexation complémentaire pour les banques de données brevets fulltext sur STN

François Libmann

Bases no

374

publié en

2019.10

1834

Acheter ce no

Tags

propriété intellectuelle | brevets

Key Terms : Une indexation complémentaire pour les banques ... Image 1

La recherche dans les brevets en texte intégral, comme d’ailleurs dans le texte intégral de n’importe quel document, n’est pas toujours évidente.

En effet, se limiter aux champs titre ou abstract ou revendications (ces dernières dans le cas des brevets) peut être un petit peu restrictif, mais inclure l’ensemble de la description générera, en général, du bruit.

STN propose maintenant pour ces banques de données un nouveau champ baptisé Key Terms (KT).

Ces Key Terms sont extraits de l’ensemble des champs de la version anglaise du brevet.

Ils sont créés en utilisant des méthodes linguistiques et statistiques ainsi qu’en analysant la structure des documents de brevet.

Un maximum de 30 Key Terms est attaché à chaque brevet/famille de brevets, chaque Key Term étant composé d’un mot ou, plus souvent, d’une expression composée d’un maximum de cinq mots.

Pour illustrer l’effet de l’utilisation des Key Terms, dans une recherche, STN cite l’exemple suivant :

Pour une recherche sur l’expression « transdermal (3A) patch? » (3A étant un opérateur de proximité, les deux termes se situant à trois mots au maximum l’un de l’autre, dans n’importe quel ordre et ? représentant une troncature illimitée), le nombre de documents trouvés est de :

348 en cherchant dans le Basic Index (titre, abstract, revendications ou description)
53 dans titre, abstract ou revendications
74 dans titre, abstract, revendications ou Key Terms.

On voit donc que l’intérêt de l’utilisation des Key Terms est d’augmenter raisonnablement et avec une pertinence certaine le nombre de documents potentiellement les plus intéressants.

Déjà abonné ? Connectez-vous...

Connexion

Du nouveau du côté des moteurs académiques

Carole Tisserand-Barthole

Bases no

374

publié en

2019.10

1725

Acheter ce no

Tags

Google | moteurs académiques

Du nouveau du côté des moteurs académiques Image 1

Depuis maintenant quelques années, le monde des moteurs académiques est en pleine ébullition.

Si Google Scholar n’évolue pratiquement pas depuis des années, on voit apparaître régulièrement de nouveaux acteurs et les acteurs en place, quant à eux, font régulièrement évoluer leurs outils.

La famille des moteurs académiques gratuits ne cesse ne s’agrandir. Après Dimensions, 1Findr ou encore Lens, voici un petit nouveau : Scinapse.

Scinapse, un nouveau venu au pays des moteurs académiques, affiche clairement ses ambitions depuis la page d’accueil : « We’re better than Google Scholar. We mean it. »

(« Nous sommes meilleurs que Google Scholar, nous le pensons vraiment »).

Scinapse (https://scinapse.io)

Le moteur indique qu’il permet de rechercher sur plus de 200 millions d’articles issus de plus de 48 000 publications scientifiques et académiques. Quand on regarde de plus près, on découvre qu’il utilise 4 grandes sources de données : Microsoft Academic Graph, Semantic Scholar, Pubmed et Springer Nature.

Derrière ce nouveau moteur, on trouve Pluto Network basé en Corée du Sud qui regroupe des ingénieurs et entrepreneurs.

Nous l’avons testé sur plusieurs requêtes et voici nos constats.

Déjà abonné ? Connectez-vous...

Connexion

Plusieurs changements discrets dans les banques de données scientifiques chez STN et Dialog

François Libmann

Bases no

374

publié en

2019.10

1248

Acheter ce no

Tags

serveur de bases de données | information scientifique et technique

Plusieurs changements discrets dans les banques de données ... Image 1

Plusieurs banques de données qu’on avait l’habitude de pouvoir interroger presque indifféremment sur les serveurs Dialog ou STN ont connu ces derniers temps des restrictions d’accès.

WSCA

WSCA (World Surface Coatings Abstracts) chargée en 1996 sur STN correspondait à la publication du même nom produite par la Paint Research Association UK. Elle était aussi accessible sur Dialog et même, il y a fort longtemps, sur Questel avant que ce serveur ne se focalise sur les brevets. Sa mise à jour avait cessé en 2013.

Aujourd’hui, la banque de données WSCA est produite par PRA World Ltd, le nouveau nom de la Paint Research Association et correspond à la banque de données Coatings online réservée aux membres de PRA.

WSCA n’est plus accessible que sur STN. Les mises à jour ont repris et la partie manquante de 2013 à 2018 a été comblée.
Dialog ne serait pas opposé à un rechargement, mais rien n’est fait pour le moment.

Déjà abonné ? Connectez-vous...

Connexion

Sommaire septembre 2019

Rédaction

Bases no

373

publié en

2019.09

1054

Acheter ce no

Tags

sommaire

PANORAMA
• Optimiser sa veille avec des extensions Chrome ou Firefox

BASE DE DONNÉES
• Les archives de Pascal et Francis en accès libre sans les abstracts

Déjà abonné ? Connectez-vous...

Connexion

Optimiser sa veille avec des extensions Chrome ou Firefox

Carole Tisserand-Barthole

Bases no

373

publié en

2019.09

1631

Acheter ce no

Tags

méthodologie | outils de veille | flux RSS

Optimiser sa veille avec des extensions Chrome ou Firefox Image 1

Depuis des années, les extensions de navigateurs (principalement sur Firefox et Chrome) permettent aux veilleurs d’optimiser leurs veilles, leurs recherches et collectes d’informations.

Elles peuvent ainsi jouer un rôle aussi bien au niveau de la surveillance de pages Web, la traduction instantanée de contenu, la détection de flux RSS, l’identification d’articles académiques en libre accès, l’extraction de données, la recherche d’images, etc.

Si les utiliser est souvent un jeu d’enfants, réussir à identifier les plus pertinentes pour son travail quotidien est une autre paire de manches…

Car ces extensions sont très nombreuses - il y en a ainsi plus de 500'000 référencées sur Mozilla par exemple - et il est donc très difficile de repérer spécifiquement celles pouvant avoir un réel intérêt dans un contexte de veille et de recherche d’information.

De plus, nombre d’entre elles disparaissent régulièrement ou deviennent inutilisables à chaque nouvelle version du navigateur et d’autres apparaissent régulièrement sans qu’il n’existe de solution dédiée satisfaisante pour les repérer.

Comment identifier des extensions pour optimiser sa veille ? Comment réussir à en découvrir de nouvelles ? Quelles sont aujourd’hui en 2019 les extensions les plus utiles pour les veilleurs ?

C’est à ces questions que nous répondrons dans ce gros dossier de BASES.

Déjà abonné ? Connectez-vous...

Connexion

Les archives de Pascal et Francis en accès libre sans les abstracts

François Libmann

Bases no

373

publié en

2019.09

1174

Acheter ce no

Tags

références bibliographiques | information scientifique et technique | open access

Les archives de Pascal et Francis en accès libre sans les ... Image 1

L’histoire des banques de données Pascal et Francis produites par l’INIST a été fortement agitée ces dernières années.

Il en a été de même avec le service de fourniture des documents primaires Refdoc, fort utilisé à une époque mais dont le nombre de commandes avait beaucoup baissé avec le temps (900'000 commandes en 1999 contre une estimation de 100'000 pour l'année 2014 selon les prévisions de l’INIST de l’époque).

Cette baisse était la conséquence du fait qu’un très grand nombre d’éditeurs avaient mis à disposition leurs publications en ligne et surtout, avaient finalement permis l’achat à l’article sans rendre obligatoire l’abonnement à la publication.

Retour sur l’arrêt de Refdoc

Dans un premier temps, le service Refdoc a cessé de fournir des documents aux clients privés.

Cette décision a été provoquée par la conjonction de deux facteurs : l’acharnement de David Forest, un juriste, à faire condamner l’INIST sur des problèmes très juridiques de droit de copie et une sorte de cabale menée par Savoirscom1 et le blogueur Olivier Ertzscheid (Affordance) qui trouvaient insupportable que l’INIST « vende » des articles accessibles gratuitement par ailleurs, ne comprenant malheureusement pas que l’INIST vendait un service plutôt qu’un document et que, de plus, il ne possédait pas le moindre monopole pour cette prestation.

Le pire, si l’on peut dire, est la déclaration de Savoircom1 du 19 décembre 2013 peu après la publication de l’arrêt de la Cour de Cassation clôturant l’affaire sur le fond : « Notre collectif prend acte de la fermeture de ce service (Refdoc, ndlr) même si nous n’avons jamais souhaité sa disparition pure et simple ». Ce niveau d’inconscience et d’inconséquence ne peut que laisser pantois, pour ne pas être plus désagréable.

On trouvera une analyse détaillée de cette calamiteuse affaire dans nos articles « Disparition de Refdoc : un désolant remake » (BASES n° 318, septembre 2014) et « Refdoc/Inist : un peu de bon sens » (BASES n° 298, novembre 2012)

La tempête Refdoc a eu pour conséquence une réorganisation de l’INIST conduisant à l’arrêt de la production des bases Pascal et Francis, qui étaient déjà sur la sellette depuis longtemps.

En effet, d’aucuns se demandaient si la vocation de l’INIST était vraiment de produire des banques de données pour un large public, et cela malgré une utilisation loin d’être négligeable tant en France qu’à l’international où Francis présentait une véritable originalité.