STN enrichit la recherche sur les valeurs numériques

François Libmann
Bases no
384
publié en
2020.09
1061
Acheter ce no
Tags
serveur de bases de données | méthodologie | information scientifique et technique
STN enrichit la recherche sur les valeurs numériques Image 1

Lancée en 2013, la recherche sur les valeurs numériques est une des valeurs ajoutées, originale, de l’offre du serveur STN qui propose, rappelons-le, un ensemble de banques de données dans le domaine de la littérature scientifique (références bibliographiques) et des brevets (références bibliographiques ou fulltext).

Le nombre de propriétés recher­chables jusqu’à présent était de 55 telle que la charge électrique (en Coulomb), la force (en Newton), la fréquence (en Hertz), la masse moléculaire (en g/mol), la pression (en Pascal), etc.

On en trouve la liste en cherchant HELP NPS si l’on est connecté à STNext et plus précisément à une des bases offrant cette possibilité.

Sinon, on trouvera la liste à l’adresse http://www.stn-international.de/en/productsservices/products-services.

La mise à jour récente a ajouté la possibilité de rechercher sur quatre valeurs numériques supplémentaires, en peu moins classiques, portant leur nombre total à 59. Il s’agit de :

  • l’activité catalytique (/CATA en kat),
  • la force du champ magnétique (/MFST en a/m),
  • l’indice de réfraction (/RI en ri),
  • la surface spécifique de masse (/SSAM, en m2/kg).
Cette mise à jour a consisté aussi à ajouter cinq bases proposant cette possibilité de recherche sur les valeurs numériques.

Dans le domaine des brevets, il s’agit de USPATFULL et de USPAT2 et, dans le domaine de la littérature scientifique, de CEABA, RAPRA et TEMA.

Précisons que les recherches sur les quatre nouvelles valeurs numériques ne sont possibles aujourd’hui que dans ces cinq bases. Elles seront possibles dans les autres à mesure de leur rechargement dans la mesure où l’implantation de ce type de recherche représente un gros travail.

Parmi les bases qui disposeront dans le futur de ces possibilités de recherche on peut citer EPFULL, INSPEC et ANALYTICAL ABSTRACTS.

Il y a donc aujourd’hui environ 30 bases offrant ces possibilités dont une quin­zaine de bases brevets (certaines sous diffé­rentes formes), beaucoup en fulltext, mais aussi WPINDEX et ENCOMPAT et 14 bases de littérature scientifique mais aucune dans le domaine biomédical.

Une formulation spécifique

Les possibilités de recherches sont nombreuses et bien pensées.

On peut rechercher dans le texte intégral ou bien dans les références de brevets, ainsi que dans les références d’articles des mentions à une valeur numérique de l’une des 55 ou 59 propriétés chimiques ou physiques. Il faut néanmoins que le texte soit en anglais.

Ces valeurs peuvent être exactes mais il est conseillé de chercher dans un intervalle, même court, car, sinon, on peut passer à côté de documents pertinents. On peut aussi chercher des valeurs plus grandes ou plus petites, strictement ou non, qu’une valeur donnée.

On écrira par exemple 10-15nm/LEN ou LEN<=10nm si l’on veut préciser des longueurs.

Bien entendu, ces valeurs doivent être associées à un contexte. L’équation de recherche est constituée d’un concept suivi d’un opérateur puis d’une recherche de propriété numérique.

On écrira par exemple : S PARTICLE SIZE (10A) 5-50 NM/LEN 
S est ici l’abréviation du terme SELECT tandis que (nA) est un opérateur de proximité où l’ordre des termes est indifférent -

Autre exemple :(S) ?BLOCK? (A) ?POLYMER? (S) MM>75000 G/MOL
(S) est ici l’opérateur de proximité, les termes devant être dans la même phrase, MM étant le poids moléculaire (MOLECULAR WEIGHT) et ? représentant des troncatures à gauche et à droite.

Au moins dans une première étape, il est recommandé de visualiser les résultats dans le format KWIC (Key Word in Context) ou HIT qui visualise l’ensemble du champ dans lequel se trouvent les éléments pertinents, qui peut être la revendication lorsqu’il s’agit d’un brevet.

On peut aussi rechercher si dans un/des documents sont mentionnées telle ou telle propriété physique.

On écrira alors, par exemple, S LEN/PHP ou S « concept » opérateur de proximité LEN/PHP
PHP signifie ici Physical Properties

Précisons par ailleurs, qu’il est possible d’utiliser six systèmes d’unités : le SI (International System of Units), le système CGS (Centimeter-Gram-Second), etc.., le système comprenant toutes ces unités.

Ce système de recherche performant par valeurs numériques est très original. Nous n’avons rencontré des possibilités analogues que sur la banque de données Inspec présente sur STN et Dialog (avec toujours sur ce dernier serveur le rajout malencontreux des références citées dans le champ abstract).

On regrettera que sur STN les bases de données biomédicales ne soient pas (encore ?) concernées par ces possibilités.