On avait fini par penser que la recherche dans la littérature scientifique et les brevets était intimement et irrévocablement réalisée avec des outils de logique booléenne plus ou moins sophistiqués. Nous allons voir dans cet article qu’une approche alternative est maintenant disponible et donne des résultats intéressants. Nous allons présenter dans cet article plusieurs nouveaux outils, ainsi que d’autres à venir dans les prochains numéros de BASES.
Cinquante ans de recherche booléenne : un modèle qui n’a guère varié
On peut dater à 1972 (date de début de commercialisation du serveur Dialog au sein de la société américaine Lockheed) la mise en place de la recherche dans des corpus de littérature scientifique en utilisant une logique booléenne sur des documents préalablement indexés.
À mesure que la puissance informatique devenait disponible, l’utilisation de cette logique booléenne a permis de construire des requêtes d’une très grande complexité combinant jusqu’à plus de 100 étapes.
Durant de nombreuses décennies, ce domaine de recherche s’est étendu grâce à l’enrichissement substantiel des corpus, notamment par la création de centaines de banques de données spécialisées disponibles sur divers serveurs, ainsi que par l’émergence de systèmes globaux tels que Scopus ou Web of Science .
