La dématérialisation des publications a permis aux éditeurs privés, ainsi qu’aux éditeurs issus de la sphère publique d’explorer de nouveaux territoires. On assiste en particulier à la montée en puissance d’initiatives éditoriales comme celles relevant de l’Open Access dont le but est de proposer un accès en ligne et gratuit aux publications scientifiques.
Penchons-nous dans un premier temps sur le mode de publication scientifique qui a prévalu pendant les 200 dernières années, afin de mieux appréhender la nature des évolutions récentes.
L’habitude est prise par beaucoup de démarrer une recherche sur un sujet scientifique non familier dans Wikipedia, et plus généralement sur le Web l'éditeur Elsevier a lancé récemment ScienceDirect Topics pour proposer une alternative.
Cette «couche» créée par Elsevier, ajoutée à son produit ScienceDirect vise à répondre à ces questions de premier niveau qui ne sont en général pas traitées dans les articles scientifiques disponibles sur la plateforme car ils sont trop pointus. Elsevier considère, en effet, que ces réponses de premier niveau peuvent plutôt se trouver dans des chapitres de sa collection d’e-books constituée, en particulier d’encyclopédies et d’ouvrages de référence.
Entretien croisé entre Elsa Drevon, responsable du cours « Veille stratégique » à l’EBSI (Ecole de Bibliothéconomie et des Sciences de l’Information) à l’Université de Montréal et candidate au doctorat et Carole Tisserand-Barthole, rédactrice en chef de BASES et NETSOURCES.
Nous plongerons au coeur de l'enseignement de la formation à la veille et l'infodoc au Canada, ainsi que dans les meilleures pratiques "d'auto-formation".
En ce début d’année, l’actualité de Bing et Google ne manque pas.
Et ce qui fait beaucoup parler, ce sont les featured snippets de Google et de Bing.
Affiché dans un cadre spécifique et au-dessus des résultats dits « naturels », en « position 0 », le featured snippet constitue une réponse à la question posée par l’internaute et est extrait directement d’une page Web.
SERVEURS
• Les évolutions d’Orbit
• Les petits soucis du lancement de STNext
A LIRE • « Les dirigeants face à l’information », l’ouvrage qui interroge les professionnels de l’information en entreprise
COMPTE-RENDU DE CONFÉRENCE • Internet Librarian 2017
TENDANCES • Gratuité de l’information pour la veille : la fin d’une époque ?
ACTUALITÉ • L’actualité de janvier 2018
INDEX • Index BASES
La réunion parisienne des utilisateurs d’Orbit a été l’occasion de faire le point sur les nouveautés déjà opérationnelles ou proches de leur mise à disposition.
Une première tendance a été fortement mise en avant, qui est celle des différentes analyses possibles des résultats en fonction d’une multitude de critères avec toujours plus d’options de visualisation, en particulier de coloriage pour une analyse plus facile.
Si l’on a souscrit à l’option Platinum, on dispose même de près d’une vingtaine de graphes prédéfinis, avec, parmi eux, un graphe indiquant les dépenses brevets d’un ensemble de sociétés.
Il est rare que la mise en ligne d’un nouveau logiciel ne génère pas quelques soucis. STNext n’y a pas échappé. En effet, on rencontre un problème lorsque l’on utilise une parenthèse avec un clavier AZERTY car cette parenthèse efface le caractère précédent.
Par exemple, si l’on tape S (un terme) le S est effacé et la commande ne peut être exécutée. On ne peut donc faire que des stratégies de recherches qui ne comportent pas de parenthèse ce qui est évidemment très restrictif.
Pour pallier cet inconvénient, il y a plusieurs solutions : utiliser un clavier QWERTY, ou bien utiliser Command Window accessible à partir de la flèche en bas à gauche de l’écran si l’on veut rester sur STNext.
Sinon, on peut bien sûr utiliser STN on the Web ou STN Express.
Autre «détail» à prendre en compte si l’on utilise STNext : il faut penser à récupérer le transcript avant de se déconnecter, contrairement à ce qui se passe avec STN on the Web où l'on accède au transcript après la déconnexion.
Pour ceux qui n’ont pas de contrat forfaitaire, cela augmente inutilement les coûts.
Pascal Junghans, docteur en sciences de gestion et directeur de la Prospective d’Entreprise & Personnel, vient de publier dans la collection “Information et stratégie” de l’ADBS un ouvrage intitulé « Les dirigeants face à l’information », issu de son travail doctoral.
Ce livre constitue à notre sens une plongée rare dans une sphère jusqu’ici très peu explorée et mystérieuse : la relation à l’information du décideur au plus haut niveau de l’entreprise et au cœur du processus décisionnel.
Le sujet en effet, - les recherches de l’auteur l’ont montré, - a très peu été traité, que ce soit par les chercheurs, les journalistes ou les dirigeants eux-mêmes, à l’exception de Jack Welsh et Carlos Ghosn, les mythiques patrons de General Electric et Renault/Nissan respectivement.
La version américaine de la conférence appelée « Internet Librarian 2017 » a eu lieu à la même période (du 23 au 25 octobre 2017) à Monterey en Californie. C'est le pendant de la conférence « Internet Librarian International 2017 » à Londres.
L’information est au cœur du processus de veille. Si l’on n’est pas en mesure d’identifier les bonnes sources et par la suite les informations les plus pertinentes sur un sujet donné, toute analyse et recommandation stratégique en découlant sera incomplète, avec tous les risques que cela entraîne.
L’information produite par les médias, qu’il s’agisse de presse nationale, locale ou même spécialisée est un élément précieux pour la veille quel que soit le secteur d’activité concerné.
Le développement de la presse en ligne il y a une vingtaine d’années ainsi que la prolifération des contenus gratuitement accessibles sur ces sites, parallèlement à l’émergence de Google, a conduit à une croyance trompeuse largement répandue selon laquelle il n’est pas nécessaire de payer pour avoir accès à l’information. Et si l’information ne ressort pas dans Google, c’est qu’elle n’existe pas.
Premier événement en date : l’annonce du rachat de CEDROM-SNI, propriétaire de l’agrégateur de presse Europresse par Cision le 20 décembre dernier. On en sait pour l’instant assez peu sur ce qu’il va advenir d’Europresse et de tous ses clients sur le sol français si ce n’est que cela va apporter « une excellente complémentarité stratégique » et « permettra de renforcer l’offre internationale » de Cision. Nous enquêterons donc sur les conséquences à court et long-terme de ce rachat et la nouvelle place de Cision dans le paysage de la veille, qui, rappelons-le, avait déjà racheté l’Argus de la presse cet été.
Autre rachat : celui de Xilopix, l’éditeur du moteur français Xaphir (pour lequel nos tests avaient été peu concluants) par le moteur français également Qwant. Les deux équipes travailleront ensemble pour développer des solutions de recherche adaptées au respect de la vie privée.
Enfin, l’outil de curation de contenus Storify, que certains de nos lecteurs connaissent et utilisent vient d’être acquis par la start-up américaine Livefyre spécialisée dans la curation de contenus et l’engagement d’audiences, elle-même acquise par Adobe en mai 2016. Storify fermera ses portes en mai 2018 et deviendra une fonctionnalité de LiveFyre qui est par contre un outil payant.
La lutte contre les fake news était un des thèmes central de l’année 2017. Et de nouvelles initiatives voient régulièrement le jour.
• Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
• Au delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
• La recherche au défi de la désinformation et des fake news
• Search industry awards
• De la recherche classique à la recherche conversationnelle
• Au delà de la recherche Web
RETOUR D’EXPÉRIENCE • Vera Lúcia Vieira : la pratique de l’information made in Brésil
SERVEUR • Orbit lance le module chimie en Beta
Le 29 novembre dernier, nous avons eu l’occasion d’assister à une journée d’étude riche en enseignements organisée par BCS, The Chartered Institute for IT à Londres. Cette journée d’étude payante appelée « Search Solutions » est organisée tous les ans à la même période depuis 2006 et est limitée à 70 participants afin de privilégier la qualité des échanges.
Mais à l’origine de cette manifestation annuelle, il y avait la volonté de combler le fossé qu’il pouvait y avoir, et qu’il y a toujours d’ailleurs, entre les ingénieurs et informaticiens qui travaillent chez les acteurs des outils de recherche (moteurs de recherche, bases de données, médias sociaux, etc.) et les utilisateurs de ces solutions (et notamment les professionnels de l’information).
Les thèmes traités dans cet article sont :
Lire aussi dans notre dossier spécial :
Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web
En quelques années, la recherche Web via les moteurs a considérablement évolué. Alors que pendant très longtemps, les moteurs se conformaient à la requête entrée par l’utilisateur, ce n’est plus le cas chez les géants du Web avec l’intégration de technologies alliant recherche sémantique, machine learning ou encore reconnaissance vocale ou visuelle.
L’une des évolutions majeures concerne les interactions entre l’utilisateur et la machine qui ont ainsi connu des mutations profondes ces dernières années.
Et au regard des présentations auxquelles nous avons assisté, l’avenir devrait être également riche en nouveautés.
Lire aussi dans ce dossier :
Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
Au-delà de la recherche Web
La dernière session s’intéressait à la recherche au-delà de la recherche Web.
On retiendra de la présentation que les équipes de Microsoft à Londres qui travaillaient avant exclusivement sur le moteur de recherche Bing ont vu leurs attributions changer récemment et travaillent désormais uniquement au développement de solutions de recherche pour les produits Microsoft.
Cela a été illustré par la présentation du nouveau projet sur lequel travaillent les équipes à Londres : il s’agit d’un système permettant de répondre quasi-automatiquement à une demande de document par email.
Lire aussi dans ce dossier :
Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web
Un des grands sujets de l’année 2017 a bien évidemment été celui des fake news et des bulles de filtres.
Si l’on a déjà pu lire une multitude de choses sur le sujet, ces quelques interventions avaient le mérite d’apporter des éclairages différents en proposant notamment des solutions techniques et méthodologiques pour lutter contre ce phénomène et évaluer les contenus.
Lire aussi dans ce dossier :
Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web
La journée s’est finalement terminée sur la remise de prix des « search industry awards » avec le meilleur projet de recherche d’une part et la startup la plus prometteuse d’autre part.
Dans la première catégorie, c’est Datasearch, le moteur de données de la recherche développé par Elsevier qui a remporté le prix face à Trip Database, un outil de recherche en médecine par les preuves qui a récemment été amélioré et chatnoir, un projet de moteur de recherche web.
Pour la start-up, c’est searchhub.io qui a remporté la palme face à Nalanda. Searchhub.io est une solution qui s’intègre à n’importe quel moteur de recherche et qui recourt à l’intelligence artificielle pour améliorer la pertinence des résultats et mieux comprendre l’intention de l’utilisateur. Avec son produit Nalytics, Nalanda propose une solution pour extraire de la connaissance à partir de données non structurées.
Lire aussi dans ce dossier :
Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web
Entretien croisé entre Vera Lúcia Vieira, professionnelle de l’information indépendante au Brésil et Carole Tisserand-Barthole, rédactrice en chef de BASES et NETSOURCES :
"Je n’ai pas le sentiment que le métier soit en voie de disparition mais il y a nécessité de se renouveler en permanence."
J’ai une formation en Lettres Français-Portugais avec une spécialisation en Marketing et je suis diplômée en Français des Affaires par la Chambre de Commerce et d’Industrie de Paris.
Pendant dix ans, j’ai été professeur de français et de portugais dans l’enseignement secondaire et supérieur. C’est durant cette période que j’ai découvert avec intérêt la recherche d’information, pour suivre les nouvelles méthodes d’enseignement bien sûr, mais aussi pour m’informer sur les questions de marché impactant le métier.
J’ai très vite senti la nécessité d’aller au-delà de l’enseignement du français. Et c’est pour cette raison que j’ai décidé de m’adresser à la Chambre de Commerce France-Brésil où j’ai trouvé (et accepté) une offre d’emploi chez Rhodia Brasil (Rhône-Poulenc) au début des années 80. L’entreprise recherchait alors un professionnel pour participer à l’implantation de l’accès aux bases de données internationales.
On savait que Questel travaillait avec la société hongroise Chemaxon pour réaliser ses modules chimie. Comme les logiciels utilisés par Intellixir et Orbit sont différents, cela s’est fait en deux temps.
Intellixir a été le premier à offrir le module chimie, avec la contrainte de limiter la recherche aux données déchargées dans Intellixir mais avec l’avantage de fonctionner aussi bien sur des documents brevets que sur la littérature ou les essais cliniques.
En ce qui concerne Orbit, une première étape vient d’être franchie avec la mise a disposition en beta du module chimie qui permet, lui, d’effectuer des recherches sur l’ensemble de la base.
Pour y avoir accès, il suffit de le demander à son interlocuteur commercial, Questel étant très en demande de retours.
Précisons que, pour limiter le bruit, et comme dans Patentscope, ces recherches sont limitées aux brevets ayant au moins un code CIB dans le domaine de la chimie. Par contre, Orbit utilise un algorithme de détection de noms de molécules, ce qui signifie que cette détection n’est pas limitée par la mise à jour d’un thésaurus. L’algorithme sera donc capable de comprendre le nom d’une nouvelle molécule et de l’indexer.
Auteur : François Libmann, Directeur de Publication
SERVEURS • STN lance une interface Web plus conviviale
MÉTHODOLOGIE • Se former au-delà des frontières de l’infodoc
MÉTIER • Google Scholar : ami ou ennemi des outils professionnels ?
EN BREF • L’actualité du mois de Novembre 2017
La dernière édition de la manifestation ICIC en tant que telle vient d’avoir lieu à Heidelberg en Allemagne, citée universitaire charmante mais toujours aussi peu pratique d’accès.
Le schéma précis de cette organisation est original. Il a été créé il y a bien longtemps par Harry Collier et sa société Infonortics et a résisté fort longtemps, bien plus que le fameux Online de Londres qui a aussi duré longtemps mais s’est effondré totalement en quelques années, son modèle n’ayant finalement pas résisté aux évolutions, en particulier celle du Web.
Nous avons déjà évoqué à la suite de l’édition 2016 de l’ICIC la généralisation de la reconnaissance automatique des éléments chimiques dans le texte, et ce quelle que soit la façon de les écrire (BASES n° 345, février 2017).
Comme on l’avait vu, au moins quatre acteurs étaient présents sur ce créneau : Infochem, en particulier avec l’OMPI, Ontochem IT Solution avec Infoapps, Chemaxon avec Questel, NextMove Software avec Minesoft (pour PatBase), sans oublier STN avec PatentPack basé sur la reconnaissance intellectuelle et non pas automatique des noms chimiques au sens large.
A l’occasion de l’édition 2017 de l’ICIC, Infochem (filiale de Springer Nature depuis 2015) a annoncé de nouveaux développements dans l’informatique appliqué à la chimie et en particulier a précisé l’ensemble des langues dans lesquelles son outil de reconnaissance fonctionnait désormais à savoir, l’anglais, l’allemand, le français, le russe, le coréen, le japonais et le chinois.
Infochem a notamment insisté sur le fait qu’ils adaptent précisément leurs prestations aux besoins précis de leurs clients, généralement dans le cadre d’un projet.
Lighthouse IP est une société néerlandaise créée en 2006 ayant de nombreux bureaux dans le monde. Son objectif est d’être la plus exhaustive possible dans le recensement de l’information sur les brevets et les marques.
En matière de brevets, Lighthouse IP couvre en texte intégral plus de 65 offices dans le monde. Ce texte intégral est dans la langue d’origine accompagné de traductions machine en anglais. Les deux versions sont « recherchables ».
La couverture inclut, en particulier, l’essentiel des offices asiatiques et sud américains.
On connaissait déjà les accès professionnels à STN par STN Express ou par STN on the Web (attention pour cet accès à bien se connecter sur le site de FIZ Karlsruhe et pas sur celui de CAS). S’est ajouté en fanfare, il y a quelques années le «New STN» supposé remplacer et rendre obsolète les deux interfaces précédentes.
Le New STN, longtemps mis en avant, ne mettait toujours pas à disposition toutes les bases du catalogue et son développement apparaissait long et quelque peu problématique. Et effectivement, STN a fini par annoncer que cette interface utilisait des technologies nouvelles pour lesquelles des contraintes non prévues étaient apparues.
On ne le répétera jamais assez mais se former en permanence à de nouvelles compétences est une qualité essentielle des professionnels de l’information.
Mettre à jour ses connaissances en veille, recherche d’informations ou tout autre sujet relatif à l’infodoc est bien évidemment indispensable, mais il serait dommage de s’y restreindre et de ne pas aller explorer des domaines annexes (formation, communication, etc.).
Cette idée d’article nous avait été suggérée par un visiteur d’un précédent salon i-expo qui nous avait expliqué les difficultés à identifier des formations dès lors que l’on sort du champ traditionnel de l’infodoc.
Dans l’imaginaire collectif des professionnels de l’information, Google Scholar, le moteur de recherche académique de Google, apparaît comme un concurrent des serveurs et bases de données payantes comme Scopus, Web of Science, Proquest, Proquest Dialog, etc.
S’il est de notoriété publique qu’une grande partie du contenu des sites et outils des éditeurs scientifiques se retrouvent sur Google Scholar, cela paraît moins évident pour le contenu des bases de données disponibles sur les grands serveurs.
Pourtant, on apprenait il y a peu que Google étendait sa collaboration avec Proquest en indexant près d’un demi million de thèses disponibles dans la base de données ProQuest Dissertations & Theses Global™ database (PQDT).
Suite du feuilleton entre les éditeurs scientifiques et le réseau social scientifique ResearchGate.
Rappelons qu’au dernier épisode, les éditeurs avaient proposé un accord à ResearchGate pour limiter le nombre d’articles enfreignant les règles du copyright. Le réseau social n’a semble t-il jamais répondu à leurs sollicitations.
Cinq acteurs (American Chemical Society, Brill, Elsevier, Wiley et Wolters Kluwer) ont donc décidé de se regrouper pour créer la « Coalition for responsible sharing » et ont alors prévu de prendre des mesures légales envers ResearchGate.
Face à cette levée de boucliers, ResearchGate a décidé de réagir à sa façon en supprimant un certain nombre de publications présentes dans son système. Certaines publications ont ainsi été rendues privé avec un accès restreints à certaines personnes et d’autres ont tout simplement été supprimées sans que l’auteur n’ait été prévenu au préalable.
MÉTIER • Moteurs de recherche humains : des documentalistes au rabais ?
RETOUR D’EXPÉRIENCE
• Joseph Noumbissi, Hydro-Québec : professionnel de l’information de l’autre côté de l’Atlantique
EN BREF • L’actualité du mois d’Octobre 2017
INFORMATION SCIENTIFIQUE • HighWire Press a abandonné son moteur de recherche
SERVEURS • TableBase de retour sur Dialog
Si Google détient le quasi-monopole du marché de la recherche d’information Web grâce à une ambition et une intelligence hors normes, force est de le reconnaître, il ne détient heureusement pas le privilège de l’innovation. Le Goliath du Search donne même assez souvent envie à des David en herbe de relever le défi de la recherche et d’inventer des modèles de recherche alternatifs.
On constate avec plaisir que la France est présente sur ce terrain, les exemples ne manquant pas, avec pour les plus connus, Exalead, Qwant et maintenant Xaphir.
Parmi les initiatives qui ont vu et continuent de voir le jour, il existe une catégorie de moteur particulière : le « human powered search engine », que l’on pourrait traduire par moteur de recherche humain, ou « à modération humaine », comme les qualifie Phil Bradley sur son blog. Ce type de moteur se différencie en ce qu’il réintroduit l’expertise humaine dans un modèle de recherche algorithmique dominant.