Lire un no sur 1 page - Bases & Netsources

L’actualité de janvier 2018

Carole Tisserand-Barthole

Bases no

355

publié en

2018.01

1081

Acheter ce no

Tags

Les rachats de la fin d’année 2019

Premier événement en date : l’annonce du rachat de CEDROM-SNI, propriétaire de l’agrégateur de presse Europresse par Cision le 20 décembre dernier. On en sait pour l’instant assez peu sur ce qu’il va advenir d’Europresse et de tous ses clients sur le sol français si ce n’est que cela va apporter « une excellente complémentarité stratégique » et « permettra de renforcer l’offre internationale » de Cision. Nous enquêterons donc sur les conséquences à court et long-terme de ce rachat et la nouvelle place de Cision dans le paysage de la veille, qui, rappelons-le, avait déjà racheté l’Argus de la presse cet été.

Autre rachat : celui de Xilopix, l’éditeur du moteur français Xaphir (pour lequel nos tests avaient été peu concluants) par le moteur français également Qwant. Les deux équipes travailleront ensemble pour développer des solutions de recherche adaptées au respect de la vie privée.

Enfin, l’outil de curation de contenus Storify, que certains de nos lecteurs connaissent et utilisent vient d’être acquis par la start-up américaine Livefyre spécialisée dans la curation de contenus et l’engagement d’audiences, elle-même acquise par Adobe en mai 2016. Storify fermera ses portes en mai 2018 et deviendra une fonctionnalité de LiveFyre qui est par contre un outil payant.

De nouvelles initiatives pour lutter contre la désinformation et les fake news

La lutte contre les fake news était un des thèmes central de l’année 2017. Et de nouvelles initiatives voient régulièrement le jour.

Facebook a récemment fait le point sur sa première année de lutte contre les fake news et les enseignements qu’il en a tirés.

« Le fait [qu’un article] soit indiqué comme ‘faux’ ou ‘contesté’ ne signifie pas forcément que nous parviendrons à faire changer les personnes d’avis sur sa véracité. Certaines études prouvent même que cela […] peut s’avérer contre-productif et renforcer les convictions de l’utilisateur. »

Finalement, Facebook a décidé de se recentrer sur sa fonctionnalité d’articles liés qui proposent, pour des articles au contenu « discutable » des contenus sur la même thématique mais avec un point de vue différent afin de faire réfléchir les internautes.

Google de son côté, a indiqué qu’il allait exclure de Google news les sites qui masquent ou mentent sur leur pays d’origine.

Et pour le factchecking, on signalera le lancement du site https://factuel.afp.com et du compte Twitter associé @AfpFactuel.

Les featured snippets des moteurs à l’honneur et leur impact sur la recherche d’information

Google vient d’annoncer qu’il allait ajouter plus d’images et de recherches associées (suggestions de recherche effectuées par d’autres internautes) au sein de ses featured snippets.

Rappelons qu’un featured snippet est un mode de présentation de résultats utilisé par Google qui consiste à présenter dans un cadre spécifique une partie ou la totalité de la réponse correspondant à la requête de l’internaute au dessus des résultats organiques traditionnels. Lorsqu’un site figure en featured snippet on parle généralement de rang ou position zéro. Le format de présentation featured snippet est principalement utilisé par Google pour des requêtes de type interrogatif (Qu’est ce que ? Définition…?).» (source : definitions-marketing.com)

Entre les featured snippets qui vont s’allonger, le Knowledge graph qui apparaît parfois à la droite de la liste de résultats (qui est « une base de connaissance utilisée par Google pour compiler les résultats de son moteur de recherche avec des informations sémantiques issues par ailleurs de sources diverses » - Wikipédia) et les recherches associées en bas de la page de résultats, il va rester peu de place pour les résultats naturels du moteur...

D’autant plus que Google vient également d’annoncer que la taille de la description de chaque résultat allait passer de 150/160 signes à 230 environ. On risque donc d’avoir de moins en moins de résultats sur la première page de résultats et toujours moins de visibilité pour ceux qui n’apparaissent pas dans les premiers résultats.

Bing, de son côté, vient d’ajouter des fonctionnalités de « recherche intelligente » qui repose sur le deep learning et les réseaux neuronaux. Dans les faits, cela ressemble beaucoup aux featured snippets de Google, soit un cadre au dessus des résultats qui affiche des éléments de réponse à la question posée. Mais là où Bing se veut plus intelligent que Google, c’est que cette réponse ne repose pas sur une unique source d’information. Il indique ainsi agréger des informations issues de plusieurs sources réputées. Et s’il y a différentes réponses ou points de vue possibles, il s’engage à proposer un carrousel de réponses reflétant ces différences.

Au regard des premiers tests menés par les internautes, il y a encore un peu de travail pour améliorer la solution.

Sommaire décembre 2017

Rédaction

Bases no

354

publié en

2017.12

951

Acheter ce no

Tags

sommaire

DOSSIER SPECIAL SEARCH SOLUTIONS 2017

• Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
• Au delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
• La recherche au défi de la désinformation et des fake news
• Search industry awards
• De la recherche classique à la recherche conversationnelle
• Au delà de la recherche Web

RETOUR D’EXPÉRIENCE • Vera Lúcia Vieira : la pratique de l’information made in Brésil

SERVEUR • Orbit lance le module chimie en Beta

Déjà abonné ? Connectez-vous...

Connexion

Dossier Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils

Carole Tisserand-Barthole

Bases no

354

publié en

2017.12

1607

Acheter ce no

Tags

recherche Web | tendances | conférences salons

Dossier Search solutions 2017 : tendances et innovations ... Image 1

Le 29 novembre dernier, nous avons eu l’occasion d’assister à une journée d’étude riche en enseignements organisée par BCS, The Chartered Institute for IT à Londres. Cette journée d’étude payante appelée « Search Solutions » est organisée tous les ans à la même période depuis 2006 et est limitée à 70 participants afin de privilégier la qualité des échanges.

Mais à l’origine de cette manifestation annuelle, il y avait la volonté de combler le fossé qu’il pouvait y avoir, et qu’il y a toujours d’ailleurs, entre les ingénieurs et informaticiens qui travaillent chez les acteurs des outils de recherche (moteurs de recherche, bases de données, médias sociaux, etc.) et les utilisateurs de ces solutions (et notamment les professionnels de l’information).

Cette année, la journée s’articulait autour de 4 grandes thématiques au cours desquelles chaque intervenant effectuait une présentation de 15 minutes :

Session 1 : « Au-delà du matching des mots-clés » où il était question des solutions utilisées par les acteurs pour améliorer la pertinence des résultats et notamment de taxonomie et recherche sémantique avec des intervenants de Bloomberg et LexisNexis.
Session 2 : « Nouveaux challenges : désinformation, fake news & contenus toxiques » avec des interventions sur l’impact de la désinformation et des fake news sur la recherche d’information et des pistes pour lutter contre ce phénomène.
Session 3 : « De la recherche à la conversation » avec des intervenants de Google et Facebook qui ont abordé la question de l’évolution de la recherche vers un modèle conversationnel.
Session 4 : « Au-delà de la recherche Web » où il était question d’outils de recherche qui sortaient de l’univers traditionnel de la recherche Web avec des intervenants de Microsoft et d’Elsevier.

BCS, l’organisateur de l’événement, s’adresse avant tout à un public de professionnels de l’informatique.

Déjà abonné ? Connectez-vous...

Connexion

Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie,... Dossier spécial Search 2017

Carole Tisserand-Barthole

Bases no

354

publié en

2017.12

1720

Acheter ce no

Tags

recherche Web | tendances | conférences salons | agrégateurs de presse

Au-delà de la simple correspondance de mots-clés : ... Image 1

Les thèmes traités dans cet article sont :

La Recherche sémantique, les recommandations et le multilinguisme chez Bloomberg

LexisNexis : L’utilisation de la taxonomie au service de la pertinence des résultats

Lire aussi dans notre dossier spécial :

Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web

Déjà abonné ? Connectez-vous...

Connexion

De la recherche classique à la recherche conversationnelle - Dossier spécial Search 2017

Carole Tisserand-Barthole

Bases no

354

publié en

2017.12

1790

Acheter ce no

Tags

recherche Web | Google | tendances

De la recherche classique à la recherche conversationnelle ... Image 1

En quelques années, la recherche Web via les moteurs a considérablement évolué. Alors que pendant très longtemps, les moteurs se conformaient à la requête entrée par l’utilisateur, ce n’est plus le cas chez les géants du Web avec l’intégration de technologies alliant recherche sémantique, machine learning ou encore reconnaissance vocale ou visuelle.

L’une des évolutions majeures concerne les interactions entre l’utilisateur et la machine qui ont ainsi connu des mutations profondes ces dernières années.

Et au regard des présentations auxquelles nous avons assisté, l’avenir devrait être également riche en nouveautés.

Lire aussi dans ce dossier :

Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
Au-delà de la recherche Web

Déjà abonné ? Connectez-vous...

Connexion

Au delà de la recherche Web - Dossier spécial Search 2017

Carole Tisserand-Barthole

Bases no

354

publié en

2017.12

1711

Acheter ce no

Tags

Bing | recherche Web | conférences salons

Au delà de la recherche Web - Dossier spécial Search 2017 Image 1

La dernière session s’intéressait à la recherche au-delà de la recherche Web.

On retiendra de la présentation que les équipes de Microsoft à Londres qui travaillaient avant exclusivement sur le moteur de recherche Bing ont vu leurs attributions changer récemment et travaillent désormais uniquement au développement de solutions de recherche pour les produits Microsoft.

Cela a été illustré par la présentation du nouveau projet sur lequel travaillent les équipes à Londres : il s’agit d’un système permettant de répondre quasi-automatiquement à une demande de document par email.

Lire aussi dans ce dossier :

Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web

En effet, de nombreux mails professionnels ne sont en réalité que des demandes de documents ou fichiers (« Peux-tu m’envoyer le dernier compte-rendu de réunion ? » « Peux-tu m’envoyer la dernière version du fichier excel », etc.). Face à une telle demande, le système suggérerait directement à l’utilisateur le fichier présent sur son ordinateur à intégrer en réponse à son mail.

Le redéveloppement des équipes de Bing sur d’autres projets est en soi une information et n’a rien de rassurant pour l’avenir du moteur, surtout quand on sait qu’il traverse actuellement une mauvaise passe. Cependant, à l’heure où nous écrivons cet article, Bing vient d’annoncer le lancement de fonctionnalités de « recherche intelligente » et Microsoft sa volonté de relancer Bing pour contrer Google.

A suivre donc ...

La recherche au défi de la désinformation et des fake news - Dossier spécial Search 2017

Carole Tisserand-Barthole

Bases no

354

publié en

2017.12

1896

Acheter ce no

Tags

recherche Web | fake news | conférences salons

La recherche au défi de la désinformation et des fake news ... Image 1

Un des grands sujets de l’année 2017 a bien évidemment été celui des fake news et des bulles de filtres.

Si l’on a déjà pu lire une multitude de choses sur le sujet, ces quelques interventions avaient le mérite d’apporter des éclairages différents en proposant notamment des solutions techniques et méthodologiques pour lutter contre ce phénomène et évaluer les contenus.

Lire aussi dans ce dossier :

Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web

Lutter contre les contenus toxiques avec la suite Elastic

L’intervenant, Mark Harwood, développeur chez Elastic, était bien évidemment là pour mettre en avant les produits open source développés par sa société mais fort heureusement, pas seulement, en proposant une approche intéressante et des éléments de méthodologie pour lutter contre les fake news et les contenus dits « toxiques ».

La suite d’outils développés par Elastic permet de rechercher, analyser et visualiser des données issues de n’importe quelle source et sous n’importe quel format. Parmi ces outils, on citera Elasticsearch qui est un moteur de recherche et d’analyse ou encore Kibana, un outil de visualisation des données.

A travers ces outils, il a voulu montrer qu’il était possible de mettre en place un système similaire à celui des outils de recommandation de contenus disponibles aujourd’hui (recommandations de morceaux de musique similaires à ceux déjà écoutés sur les plateformes musicales, recommandations d’articles suite à ceux déjà consultés, etc.) mais dans un but inverse : se faire recommander des contenus illicites, « toxiques » ou déformant la réalité à partir de ceux déjà identifiés afin de les blacklister ou du moins les marquer comme indésirables.

Déjà abonné ? Connectez-vous...

Connexion

Search industry awards - Dossier spécial Search 2017

Carole Tisserand-Barthole

Bases no

354

publié en

2017.12

1634

Acheter ce no

Tags

conférences salons

Search industry awards - Dossier spécial Search 2017 Image 1

La journée s’est finalement terminée sur la remise de prix des « search industry awards » avec le meilleur projet de recherche d’une part et la startup la plus prometteuse d’autre part.

Dans la première catégorie, c’est Datasearch, le moteur de données de la recherche développé par Elsevier qui a remporté le prix face à Trip Database, un outil de recherche en médecine par les preuves qui a récemment été amélioré et chatnoir, un projet de moteur de recherche web.

Pour la start-up, c’est searchhub.io qui a remporté la palme face à Nalanda. Searchhub.io est une solution qui s’intègre à n’importe quel moteur de recherche et qui recourt à l’intelligence artificielle pour améliorer la pertinence des résultats et mieux comprendre l’intention de l’utilisateur. Avec son produit Nalytics, Nalanda propose une solution pour extraire de la connaissance à partir de données non structurées.

Lire aussi dans ce dossier :

Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
De la recherche classique à la recherche conversationnelle
Au-delà de la recherche Web

Vera Lúcia Vieira : la pratique de l’information made in Brésil

FLA Consultants

Bases no

354

publié en

2017.12

1249

Acheter ce no

Tags

retour d'expérience | professionnel de l'information

Vera Lúcia Vieira : la pratique de l’information made in ... Image 1

Entretien croisé entre Vera Lúcia Vieira, professionnelle de l’information indépendante au Brésil et Carole Tisserand-Barthole, rédactrice en chef de BASES et NETSOURCES :

"Je n’ai pas le sentiment que le métier soit en voie de disparition mais il y a nécessité de se renouveler en permanence."

Pour commencer, pourriez-vous nous décrire votre parcours universitaire ? Comment en êtes-vous venue à vous orienter vers les métiers de l’information?

J’ai une formation en Lettres Français-Portugais avec une spécialisation en Marketing et je suis diplômée en Français des Affaires par la Chambre de Commerce et d’Industrie de Paris.

Pendant dix ans, j’ai été professeur de français et de portugais dans l’enseignement secondaire et supérieur. C’est durant cette période que j’ai découvert avec intérêt la recherche d’information, pour suivre les nouvelles méthodes d’enseignement bien sûr, mais aussi pour m’informer sur les questions de marché impactant le métier.

J’ai très vite senti la nécessité d’aller au-delà de l’enseignement du français. Et c’est pour cette raison que j’ai décidé de m’adresser à la Chambre de Commerce France-Brésil où j’ai trouvé (et accepté) une offre d’emploi chez Rhodia Brasil (Rhône-Poulenc) au début des années 80. L’entreprise recherchait alors un professionnel pour participer à l’implantation de l’accès aux bases de données internationales.

Déjà abonné ? Connectez-vous...

Connexion

Orbit lance le module chimie en Beta

François Libmann

Bases no

354

publié en

2017.12

1012

Acheter ce no

Tags

chimie | serveur de bases de données

Orbit lance le module chimie en Beta Image 1

On savait que Questel travaillait avec la société hongroise Chemaxon pour réaliser ses modules chimie. Comme les logiciels utilisés par Intellixir et Orbit sont différents, cela s’est fait en deux temps.

Intellixir a été le premier à offrir le module chimie, avec la contrainte de limiter la recherche aux données déchargées dans Intellixir mais avec l’avantage de fonctionner aussi bien sur des documents brevets que sur la littérature ou les essais cliniques.

En ce qui concerne Orbit, une première étape vient d’être franchie avec la mise a disposition en beta du module chimie qui permet, lui, d’effectuer des recherches sur l’ensemble de la base.

Pour y avoir accès, il suffit de le demander à son interlocuteur commercial, Questel étant très en demande de retours.

Précisons que, pour limiter le bruit, et comme dans Patentscope, ces recherches sont limitées aux brevets ayant au moins un code CIB dans le domaine de la chimie. Par contre, Orbit utilise un algorithme de détection de noms de molécules, ce qui signifie que cette détection n’est pas limitée par la mise à jour d’un thésaurus. L’algorithme sera donc capable de comprendre le nom d’une nouvelle molécule et de l’indexer.