En ce début d’année, l’actualité de Bing et Google ne manque pas.
Et ce qui fait beaucoup parler, ce sont les featured snippets de Google et de Bing.
Affiché dans un cadre spécifique et au-dessus des résultats dits « naturels », en « position 0 », le featured snippet constitue une réponse à la question posée par l’internaute et est extrait directement d’une page Web.
La recommandation de contenus prend une place toujours plus importante dans l’univers du Web avec l’accroissement de la recommandation humaine, lié d’une part, au développement des médias sociaux et des outils du Web 2.0 et d’autre part, à la multiplication des systèmes et algorithmes de recommandations automatiques, grâce aux progrès de l’informatique d’abord et plus récemment de l’intelligence artificielle.
Quand on pense aux systèmes de recommandations, on pense en premier lieu aux sites d’e-commerce tels que Amazon qui nous propose des produits similaires à ceux que nous consultons ou susceptibles de nous intéresser, Netflix qui nous recommande des séries et des films qui pourraient nous plaire ou encore Spotify qui nous signale des morceaux et artistes correspondant à nos goûts musicaux.
Mais aujourd’hui, la recommandation est partout et il ne se passe pas un mois sans que l’on ne voie surgir une nouvelle fonctionnalité ou de nouveaux outils grand public et professionnels nous promettant de nous faire découvrir automatiquement des contenus nouveaux qui pourraient nous intéresser et nous faire sortir de notre bulle informationnelle ou des contenus similaires à ce que nous consultons.
Premier événement en date : l’annonce du rachat de CEDROM-SNI, propriétaire de l’agrégateur de presse Europresse par Cision le 20 décembre dernier. On en sait pour l’instant assez peu sur ce qu’il va advenir d’Europresse et de tous ses clients sur le sol français si ce n’est que cela va apporter « une excellente complémentarité stratégique » et « permettra de renforcer l’offre internationale » de Cision. Nous enquêterons donc sur les conséquences à court et long-terme de ce rachat et la nouvelle place de Cision dans le paysage de la veille, qui, rappelons-le, avait déjà racheté l’Argus de la presse cet été.
Autre rachat : celui de Xilopix, l’éditeur du moteur français Xaphir (pour lequel nos tests avaient été peu concluants) par le moteur français également Qwant. Les deux équipes travailleront ensemble pour développer des solutions de recherche adaptées au respect de la vie privée.
Enfin, l’outil de curation de contenus Storify, que certains de nos lecteurs connaissent et utilisent vient d’être acquis par la start-up américaine Livefyre spécialisée dans la curation de contenus et l’engagement d’audiences, elle-même acquise par Adobe en mai 2016. Storify fermera ses portes en mai 2018 et deviendra une fonctionnalité de LiveFyre qui est par contre un outil payant.
La lutte contre les fake news était un des thèmes central de l’année 2017. Et de nouvelles initiatives voient régulièrement le jour.
En quelques années, la recherche Web via les moteurs a considérablement évolué. Alors que pendant très longtemps, les moteurs se conformaient à la requête entrée par l’utilisateur, ce n’est plus le cas chez les géants du Web avec l’intégration de technologies alliant recherche sémantique, machine learning ou encore reconnaissance vocale ou visuelle.
L’une des évolutions majeures concerne les interactions entre l’utilisateur et la machine qui ont ainsi connu des mutations profondes ces dernières années.
Et au regard des présentations auxquelles nous avons assisté, l’avenir devrait être également riche en nouveautés.
Lire aussi dans ce dossier :
Search solutions 2017 : tendances et innovations pour la recherche d’information et ses outils
Au-delà de la simple correspondance de mots-clés : recherche sémantique, taxonomie, etc.
La recherche au défi de la désinformation et des fake news
Les Search Industry Awards
Au-delà de la recherche Web
Dans l’imaginaire collectif des professionnels de l’information, Google Scholar, le moteur de recherche académique de Google, apparaît comme un concurrent des serveurs et bases de données payantes comme Scopus, Web of Science, Proquest, Proquest Dialog, etc.
S’il est de notoriété publique qu’une grande partie du contenu des sites et outils des éditeurs scientifiques se retrouvent sur Google Scholar, cela paraît moins évident pour le contenu des bases de données disponibles sur les grands serveurs.
Pourtant, on apprenait il y a peu que Google étendait sa collaboration avec Proquest en indexant près d’un demi million de thèses disponibles dans la base de données ProQuest Dissertations & Theses Global™ database (PQDT).
Suite du feuilleton entre les éditeurs scientifiques et le réseau social scientifique ResearchGate.
Rappelons qu’au dernier épisode, les éditeurs avaient proposé un accord à ResearchGate pour limiter le nombre d’articles enfreignant les règles du copyright. Le réseau social n’a semble t-il jamais répondu à leurs sollicitations.
Cinq acteurs (American Chemical Society, Brill, Elsevier, Wiley et Wolters Kluwer) ont donc décidé de se regrouper pour créer la « Coalition for responsible sharing » et ont alors prévu de prendre des mesures légales envers ResearchGate.
Face à cette levée de boucliers, ResearchGate a décidé de réagir à sa façon en supprimant un certain nombre de publications présentes dans son système. Certaines publications ont ainsi été rendues privé avec un accès restreints à certaines personnes et d’autres ont tout simplement été supprimées sans que l’auteur n’ait été prévenu au préalable.
Pour la veille et la recherche d’information, le moteur Google est un outil indispensable, pour rechercher sur le Web ouvert et gratuit ainsi que pour détecter des sources pertinentes dans le cadre du sourcing.
Les relations entre le géant américain et les professionnels de la veille sont cependant compliquées. Ces derniers se voient par exemple dépossédés de leur rôle d’intermédiaire auprès des usagers, désillusionnés quant à la stratégie à long-terme de Google mais doivent également faire face aux retraits réguliers de produits et fonctionnalités très utilisées par les veilleurs.
Être un concurrent direct de Google n’est sûrement pas facile tous les jours...
On apprenait il y a peu qu’Apple avait décidé de remplacer Bing par Google sur IoS et Mac. Désormais, les utilisateurs des produits Apple effectueront donc leurs recherches Web par défaut sur Google.
Un nouveau coup dur pour Bing, qui n’en est pourtant pas à sa première déconvenue.
Google est le leader incontesté des moteurs de recherche depuis maintenant de nombreuses années et personne ne semble en passe de le détrôner. Pourtant d’autres moteurs existent, survivent et disposent tout de même d’une certaine audience.
Lorsque nous devons réaliser une recherche d’informations ou une veille, notre premier réflexe sur le Web ouvert est évidemment Google mais y-a-t-il également un intérêt à interroger d’autres moteurs et les résultats proposés sont-ils proches ou identiques à ceux de Google ?
Nous parlons ici de moteurs de recherche généralistes comme Google et non de moteurs spécialisés (vidéos, images, thématiques, etc.) qui ont évidemment leurs propres spécificités.
Dans le numéro de Bases de Septembre 2016 (n°340), nous avions abordé la question de l’évolution des modes de recherche sur Google ainsi que sur les autres moteurs de recherche.
Il en ressortait que quoi qu’en disent certaines personnes et experts, la recherche booléenne n’était pas encore morte mais que la façon d’interroger les moteurs de recherche web évoluait considérablement notamment suite au développement récent de la recherche sémantique.
Nous avons cherché à savoir si cette tendance s’appliquait également au monde des outils de recherche et de veille professionnels comme les serveurs, les agrégateurs de presse ou encore les plateformes de veille.
On reconnait bien souvent un professionnel de l’information à son utilisation intensive et souvent experte des opérateurs booléens et autres opérateurs avancés.
Chaque question est ainsi décortiquée, traduite en une liste de mots-clés avec leurs variantes et synonymes et combinés entre eux avec des opérateurs booléens et de multiples opérateurs avancés (termes dans la même phrase, termes cités au moins n fois, opérateurs de proximité, etc.).
Les autres professions ont quant à elles généralement tendance à méconnaître ces différentes fonctionnalités et à préférer des requêtes en langage naturel.
Longtemps ignorée du grand public, la personnalisation constante des résultats par les plus importants moteurs de recherche, Google au premier chef, est maintenant très largement intégrée dans l’esprit de chacun, prenant même une place centrale dans le débat public concernant les problématiques de respect de la vie privée.
Google, comme d’autres géants du web, utilise chacune de nos recherches pour établir un profil qui permettra ensuite à l’entreprise de proposer des publicités personnalisées, mais aussi d’adapter les résultats de recherche afin qu’ils soient les plus « pertinents » possible.
Pourtant, au-delà de la question de la vie privée, certains activistes et professionnels de l’information se sont inquiétés de la création d’une « bulle » autour de l’internaute, les résultats de recherche s’adaptant au fur et à mesure pour ne proposer au final à l’internaute que ce qu’il veut lire, évacuant des résultats potentiellement intéressants mais que le moteur de recherche aurait jugé non-pertinents.
La guerre entre Google et la presse ne semble pas être terminée, du moins pas en Allemagne. Un groupe d’éditeurs allemands a déposé une plainte en janvier dernier contre le géant américain. Il lui reproche de ne pas respecter la loi sur le copyright des éditeurs de presse « Leistungsschutzrecht für Presseverleger » votée en 2013 en Allemagne. Cette loi prévoit de faire payer les moteurs de recherche et agrégateurs d’actualités dès lors qu’ils affichent des articles de presse (même une partie seulement) dans leurs résultats.
Jusqu’à présent, Google proposait plusieurs API autour de la recherche permettant ainsi aux développeurs d’utiliser et d’intégrer certains services de Google à d’autres sites et applications. Mais à partir du 15 février prochain, Google a annoncé la fermeture des API suivantes : recherche brevets, Google News, recherche dans les blogs, recherche vidéos, recherche images
Le « 2016 Edelman Trust Barometer », un sondage mené par la société Edelman a récemment montré que 60% des personnes sondées (33 000 personnes dans 28 pays différents) faisaient plus confiance aux informations publiées dans Google News qu’aux mêmes actualités publiées sur les sites des journaux.
En novembre, Google a annoncé avoir amélioré son système de reconnaissance vocale de demandes effectuées sur son moteur en langage naturel, que ce soit sur mobile ou sur ordinateur. Les améliorations ne sont disponibles que pour la langue anglaise pour le moment.
Depuis le mois de novembre, il est possible de bookmarker des images directement depuis les résultats du moteur Google Images, de les classer par dossier et de les taguer pour les retrouver facilement. Cette fonctionnalité n’est malheureusement disponible qu’aux Etats-Unis pour le moment et uniquement sur mobiles et tablettes.
Du côté des services dérivés du moteur, on notera que Google Maps est désormais disponible offline, c’est à dire qu’il est possible de télécharger la carte d’une zone géographique précise et de la visualiser plus tard même sans connexion internet.
Enfin, pour clore l’année, rappelons que Google a supprimé 13 de ses produits et services en 2015 : Google TV, Google Code, Google Talk, ClientLogin protocol, Google Helpouts, Google+ Photos, PageSpeed Service, Google Catalogs, Autocomplete API, Google Moderator, Google Flu Trends, Google Hotel Finder et ADT for Eclipse.
Il n’est pas possible de commencer cette rubrique sans débuter par Google, dont l’actualité est chargée.
Récemment, l’un des porte-paroles de Google a annoncé lors de la conférence SMX Advanced de Seattle (les 2 et 3 juin derniers) que le moteur n’indexait pas toutes les urls rencontrées lors de son exploration. Google aurait ainsi accès à plus de 30 mille milliards d’urls mais n’aurait pas la capacité de stocker un tel volume.
Lors d’une recherche sur le moteur, il faut donc bien garder à l’esprit que Google ne lancera pas la recherche sur l’intégralité du Web mais une partie seulement.
Toujours au niveau de la recherche, le géant du Web vient d’annoncer que dans 10 pays (dont les Etats-Unis et le Japon), le nombre de recherches sur téléphones mobiles dépassait désormais le nombre de recherches sur ordinateurs ou tablettes. La firme ne donne malheureusement aucune indication sur les 8 autres pays.
Google dispose désormais d’une nouvelle section intitulée « Dans l’actualité ».
Par rapport à l’ancien encart « actualités » qui se contentait de présenter dans l’onglet de recherche les premiers résultats de Google News, cette nouvelle section présente un ensemble de médias (articles, mais aussi blogs, vidéos youtube ou posts issus de réseaux sociaux) liés aux dernières nouvelles et qui ne sont pas nécessairement indexés par Google Actualités.