Notre avis :
Si le moteur s’est amélioré en un an avec plus de datasets et quelques filtres supplémentaires, on reste néanmoins loin du compte.
Pas de décompte précis du nombre de résultats, pas de possibilités de classement par date, peu de données sur chaque datasets et des données très hétérogènes qui mêlent des données publiques et données de la recherche sans distinction.
Pour les données publiques, on continuera à privilégier des moteurs liés à l’open data comme data.gouv.fr et ses équivalents dans les autres pays. Pour les données de la recherche, Mendeley Data reste bien plus efficace et similaire en taille avec ses 20 millions de datasets. Le moteur Datacite Search est également intéressant Et le moteur académique Dimensions vient d’annoncer à la fin janvier qu’il intégrait désormais des datasets (aussi bien dans la version gratuite que payante). A l’heure actuelle, 1.4 millions de datasets seraient référencés en provenance de sources come Dryad, Zenodo, Pangea, ou encore Figshare.
Google Datasets représente un complément intéressant de par la taille de son index, mais reste encore trop limité en termes de fonctionnalités de recherche et de filtres.
Google podcasts se transforme en moteur de recherche
Autre verticale qui se développe : Google Podcasts (https://podcasts.google.com/). Rien d’étonnant cependant quand on voit la place grandissante des podcasts dans le monde de l’information.
Lancé en 2018, Google Podcasts n’était au départ qu’un lecteur de podcasts. Depuis peu, il dispose également d’une version Web et surtout depuis quelques semaines, un moteur de recherche a également été intégré.
Le moteur fonctionne comme un moteur Google classique avec la possibilité d’utiliser les opérateurs AND (par défaut), OR ou NOT (sous la forme d’un tiret -), les guillemets pour la recherche d’expression exacte ou encore l’opérateur intitle:.
Comme pour Google Datasets, Google ne recherche que sur les métadonnées et non sur le contenu des podcasts eux-mêmes.
Notre avis :
- Google vient encore une fois se positionner sur un créneau porteur, en l’occurrence celui des podcasts.
- La couverture semble plutôt bonne, mais la recherche reste pour le moment très simpliste avec aucun filtre disponible (pas de filtre par date, langue, pays, etc.). De même, il n’indique pas le nombre de résultats.
- On conseillera aujourd’hui d’utiliser plutôt des moteurs plus performants comme par exemple celui de Listen Notes qui propose une meilleure couverture et des fonctionnalités plus avancées.
- Google Podcasts ne pourra être perçu que comme un complément. Mais on suivra son évolution dans les prochains mois.
Google News : on ne sait plus sur quel pied danser
Suite à l’adoption de la directive européenne sur le droit voisin pour les éditeurs de presse, Google avait annoncé qu’il n’envisageait pas de rémunérer les éditeurs de presse pour leurs contenus et avait choisi de n’afficher que les titres des articles pour éviter d’avoir à payer une quelconque redevance aux médias. Tous les éditeurs ou presque avaient alors finalement renoncé à se faire rémunérer et avaient ajouté la balise autorisant Google à reprendre leurs contenus sans frais, car la baisse de trafic se faisait ressentir.
Contre toute attente, Google vient d’annoncer qu’il réfléchissait à passer des accords de partenariat pour développer des « informations premium ». Les discussions seraient en cours avec des éditeurs français et européens. On ne sait pas encore si Google prévoit de lancer un « Netflix » de la presse comme Apple News+ ou Pressmium où les internautes peuvent accéder en texte intégral à des contenus habituellement disponibles sur abonnement pour un forfait mensuel dont le coût tourne autour d’une dizaine d’euros.
Notre avis :
Il n’y a pas encore assez d’information pour évaluer l’éventuel impact de ce nouveau projet pour la recherche d’information. Ce qui est sûr cependant, c’est que Google n’envisage pas de négocier avec tous les éditeurs, mais seulement avec une sélection d’entre eux. Il s’agira probablement de grands titres de presse nationale, locale et magazines ; sources que l’on retrouve déjà dans les agrégateurs de presse payants.
Un récent article du Monde indique que « Le leader mondial de la recherche en ligne a testé l’idée auprès du Figaro, du groupe Les Echos-Le Parisien, du Monde et aussi de titres de presse régionale comme Ouest-France » et a évoqué des montants de « 100 000 à 1 million de dollars (de 90 000 à 899 000 euros) par an ». Pour l’instant, ces discussions n’ont pas abouti.
La valeur ajoutée de ce nouveau service serait donc limitée pour les professionnels de l’information. L’intérêt aurait été une négociation de grande ampleur qui permettrait d’avoir accès à des contenus en texte intégral que l’on a peu de chances de retrouver ailleurs.
On pourra avancer plusieurs explications possibles à ce revirement de situation :
- une volonté d’apaisement avec les éditeurs qui sont de plus en plus critiques vis-à-vis de Google Actualités et lancent de plus en plus d’actions en justice.
- une nouvelle stratégie « diviser pour mieux régner », car Google n’envisage absolument pas de négocier avec tous les éditeurs, mais juste un petit nombre.
- face au développement des « Netflix » de la presse comme Apple News+, Pressmium ou Cafeyn, Google sent qu’il y a tout simplement un nouveau créneau porteur à investir.
Quand Google redirige vers des moteurs alternatifs
Désormais, pour certaines requêtes, Google propose en haut des résultats des moteurs et outils de recherche alternatifs.
Par exemple,
- pour la recherche de médecins en France, il suggère de rechercher sur Doctolib et Pages Jaunes
- pour la recherche de restaurants, Tripadvisor, La Fourchette ou Timeout
- pour la recherche de plombiers Pages jaunes et Buyyers, etc.
Malheureusement, ces suggestions de moteurs alternatifs n’apparaissent que sur des questions très grand public.
Notre avis :
Google ne perçoit pas ici de segment porteur… Il a introduit cette nouvelle fonctionnalité uniquement pour se prémunir de sanctions de la part de l’Union européenne pour abus de position dominante. Cela a déjà été récemment le cas sur Android où Google a été obligé de proposer des moteurs alternatifs par défaut sur les téléphones Android suite à une décision de l’UE pour abus de position dominante.
Pour les professionnels de l’information, cela ne changera pas grand-chose, car ces suggestions n’apparaissent que pour des questions très grand public et il est peu probable que Google élargisse ces suggestions à d’autres thématiques et secteurs d’activités. Il est peu probable que Google nous suggère d’autres moteurs pour rechercher des datasets, des agrégateurs de presse professionnels pour rechercher l’actualité ou des moteurs académiques concurrents pour rechercher des articles scientifiques.
D’un point de vue ergonomique, cela prend de la place sur la première page de résultats au même titre que les informations issues du Knowledge graph, les cartes, suggestions de vidéos, actualités, les adwords et il reste de moins en moins de place pour les résultats naturels.
Google se mettrait-il au speech-to-text pour les contenus vidéo et audio ?
L’excellent blog dédié au SEO appelé "SEO by the Sea" indiquait récemment (http://www.seobythesea.com/) que Google avait mis à jour en 2019 un brevet appelé « Systems and methods for searching quotes of entities using a database » (Systèmes et méthodes de recherche de citations d’entités à l’aide d’une base de données).
Dans le brevet, Google détaille la méthode suivante :
« effectuer une analyse audio du contenu audio pour identifier une citation dans le contenu audio ; déterminer l’utilisateur comme auteur du contenu audio en reconnaissant l’utilisateur comme le locuteur du contenu audio ; identifier, sur la base de mots ou de phrases extraits de la citation, un ou plusieurs sujets associés à la citation »
Notre avis :
Cela confirme que Google s’intéresse de près à la question du speech to text pour les contenus audio et vidéo. Reste maintenant à voir s’il va, à l’avenir, proposer des possibilités de recherche sur le contenu des vidéos et contenus audio. Cela serait une bonne nouvelle pour les professionnels de l’information qui sont de plus en plus confrontés aux contenus multimédias dans leurs veilles et recherches, d’autant que les quelques moteurs speech to text gratuits et grand public (Voxalead notamment) ont tous aujourd’hui disparu. À l’inverse, les outils professionnels payants développent et intègrent de plus en plus la technologie du speech to text dans leurs produits.