Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

Google Actualités : la tendance n’est pas au beau fixe - Dossier spécial Agrégateurs de presse

Carole Tisserand-Barthole
Bases no
377
publié en
2020.01
2067
Google Actualités : la tendance n’est pas au beau fixe - ... Image 1

Le terme « agrégateur de presse » est indissociable de la recherche d’information presse mais il revêt aujourd’hui de multiples dimensions.

A l’origine, le terme faisait exclusivement référence aux agrégateurs de presse payants comme Factiva, Nexis, Press’edd, etc. qui fournissaient un outil de recherche mais également un accès au texte intégral à tous les articles de presse qu’ils indexaient.

Aujourd’hui, la grande majorité de ces acteurs intègrent des contenus plus larges (blogs, médias sociaux, sites, etc.) et se contentent pour certaines sources de crawler les sites Web sans donner accès au texte intégral.

Ces acteurs n’utilisent d’ailleurs même plus le terme « agrégateur de presse » sur leurs supports commerciaux

Lire aussi : 

Quelles alternatives crédibles à Google Actualités en 2020 ?
Les agrégateurs de presse payants ont-ils toujours de la valeur ?

  • Press’edd se définit comme un outil de « veille média » ou comme une « base de données » presse ;
  • Europresse comme une base de données de « veille et analyse d’information stratégique » ou un outil de « veille à 360° » ;
  • Factiva se positionne comme « Global news monitoring & search engine »
  • et enfin Nexis Newsdesk utilise dans sa communication des mots comme « Media Monitoring », « Veille à 360° », « veille et analyse média ».

La presse professionnelle info-doc anglo-saxonne utilise d’ailleurs de plus en plus rarement le terme news aggregators pour parler de ces services et on voit fleurir de nouvelles appellations comme news current awareness services.

À l’inverse, quand Google Actualités a fait son apparition en 2002, il était généralement désigné en français comme un agrégateur d’actualités ou d’informations ou encore un moteur d’actualités. Avec le temps, les usages ont évolué et on en parle de plus en plus souvent comme d’un « agrégateur de presse » (gratuit en l’occurrence).

On constate également que les lecteurs de flux RSS sont, bien plus souvent que par le passé, référencés comme des « agrégateurs de presse » ou comme des alternatives directes à Google Actualités. L’idée étant ici que l’internaute se construit son propre agrégateur de presse à partir d’un corpus qu’il a lui-même sélectionné.

Les dernières nouvelles de Google Actualités n’augurent rien de bon dans un contexte de recherche d’information professionnelle.

Faut-il encore utiliser Google Actualités pour la recherche d’information, ou bien faut-il aujourd’hui s’en détourner et absolument s’orienter vers des alternatives ?

Google Actualités : un nom pour deux interfaces

Il existe deux façons d’interroger Google Actualités et en fonction de la méthode choisie, la qualité de la recherche ne sera pas la même.

  • La première, directement depuis l’interface de Google Actualités https://news.google.fr - il s’agit ici à proprement parler d’un agrégateur de presse gratuit.
  • La seconde, en lançant sa recherche dans le moteur Web https://www.google.com/ puis en sélectionnant l’onglet Actualités. Il s’agit ici d’un moteur de recherche qui ne porte que sur un corpus composé de presse, blogs et sites d’actualités.

Interface de Google Actualités : adieu recherche !

L’interface de l’agrégateur Google Actualités a beaucoup changé en quelques années, aussi bien en termes d’esthétique que de fonctionnalités proposées.

Mais la stratégie de Google reste la même : fournir à l’internaute une sélec­tion d’informations sur de grands sujets d’actualités en provenance de sources variées.

Sauf qu’il y a quelques années, les technologies n’étaient pas assez évoluées pour répondre à ce besoin de manière automatique.

Dans un contexte professionnel, l’inter­face de l’agrégateur Google Actualités est à fuir à tout prix.
Lenteur, limitation du nombre de résultats à 100, antériorité limitée, disparition de ce certains filtres, titres des articles seulement, voilà à quoi ressemble aujourd’hui l’interface de Google Actualités.

Le moteur d’actualités : tout n’est pas à jeter

Heureusement, Google n’a pas complè­tement détruit la recherche d’actualités, mais, pour cela, il faut passer par l’interface Web de Google puis sélectionner l’onglet « Actualités ».

Pour une même requête, on obtient généralement plus de résultats que sur l’interface de l’agrégateur Google Actualités, on dispose des titres et premières lignes ou mots en contexte des articles, on peut utiliser les opérateurs classiques de Google, limiter la recherche aux blogs uniquement, entrer un intervalle de dates précises ou encore classer les résultats par pertinence ou par date.

A noter : le classement des résultats par date génère dans la majorité des cas plus de résultats que le classement par pertinence.

Mais le tableau n’est pas pour autant idyllique... Car les récentes annonces concernant Google Actualités viennent également impacter la recherche d’actualités depuis le moteur Web.

Fake News, contenus de mauvaise qualité et spams

Jusqu’à il y a peu, Google Actualités avait tout de même le mérite d’indexer des sources de bonne qualité. Tout d’abord, tout le monde ne pouvait pas y avoir son site indexé. De plus, la présence de la presse traditionnelle y était complétée par des blogs et sites d’actualités qualitatifs, suite notamment à l’intégration de son moteur de Google Blog Search dans Google Actualités en 2014).
Cependant, cela n’a plus lieu d’être...

En décembre dernier, Google a annoncé avoir intégré BERT dans Google Actualités, son nouvel algorithme qui fait la part belle à la compréhension du langage naturel ainsi que d’autres éléments de machine learning. Et de fait, il n’est plus nécessaire pour les éditeurs de soumettre leurs sites dans Google Actualités.

Google peut donc automatiquement inclure des contenus issus du Web que son algorithme juge pertinents et éligibles pour figurer dans Google Actualités à condition que le site réponde à certains critères techniques.

Ainsi depuis cette annonce, plusieurs figures du monde de l’info-doc aux États-Unis ont récemment identifié des sources qui publient des contenus de très mauvaise qualité voire même des fake news dans Google News. On trouvera quelques exemples dans le billet de blog « Look out for junk sources in Google News »

La présence de sites douteux impacte aussi bien l’interface de l’agrégateur Google Actualités que la recherche d’actualités depuis le moteur Web.

D’autre part, depuis la suppression des flux RSS sur son interface il y a quelques années (ce qui était très utile pour la veille), Google actualités incitait les internautes à créer des alertes sur les contenus presse et blogs depuis son outil d’alertes Google Alertes.

Seul problème : Google Alertes est de plus en plus pollué par le spam dans les résultats qu’il propose. Google en est parfaitement conscient, mais ne semble pas s’en préoccuper, car Google Alertes n’est plus sa priorité depuis des années. On notera que ce phénomène n’est pas lié au nouvel algorithme de Google.

Des problèmes d’indexation plus nombreux

Google a également lancé récemment une nouvelle version de sa plateforme « Publisher Center » à destination des éditeurs afin qu’ils puissent gérer leurs contenus présents sur Google Actualités. Et ce changement ne se fait pas sans heurt.

On ne compte plus le nombre de critiques et alertes d’éditeurs qui n’arrivent pas à indexer leurs contenus ou qui voient certains de leurs contenus disparaître sans raison, etc.

Quand on recherche sur Google Actualités, il n’est donc pas certain que tous les articles qui devraient remonter soient bien indexés.

Des relations toujours plus difficiles avec les éditeurs de presse

Il y a encore quelques années, tous les éditeurs ou presque voulaient être sur Google Actualités, car y être indexé, c’était la garantie de générer du trafic vers son site Web. Aujourd’hui, les relations sont de plus en plus compliquées.

De nombreux éditeurs aimeraient se passer de Google, mais il reste une source de trafic importante dont la majorité ne peut aujourd’hui se passer.

Du côté de Google, suite à la mise en application de la nouvelle loi sur les droits voisins en France, Google Actualités avait fait le choix de n’ afficher que les seuls titres des articles et plus de lignes de description, dans le but d’éviter d’avoir à payer les éditeurs de presse. Cette situation n’a finalement pas duré longtemps et la très grande majorité des éditeurs a finalement autorisé Google à reprendre gratuitement leurs extraits au bout d’à peine un mois.

Depuis quelques mois, nombreux sont les sites et blogs professionnels de journalistes qui annoncent « la fin de l’ère des plateformes pour la presse » en prédisant le retrait progressif des éditeurs des agrégateurs de presse notamment ceux gérés par les GAFAM.

Dans la réalité, il n’y a pas, du moins pour le moment, d’exode massif. Les éditeurs de presse réfléchissent et se lancent dans le développement de nouvelles plateformes, mais ils ne retirent pas pour autant leurs contenus des plateformes des GAFAM. Ils multiplient seulement les canaux pour en être moins dépendants.

La fin des magazines numériques payants sur Google Actualités

Enfin, il y a quelques jours, Google a annoncé qu’il ne serait plus possible de souscrire d’abonnement à la version PDF d’un journal directement depuis Google Actualités. Les utilisateurs actuels verront leurs abonnements remboursés.

Au final, ce n’est pas tant la nouvelle stratégie des éditeurs de presse qui doit nous pousser à repenser notre usage de Google Actualités, mais plutôt la dégradation , la disparition progressive des fonctionnalités de recherche et de veille et la baisse de qualité du corpus.

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...