La presse professionnelle info-doc anglo-saxonne utilise d’ailleurs de plus en plus rarement le terme news aggregators pour parler de ces services et on voit fleurir de nouvelles appellations comme news current awareness services.
À l’inverse, quand Google Actualités a fait son apparition en 2002, il était généralement désigné en français comme un agrégateur d’actualités ou d’informations ou encore un moteur d’actualités. Avec le temps, les usages ont évolué et on en parle de plus en plus souvent comme d’un « agrégateur de presse » (gratuit en l’occurrence).
On constate également que les lecteurs de flux RSS sont, bien plus souvent que par le passé, référencés comme des « agrégateurs de presse » ou comme des alternatives directes à Google Actualités. L’idée étant ici que l’internaute se construit son propre agrégateur de presse à partir d’un corpus qu’il a lui-même sélectionné.
Les dernières nouvelles de Google Actualités n’augurent rien de bon dans un contexte de recherche d’information professionnelle.
Faut-il encore utiliser Google Actualités pour la recherche d’information, ou bien faut-il aujourd’hui s’en détourner et absolument s’orienter vers des alternatives ?
Google Actualités : un nom pour deux interfaces
Il existe deux façons d’interroger Google Actualités et en fonction de la méthode choisie, la qualité de la recherche ne sera pas la même.
- La première, directement depuis l’interface de Google Actualités https://news.google.fr - il s’agit ici à proprement parler d’un agrégateur de presse gratuit.
- La seconde, en lançant sa recherche dans le moteur Web https://www.google.com/ puis en sélectionnant l’onglet Actualités. Il s’agit ici d’un moteur de recherche qui ne porte que sur un corpus composé de presse, blogs et sites d’actualités.
Interface de Google Actualités : adieu recherche !
L’interface de l’agrégateur Google Actualités a beaucoup changé en quelques années, aussi bien en termes d’esthétique que de fonctionnalités proposées.
Mais la stratégie de Google reste la même : fournir à l’internaute une sélection d’informations sur de grands sujets d’actualités en provenance de sources variées.
Sauf qu’il y a quelques années, les technologies n’étaient pas assez évoluées pour répondre à ce besoin de manière automatique.
Dans un contexte professionnel, l’interface de l’agrégateur Google Actualités est à fuir à tout prix.
Lenteur, limitation du nombre de résultats à 100, antériorité limitée, disparition de ce certains filtres, titres des articles seulement, voilà à quoi ressemble aujourd’hui l’interface de Google Actualités.
Le moteur d’actualités : tout n’est pas à jeter
Heureusement, Google n’a pas complètement détruit la recherche d’actualités, mais, pour cela, il faut passer par l’interface Web de Google puis sélectionner l’onglet « Actualités ».
Pour une même requête, on obtient généralement plus de résultats que sur l’interface de l’agrégateur Google Actualités, on dispose des titres et premières lignes ou mots en contexte des articles, on peut utiliser les opérateurs classiques de Google, limiter la recherche aux blogs uniquement, entrer un intervalle de dates précises ou encore classer les résultats par pertinence ou par date.
A noter : le classement des résultats par date génère dans la majorité des cas plus de résultats que le classement par pertinence.
Mais le tableau n’est pas pour autant idyllique... Car les récentes annonces concernant Google Actualités viennent également impacter la recherche d’actualités depuis le moteur Web.
Fake News, contenus de mauvaise qualité et spams
Jusqu’à il y a peu, Google Actualités avait tout de même le mérite d’indexer des sources de bonne qualité. Tout d’abord, tout le monde ne pouvait pas y avoir son site indexé. De plus, la présence de la presse traditionnelle y était complétée par des blogs et sites d’actualités qualitatifs, suite notamment à l’intégration de son moteur de Google Blog Search dans Google Actualités en 2014).
Cependant, cela n’a plus lieu d’être...
En décembre dernier, Google a annoncé avoir intégré BERT dans Google Actualités, son nouvel algorithme qui fait la part belle à la compréhension du langage naturel ainsi que d’autres éléments de machine learning. Et de fait, il n’est plus nécessaire pour les éditeurs de soumettre leurs sites dans Google Actualités.
Google peut donc automatiquement inclure des contenus issus du Web que son algorithme juge pertinents et éligibles pour figurer dans Google Actualités à condition que le site réponde à certains critères techniques.
Ainsi depuis cette annonce, plusieurs figures du monde de l’info-doc aux États-Unis ont récemment identifié des sources qui publient des contenus de très mauvaise qualité voire même des fake news dans Google News. On trouvera quelques exemples dans le billet de blog « Look out for junk sources in Google News »
La présence de sites douteux impacte aussi bien l’interface de l’agrégateur Google Actualités que la recherche d’actualités depuis le moteur Web.
D’autre part, depuis la suppression des flux RSS sur son interface il y a quelques années (ce qui était très utile pour la veille), Google actualités incitait les internautes à créer des alertes sur les contenus presse et blogs depuis son outil d’alertes Google Alertes.
Seul problème : Google Alertes est de plus en plus pollué par le spam dans les résultats qu’il propose. Google en est parfaitement conscient, mais ne semble pas s’en préoccuper, car Google Alertes n’est plus sa priorité depuis des années. On notera que ce phénomène n’est pas lié au nouvel algorithme de Google.
Des problèmes d’indexation plus nombreux
Google a également lancé récemment une nouvelle version de sa plateforme « Publisher Center » à destination des éditeurs afin qu’ils puissent gérer leurs contenus présents sur Google Actualités. Et ce changement ne se fait pas sans heurt.
On ne compte plus le nombre de critiques et alertes d’éditeurs qui n’arrivent pas à indexer leurs contenus ou qui voient certains de leurs contenus disparaître sans raison, etc.
Quand on recherche sur Google Actualités, il n’est donc pas certain que tous les articles qui devraient remonter soient bien indexés.
Des relations toujours plus difficiles avec les éditeurs de presse
Il y a encore quelques années, tous les éditeurs ou presque voulaient être sur Google Actualités, car y être indexé, c’était la garantie de générer du trafic vers son site Web. Aujourd’hui, les relations sont de plus en plus compliquées.
De nombreux éditeurs aimeraient se passer de Google, mais il reste une source de trafic importante dont la majorité ne peut aujourd’hui se passer.
Du côté de Google, suite à la mise en application de la nouvelle loi sur les droits voisins en France, Google Actualités avait fait le choix de n’ afficher que les seuls titres des articles et plus de lignes de description, dans le but d’éviter d’avoir à payer les éditeurs de presse. Cette situation n’a finalement pas duré longtemps et la très grande majorité des éditeurs a finalement autorisé Google à reprendre gratuitement leurs extraits au bout d’à peine un mois.
Depuis quelques mois, nombreux sont les sites et blogs professionnels de journalistes qui annoncent « la fin de l’ère des plateformes pour la presse » en prédisant le retrait progressif des éditeurs des agrégateurs de presse notamment ceux gérés par les GAFAM.
Dans la réalité, il n’y a pas, du moins pour le moment, d’exode massif. Les éditeurs de presse réfléchissent et se lancent dans le développement de nouvelles plateformes, mais ils ne retirent pas pour autant leurs contenus des plateformes des GAFAM. Ils multiplient seulement les canaux pour en être moins dépendants.
La fin des magazines numériques payants sur Google Actualités
Enfin, il y a quelques jours, Google a annoncé qu’il ne serait plus possible de souscrire d’abonnement à la version PDF d’un journal directement depuis Google Actualités. Les utilisateurs actuels verront leurs abonnements remboursés.
Au final, ce n’est pas tant la nouvelle stratégie des éditeurs de presse qui doit nous pousser à repenser notre usage de Google Actualités, mais plutôt la dégradation , la disparition progressive des fonctionnalités de recherche et de veille et la baisse de qualité du corpus.