Comment surveiller Google Actualités ?

Aurélie Vathonne
Bases no
381
publié en
2020.05
1574
Acheter ce no
Tags
Google | méthodologie | outils de veille
Comment surveiller Google Actualités ? Image 1

Google News, ou Google Actualités dans sa version francophone, est l’un des services incontournables de Google pour les veilleurs et les professionnels de l’information. Il peut paraître plutôt simpliste a priori, mais les moyens d’y accéder et de le surveiller ne sont pas si limpides.

C’est pourquoi nous nous proposons de faire ici un point sur son contenu, son histoire, ses points d’accès et enfin les différents paramétrages, méthodes et outils à disposition pour surveiller une requête dans Google Actualités, qui comme on va le voir, peuvent faire considérablement varier les résultats.

Cet index spécifique de Google est né en 2002 et la version française a vu le jour en 2009. Pour rappel, Google News est un moteur de recherche dédié uniquement aux articles de presse et aux news publiés sur des sites ou portails spécialisés. D’après les derniers chiffres que nous avons pu trouver, il crawle au total 50.000 sources et il se décline en 60 versions régionales et en 35 langues. Ces précisions ont leur importance pour la recherche et la veille.

Google Actualités : un index, deux interfaces

Rappelons qu’il existe deux façons distinctes d’accéder à Google News, avec deux interfaces différentes.

  • Une interface générique disponible directement à l’adresse https://news.google.com/, où l’on peut entrer directement une requête ;
  • Une interface qui ne sera accessible qu’après avoir entré une requête dans le moteur généraliste, et qui apparaît alors derrière l’onglet de résultats « Actualités ». Ce choix n’est pas toujours visible immédiatement et il est parfois nécessaire de cliquer d’abord sur l’onglet « Plus » pour avoir ensuite accès à l’onglet « Actualités ».

Les résultats obtenus avec l’une ou l’autre des interfaces peuvent varier très légèrement, essentiellement en ce qui concerne l’ordre de présentation.

Mais, quelle que soit l’interface, Google prend en compte la zone géographique depuis laquelle la recherche est effectuée, afin de privilégier des résultats rédigés dans la langue du pays et/ou issus de sites provenant du pays en question.

L’impact du paramètre de région

Il faut savoir qu’il est possible de modifier ce paramétrage par défaut, afin que Google présente alors des résultats différents, issus d’un autre pays et rédigés dans une autre langue.

Dans l’interface générique, il suffit de cliquer dans la colonne de gauche sur l’option « Langue et Zone géographique », puis de faire son choix. Dans l’autre interface (onglet « Actualités » du moteur), le choix de la zone géographique est modifiable en cliquant sur Paramètres > Paramètres de recherche > Paramètres de Région.

Cette modification du paramétrage de la région est cruciale, tout particulièrement lorsqu’on effectue des recherches sur des noms de sociétés présentes dans différents pays. Nous avons fait le test sur la société italienne Safilo, en recherchant à chaque fois Safilo dans le titre, mais en modifiant successivement le paramétrage de région, et cela confirme que les résultats sont alors complètement différents (voir Figure 1).

Il sera donc nécessaire de prendre en compte ce paramétrage lors de la mise en place d’une surveillance automatique, sous peine de passer à côté de résultats importants.

Résultats de Google Actualités avec le paramétrage de région « France » Résultats de Google Actualités avec le paramétrage de région « Italie » Résultats de Google Actualités avec le paramétrage de région « Etats-Unis »
« Safilo supprimera 700 postes en Italie en 2020 » - L’OL MAG « Safilo: balzo del titolo dopo nuovo accordo licenza in Cina » - Finanzaonline.com « Ports 1961, Safilo Sign Eyewear Pact for China » - WWD
« Safilo rachète Privé Revaux » - L’OL MAG « Safilo : Accordo di licenza decennale con marchio Ports per la Cina » - Il Sole 24 ORE « Safilo Announces PPE Protective Eyewear Solutions Program » - InvisionMag
« Les lunettes Gucci volent au secours de l’italien Safilo » - Le Monde « Safilo Group, alcune indicazioni finanziarie sul primo trimestre 2020 » - SoldiOnline.it « Prescription Sunglasses Market 2020: Luxottica Group, Safilo ... » - 3rd Watch News

« Isabel Marant lance une ligne de lunettes avec Safilo » - FashionNetwork.com

« Safilo annonce son plan de restructuration et dévoile ses objectifs d’ici 2024 » - Acuité

« Safilo, il rating B2 è in fase di revisione » - MF Fashion « Safilo S p A: The Shareholders’ Meeting approves the financial statements as at December 31 2019 » - marketscreener.com

Figure 1 : 5 premiers résultats obtenus avec la requête intitle:safilo, selon le paramétrage de région

On peut aussi utiliser un VPN (Virtual Private Network) pour modifier son adresse IP et leurrer ainsi Google afin de simuler le fait qu’on soit localisé ailleurs. Mais cette méthode n’est valable que dans le cadre d’une recherche ponctuelle : on active et désactive le VPN en choisissant à chaque fois une localisation. Mais il ne peut pas être utilisé pour une veille effectuée à l’aide de flux RSS.

Eviter les résultats non pertinents

Cela fait déjà un moment que les résultats d’une recherche dans Google Actualités, surtout lorsqu’elle porte sur une société d’une certaine taille, sont truffés de pages qui sont en réalité des présentations publicitaires d’études de marché. Ce détournement est une vraie plaie pour le professionnel de l’information qui recherche avant tout des articles de presse. Cette pollution, qui peut atteindre facilement la moitié des résultats, se remarque de façon plus prégnante dans les index anglophone et francophone, mais c’est le cas aussi pour les autres langues. Pour supprimer ce type de résultat, on n’aura guère d’autre moyen que d’exclure de la recherche les résultats contenant dans le titre les mots market ou marché ou mercato etc. :

Safilo -intitle:market -intitle:marché -intitle:mercato

Cette stratégie d’exclusion peut paraître un peu brutale, mais elle se révèle absolument nécessaire pour une bonne lisibilité des résultats, et d’après nos observations ne génère pas trop de silence, c’est-à-dire de suppression d’informations intéressantes et pertinentes.

Le RSS pour surveiller Google Actus

  1. Il y a plusieurs années, il existait un bouton « natif » dans la page de résultats de Google Actualités qui permettait d’un seul clic de générer un flux RSS correspondant à la requête qu’on venait d’entrer. Une fois entré ce flux RSS dans un lecteur, c’était simplissime d’en surveiller les nouveaux résultats.
  2. Puis en 2014, Google a supprimé cette possibilité au grand dam de tous les veilleurs, mais il était toujours possible de recréer soi-même un flux RSS en modifiant de façon ingénieuse l’url de résultats de Google, comme l’avaient partagé à l’époque Frédéric Martinet et Bryan Coder sur leurs blogs respectifs.
  3. En 2018, un nouveau changement dans l’algorithme a rendu encore plus difficile la surveillance des résultats de Google Actualités et les flux RSS précédemment recréés en modifiant l’url ne fonctionnaient plus, ou plus aussi bien, faisant remonter des résultats qui étaient parfois anciens.
  4. Aujourd’hui, surveiller Google Actualités grâce aux flux RSS reste possible, au moyen de différents outils et/ou techniques qui consistent notamment à :
  • Passer par Google Alerts ;
  • Utiliser les fonctionnalités intégrées à des lecteurs RSS, tels qu’Inoreader ou Feedly ;
  • Générer soi-même un flux RSS en utilisant une écriture spécifique au sein de l’url ;
  • Exploiter d’autres outils gratuits comme Talkwalker alerts.

Dans tous les cas, le flux RSS généré est intégré in fine dans un lecteur (Inoreader ou autre) pour en permettre la consultation.

Google Alerts

https://www.google.fr/alerts

Même si la création d’un compte n’est pas obligatoire pour pouvoir créer une alerte Google, on le recommandera vivement, car cette étape est nécessaire pour pouvoir accéder à l’interface de gestion des alertes (modification de requête, de fréquence, suppression, etc.) et surtout pour pouvoir choisir le fameux format de réception RSS. Comme évoqué plus haut, on prendra aussi bien garde à spécifier la langue et la région de recherche dans les menus déroulants correspondants.

Fonction intégrée à Inoreader

C’est la méthode qui paraît a priori la plus simple et la plus intuitive, puisque c’est le même outil qui va servir ici à saisir la requête, à générer le flux RSS puis à le consulter. Toutes les possibilités de recherche offertes par Google peuvent être utilisées, y compris les opérateurs avancés de type intitle: ou filetype: par exemple. Rappelons néanmoins que comme sur Google de façon générale, il faut éviter les requêtes trop longues et complexes.

Après avoir entré la requête dans la zone de saisie en haut à gauche, l’utilisateur a la possibilité de spécifier qu’il souhaite l’appliquer au corpus « Google Actualités » accessible derrière l’onglet « Plus ». Attention, en dépit de l’appellation francophone « Google Actualités », induite par l’utilisation d’Inoreader dans son interface en français, la recherche et la surveillance s’effectuent ici dans l’index anglophone de Google News. Il n’y a malheureusement aucune possibilité de spécifier un paramètre de langue ou de région différent, lorsqu’on utilise la fonction intégrée à Inoreader.

Fonction intégrée à Feedly

Le lecteur de flux RSS Feedly permet également de créer des alertes sur Google Actualités. On peut utiliser les opérateurs booléens classiques AND, OR et NOT, les guillemets pour la recherche d’expression exacte ainsi que l’opérateur intitle: Et contrairement à Inoreader, il est possible de sélectionner la langue. 11 langues sont disponibles dont le français.

Générer soi-même un flux RSS

La plus récente « syntaxe » dont nous ayons eu connaissance, a été très discrètement signalée en juillet 2018 par Serge Courrier dans une brève diffusée sur son blog, citant lui-même un thread trouvé sur Stack overflow. Elle consiste à utiliser l’écriture suivante :

https://news.google.com/news/rss/search/section/q/ 

où l’on entre sa requête Google à l’intérieur de deux accolades. Si l’on souhaite spécifier dans cette requête les paramètres de langue de l’interface (hl) et de région (gl) ou de langue de recherche (lr), il faut ajouter un autre morceau à l’url. Par exemple, pour spécifier que l’on souhaite obtenir des actualités en italien issues de sources italiennes, concernant la société Safilo, on écrira :

https://news.google.com/news/rss/search/section/q/? hl=IT&gl=IT&lr=lang_it

La liste des codes langues et pays utilisés par Google peut être consultée ici :

https://huit.re/codes-langues

Précisons que toutes sortes de paramètres supplémentaires peuvent être ajoutés à la fin de l’url. Cette méthode n’est pas la plus simple à utiliser, mais elle peut donner de bons résultats.

Talkwalker Alerts

Talkwalker jouit d’une certaine réputation en tant que plateforme de veille sur les réseaux sociaux, mais ils proposent également un service d’alerte gratuit qui se proclame « meilleure alternative gratuite à Google Alerts ». Pour les mêmes raisons que pour Google Alerts, nous recommandons la création d’un compte, à l’adresse : https://alerts.talkwalker.com/ afin de gérer plus facilement les alertes.

Chez Talkwalker, la création d’une alerte permet de préciser une langue, mais le paramétrage du pays afin de spécifier l’origine des sources doit s’effectuer au moyen d’un opérateur spécifique qui permet de sélectionner les articles provenant de sources dans une langue donnée et qui ont été publiés dans un pays donné.

Dans notre exemple, la requête devra donc être écrite : Safilo AND sourcecountry:it

Quel outil choisir ?

Pour toutes les recherches nécessitant de préciser un pays, la méthode par Inoreader est exclue. Celle-ci reste cependant une solution satisfaisante et facile à mettre en place lorsqu’on effectue des recherches en anglais dans un pays anglo-saxon.

Cependant, il est possible de modifier manuellement les paramètres de langues et de pays dans l’url, puis de réintégrer le flux dans Inoreader une fois cette opération effectuée, mais on perd alors tout le bénéfice d’une fonction intégrée !

  • Les possesseurs de l’outil Feedly pourront en revanche facilement mettre en place des flux RSS pour surveiller Google Actualités, tout en ayant la possibilité de choisir 11 langues différentes.
  • Talkwalker Alerts génère un nombre important de résultats, mais en les examinant, on a l’impression qu’il remonte beaucoup de réponses issues de sites qui ne sont pas des sites d’actualités, tels que des sites de e-commerce par exemple.
  • Pour ceux qui ne possèdent pas Feedly, la moins mauvaise méthode nous semble donc être celle qui consiste à écrire soi-même l’url du flux RSS selon la méthode décrite plus haut. Mais attention à rester attentif au volume et à la cohérence des résultats, cette technique étant tributaire des changements opérés au sein de Google Actualités, et parfois sans crier gare.
capture décran 2020 06 10 16.25.59 opt
Figure 2 : Fonction intégrée Google Actualités dans Feedly