Détection de flux RSS : meilleurs outils et bonnes pratiques en 2021

Aurélie Vathonne
Bases no
389
publié en
2021.02
2882
Acheter ce no
Tags
méthodologie | flux RSS
Détection de flux RSS : meilleurs outils et bonnes ... Image 1

Le format RSS est toujours - et plus que jamais - d’une grande utilité pour la veille mais il vous arrive peut-être de ne plus parvenir à détecter facilement la présence des flux sur une page, sur les sites web des sociétés et même sur les sites web de presse. Ils sont en effet devenus beaucoup moins visibles et moins promus - ce qui ne veut pas dire pour autant inexistants - que par le passé. A cela s’ajoute le fait que les outils de détection souffrent d’une certaine instabilité.

Cette méthodologie présente les bonnes pratiques à essayer systématiquement, ainsi qu’une sélection des meilleurs outils de détection en 2021. Elle détaille en outre les points d’attention à vérifier pour garantir l’efficacité de la démarche, et suggère quelques pistes pour identifier de nouveaux outils de détection RSS.

 Nous allons vous présenter dans cet article plusieurs astuces et outils permettant de détecter la présence de flux RSS sur un site web, même quand ils sont un peu cachés.

Lire aussi : Quel lecteur de flux RSS choisir en 2020 

Rechercher des flux RSS, c’est d’abord identifier des sources

Pour commencer, nous recommandons très vivement de démarrer par la recherche de sources web pertinentes pour un sujet, et non par la recherche directe de flux RSS sur ce sujet.

Il existe en effet des moteurs spécialisés dans les flux RSS (comme par exemple Datorss.com), mais la plupart de ces outils sont souvent assez vieux. Ces derniers sont souvent très centrés sur le monde anglo-saxon, et contrairement aux idées reçues, ne seront jamais à jour ni exhaustifs. Effectuer un sourcing en bonne et due forme (voir NETSOURCES n°146, Mai-Juin 2021), puis vérifier pour chaque source pertinente s’il existe un ou plusieurs flux RSS, s’avère une stratégie bien plus gagnante et efficace.

Quelles méthodes pour identifier des flux RSS en 2021 ?

Utiliser un moteur web

La commande site: disponible au moins chez Google et Bing, ou la commande inurl: peuvent permettre d’identifier l’adresse de la page qui présente tous les flux RSS disponibles sur un site identifié au préalable.

RSS inurl:www.nytimes.com permet par exemple de trouver très rapidement la liste des flux offerts par le New York Times.

Il est conseillé d’essayer non seulement avec le mot « RSS » mais aussi avec le mot « feed », que l’on croisera consécutivement avec la commande site: puis la commande inurl: suivies à chaque fois du nom de domaine du site ciblé. Si la réponse attendue n’apparait pas de façon évidente dans la première page de Google ou de Bing, il est inutile d’y passer plus de temps, et il est alors préférable de se rendre directement sur le site web visé.

Chercher visuellement l’icône du RSS

Le plus souvent celle-ci est de couleur orange, ce qui est pratique pour la repérer, mais elle passe parfois inaperçue derrière un gris plutôt neutre, ce qui ne facilite pas la tâche. Elle se trouve en général en haut à droite ou dans le pied de page. Pensez à regarder sur la page d’accueil du site bien sûr, mais aussi dans la page principale de chaque rubrique identifiable.

Rechercher les mots RSS, feed ou flux

Toujours plus discret, le flux RSS se cache parfois derrière un simple lien très court. Effectuer alors une recherche systématique par CONTROL+F avec les mots RSS, feed ou flux. Là encore, vérifiez non seulement la page d’accueil mais aussi les pages des grandes rubriques, sans oublier le plan du site.

Explorer le code source de la page

Il faut savoir que même si le flux RSS n’est pas matérialisé sur un site ou une page web, que ce soit par une icône, un bouton ou un lien, il peut néanmoins être présent dans le code source de la page. Il s’agit d’une spécification avec syntaxe particulière au sein du code, appelée RSS Autodiscovery, qui permet à un webdesigner ou a un informaticien d’y mentionner l’adresse du flux RSS.

Il existe une convention d’écriture au sein du code qui prend la forme : <link rel="alternate" type="application/rss+xml". Pour plus de détails, on pourra se referrer au site officiel du RSS Advisory Board (https://www.rssboard.org/rss-autodiscovery).

En affichant le code source de la page (CONTROL+U) puis en recherchant le mot « alternate », on peut en déduire à coup sûr la présence d’un flux RSS. Pour autant, il n’est pas toujours aisé d’y repérer l’adresse exacte du flux qui se trouve à proximité ; parfois elle est assez évidente, même pour un novice, parfois moins.

Heureusement, il existe des détecteurs qui font cela très bien.

Utiliser un détecteur de flux RSS

Il s’agit d’extensions Chrome ou d’add-on pour Firefox/Mozilla. A l’arrivée sur une page, un clic sur le bouton de l’extension ou de l’add-on permet de charger le code source de la page en arrière-plan. Grâce à des scripts, ces détecteurs recherchent des chaines de caractères spécifiques permettant d’identifier et d’extraire les adresses de flux RSS qui s’y trouvent cachés.

Il existe de nombreux outils de ce type mais nous en avons sélectionné un pour chaque navigateur, qui nous paraissent particulièrement efficaces en ce début d’année 2021. Notre choix s’appuie en particulier sur le fait qu’ils ont été récemment mis-à-jour, ce qui constitue un critère important, et sur le fait qu’ils prennent en compte un grand nombre de formats/variables dans lesquels peuvent s’exprimer de façon informatiquement codée, la présence d’un flux RSS.

Aux utilisateurs de Chrome, nous recommandons l’extension Get RSS Feed URL (https://chrome.google.com/webstore/detail/get-rss-feed-url/kfghpdldaipanmkhfpdcjglncmilendn). Cette extension a été créée en 2017 par un développeur français, mais elle bénéficie régulièrement d’améliorations et la dernière version (1.4) date de décembre 2020.

Elle permet de prévisualiser le flux RSS, mais également de copier au moyen d’un simple bouton son URL dans le presse-papier, et même toutes les URLs des flux trouvés. Les adresses de ces flux sont par ailleurs affichées en clair, et pas seulement le nom du flux comme sur la plupart des extensions. Cela permet d’évaluer plus rapidement si ce flux est bien celui que l’on cherche, puis d’inclure facilement le lien dans son lecteur.

Pour Firefox/Mozilla, nous conseillons l’utilisation de l’add-on Feed preview (https://addons.mozilla.org/fr/firefox/addon/feed-preview/ ). Également mis à jour récemment, en novembre 2020, ce détecteur fonctionne automatiquement à l’arrivée sur une page web.

S’il localise la présence d’un flux RSS, une icône grise emblématique du RSS apparait dans la barre de navigation. Lorsqu’on clique sur cette icône, on obtient les noms des différents flux disponibles sur la page, ou parfois seulement la mention « RSS Feed :RSS ». Un deuxième clic sur le nom du flux ou sur cette mention, donne accès à une page de prévisualisation incluant : le nom du flux, les dernières news, ainsi qu’un module d’abonnement direct, ce qui est un vrai plus.

L’abonnement peut s’effectuer au moyen d’une dizaine de lecteurs parmi les plus utilisés, comme Inoreader, Feedly, Newsblur, The Old reader, etc.

Signalons pour finir des outils plus spécifiques, tels que l’add-on Youtube RSS Finder ( https://addons.mozilla.org/fr/firefox/addon/youtube-rss-finder/ ) qui permet de détecter le flux d’une chaîne Youtube, y compris à partir de la page de lecture d’une vidéo. Get RSS Feed URL a aussi cette fonctionnalité mais uniquement à partir de la page d’une chaîne, tandis qu’Inoreader permet également de détecter les flux RSS de Youtube, en entrant l’adresse de la chaîne.

Un autre outil au fonctionnement légèrement différent est disponible pour Firefox/Mozilla. Il s’agit de Livemarks (https://addons.mozilla.org/fr/firefox/addon/livemarks/ ). Outre le fait de détecter les flux disponibles sur une page, Livemarks crée pour chaque flux un signet dynamique, autrement dit un dossier contenant les dernières news de la page, qui se mettra à jour automatiquement en même temps que le flux RSS.

Il existe bien entendu de nombreux autres outils spécialisés dans la détection de flux, tels que Extension Abonnement RSS, Want my RSS, Awesome RSS, Shoyu RSS… Il peut être d’ailleurs intéressant d’avoir plusieurs extensions ou add-ons installés sur son poste, car il peut arriver que l’un détecte ce que l’autre ne voit pas, et inversement.

Les points d’attention pour une efficacité optimale

Il ne faut pas perdre de vue que certains outils ne détectent qu’un seul flux alors qu’il en existe plusieurs. Raison de plus pour tester plusieurs outils à la suite si l’on ne trouve pas son bonheur.

Il faut penser également à actionner les outils détecteurs non seulement sur la page d’accueil, ce qui permettra de trouver la plupart du temps le flux RSS général du site, mais également à partir des pages des rubriques ciblées à l’intérieur du site, afin de localiser les flux plus spécifiques (page d’actualités d’une société par exemple).

Enfin, cela peut paraitre évident, mais il faudra bien distinguer le flux des news de celui des commentaires, en particulier pour les blogs et les sites de presse.

Comme dit plus haut, il est important de porter une attention particulière à la date de mise à jour de ces outils, qui sont sujets à une certaine instabilité, liée en partie aux évolutions des navigateurs, ainsi qu’aux changements de pratiques des webdesigners dans leur façon de coder les pages.

Comment identifier de nouveaux détecteurs de flux ?

Si vous constatez que votre outil de détection favori perd de son efficacité, vous pourrez toujours explorer à nouveau le Chrome webstore ou la bibliothèque d’add-ons de Firefox/Mozilla. Une recherche qui croise des mots tels que RSS ou feed avec des mots comme autodiscover, discover, detect, autodetect, find, preview, retrieve etc. permettra d’en identifier plusieurs dizaines, qu’il est ensuite possible de classer par date de mise à jour ou par ranking d’évaluation.