Comment déterminer la bonne méthode de surveillance d’une source ?
À toujours garder en tête : privilégier le RSS quand c’est possible
On gardera en tête que le moyen le plus simple et le plus efficace pour surveiller une source passe par l’utilisation des flux RSS. C’est un format simple à appréhender, très lisible, très efficace et par nature gratuit (sauf dans le cas de sources avec accès payant comme les bases de données payantes ou les agrégateurs de presse).
Pour autant, tout n’est pas récupérable sous forme de flux RSS.
Étape 1 : Réfléchir au type de sources et type de contenus pour déterminer les possibilités qui s’offrent à soi
À l’issue de son sourcing, le veilleur peut se retrouver avec toute une panoplie de sources de nature très diverses que l’on ne va pas pouvoir surveiller de la même façon.
La première question à se poser est de savoir si le type de sources que l’on souhaite surveiller est « RSS compatible ».
Les sources les plus adaptées à une surveillance par flux RSS sont celles qui proposent des contenus par ordre antéchronologique (du plus récent au plus ancien) :
Des actualités/articles ;
- Des résultats de recherche par mot-clé.
- Les sites de presse, les blogs sont ainsi parfaitement adaptés à une surveillance avec des flux RSS. Les sites de salon ou conférence le seront en revanche beaucoup moins.
Si la source est bien adaptée au RSS, on se demandera ensuite si ce que l’on souhaite précisément surveiller sur cette source est à son tour « RSS compatible ».
Le RSS est ainsi parfaitement adapté pour surveiller
- Les actualités d’un site ;
- Une rubrique spécifique ;
- Une requête par mot-clé.
Cela ne l’est pas du tout si on souhaite vérifier le changement d’un tarif sur une page par exemple.
Quand le RSS n’est pas adapté, on pourra se tourner vers des outils de surveillance de pages
Voir notre article « Les outils de surveillance de pages gratuits et freemiums au banc d’essais » - NETSOURCES n°153 - juillet/août 2021 ou l’on se tournera vers une veille manuelle.
À noter que le lecteur de flux RSS Inoreader a lancé récemment une nouvelle fonctionnalité de surveillance de pages. Il est à notre connaissance le seul lecteur de flux à proposer aujourd’hui cette fonctionnalité.
Étape 2 : Déterminer si une source dispose de flux RSS
Si notre source et les contenus à surveiller sont bien adaptés au RSS, on va donc partir à la recherche d’éventuels flux RSS disponibles.
Il existe plusieurs méthodes que nous recommanderons de suivre dans l’ordre suivant.
Manuellement
- Chercher visuellement le logo RSS ou le terme RSS sur la page d’accueil ou la page que l’on souhaite surveiller ;
- Chercher le terme RSS avec un Ctrl F ;
- Chercher dans le code source de la page le terme RSS ;
- Tenter d’ajouter des éléments dans l’URL comme par exemple .rss, /rss ou .atom ou /atom à la fin de l’URL ou juste après le .com ou .fr ;
La commande site: disponible chez Google et Bing, ou la commande inurl: peuvent permettre d’identifier l’adresse de la page qui présente tous les flux RSS disponibles sur un site identifié au préalable. RSS inurl:www.nytimes.com
permet par exemple de trouver très rapidement la liste des flux offerts par le New York Times.
Si aucune de ces solutions ne fonctionne, cela ne veut nullement dire que le site ne propose pas de flux RSS. On va alors passer à des détecteurs automatiques de flux.
Avec des détecteurs de flux RSS
Tous les détecteurs de flux RSS ont leur propre fonctionnement et ce n’est pas parce que l’un ne détecte pas de flux RSS que le suivant n’en détectera pas.
Pour se donner toutes les chances, on a tout intérêt à tester tous les détecteurs disponibles qui ne sont d’ailleurs pas très nombreux.
Il en existe deux types :
- Ceux qui sont déjà intégrés à des outils de veille ou lecteurs de flux RSS. On entre l’URL d’une page ou d’un site dans l’outil et il vous indique s’il dispose d’un flux RSS connu ;
- Ceux qui sont des petits outils indépendants et qui prennent souvent la forme d’un plug-in Chrome ou Firefox, mais il peut aussi s’agir de moteurs de recherche qui fonctionnent à partir d’une URL.
Du côté des lecteurs de flux RSS, Inoreader et Feedly offrent tous deux un détecteur de flux RSS intégré.
Du côté des détecteurs de flux indépendants, on pourra citer :
Les extensions Chrome
- Get RSS Feed URL (https://chrome.google.com/webstore/detail/get-rss-feed-url/kfghpdldaipanmkhfpdcjglncmilendn)
- Extension Abonnement RSS (https://chrome.google.com/webstore/detail/rss-subscription-extensio/nlbjncdgjeocebhnmkbbbdekmmmcbfjd?hl=fr)
- Shoyu RSS (https://chrome.google.com/webstore/detail/shoyu-rssatom-feed-update/opnimlbiokbgomihhpobbgnlfolgdada)
- RSS Finder (https://chrome.google.com/webstore/detail/rss-finder/ijdgeedipkpmcliidjhbemmlgibfnaff?hl=fr).
On rappellera que les extensions Chrome fonctionnent également sur le navigateur Brave et Edge.
Les extensions Firefox
- Feed preview (https://addons.mozilla.org/fr/firefox/addon/feed-preview/)
- Livemarks (https://addons.mozilla.org/fr/firefox/addon/livemarks/)
- Want my RSS (https://addons.mozilla.org/fr/firefox/addon/want-my-rss/)
- Awesome RSS (https://addons.mozilla.org/fr/firefox/addon/awesome-rss/)
Les moteurs de découverte de flux RSS
- RSS Discovery Engine (https://rdengine.herokuapp.com/)
- Feedsearch (https://feedsearch.dev)
Astuce
Quand on se trouve sur la page d’accueil d’un site, il peut arriver que les détecteurs de flux ne trouvent aucun flux ou seulement un flux général alors qu’il en existe en réalité plusieurs.
On conseillera alors de se rendre sur les pages que l’on souhaite surveiller (page d’accueil d’une rubrique, page qui rassemble tous les articles liés à un tag, page de résultats de recherche, etc.) et de relancer son/ses détecteurs de flux. Il arrive fréquemment que les détecteurs arrivent alors à identifier d’autres flux RSS.
Si l’on trouve un flux RSS qui correspond parfaitement à ce que l’on souhaite surveiller, on s’y abonnera sans hésiter. Si l’on trouve un flux trop large ou trop restrictif par rapport à ce que l’on veut surveiller ou pas de flux du tout, on continuera sa quête.
Étape 3 : Déterminer si la source propose d’autres solutions d’alertes
Toujours privilégier les solutions proposées par les sources ou ses outils de veille
Avant d’aller essayer de créer soi-même un flux RSS, on a tout intérêt à vérifier si le site ne propose pas d’autres solutions de surveillance que le RSS comme des alertes par mail (tout le contenu du site, thématique ou même par mots-clés). Et si cela correspond à ce que l’on souhaite surveiller, on a tout intérêt à choisir cette solution, quitte à transformer ensuite cette alerte en flux RSS si on le souhaite.
Dans la mesure du possible, il faut toujours privilégier les solutions proposées par les sources elles-mêmes ou par les outils de veille ou lecteur de flux qu’on utilise et limiter ainsi l’utilisation de petits outils externes. Ces derniers ne fonctionnent pas toujours parfaitement et peuvent disparaître du jour au lendemain.
Étape 4 : Créer soi-même un flux RSS
Si aucune des solutions précédemment présentées ne fonctionne, on peut passer à la création de flux.
Là encore, on a deux solutions. Les solutions intégrées aux lecteurs de flux RSS et outils de veille d’une part et les petits outils indépendants d’autre part.
Inoreader et Feedly proposent tous deux cette fonctionnalité, mais celle d’Inoreader est indéniablement plus perfectionnée. Inoreader offre en effet plusieurs méthodes de création de flux RSS pour des pages qui n’en ont pas, ce qui fait que quand une méthode ne fonctionne pas, on passe à la suivante et on arrive généralement à une solution satisfaisante.
Du côté des outils indépendants, on pourra citer :
- Feed43 (https://feed43.com/) qui existe depuis les débuts du RSS et qui est puissant, mais un peu technique. Il fonctionne sur un modèle freemium, les versions payantes permettant d’avoir des flux avec plus d’éléments, un rafraîchissement plus fréquent, etc.
- Feed Creator (par Five Filters - http://createfeed.fivefilters.org/) qui est un outil puissant, mais très limité dans sa version gratuite (3 items par flux maximum), mais aussi dans sa version payante (10 items par flux).
- Feedfry (https://feedfry.com/), un outil uniquement payant. L’utilisateur a moins la main sur la création du flux que sur d’autres outils. Peu de valeur ajoutée.
- FetchRSS (http://fetchrss.com/), un outil puissant qui propose différentes méthodes pour créer des flux RSS. La version gratuite n’offre que 5 flux RSS et 5 items par flux, mais les versions payantes permettent d’aller beaucoup plus loin.
- PolitePol (https://politepol.com/en/) qui propose un fonctionnement simple, mais pas adapté à toutes les situations. Il fonctionne sur un modèle freemium avec 20 flux uniquement dans la version gratuite.
- RSS.app (https://rss.app/) qui propose la création de flux sur des pages Web qui n’en ont pas, mais aussi la possibilité de créer des flux sur les réseaux sociaux. L’outil propose une version gratuite tellement limitée qu’on ne peut pas en faire grand-chose, mais les versions payantes sont beaucoup plus intéressantes. Il permet également de mixer des flux et de convertir des newsletters en flux RSS.
Dans la mesure du possible, on privilégiera le créateur intégré à son outil de veille /lecteur de flux, ce qui garantit une plus grande pérennité.
Étape 5 : Passer par un outil de surveillance de page ou une veille manuelle
Il arrive que des sources ne soient pas adaptées à la création de flux RSS. Et dans ce cas, il ne sert à rien de s’acharner.
On pourra alors se tourner vers des outils de surveillance de pages ou bien se contenter d’une veille manuelle qui peut s’avérer bien plus simple et moins chronophage. Les sources non adaptées à des veilles automatisées pourront ainsi être entrées dans un simple fichier Excel et visitées à fréquence régulière ou « bookmarkées ».
Voir notre article « Les outils de surveillance de pages gratuits et freemiums au banc d’essais » - NETSOURCES n°153 - juillet/août 2021
Pour déterminer rapidement quelle est la méthode la plus adaptée pour surveiller une source, nous avons réalisé une infographie que vous pouvez trouver dans ce même article.
Cas particuliers :
Quand alerte mail et flux RSS coexistent, lequel choisir ?
Il arrive régulièrement que des sources proposent indistinctement des alertes mails ou des flux RSS. C’est par exemple le cas de Google Alertes, qui permet de recevoir les alertes par mail ou flux RSS, ou encore de l’agrégateur de presse Factiva, qui permet de créer des alertes sur ses requêtes que l’on peut recevoir par email ou par flux RSS.
Le contenu reçu par l’utilisateur est identique, seuls la méthode et le lieu de réception diffèrent.
Dans ce cas précis, c’est avant tout une question de préférence personnelle, mais on aurait tendance à privilégier le RSS pour les raisons suivantes.
Le choix du RSS va permettre :
- de centraliser au maximum sa veille dans un seul outil ;
- d’éviter que l’alerte mail finisse dans les spams et passe donc inaperçue ;
- de rechercher efficacement dans les archives de cette alerte. Les lecteurs de flux sont en mesure de conserver les archives d’un flux et proposent souvent des moteurs de recherche internes plus performants que ce que propose le moteur interne de sa messagerie.
Faut-il transformer une alerte mail en RSS ?
Quand le site que l’on souhaite surveiller propose des alertes mails, mais pas de flux RSS, on pourrait être tenté de transformer son alerte mail en flux RSS grâce à des petits outils.
Depuis quelque temps, les lecteurs de flux RSS permettent à leurs utilisateurs de recevoir les newsletters auxquelles ils sont abonnés directement dans le lecteur de flux. L’outil génère une adresse électronique que l’utilisateur devra entrer pour s’abonner à une newsletter et qui permettra d’envoyer directement la newsletter dans la plateforme. Les alertes mails fonctionnant exactement sur le même principe qu’une newsletter, on pourra utiliser ces fonctionnalités pour les recevoir directement dans son outil de veille.
Il existe également des outils externes comme Kill the Newsletter (https://kill-the-newsletter.com/) qui fonctionnent sur le même principe.
Dans la mesure du possible, on déconseillera ces outils externes qui risquent de disparaître du jour au lendemain. Les outils Email 2 RSS et Notifier ont tous deux disparus et rien ne garantit que Kill The Newsletter ne va pas avoir la même fin.
La fonctionnalité « Newsletter », intégrée aux lecteurs de flux est quant à elle plus intéressante, car beaucoup plus pérenne. Mais elle a également quelques défauts.
- Elle n’est parfois disponible que dans les versions les plus chères de l’outil (c’est le cas pour Feedly par exemple).
- Et il faut savoir que la newsletter apparait « en bloc », c’est-à-dire que les différentes actualités de la newsletter ne sont pas décomposées une à une comme les news d’une page web. En ce sens, ça ne transforme pas complètement en flux RSS.
Faut-il s’abonner à la newsletter d’un site ou suivre les comptes sur les réseaux sociaux quand il n’y a ni flux RSS ni alerte mail ?
De nombreux acteurs ont supprimé les flux RSS et ont basculé leur communication sur les réseaux sociaux et/ou à travers une newsletter.
Quand une source n’a ni flux RSS ni fonctionnalité d’alerte par mail, on est souvent tenté de s’abonner à la newsletter du site s’il en existe une ou aux comptes Twitter, YouTube, Instagram, etc. puis récupérer tout cela par flux RSS ensuite grâce à des petits outils.
C’est en général une fausse bonne idée, car ces canaux n’ont pas vocation à rediffuser tout ce qui est présent sur le site Web. La plupart du temps, seule une sélection d’informations est rediffusée via une newsletter ou sur les médias sociaux. Inversement, il y a des contenus diffusés sur les réseaux sociaux ou une newsletter qui ne sont pas repris sur le site Web.
Il faut vraiment considérer que ce sont des contenus différents. On a donc intérêt à s’abonner à la newsletter si elle existe et aux comptes sur les réseaux sociaux, mais on a aussi intérêt à trouver une solution pour surveiller les nouveautés du site lui-même.
Voir notre article « RSS, Twitter, Facebook, LinkedIn et les autres : surveille-t-on vraiment la même chose ? » (Brèves de Veille - mai 2018)
Faut-il utiliser les outils d’optimisation de flux RSS pour mixer, filtrer les flux et récupérer le texte intégral des articles ?
Parallèlement aux outils cités dans cet article, il existe toute une panoplie d’outils permettant de mixer plusieurs flux entre eux, filtrer des flux RSS par mot-clé et récupérer le texte intégral des articles directement dans son lecteur de flux sans avoir à se rendre sur la source.
A priori ces outils vont permettre d’affiner sa veille et de la rendre encore plus aboutie. Dans la réalité, cela dépend des cas de figure.
Comme mentionné plus haut dans cet article, on a intérêt à ne pas trop multiplier les outils indépendants. Ces outils sont instables et plus on y a recours, plus la veille risque de devenir ce qu’on appelle prosaïquement « une usine à gaz ». On privilégiera les fonctionnalités d’optimisation proposées par les lecteurs de flux RSS plutôt que d’utiliser des outils indépendants. Inoreader permet par exemple de filtrer des flux au sein de son interface.
Mixer plusieurs flux n’a pas forcément d’utilité à part éventuellement dans une optique de dédoublonnage. Il vaut donc mieux l’éviter si cette fonctionnalité n’est pas intégrée à son lecteur de flux.
En ce qui concerne le filtrage de flux par mot-clé, cela va dépendre de la situation.
Si on souhaite surveiller une rubrique spécifique d’un site, mais que le site ne propose qu’un flux général, on a deux possibilités :
- Récupérer le flux général puis le filtrer par mots-clés ;
- Créer un flux RSS avec les outils de création de flux spécifiquement sur la rubrique.
Nous conseillerons cette deuxième option. En effet, quand on souhaite surveiller une rubrique, il est impossible de lister tous les mots-clés qui pourraient être utilisés dans cette rubrique. En récupérant le flux général filtré par mot-clé, on risque donc de ne pas visualiser l’ensemble des articles présents dans la rubrique.
Si au contraire, le but est de surveiller l’apparition d’un mot-clé (le nom d’une entreprise, d’une personne, etc.) sur un site, on choisira de s’abonner au flux général du site que l’on filtrera ensuite par mot-clé. Mais attention tout de même, ces outils ou fonctionnalités ne recherchent généralement que sur le titre, les descriptions et les URLs des articles et non le texte intégral. On pourra citer des outils comme SiftRSS (https://siftrss.com/).
Il existe également des outils qui permettent de récupérer le texte intégral des articles présents dans le flux RSS. On les appelle des outils de « full-text RSS ». On pourra citer l’outil Morss.it (https://morss.it/) par exemple ou encore Full-text RSS de FiveFilters (http://ftr.fivefilters.org/) qui fonctionne sur un modèle freemium. Au lieu d’avoir un flux RSS avec le titre des articles et quelques lignes de description, l’internaute a dans son flux RSS les articles en texte intégral, ce qui évite de cliquer sur chaque élément et d’être ensuite redirigé vers le site web de la source. On notera que cela ne fonctionne que pour des sites qui proposent des articles en libre accès.
Même si ces outils peuvent avoir une utilité, attention, ils sont dans l’illégalité car ils reprennent l’ensemble du contenu et non une simple citation (titre et premières lignes).