Bases & Netsources - Accueil

L’intelligence économique commence par une veille intelligente

La renaissance des annuaires sur le Web : comment les identifier et les utiliser pour vos veilles et recherches ?

Carole Tisserand-Barthole
Bases no
402
publié en
2022.04
1904
La renaissance des annuaires sur le Web : comment les ... Image 1

Même bien avant l’invention du Web, il a toujours existé un besoin de sources et outils capables de proposer, d’agréger et de structurer des listes de personnes, d’entreprises, de sources, etc. qualifiées par rapport à une thématique donnée ou un type de contenus. C’est le principe même des annuaires, dont on retrouve les premières traces dès le Moyen-âge.

Et ces annuaires et répertoires, papier d’abord puis numériques (on se souvient de l’annuaire de Yahoo ou de Dmoz) ont toujours été d’une grande utilité pour le veilleur et ont longtemps fait partie de la panoplie de base du professionnel de l’information. Ils constituaient en quelque sorte de riches portails agrégateurs de flux thématiques.

Pourtant, ils se sont fait de plus en plus discrets avec les années, quitte à disparaître pour un grand nombre d’entre eux ou ont simplement été délaissés par les internautes et les professionnels.

Les moteurs de recherche généralistes comme Google, Bing et les autres ne sont pas sans responsabilité dans leur disparition. D’un côté les moteurs eux-mêmes ont tout fait pour marginaliser ces acteurs en limitant leur visibilité dans les résultats de leur propre moteur. Et de l’autre, les internautes ont naturellement choisi la voie de la simplicité et de l’efficacité en choisissant des outils les menant directement à la réponse à leur question plutôt que des outils les conduisant vers des sources pertinentes qu’il faut ensuite explorer et interroger.

Mais le vent pourrait bien être en train de tourner…


Lire aussi :

Comment identifier des sources d’information locales ?

Comment trouver des outils de recherche d’information thématiques ?

L’avenir de la recherche Web sera t-il thématique ?

L’Open Data pour la veille et la recherche


L’augmentation constante des contenus sur le Web entraine une évolution des moteurs et réseaux sociaux vers toujours plus de sélection : les algorithmes à l’oeuvre donnent en effet de moins en moins accès à toute la richesse du Web . Résultat : il est aujourd’hui de plus en plus difficile de réussir à identifier une liste ou sélection qualifiée de sources, d’acteurs, d’outils sur une thématique donnée, en passant par les moteurs de recherche ou les réseaux sociaux.

Deux solutions s’offrent alors au professionnel de l’information :

  1. - Aller identifier les meilleures sources par lui-même pour les mettre sous surveillance ou encore les utiliser lors de ses recherches (voir notre article « Nous avons testé L’Atlas Pro, un nouveau moteur de recherche thématique personnalisable » dans ce même numéro) ;
  2. - Tirer parti du travail réalisé par d’autres, d’identification et de classification de sources, d’acteurs, d’outils.

Et ce dernier point ressemble à s’y méprendre à ce que les annuaires ont toujours proposé.

Malgré les apparences, de nombreux annuaires ont en réalité survécu et de nouveaux acteurs ne cessent d’apparaître. Certes, ils n’ont plus ni le nom ni la forme des annuaires que l’on a pu connaître par le passé, mais ils remplissent bien le même rôle.

Dans cet article, nous nous intéresserons donc à ces annuaires classiques et à ceux qui ne disent plus leur nom, à leurs usages actuels pour la veille et la recherche d’information et nous verrons quelles formes ils peuvent revêtir aujourd’hui et comment les identifier.

Les annuaires : une longue histoire

Derrière le terme annuaire se cache une très grande diversité de contenus.

On pourrait les représenter de la manière suivante :

  1. Les annuaires de sources qui sont répartis en deux catégories : ceux qui se focalisent sur un secteur ou une thématique (les sources du secteur pharmaceutique par exemple) et ceux qui se focalisent sur un type de contenus (la presse, les podcasts, etc.) ;
  2. Les annuaires d’outils ;
  3. Les annuaires de personnes ;
  4. Les annuaires d’entreprises ;
  5. Les annuaires d’événements.

Ces annuaires ont tout d’abord existé au format papier (c’est le cas des annuaires téléphoniques, des annuaires d’anciens élèves d’une école et même des annuaires de sources comme la presse) puis ils se sont ensuite progressivement digitalisés après être passés par une phase minitel pour certains.

Remarque : On notera par exemple que le Ulrich’s Periodicals Directory (payant) qui recense des journaux, magazines et revues scientifiques à travers le monde existe depuis 1932 (au format papier à l’époque) et continue toujours d’exister. La base de données est aujourd’hui proposée par Proquest (maintenant Proquest Clarivate).

Et nombre d’entre eux n’ont jamais vraiment été menacés de disparition.

L’arrivée du Web a vu l’émergence d’une nouvelle catégorie d’annuaires qui n’ont jamais existé autrement qu’en numérique. C’est ce qu’on appelait à l’époque les annuaires généralistes et les annuaires spécialisés. Ils permettaient de se repérer dans cette nouvelle étendue que représentait le Web et d’identifier des sources pertinentes par rapport à une thématique donnée. Les représentants les plus connus alors étant l’annuaire de Yahoo ou encore Dmoz. Et ce sont ces annuaires (et plus encore les annuaires généralistes que spécialisés) qui ont finalement le plus souffert par la suite quand ils ont été supplantés par les moteurs de recherche, même si la finalité n’est en réalité pas la même. De plus la sélection des annuaires est un processus humain, là où celle des moteurs est liée à des algorithmes.

Quel intérêt pour le professionnel de l’information ?

Comme nous le mentionnions en introduction, les annuaires ont encore un rôle à jouer dans le quotidien du professionnel de l’information. Mais ils n’en ont plus nécessairement ni le nom ni la forme.

La distinction entre annuaire et base de données est d’ailleurs de plus en plus floue et de nombreux acteurs n’hésitent pas à se définir comme une base de données de sources, de personnes ou d’entreprises plutôt que comme un annuaire.

Le terme annuaire ou directory n’est pas nécessairement utilisé pour y faire référence. On trouve aussi des termes comme base de données, database, liste/list, répertoire, ressources, sources, etc.

Pour le professionnel, ces annuaires, revendiqués ou ne disant pas leur nom, ont un rôle à jouer pour la veille comme pour la recherche d’information ponctuelle :

  • Au niveau de la phase de sourcing pour identifier des sources pertinentes ;
  • Au niveau de la veille métier ou quand on a besoin d’améliorer ses processus de veille et de recherche (trouver des outils de veille, des lecteurs de flux RSS, etc.) ;
  • Au niveau de l’identification de personnes, experts, entreprises et organisations ;
  • Au niveau de l’identification d’événements.

Quels annuaires thématiques en 2022 et comment les identifier ?

On ne s’intéressera pas ici aux annuaires généralistes, qui ont aujourd’hui peu de valeur ajoutée pour le veilleur, mais aux annuaires spécialisés classiques ainsi qu’à tous les nouveaux outils et ressources aux formats très variés qui poursuivent une ambition similaire à celle des annuaires thématiques. Nous prendrons comme exemples les annuaires que nous avons identifiés lors de nos tests pour cet article.

Les annuaires au sens classique du terme

Il y a tout d’abord les annuaires qui se revendiquent comme tels ou qui en ont la forme, c’est-à-dire une base de données de sources, personnes, organisations, etc. classées par rubriques. Tous n’utilisent cependant pas le terme annuaire ou directory.

Les annuaires spécialisés sur un type de contenus

On constate que les plus courants sont ceux spécialisés sur un type de contenus.

On pourra par exemple citer les annuaires de presse comme :

Mais il en existe beaucoup d’autres qui s’intéressent à d’autres types de contenus.

On pensera par exemple aux annuaires de flux RSS comme Atlas Flux par exemple, Feedspot, un annuaire de blogueurs et de podcasts, des annuaires de revues en open access (comme le DOAJ), des annuaires de répertoires de thèses (NDLTD), des annuaires de podcasts comme La French Stack, la première base de newsletters éditoriales francophones, des annuaires de revues (comme Mirabel en France ), etc.

Les annuaires spécialisés sur un secteur/thématique

Les annuaires spécialisés sur un secteur se font beaucoup moins nombreux que les précédents et sont de qualité très variable. On trouvera par exemple sur ce site une sélection d’annuaires thématiques français : https://www.webrankinfo.net/cat/147-annuaires-specialistes.htm.

On se rend compte à l’usage qu’il est très compliqué pour un annuaire de recenser des sources sur un secteur d’activité, car elles sont très disparates : par exemple un annuaire de sources sur le secteur automobile peut aussi bien recouvrir la presse spécialisée que les sites de fournisseurs de pièces détachées, des sites de garagistes ou des sites qui publient des données de marché sur le secteur.

Les annuaires de personnes

De nouveaux annuaires de personnes continuent de voir régulièrement le jour sur des angles très spécifiques. On trouve par exemple des annuaires des femmes expertes, des experts numériques responsables, des annuaires de chercheurs spécialisés sur la fin de vie, etc.

Les annuaires d’outils

On ne négligera pas non plus les annuaires d’outils qui peuvent permettre d’enrichir la boîte à outils du veilleur : annuaire d’extensions de navigateur, d’outils pour l’OSINT, répertoire d’outils de veille.

Les annuaires d’entreprises/organisations

On pensera également aux annuaires qui recensent des entreprises ou organisations dans un secteur précis.

On citera par exemple, Golden, un annuaire mondial qui liste des entreprises par domaine (biotechnologie, microbiome, etc.), Incubator List , un annuaire des incubateurs dans le monde.

On pensera enfin à Ecolocall, un nouvel annuaire (payant) lancé récemment par le fondateur de la solution de veille MyTwip et qui se définit comme un « annuaire intelligent, géolocalisé et dynamique ». L’outil se donne comme ambition de répertorier les acteurs d’un territoire à travers un annuaire classique, propose une cartographie pour une meilleure visualisation des résultats, permet l’ajout de ses propres données et leur enrichissement automatique et offre également des fonctionnalités de veille pour suivre l’actualité.

Les annuaires d’événements

Enfin, on pourra finir avec des annuaires d’événements qui permettent d’identifier en un seul endroit des événements dédiés à un secteur d’activité précis, un pays, etc.

On pensera par exemple à Eventseye qui recense des salons et événements à travers le monde, classés par domaine https://www.eventseye.com/salons.html.

Comment identifier les annuaires classiques  ?

Pour identifier ces annuaires classi­ques ou ces répertoires de sources, on commencera par réflé­chir en amont aux types de sources que l’on a besoin d’identifier. S’agit-il de sources comme de la presse, des podcasts, etc. ou plutôt des sites d’entreprises, des listes d’outils, etc.

On pourra ensuite utiliser les moteurs de recherche en croisant le champ lexical des annuaires avec le type de contenus ou d’annuaires que l’on recherche :

  • annuaire, directory, base, base de données, répertoire, liste, list, library, database, knowledge base, etc.
  • médias français, podcasts, experts, événements, etc.

On pourra également tirer parti des opérateurs comme inurl: ou intitle: pour rechercher dans l’URL, car le terme annuaire, base, répertoire, etc. apparaît souvent dans l’URL ou dans le titre de la page.

On aura également intérêt à lancer une recherche similaire sur les réseaux sociaux et notamment Twitter où de nombreux internautes signalent des ressources et outils intéressants.

Les outils qui poursuivent une ambition similaire aux annuaires

Comme nous le mentionnions en introduction, le besoin d’avoir accès à des listes de sources qualifiées ne s’est pas tari même si de nombreux annuaires classiques ont aujourd’hui disparu. Ces ressources qui poursuivent un but similaire à celui des annuaires prennent aujourd’hui de très nombreuses formes. Et il est important de connaître ces différentes formes pour réussir à les identifier et les intégrer à son panel de sources et outils.

Les jeux de données thématiques issus de l’open data

L’open data s’est beaucoup développé avec les années et de nombreuses collectivités publiques et parfois entre­prises privées mettent à disposition en libre accès leurs jeux de donnés. Et parmi ces jeux de données, on trouve de nombreux listings qui peuvent s’apparenter à des annuaires d’entreprises ou d’organisations.

On trouve par exemple sur le site national data.gouv.fr, le répertoire national des associations en France qui recense l’ensemble des associations relevant de la loi du 1er juillet 1901 dont le siège est en France (à quelques exceptions près), la liste des casinos de France, un annuaire des entreprises françaises, le répertoire national des élus, le répertoire national des structures de recherche, etc.

Comment identifier les annuaires data ?

Pour identifier ces jeux de données thématiques, il existe plusieurs méthodes :

  • interroger Google et les autres moteurs en croisant le terme open data avec le type d’annuaire que l’on recherche (associations françaises, presse française, maires de France, etc.)
  • interroger directement les grandes ressources et moteurs dédiés à l’open data comme data.gouv.fr pour la France, mais il existe des équivalents dans la plupart des pays, Google Dataset Search, etc.

Les réseaux sociaux et leurs fonctionnalités « annuaires »

Les réseaux sociaux proposent pour la plupart des fonctionnalités de type annuaire. Certaines prennent la forme d’annuaires classiques, d’autres des formes complètement différentes.

Twitter et ses listes

Sur Twitter, les listes ont une visée similaire à celui d’un annuaire. Une liste référence des comptes pertinents par rapport à une thématique donnée. C’est un excellent moyen de repérer rapidement des sources qualifiées (en l’occurrence des comptes sur Twitter) sur un sujet.

On pensera par exemple à la Bibliothèque de Science Po qui a ouvert 130 listes thématiques Twitter. Parmi les sujets traités dans ces listes, on citera : Économie Numérique, Histoire de l’art, Énergie, Ukraine, Infos-Afrique, Ressources Naturelles, Think Tank, etc.

Comment les identifier sur Twitter ?

Mais le plus difficile sur Twitter reste d’identifier ces listes, car Twitter a retiré la possibilité de les rechercher depuis son interface.

On pourra :

  • utiliser le moteur personnalisable http://twitterdaily.com qui recherche spécifiquement sur les listes
  • utiliser Google avec la requête : site:twitter.com/*/lists intitle:votre thème ou site:twitter.com inurl:lists votre thème

Facebook et LinkedIn : des annuaires qui se sont transformés

Il ne faut pas oublier que Facebook et LinkedIn ont au départ été conçus comme des annuaires. Facebook comme un annuaire d’élèves et d’alumni et LinkedIn comme un annuaire de CV et de profils professionnels.

Et même s’ils ne sont plus très visibles, Facebook et LinkedIn continuent d’utiliser quelques fonctionnalités d’annuaires dans leur moteur.

LinkedIn propose par exemple une dizaine d’annuaires et répertoires qui recensent les contenus publiés sur sa plateforme :

Facebook proposait il y a encore quelque temps un annuaire des pages, personnes et lieux qu’il recensait dans sa plateforme. Les pages et personnes ne semblent plus accessibles, mais l’annuaire de lieux est encore accessible.

On y accédera à cette adresse : https://www.facebook.com/places/.

WhatsApp : des fonctionnalités d’annuaires dans un futur proche

WhatsApp (propriété de Facebook) semble également s’intéresser aux annuaires.

En septembre dernier, WhatsApp a lancé le test d’une nouvelle fonctionnalité, dans la ville brésilienne de São Paulo. Elle devrait fonctionner comme un annuaire et permettre aux utilisateurs de rechercher une entreprise directement dans l’application.

Difficile cependant pour le moment de voir comment cette fonctionnalité pourrait être utile pour le professionnel de l’information, car elle semble liée à la géolocalisation.

Quand les outils de curation sont utilisés comme des annuaires d’outils et de sources

De nombreux internautes utilisent les outils de curation pour lister des sources en lien avec une thématique. Parmi les outils les plus utilisés on trouve Padlet, Start.me, Diigo ou encore Scoop.it.

On citera par exemple :

Comment identifier les listes de sources présentes sur les outils de curation ?

Pour les identifier, on conseillera d’utiliser l’opérateur site: sur Google pour limiter la recherche à ces sites précis. Par exemple :

site:https://start.me podcasts

On pourra également lancer une recherche dans les moteurs internes de ces outils de curation. Diigo par exemple permet de rechercher par tags sur les signets publics publiés dans Diigo.

Enfin, on réussira à identifier ces annuaires en passant par les médias sociaux et notamment Twitter où ils ont pu être signalés.

Les listes de sources sous forme d’article ou billet ou livre blanc

Le recensement de sources ne prend pas nécessairement la forme d’une base de données ou de jeux de données. Parfois, c’est le simple format texte ou HTML qui est utilisé.

On retrouvera ce cas de figure sur Wikipédia par exemple où il y a de nombreuses pages qui recensent des liens (liste des communes françaises, liste des écoles d’ingénieurs en France, liste de titres de la presse économique et financière).

On trouvera également des blogs, sites de médias ou encore sites institutionnels qui proposent des articles ou pages qui listent des ressources thématiques et parfois même des livres blancs avec des listes de ressources par thématiques.

Ces pages ont bien souvent remplacé les blogrolls et pages de liens utiles que l’on retrouvait sur les sites et les blogs dans les années 2000/2010.

À titre d’exemple, on pourra citer :

Comment identifier les listes de sources au format texte et article ?

Sur Wikipédia, on pourra commencer par interroger le moteur pour voir s’il n’existe pas de page sur le sujet qui nous intéresse.

Pour identifier ces autres listes de sources et d’outils, on utilisera les moteurs en croisant cette fois-ci les termes sources, ressources, listes de sources, meilleures sources, outils, infographie, etc. avec le thème qui nous intéresse.

Les médias sociaux seront également un bon moyen de les identifier, car ils ont toutes les chances d’avoir été repris et partagés par d’autres internautes en raison de leur grande valeur.

Les corpus de sources des outils de recherche ou de veille

Les corpus de sources des outils de recherche et de veille peuvent également s’apparenter à des annuaires. Et quand la liste des sources est accessible librement, c’est bien souvent une mine d’or pour le professionnel de l’information.

  • Le lecteur de flux RSS Feedly propose par exemple un annuaire de sources à l’adresse suivante : https://feedly.com/i/all.
  • Pour en savoir plus sur les annuaires des lecteurs de flux RSS et comment il est possible de récupérer ces flux pour les inclure de la propre veille, nous conseillerons la lecture de la série d’articles de Christophe Deschamps intitulée « Mettre en place une veille Quick & Dirty » .

Certains agrégateurs de presse proposent un répertoire en ligne de leurs sources. C’est par exemple le cas d’Europresse.

Comment identifier les corpus de sources des outils professionnels ?

Pour identifier ce type d’annuaire, il ne faut pas rechercher dans la direction des annuaires. Il faut au contraire chercher des outils de recherche, outil de veille ou agrégateur de presse puis explorer leurs sites à la recherche d’un annuaire en libre accès.

On pourra également utiliser les moteurs de recherche en croisant le nom de l’outil de recherche, de veille ou l’agrégateur d’actualités avec le terme sources pour voir s’il n’existe pas une page avec la liste de leurs sources ou une base de données de leurs sources, car il arrive que ces informations soient bien en libre accès, mais juste très bien cachées.

Un usage détourné des tableurs en ligne

Autres outils fréquemment utilisés par les internautes pour lister et regrouper des sources sur une thématique : les tableurs en ligne comme Google Sheets ou encore Airtable (des équivalents d’Excel, mais hébergés en ligne avec la possibilité de mettre à disposition des fichiers publics).

À titre d’exemple, on pourra citer :

  • Ce tableau/base de données sur Google Sheets qui rassemble des outils pour l’OSINT et l’investigation en ligne 
  • Ce tableau sur Airtable qui recense plus de 280 sources d’informations sur les startups 

Comment identifier les répertoires de sources au format tableur ?

Le point commun à tous ces tableaux, c’est qu’ils sont hébergés en ligne sur Google Sheets, Airtable et les autres.

On pourra donc rechercher sur Google en tirant parti de l’opérateur site:

Site:https://docs.google.com/ pour Google Sheets et site:https://airtable.com/ pour Airtable.

Par exemple la requête site:https://docs.google.com/ osint permettra d’identifier des tableaux qui rassemblent des sources en lien avec l’OSINT.

On pourra également explorer les réseaux sociaux et notamment Twitter où certains de ces tableaux ont probablement déjà été signalés et partagés. On pourra croiser le nom du tableur (Google Sheet ou Airtable) avec la thématique qui nous intéresse.

La dataviz au service du recensement des sources

Enfin, on ne négligera pas les représentations visuelles qui sont de plus en plus utilisées pour répertorier des sources ou des outils et qui remplissent donc également un rôle d’annuaire. C’est le cas de certaines cartes, infographies et datavisualisations.

On pensera par exemple à :

Comment identifier les recensements de sources sous forme de dataviz ?

On pourra interroger les moteurs en croisant les termes cartes, map, infographie, infography, dataviz, datavisualisation avec le thème qui nous intéresse.

Les réseaux sociaux seront également une bonne porte d’entrée, car il est probable que d’autres internautes aient déjà identifié et partagé certaines de ces ressources.

Finalement, même si le terme « annuaire » semble renvoyer à un temps révolu, le besoin d’accéder à des listes, répertoires, base de données structurées de sources, d’outils, de personnes, d’entreprises ou d’événements n’a pas cessé d’exister. Et les outils classiques utilisés pour la recherche d’information comme les moteurs permettent de moins en moins de répondre à ce besoin.

Il tient fort à parier que les annuaires continueront d’exister et de se réinventer sous de nouvelles formes car le besoin de structuration restera un élément primordial inhérent à l’organisation de l’information et des connaissances.

Les abonnés peuvent poster des commentaires ! N'hésitez pas à vous abonner à Bases et Netsources...