La méthode Google
Bien évidemment, le premier réflexe est d’interroger Google en croisant des termes liés aux types d’informations recherchées, croisés avec des termes relatifs à la notion de bases de données. Les termes pourront être recherchés en français, anglais et quand c’est possible dans la langue locale du pays sur lequel porte la recherche.
A noter que Google recherche en principe les variantes d’un terme (pour publication, il devrait aussi rechercher publications par exemple). Mais lorsque l’on effectue des tests il y a toujours plus de résultats si l’on écrit toutes les formes d’un mot (publication OR publications par exemple). De même pour les accents, il est préférable d’entrer les mots avec et sans accent car le nombre de résultats diffère.
Cette méthode est efficace mais prend du temps pour passer aux travers de la longue liste de résultats. De plus, les sources identifiées ne sont pas forcément locales (il peut s’agir de bases de données internationales citant quelques sources mineures sur le pays de notre recherche). Une solution consiste à limiter la recherche aux sites dont l’extension de l’url correspond au pays (.cn pour la Chine, .de pour l’Allemagne, etc.).
Il faut alors ajouter à la requête :
site:.za
(pour limiter aux sites sud-africains par exemple)
Mais cette méthode a un biais car elle exclut de fait tous les sites locaux qui n’utilisent pas cette extension et préfèrent le .com. On l’utilisera donc avec parcimonie et seulement en complément.
Dès lors qu’on a identifié une ou plusieurs bases de données locales, il peut être intéressant d’effectuer une recherche sur Google en croisant au minimum deux ou trois noms de bases de données repérées. On a alors toutes les chances de tomber sur des pages Web (souvent créées par des bibliothèques universitaires) listant des sources sur un pays ou un sujet.
Les sites gouvernementaux sont également une bonne source pour identifier des informations sur le pays car ils proposent souvent des bases de données économiques et statistiques. Pour repérer les données qu’ils publient, on pourra :
- Soit chercher à identifier les sites en question (ministère de l’économie et des finances, site du gouvernement, institut national de la statistique, banque centrale, etc.) puis explorer ces sites à la recherche des bases de données. Il est important de noter que ces sites n’utilisent pas forcément le terme « base de données » ou « database » mais regroupent souvent l’ensemble de leurs données dans des rubriques appelées « statistiques », « statistics », « données » ou « data ».
- Soit rechercher ces données dans Google en croisant des termes relatifs aux informations recherchées (statistiques, données économiques, etc.) avec des termes relatifs aux organismes susceptibles d’héberger les données (institut de statistiques, ministère, banque centrale, etc.) On pourra limiter la recherche aux url contenant l’extension .gov (pour de très nombreux pays anglophones mais également non anglophones) ou .gouv (pour les pays francophones) qui est très souvent utilisée par les organismes gouvernementaux. On écrira alors
inurl:gov
ORinurl:gouv
Exemple de stratégie de recherche sur Google en anglais et français
Comme il est impossible d’entrer plus de 32 mots (hors opérateur booléens) dans une requête Google, nous avons été obligés de diviser la stratégie de recherche en 3 requêtes.
Requête 1
Newspaper OR magazine OR publications OR publication OR media OR “economic data” OR “macroeconomic data” OR forecast OR forecasts OR statistics OR imports OR exports AND database OR “information provider” OR repository OR “electronic ressources” OR “electronic resources” OR e-journals OR “base de données” OR serveurs OR “sources électroniques” OR “ressources électroniques”
Requête 2
“Market research” OR “company data” OR “company financials” OR tenders OR journal OR journaux OR médias OR “données économiques” OR “informations économiques” AND database OR “information provider” OR repository OR “electronic ressources” OR “electronic resources” OR e-journals OR “base de données” OR serveurs OR “sources électroniques” OR “ressources électroniques”
Requête 3
« Données macroéconomiques » OR prévisions OR statistiques OR importations OR exportations OR « études de marché » OR « informations entreprises »,OR « données entreprises » AND database OR « information provider » OR repository OR « electronic ressources » OR « electronic resources » OR e-journals OR « base de données » OR serveurs OR « sources électroniques » OR « ressources électroniques »
.
On croisera également ces stratégies avec les noms des pays concernés dans différentes langues (spain, españa, espagne, etc.) ou le nom de la langue locale (spanish, espagnol, etc.)
Les bibliothèques universitaires et nationales : ces sources trop souvent oubliées !
Il existe une source formidable pour ce genre de question mais à laquelle on pense trop peu souvent : les sites de bibliothèques universitaires qui fournissent bien souvent en libre accès la liste des bases de données auxquelles elles sont abonnées et auxquelles les étudiants et chercheurs de l’université ont accès. Et même si cela ne permet pas d’accéder au contenu de ces bases, cela permettra de repérer les bases de données les plus représentatives et les plus utilisées du pays.
Ces universités produisent parfois également des guides ou des annuaires de sources sur des sujets donnés. Les ressources citées ont été sélectionnées par des professionnels ce qui garantit du contenu de qualité.
Parmi ces listes de sources, on trouve bien évidemment des bases et ressources internationales mais au milieu de ces sources, on trouve également des ressources locales difficilement identifiables sur le Web car mal référencées.
Pour retrouver ces fameux listings, deux méthodes s’offrent à l’internaute :
- Identifier les principales universités du ou des pays visés puis explorer leurs sites à la recherche de cet annuaire de sources (il se trouve en général dans la rubrique bibliothèque/library puis bases de données, database, eressources, ressources électroniques, etc.). Parfois toutes les bases sont citées sur une même page, et parfois (et c’est encore mieux), il est possible de les consulter par sujet/thématique ou même zone géographique.
- Utiliser Google en croisant des termes relatifs à la notion d’université, école, des termes liés à la notion de base de données et le nom du pays. On pourra également limiter aux sites contenant une extension .edu (très utilisée par les universités du monde entier à l’exception de la France). Mais attention à ne pas manquer les résultats provenant de sites n’utilisant pas cette extension.
La recherche par l’exemple
Prenons maintenant deux exemples concrets.
Exemple 1 : la recherche d’informations sur les investissements directs à l’étranger
Les investissements directs à l’étranger, ou investissements directs étrangers (en anglais FDI pour Foreign Direct Investment) sont les mouvements internationaux de capitaux réalisés pour créer, développer ou maintenir une filiale à l’étranger ou pour exercer le contrôle ou une influence significative sur la gestion d’une entreprise étrangère. Imaginons maintenant que nous ayons besoin d’identifier des bases spécialisées sur ce type d’information dans le monde.
En recherchant sur Google en croisant Foreign Direct Investment (et ses variantes en anglais et français) croisé avec database, on trouve de nombreux résultats pertinents (bases de données gratuites et payantes) mais Google nous annonce plus de 600 000 réponses même si dans la réalité il n’en reste que 250 environ quand on se rend jusqu’à la dernière page. Mais la consultation de tous ces liens qui semblent pertinents est très chronophage...
Alors que si on lance la même recherche en limitant les résultats aux sites contenant l’extension .edu dans leur url (caractéristique de nombreuses universités), on trouve dès le premier résultat un guide de la bibliothèque universitaire d’Harvard intitulé « Foreign Direct Investment Data Resources » qui liste les principales bases de données sur le sujet avec un descriptif détaillé pour chacune d’entre elles. Bref, un véritable gain de temps pour commencer à explorer le sujet.
Exemple 2 : trouver des sources locales d’information business en Chine
Imaginons maintenant que nous tentions d’identifier des sources d’informations business (agrégateurs de presse, bases de données économiques et financières notamment) en Chine.
Encore une fois, une recherche Google prend du temps et il faut consulter chaque résultat a priori pertinent. Alors qu’en orientant directement nos recherches sur les bibliothèques universitaires, on découvre immédiatement des listings complets sur les sujets qui nous intéressent comme par exemple :
- La bibliothèque nationale de Chine qui liste les différents agrégateurs de presse chinoise (presse généraliste, spécialisée, économique mais également publications scientifiques en texte intégral).
- La bibliothèque de sciences et technologie d’Hong Kong qui liste une centaine de bases de données auxquelles l’université a accès parmi lesquelles de nombreuses bases locales.
- L’université de Sydney qui propose dans son annuaire de banques de données une rubrique « Asian Studies » avec plusieurs bases chinoises de presse.
Ce dernier résultat montre d’ailleurs qu’il est intéressant de ne pas se limiter aux bibliothèques d’un pays mais aussi d’explorer plus largement celles des pays de la région.
Ainsi, pour commencer à explorer un nouveau pays ou une nouvelle zone géographique, une bonne porte d’entrée consiste à identifier des bases de données ou fournisseurs d’information locaux. Et le meilleur moyen de les repérer rapidement, c’est d’identifier les listes de bases de données proposées par les bibliothèques universitaires ou nationales du pays en question et plus largement des pays aux alentours.
Ces listes ne sont bien évidemment pas exhaustives parce que l’université, même si elle le souhaitait, n’a souvent pas les moyens financiers de s’abonner à toutes les bases pertinentes. Mais c’est à partir de l’identification de ces quelques sources qualifiées que l’on va pouvoir aller plus loin et explorer des contenus similaires en utilisant cette fois-ci des moteurs de recherche.