Cibler sa question et multiplier les requêtes courtes
De l’avis de nombreux experts, les longues requêtes booléennes sont désormais à proscrire. Mieux vaut donc multiplier les requêtes courtes.
Depuis quelques années déjà, Google s’est lancé dans la recherche sémantique. Ainsi, lorsque l’on entre un terme dans le moteur, il élargit en principe automatiquement la recherche aux synonymes et termes proches.
Sauf que dans la réalité, cela varie beaucoup d’un mot à l’autre.
On aura donc intérêt à tester avec un premier terme et relancer ensuite différentes requêtes avec des synonymes et termes proches.
Il faudra aussi tester différentes formulations de la requête : requête booléenne traditionnelle, requête en langage naturel et requête sous forme d’une question.
Si l’on prend comme exemple une recherche d’information ayant pour but de réaliser un profil détaillé de l’entreprise Pizzorno, une société spécialisée dans la gestion des déchets, une recherche Google sur le terme Pizzorno génère 317 résultats sans limite de date. Autant dire qu’on passe à côté de très nombreux résultats pertinents.
Toute la question est de savoir ce dont nous avons réellement besoin pour réaliser ce profil d’entreprise :
- des éléments financiers ;
- des informations sur les dirigeants ;
- des informations sur les contrats remportés ;
- des informations sur d’éventuels scandales ;
- des informations sur d’éventuels vagues de licenciements ou de recrutement ;
- des informations sur d’éventuels mouvements sociaux ;
- des informations sur des projets de centres de stockage ;
- etc.
Il faudra donc orienter sa requête en fonction du type d’informations que l’on recherche
Dans notre exemple, on croisera par exemple Pizzorno
avec des termes relatifs aux éléments financiers comme rapport annuel, données financières
, etc. et on relancera ensuite de multiples requêtes pour les différents aspects.
Et quand on trouve une information intéressante, comme par exemple, le nom d’un nouveau projet, on conseillera de relancer la recherche sur des termes précis liés à cette information comme le nom du projet, le nom de la ville concernée, le nom d’une personnalité mentionnée, etc., afin de réorienter la recherche et obtenir plus de détails.
On a également intérêt à commencer par une recherche simple à base de mots-clés ou en langage naturel et affiner ensuite avec les opérateurs avancés que nous détaillons ci-après.
Rappel des fonctionnalités avancées des moteurs
On rappellera ici les principaux opérateurs avancés de Google qui fonctionnent le mieux d’après nos tests :
- les opérateurs booléens
AND
(par défaut),OR
,NOT
(représenté sous la forme d’un tiret -) - les guillemets pour la recherche d’expression exacte
- intitle: pour rechercher le(s) terme(s) dans le titre des pages Web
- filetype: pour recherche des documents dans un format précis (.pdf, .doc, .xls)
- site: pour rechercher des résultats en provenance d’un site spécifique ou d’un nom de domaine
- related: pour rechercher des pages et sites similaires (voir notre billet « Comment trouver des sources et contenus similaires pour enrichir votre veille? »)
- inurl: pour rechercher un terme contenu au sein de l’url
- * qui permet de remplacer un mot ou un groupe de mots (veille * stratégique permettra par exemple de retrouver les résultats contenant l’expression veille concurrentielle et stratégique)
On peut également filtrer les résultats par date (moins d’une heure, moins d’une semaine, moins d’un mois, période personnalisée).
On constate cependant qu’à trop relancer de recherches et à trop utiliser d’opérateurs avancés, Google nous considère très vite comme un robot et nous demande sans cesse de cliquer sur un bouton pour prouver le contraire.
Preuve en est que pour Google, la recherche d’information pratiquée par des experts et les requêtes sophistiquées ont tout de suite quelque chose de suspect...
On conseillera enfin d’afficher 100 résultats par page, ce qui permet un gain de temps certain et permet d’avoir une meilleure vision du nombre de résultats réels.
La cas particulier de la recherche d’informations locales
Depuis octobre dernier, Google ne permet plus d’interroger directement les différentes versions locales de son moteur. Ce qui est un problème pour la recherche d’informations locales...
Avant, si vous souhaitiez obtenir des résultats issus principalement de sites britanniques, il suffisait d’aller sur Google.co.uk. Désormais, les résultats dépendent entièrement de votre localisation. Pour contourner cette limite, on peut toujours aller changer sa zone géographique dans les paramètres du moteur ou encore utiliser un VPN.
Chercher la source plutôt que l’information
L’autre élément indispensable à une bonne recherche, c’est de ne pas toujours chercher directement l’information finale mais la source susceptible de la détenir.
Dans notre exemple sur l’entreprise Pizzorno, on aurait donc intérêt à rechercher des sources spécialisées sur le secteur d’activité des déchets ou plus largement liées à l’environnement (presse spécialisée, blogs, etc.), des sources spécialisées sur les données financières, des sources spécialisées sur les appels d’offres, des sources locales en lien avec les projets identifiés (presse locale, site des collectivités locales), etc.
On ira ensuite interroger ces sources et si elles ne disposent pas de moteur interne digne de ce nom, on pourra toujours les interroger via Google en utilisant l’opérateur site:
Interroger les médias sociaux depuis leurs propres plateformes
On constate également que, dans une liste de résultats Google, il y a très peu de résultats en provenance des principaux médias sociaux comme Twitter, Facebook, LinkedIn, etc.
Google n’a pas véritablement intérêt à vous conduire directement chez ses concurrents...
On pensera donc à aller interroger toutes ces plateformes séparément.
Pas de formule magique pour interroger Google, Bing et les autres
Au cas où on en douterait encore, il n’existe donc pas de méthode ou solution miracle pour interroger les moteurs de recherche. Tout dépend de ce que l’on cherche et il va souvent falloir tâtonner et tester un certain nombre de possibilités et de requêtes.
Contrairement à la croyance populaire, une bonne recherche sur Google est loin d’être un jeu d’enfant et, dans le cas de questions plus complexes où l’on souhaite avoir une vision d’ensemble d’un sujet, cela peut prendre du temps, beaucoup de temps même...
On peut sans aucun doute optimiser sa recherche d’information sur Google mais on n’aura jamais la garantie d’avoir accès aux principaux documents les plus pertinents par rapport à son besoin informationnel et, ce même s’ils sont référencés dans l’index de Google.
On ne le rappellera jamais assez : il est toujours problématique de se limiter uniquement aux moteurs de recherche généralistes dans le cadre d’une veille ou d’une recherche d’informations.
On ne saurait ainsi se passer des agrégateurs de presse, des moteurs thématiques, des bases de données financières, académiques, juridiques, scientifiques et brevets, etc.
Dès que l’on sort d’une question simple générant une réponse simple et limitée, n’en déplaise aux moteurs, on n’a pas encore trouver mieux que l’humain pour le réaliser.
Le dialogue est en effet essentiel pour comprendre précisément les besoins de son interlocuteur et être capable de mener une recherche de qualité.