Au lancement de Google et pendant de nombreuses années, utiliser ces opérateurs était très clairement un avantage pour bien rechercher sur le moteur. Il ne fallait surtout pas s’en priver.
Mais les évolutions technologiques de Google vers la recherche en langage naturel (où il recherche automatiquement sur les synonymes et termes proches) ou plus récemment l’implémentation de l’algorithme BERT qui permet de mieux comprendre l’intention derrière la question de l’utilisateur, éloigne toujours un peu plus le moteur des traditionnelles requêtes booléennes.
Dans le monde de l’information, on constate qu’il y a aujourd’hui deux écoles :
- La première, essentiellement française qui continue d’utiliser de longues requêtes combinant des opérateurs booléens classiques sur Google (dans la limite des 32 termes, imposée par Google) ;
- La seconde, anglo-saxonne, illustrée par des personnalités du monde de l’infodoc comme Marydee Ojala, Mary Helen Bates ou encore Irina Shamaeva (une figure du sourcing RH) qui insistent sur le fait qu’il faut absolument proscrire les longues requêtes combinant des synonymes sur Google.
Pour en avoir le cœur net, nous avons décidé de mener nos propres tests et de comparer les résultats.
Les recherches ont été menées en français et en anglais avec des questions plus ou moins conceptuelles et compliquées.
Google ne prend pas en compte les parenthèses
Même si Google permet l’usage des opérateurs booléens, on ne peut pas pour autant dire qu’il permet d’effectuer des requêtes booléennes, car il ne prend pas en compte les parenthèses. Google considère l’opérateur OR comme prioritaire.
Ainsi, si on souhaite réaliser la recherche suivante, Google n’en est tout simplement pas capable, car il ne reconnaît pas les parenthèses :
(A AND B) OR (C AND D)
.
Il interprète en réalité́ la requête de la façon suivante, ce qui n’a plus du tout la même signification :
A AND (B OR C) AND D
Recherche 1 : Dispositifs de reconnaissance des compétences acquises par les parents
Trouver des informations sur les dispositifs de reconnaissance par les entreprises des compétences acquises par les parents qui se sont occupés de leurs enfants pendant plusieurs années.
Cette première recherche très conceptuelle est complexe, car difficilement transposable en une requête avec quelques mots-clés. Elle requiert d’explorer différents champs lexicaux : celui des compétences, de la reconnaissance et de la valorisation, de l’entreprise/monde du travail, mais aussi celui de la famille.
Pour cela, nous avons donc listé des termes liés à la notion de compétences, de parents/aidants, de reconnaissance et des termes liés à la notion d’entreprise en français et en anglais.
- Compétences, skills, qualifications, reconnaissance, atout, compétences, qualité, valeur ajoutée, benefits, qualities, assets, bénéfices, , recognition, valuable skills ;
- Scheme, reconnaissance, recognition, program, programme, recrutement ;
- Caregiver, family caregiver, parent, mère au foyer, stay at home mum;
- Entreprises, companies workplace, travail, career.
On peut transcrire cette recherche sous la forme de la requête booléenne suivante :
(compétences OR skills OR qualifications OR reconnaissance OR atout OR qualité OR “valeur ajoutée” OR benefits OR qualities OR assets OR bénéfices OR recognition) AND (scheme OR reconnaissance OR recognition OR program OR programme OR recrutement) AND (“family caregiver” OR parent OR “mère au foyer” OR “stay at home mum”) AND (entreprise OR companies OR workplace OR travail OR career)
Nous avons mis des parenthèses pour plus de lisibilité pour nos lecteurs, mais on se rappellera que Google ne les prend pas en compte.
Nous avons ensuite relancé des requêtes plus courtes, sans utiliser l’opérateur OR mais avec des suites de mots-clés ou en langage naturel :
valuable skills stay at home parent companies program
reconnaissance des compétences des mères au foyer en entreprise
- etc.
Résultat :
Longue requête booléenne
Le résultat est ici catastrophique. Sur les 208 résultats proposés, aucun n’est pertinent...
Google ne comprend visiblement pas où nous voulons en venir.
Suite de requêtes courtes
Tous les résultats ne sont pas pertinents, mais on trouve un certain nombre de ressources intéressantes. Google a mieux compris ce que nous recherchions.
D’ailleurs, avec cette méthode, Google fait émerger dans les résultats des termes et concepts très pertinents que nous n’avions pas identifiés comme transferable skills ou returnship program. En relançant des requêtes spécifiquement sur ces concepts, on retrouve alors de nombreux documents et articles pertinents.
Recherche 2 : La surmortalité en Europe en 2020 liée au coronavirus
Pour une telle recherche, on pourra croiser des termes faisant référence :
- A la surmortalité comme surmortalité, excess deaths, morts excessives, surplus, excess mortality, mortality statistics, excess rise ;
- A l’Europe comme Europe, UK, Germany, France, Allemagne, Belgique, Italie, Royaume-Uni, Espagne, etc ;
- Au Coronavirus : Coronavirus, covid-19, etc.
On pourrait donc entrer une longue requête du type :
(surmortalité OR excess deaths OR morts excessives OR surplus OR excess mortality OR mortality statistics OR excess rise) AND (Europe OR UK OR germany OR france OR allemagne OR Belgique OR Italie OR Royaume-uni OR Espagne OR spain OR Italy) AND (coronavirus OR covid-19)
Nous avons mis des parenthèses pour plus de lisibilité, mais on se rappellera que Google ne les prend pas en compte.
Pour les requêtes courtes, on pourra ainsi entrer :
surmortalité europe coronavirus
excess deaths europe covid
- etc.
Résultat :
Longue requête booléenne
Cette fois-ci les résultats sont pertinents et répondent pour la plupart à la question posée. Néanmoins, on constate que sur les 151 résultats, tous sont en anglais. Google a compris la question, mais a fait le choix de privilégier la langue anglaise, peut-être parce que notre requête comporte plus de termes en anglais qu’en français.
Suite de requêtes courtes
Il y a quelques résultats communs avec ceux de la longue requête, mais également d’autres résultats pertinents qui n’étaient pas apparus.
Se limiter à une seule requête courte n’est néanmoins pas suffisant. Même si Google recherche automatiquement sur quelques de synonymes, il ne prend pas tout en compte et on passe à côté d’un certain nombre de résultats pertinents.
Recherche 3 : le marché de la balle de tennis
La longue requête booléenne pourrait par exemple prendre la forme suivante :
(marché OR market) AND (balle de tennis OR tennis ball) AND (2018 OR 2019 OR 2020)
Pour les requêtes courtes, voici quelques exemples :
marché balles de tennis
marché mondial balles de tennis
tennis ball market
tennis ball market worlwide
tennis ball market size
tennis ball market forecasts
- etc.
On peut ensuite limiter aux résultats de moins d’un an pour avoir des données récentes, croiser les requêtes avec les noms des principaux fabricants identifiés, etc.
Résultat :
Longue requête booléenne
Une partie des résultats sont pertinents, les autres ne sont que des sites de vente de balles de tennis. Cela met en lumière l’un des objectifs premiers de Google qui est de faciliter la vente/l’achat de produits. Et cette fois-ci, Google a choisi essentiellement des résultats en français, probablement parce qu’il a tendance à favoriser les sites locaux pour les sites de vente en ligne.
Suite de requêtes courtes
En multipliant les requêtes courtes, on identifie de nombreux résultats intéressants qui n’étaient pas apparus dans la première longue requête.
Notre conclusion
Même si techniquement il est toujours possible d’entrer de longues requêtes avec une liste de synonymes séparés par un OR sur Google, on a tout de même tendance à « s’auto-saborder » en faisant de la sorte.
Car Google ne fonctionne pas comme les bases de données classiques, il s’en éloigne même de plus en plus. Le moteur tente de comprendre l’intention de l’utilisateur et son besoin informationnel et va ensuite « piocher » une sélection de résultats (200 à 300 grand maximum) dans son gigantesque index. Les bases de données, elles, font ressortir TOUS les résultats qui contiennent les mots-clés demandés.
- Face à de longues requêtes booléennes complexes, Google n’a aucune chance de comprendre ce que nous recherchons. Il réinterprète donc la requête comme il l’entend en excluant certains termes, en donnant plus de poids à d’autres, etc. Les résultats proposés ne sont alors absolument pas pertinents.
Cela ne signifie pas pour autant qu’il n’existe pas sur le Web de pages et documents pertinents sur ce sujet. Mais Google n’a tout simplement pas fait le lien entre notre question et les contenus présents dans son gigantesque index...
- Pour des requêtes plus simples, Google a plus de chances de comprendre ce que nous souhaitons obtenir. Néanmoins, en se limitant à une seule longue requête booléenne, on n’accèdera pas à plus de 200/300 résultats, car Google n’en affiche jamais plus.
En relançant plusieurs requêtes, on élargit son champ des résultats possibles, car les 200/300 résultats affichés ne seront pas les mêmes (même s’il peut y avoir quelques recoupements).
En termes de méthodologie de recherche sur Google, on conservera donc une méthode classique en amont de la recherche en listant les termes et concepts importants, en listant les synonymes, termes proches, etc.
Mais on n’entrera pas tous ces termes en une seule fois dans Google. On relancera des requêtes courtes en variant le champ lexical.
Cela peut être chronophage certes, mais c’est le seul moyen de bien interroger Google aujourd’hui. On s’arrêtera quand on estimera avoir assez de matière pour répondre à sa question.
Et comme nous avons pu le voir, il est déconseillé d’entrer des requêtes qui combinent plusieurs langues, car Google fait toujours le choix d’en favoriser une. Mieux vaut partir du principe que 1 requête = 1 langue.