2. Ensuite, on peut compléter sa liste de mots-clés en allant interroger ChatGPT directement dans sa langue natale ou de travail. Il y a quelques mois, nous aurions plutôt conseillé d’aller sur Google pour mieux cerner le sujet et identifier les premiers mots-clés. Mais avec l’arrivée de ChatGPT, cette logique traditionnelle est remise en question.
Pour être efficace, il faut interroger ChatGPT le plus précisément possible grâce aux prompts (système de commandes et d’instructions permettant de communiquer et d’interagir avec ChatGPT). On lui demandera par exemple rapidement, quels sont les principaux acteurs du café au Vietnam afin qu’il dresse sa propre liste, ou encore quel est le meilleur café du Vietnam pour obtenir des espèces de café et leurs régions d’origine.
Précisons ici que nous nous contentons ici d’entrer des prompts simples. Mais à ce stade, il s’agit juste d’obtenir quelques mots-clés pour nous aider dans la mise en place de la veille sans y passer trop de temps.
Attention : Si ChatGPT nous fournit des informations très intéressantes en un rien de temps, il faut rester prudent, avoir conscience que l’information fournie n’est que partielle et revérifier les informations, car il lui arrive d’inventer des choses qui ont pourtant l’air crédibles.
Étape 2 : Identifier des mots-clés en français et en anglais
Plutôt que de plonger tout de suite dans une culture lointaine, on passera ensuite par une recherche dans sa langue natale (ici le français) et l’anglais. Il est en effet préférable d’aborder une nouvelle veille avec des repères et automatismes d’autant plus que, quel que soit le pays, on trouve toujours de l’information en anglais (un peu moins en français).
Nous avons testé plusieurs méthodes et voici les plus fructueuses pour identifier des mots-clés pertinents dans le cadre de notre veille sur le marché du café au Vietnam.
- Ce qui fonctionne le mieux, c’est de lancer une recherche
marché du café au Vietnamdans les moteurs de recherche puis d’explorer les résultats en provenance de sites spécialisés, comme les études de marché et les articles de blogueurs (nombreux sur ce secteur).
Les études de marché nous permettent d’identifier des axes de recherche que l’on n’avait pas vus aux étapes précédentes (par exemple, l’importance du marché intérieur, à peine perceptible dans les synthèses de ChatGPT), mais surtout des mots-clés que l’on n’avait pas repérés, à travers par exemple (et ce n’est pas un détail !) la segmentation du marché vietnamien « café en grains/moulu/… » et les tendances comme l’essor du café instantané, terme absent de nos résultats précédents.
On notera que la plupart des nouveaux moteurs comme Presearch, Kagi Search, etc. ont fourni des résultats plus intéressants que Google sur notre sujet.
- Sur ChatGPT le prompt
Indique-moi quelques thesaurus et vocabulaires contrôlés relatifs au cafénous indique plusieurs thesaurus que nous n’aurions pas identifiés lors de nos recherches, comme ceux de l’Organisation internationale du café (ICO), etc. On identifie par ce biais des mots-clés très pertinents. Le promptDonne-moi le champ lexical du caféfournit aussi quelques pistes intéressantes. - On rappelle l’utilité de vérifier avec des outils plus simples comme Twinw.rd Ideas qui génère un nuage de termes à partir d’un mot. Pour trouver des mots-clés rapidement, ce petit outil a été très efficace.
- Enfin et c’est une surprise, mais les études sur Google Scholar se trouvent être extrêmement pertinentes, du fait de leur diversité comme de la qualité du contenu. Après une simple requête
café Vietnam, nous obtenons des études sur l’adaptation de la communication digitale de Nescafé, l’histoire, la production dérivée… une vraie mine d’informations !
Une fois sa liste de mots-clés finalisée en français et en anglais, on pourra la traduire en vietnamien.
Les méthodes qui n’ont rien donné
Nous avons également testé d’autres méthodes et certaines se sont révélées être des échecs en tout cas par rapport à notre exemple.
Les suggestions de recherche Google (qui s’inscrivent automatiquement quand on tape par exemple café Vietnam) et les recherches associées (en bas des résultats de recherche), de Google ou de Bing, nous ont été peu utiles. Plutôt élaborées à partir de l’expérience en France du café vietnamien, elles nous renvoient davantage vers des adresses de points de vente en France que vers des mots-clés issus d’études de marché.
L’exploration de la presse qui est pourtant souvent essentielle pour identifier des mots-clés dans le cadre d’une veille classique nous a ici conduit dans une impasse. Lancer une recherche dans Google Actualités ne nous aide pas beaucoup, si ce n’est à comprendre, déjà, le manque de diversité des sources, notamment locales (lié à une forte censure, qui touche aussi bien les médias que les blogueurs). On trouvera néanmoins à la lecture de quelques articles quelques noms de personnes et d’associations/institutions comme l’Association vietnamienne du café et du cacao.
Étape 3 : l’identification de mots-clés sous l’angle du local
Jusqu’alors, notre recherche s’est contentée du prisme occidental, par la langue, la géolocalisation, les sources et les outils utilisés. Explorons maintenant la détection de mots-clés à l’échelle locale. Deux solutions s’offrent à nous.
Utiliser des moteurs de recherche occidentaux en nous géolocalisant au Vietnam
C’est une contrainte, mais elle est essentielle pour approfondir nos résultats de recherche et entrer dans un nouvel univers informationnel : la géolocalisation. Nous rappelons qu’il ne suffit plus de se connecter au Google vietnamien pour avoir les mêmes résultats qu’une personne localisée au Vietnam. Pour utiliser des moteurs de recherche en nous géolocalisant au Vietnam, on peut :
- Utiliser les nouveaux moteurs de recherche Kagi Search et Presearch, dont les fonctionnalités de géolocalisation sont intégrées et les résultats de notre requête en français
Vietnam caféy sont plus pertinents que sur Google ; - Utiliser un VPN en ligne comme VPN Mentor pour réaliser une recherche sur Google ou Bing.
C’est ici que l’on peut avoir besoin des traductions en anglais (langue qui reste très utilisée sur les sites d’Asie du Sud-Est) et vietnamien des mots-clés pour les utiliser dans nos requêtes sur les moteurs.
Utiliser des moteurs de recherche locaux
L’identification de moteurs locaux (ou géographiquement proches) est bien souvent une piste très intéressante.
Trois pistes sont ici à explorer : côc-côc, le moteur de recherche vietnamien, Naver son voisin sud-coréen et Baidu, puisque le Vietnam se situe dans la sphère d’influence chinoise. On pourra tenter de les interroger en anglais (il y a des résultats), en vietnamien et dans la langue de l’outil (coréen pour Naver et chinois pour Baidu).
Côc côc se présente comme « le Google vietnamien ». Première difficulté, le navigateur a une version anglaise, mais pas son moteur de recherche. On tente tout de même une requête en anglais, coffee in Vietnam et ça marche ! Mais notre requête aboutit sur des adresses de café et la recette du café vietnamien typique (comme notre requête française dans le Google français). De nombreux blogs sont à explorer, mais davantage orientés vers les touristes.
Sur Naver, tout est en sud-coréen. Heureusement Chrome nous propose automatiquement une traduction Google du site !
Nous avons moins de chance sur Baidu, mais nous entrons encore une fois notre requête en anglais coffee in Vietnam et avons quelques résultats dont nous devons déchiffrer les liens en chinois.
Dans les trois cas, nous trouvons quelques sources similaires à Google, mais nous découvrons aussi de nouvelles sources. Mais pas sûr que cela suffise à justifier toutes nos manipulations !
NOTRE AVIS
Au final, l’identification de mots-clés dans le contexte d’une veille multilingue passe d’abord par une liste de termes dans des langues que l’on maîtrise, notamment le français et l’anglais. L’identification de mots en langue locale n’intervient que dans un deuxième temps et il ne faut pas trop se faire d’illusion sur la valeur d’une recherche locale dans certaines zones géographiques comme en Asie du Sud-Est, qui font l’objet d’une littérature anglophone importante.
Autre constat : même avec les innovations actuelles comme l’arrivée de ChatGPT, on ne s’économise pas la lecture d’études documentées et structurées pour obtenir un travail de qualité et réussir à dresser une liste mot-clé la plus complète et pertinente possible.
Zoom sur les outils de veille professionnels
Nous sommes allés regarder ce que les outils de veille pro comme les plateformes de veille, les agrégateurs de presse et les lecteurs RSS avaient à proposer au veilleur comme solution pour identifier des mots-clés dans un contexte multilingue. Et le constat est assez mitigé.
Personne à notre connaissance ne propose de fonctionnalités intégrées pour identifier des mots-clés dans plusieurs langues ou créer directement des requêtes multilingues. Nous n’avons pas vu non plus de système permettant de rechercher dans sa langue et de voir apparaître des résultats dans d’autres langues (seul EMIS, une plateforme spécialisée sur les pays émergents proposait cette fonctionnalité il y a quelques années).
En revanche, ce qui existe, ce sont des systèmes de taxonomies (concepts, sujets, lieux, organisations, personnes) qui permettent de lancer des recherches simultanément dans plusieurs langues sans avoir besoin d’entrer une requête.
Mais attention au mirage, ces taxonomies ou filtres intelligents ne portent souvent que sur une sélection de langues (généralement les plus courantes) et non l’intégralité des langues du corpus. Sur Feedly par exemple, l’utilisation de la taxonomie ne fait ressortir que des résultats en anglais et, sur des agrégateurs comme Newsdesk ou Factiva, l’indexation sujet par exemple ne permet pas de retrouver des contenus dans toutes les langues. Les filtres « recherche des experts de Factiva » ne portent par exemple que sur une dizaine de langues et les filtres « sujets » de Newsdesk ne font ressortir que quelques langues (anglais, allemand et français surtout).
Même sur ces outils, on ne pourra donc pas s’épargner la phase d’identification de mots-clés multilingues et on conseillera donc l’utilisation des outils et méthodes cités dans cet article.
Lire aussi :
Comment identifier des sources d’information locales ? (Netsources N° 146 - mai/juin)
Sortir de la recherche géolocalisée avec VPN, extensions… quelle est aujourd’hui la meilleure solution ? (Bases N° 395 - sept 2021)
Conseil veille : boostez votre veille à l’international
Presearch permet de chercher depuis la localisation de son choix (Bases N° 410 - sept 2021)
Dossier spécial « Rechercher différemment », La recherche d’information par géolocalisation (Netsources N° 142 - sept/oct 2019)
