L’actualité de la veille et la recherche d’information

Carole Tisserand-Barthole
Bases no
384
publié en
2020.09
782
Acheter ce no
Tags
outils de veille | outils de recherche
L’actualité de la veille et la recherche d’information Image 1

L’information qui gravite autour de la veille et de la recherche d’information est toujours aussi dense en ce mois de septembre 2020.

Un moteur de recherche pour Apple ?

Une rumeur a secoué le monde des moteurs de recherche au mois d’août dernier. Apple pourrait prochainement lancer son propre outil de recherche. Mais qu’en est-il vraiment ?

Aujourd’hui, seuls Google, Bing et Yandex (et probablement Weibo pour la Chine) disposent de leur propre index. Tous les autres moteurs qui vont et viennent sur la scène de la recherche web utilisent en réalité pour la plupart l’index de Bing et parfois, mais c’est beaucoup plus rare, l’index de Google ou de Yandex.

Tous ces outils sont en réalité des métamoteurs plus que des moteurs de recherche comme c’est le cas de Qwant, DuckDuckGo, etc. même si certains acteurs aimeraient faire croire le contraire.

Mais le fait de partir d’un index existant n’a rien de très surprenant. Il est en effet pratiquement impossible de créer aujourd’hui un index à partir de zéro tant cela serait chronophage et couteux, sans compter que des acteurs comme Google font cela depuis maintenant plus de 20 ans.

Seul Apple serait en mesure de créer un véritable moteur de recherche car il dispose d’un robot crawler de sites appelé Applebot qui existe depuis 2015. Contrairement aux autres donc, il ne partirait pas de rien (mais 5 ans reste insignifiant par rapport aux 20 ans d’ancienneté de Google...)

Plusieurs experts des moteurs ont récemment relevé plusieurs indices laissant supposer qu’Apple pourrait se lancer dans la création de son propre moteur :

  • une augmentation des offres d’emploi d’Apple pour des search engineers ;
  • le robot Applebot qui visite plus régulièrement les sites web et qui bénéficie d’une nouvelle page de support plus détaillée
  • une récente décision de justice où Apple a été épinglé par l’autorité de la concurrence britannique reprochant à Google de verser 1,2 milliard de livres à Apple pour rester le moteur par défaut sur Iphone, ce qui serait anti-concurrentiel. Apple pourrait décider de s’en affranchir pour éviter tout problème à l’avenir et gagner son indépendance.

Les indices sont convaincants mais cela ne signifie pas pour autant le lancement prochain d’un moteur. D’autres experts ont ainsi montré que le nombre de recrutements avait certes augmenté chez Apple pour le search mais restent faibles comparés aux effectifs de Google dans ce domaine et cette augmentation est retombée dès le mois de septembre 2020.

On aimerait croire au lancement d’un nouveau moteur mais cela reste malgré tout peu probable. D’ailleurs, même lorsqu’un un acteur annonce la sortie d’un nouveau moteur, il ne voit pas forcément le jour. On se rappelera qu’Ahref, un acteur du SEO, avait annoncé un moteur il y a quelques années mais on n’en a toujours pas vu la couleur.

De nouveaux moteurs généralistes

  1. En janvier 2020 Verizon (ex-Yahoo) a lancé Onesearch (https://www.onesearch.com), un moteur qui surfe sur le respect de la vie privée. Le moteur utilise l’index de Bing et il n’y a rien de révolutionnaire dans les résultats de recherche comparé à Bing.
  2. Huawei développe également son moteur de recherche après avoir été blacklisté par Google. Mais comme le développement de ce moteur s’est fait dans l’urgence et à partir de zéro, le résultat laisse à désirer. D’après les premiers retours, la recherche y est très basique. Et cela ne fonctionne que sur les téléphones de la marque.
  3. Plus intéressant, deux anciens de Google ont également annoncé le lancement d’un moteur appelé Neeva qui fonctionnera sans publicité mais sur un modèle payant (a priori un peu moins de 10$ par mois).

Un comble quand on sait que les deux créateurs étaient respectivement à la tête des adwords de Google et de la monétisation sur YouTube. Après de nombreuses désillusions, les deux ingénieurs auraient ainsi décidé de quitter le navire Google.

Les deux créateurs expliquaient ainsi au site Search Engine Land que « la pression incessante pour maintenir la croissance de Google a eu un coût important pour les utilisateurs du moteur. Les résultats de recherche pertinents et utiles ont été poussés vers le bas de la page pour faire passer plus d’annonces, et la vie privée a été sacrifiée au profit d’outils de suivi en ligne ».

Neeva ne traquera donc pas ses utilisateurs mais les résultats seront personnalisés (reste à voir comment cela fonctionnera). L’outil utilisera l’index de Bing et recherchera également les documents personnels comme les emails ou fichiers de son ordinateur.

Nous le testerons dès qu’il sera disponible.

Nouveau Légifrance : du bon et surtout du moins bon

Que l’on soit expert de l’information juridique ou non, Légifrance est, depuis des années, un outil de recherche indispensable pour tout ce qui a trait à la législation et la réglementation française.

Une nouvelle version du site vient d’être lancée, apportant son lot de bonnes et mauvaises surprises pour les professionnels de l’information.

Pour une analyse approfondie du nouveau Légifrance, on conseillera la lecture de l’article « Le nouveau Légifrance : analyse raisonnée de la nouvelle version » publié par Emmanuel Barthe sur son blog de référence pour l’information juridique et régulièrement mis à jour (https://www.precisement.org/blog/Le-nouveau-Legifrance-analyse-raisonnee-de-la-nouvelle-version.html).

La grande nouveauté, c’est que le nouveau site a été conçu comme un outil de « recherche unifiée », c’est-à-dire une interface unique qui permet d’interroger les différentes bases de données en un seul et même endroit même s’il reste possible de les interroger séparément. C’est ainsi que sont d’ailleurs conçues toutes les nouvelles interfaces des moteurs et bases de données ces dernières années car cela répond à la demande des internautes qui recherchent la simplicité et des interfaces à la Google.

Pour autant, interroger des contenus disparates de la même manière peut vite devenir contre-productif. Sur Légifrance comme sur les autres outils de recherche, serveurs, bases de données ou encore agrégateurs de presse, il est donc conseillé de continuer à interroger séparément différents types de contenus. Sur LégiFrance, la recherche simple et avancée base par base restent disponibles.

On retiendra les éléments-clés suivants :

  •  le nouveau site  est maintenant plus adapté à la lecture sur mobile ;
  • de nombreuses fonctionnalités, dont certaines n’étaient plus mises à jour, ont été enlevées (les traductions par exemple, plan de classement des arrêts du Conseil d’Etat et de la Cour de cassation, thésaurus SARDE) ;
  • il n’existe plus qu’un classement des résultats par pertinence dans la recherche muti-fonds / unifiée, alors que le classement antechronologique aurait été très utile; ce dernier reste cependant possible lorsqu’on interroge les fonds séparément ; Et la pertinence des résultats proposés par l’algorithme de pertinence ne serait pas au rendez-vous selon les premiers retours d’utilisateurs...
  • il n’y a aucun flux RSS.

Les réactions dans le monde juridique ne se sont pas fait attendre et plusieurs pétitions circulent pour rétablir l’ancienne interface.

Au final, souhaitons que l’interface s’améliore au cours des prochains mois grâce aux retours des utilisateurs et que de nouvelles fonctionnalités fassent leur apparition. Mais le grand enseignement de ces premières semaines de lancement, c’est qu’il vaut mieux interroger chaque base séparément.

Du nouveau pour la veille sur les contenus multimédias

Les contenus multimédias (vidéos, images ou encore podcasts) sont de plus en plus nombreux et proposent de plus en plus de contenus professionnels pertinents que l’on ne retrouve pas nécessairement au format textuel.

Pour autant, la recherche et la veille sur ces contenus ainsi que leur capitalisation et leur diffusion pour la veille restent compliquées.

  1. Car d’une part, on ne recherche que très rarement sur les transcriptions des contenus audios ou vidéos mais uniquement sur des métadonnées (titre, bref descriptif, tags, etc.) qui restent très limitées et ne permettent pas de tirer parti de la richesse de ce qui est dit dans ces contenus vidéo et audio ;
  2. D’autre part parce qu’il est souvent compliqué d’extraire les éléments pertinents de ces contenus pour les intégrer à des livrables de veille.

Dans le n° 143 de NETSOURCES, novembre-décembre 2019, nous avions analysé cette tendance pour la veille et les solutions qui existaient actuellement pour en tirer parti dans un contexte professionnel.

Depuis la parution de ce numéro, de nouvelles solutions et méthodes continuent d’émerger.

On citera tout d’abord le lancement récent par Microsoft d’un outil appelé Transcribe qui va permettre de re­transcrire automatiquement des fichiers audio. L’avantage étant que l’outil est intégré directement dans les outils Microsoft et notamment Word. Petit bémol : Transcribe ne fonctionne pour le moment que pour l’anglais.

Du côté des podcasts, de plus en plus présents dans l’univers informationnel des veilleurs, il est souvent compliqué d’en extraire le contenu pertinent pour le transmettre aux destinataires de la veille. Le lecteur de podcasts Airr (https://apps.apple.com/us/app/airr-highlight-podcasts/id1355926315) pourrait représenter une option intéressante car il permet de partager des extraits de podcasts en y ajoutant un commentaire ou une citation sous forme d’un lien ou d’une courte vidéo. Seul problème, ce lecteur n’est disponible que pour Iphone et donc non adapté aux ordinateurs qui restent l’outil de travail principal des veilleurs. Dans la même veine, Overcast permet également de partager des morceaux de podcasts. Mais comme pour Airr, il n’est disponible que pour Ios.

Il est également important de noter que le modèle économique des podcasts est en train d’évoluer. De plus en plus d’éditeurs de podcasts natifs passent progressivement à un modèle payant comme c’est le cas pour la presse en général. Surveiller et rechercher des podcasts pourrait avoir un coût dans les années à venir.