La recherche sur le Web évolue de plus en plus vite et ce, en raison des avancées rapides de l’IA, du machine learning et du traitement du langage naturel et leur intégration dans les moteurs de recherche.
On ne peut plus rechercher sur le Web et sur les moteurs de recherche en 2020 comme on recherchait il y a à peine 5 ans. Google, tout particulièrement, évolue rapidement et annonçait il y a à peine quelques semaines plusieurs innovations majeures.
Lire aussi :
Méthodologie et outils pour la recherche de statistiques
Pour suivre de près les grandes évolutions de la recherche et de la veille mais aussi du métier de professionnel de l’information, on peut bien sûr suivre l’actualité des différents acteurs de la recherche sur le Web et plus particulièrement des moteurs de recherche. Une autre solution tout aussi intéressante consiste à assister aux différentes conférences francophones et internationales dédiées aux professionnels de l’information.
En cette année qui ne ressemble à aucune autre, ces événements, riches en informations et qui permettent d’avoir un état des lieux précis à un instant t sur le monde de l’information se sont pour beaucoup digitalisées.
Nous avons assisté pour vous cette année à trois événements majeurs pour la veille et la recherche d’information (un en présentiel et deux à distance) :
Nous allons proposer plusieurs articles au cours des prochains numéros de BASES sur les thèmes-clés abordés lors de ces différents événements.
Nous aborderons notamment la question :
Dans ce premier article, nous nous intéresserons donc aux grandes tendances et innovations qui viennent bouleverser la recherche d’information sur le Web ouvert notamment à travers des grandes évolutions des moteurs de recherche Web.
Déjà abonné ? Connectez-vous...
Pour doper au maximum ses performances de recherche sur le Web, nous conseillons de suivre, pour s’en inspirer, trois types de spécialistes du Web auxquels on ne pense pas en général : les experts du référencement (SEO), de l’OSINT (open source intelligence) et du Google Dorking (ou Google hacking).
Nous avons examiné et confronté leurs recommandations et découvertes, et livrons dans cet article la liste des opérateurs qui marchent le mieux sur Google, ainsi que les requêtes que l’on peut construire de façon originale, et dont on peut s’armer quand on cherche des choses «introuvables»…
Il est acté, parmi les veilleurs et professionnels de l’information aguerris, que les bases de données payantes constituent des outils de premier choix, tant en raison de la richesse de leurs contenus que des langages de requêtes intégrés, conçus précisément pour assurer la meilleure performance de recherche.
Mais à la différence des serveurs de bases de données détaillant les spécificités de leurs langages de requêtes, Google et Bing, dont la quasi-totalité de la clientèle est peu encline à faire des requêtes complexes, ne communiquent que de façon très succincte sur leurs opérateurs avancés. Tout juste dispose-t-on de quelques menus d’aide à la recherche dite avancée, à la fréquence de mise à jour incertaine.
Rappelons que dans nos colonnes, Carole Tisserand-Barthole teste régulièrement les capacités de recherche avancée de Google et autres moteurs, avec un diagnostic de plus en plus pessimiste sur la performance réelle des requêtes complexes construites avec des opérateurs. Google et Bing publient d’ailleurs désormais des réserves sur l’utilisation des opérateurs via des messages sur leurs supports.
Google annonce ainsi que «certains opérateurs de recherche ne renvoient pas de résultats complets» (sic), (https://support.google.com/websearch/answer/2466433?hl=fr) et Bing prévient qu’«il est possible que certaines fonctions et fonctionnalités décrites ici ne soient pas disponibles dans votre pays ou région» (https://help.bing.microsoft.com/#apex/18/fr/op%C3%A9rateurs).
Déjà abonné ? Connectez-vous...
D’aucuns pourraient penser que le RSS, cette technologie vieille de 20 ans, autant dire une éternité à l’échelle du web, est à reléguer au rang des antiquités. Et pourtant, elle a remarquablement résisté aux années et survécu à la vague du web social. On pense à tort qu’elle a disparu, alors qu’elle reste incontournable pour les métiers de la veille.
Si les lecteurs de flux RSS ne sont en rien comparables avec les grandes plateformes de veille en termes de puissance et de fonctionnalités, certains ont su tirer leur épingle du jeu et se rendre utiles voire indispensables pour les veilleurs et ce, pour un coût modeste. C’est le cas d’Inoreader et Feedly, leaders aujourd’hui incontestés du RSS auprès des professionnels de l’information. D’autres acteurs ajoutent régulièrement des fonctionnalités intéressantes, d’autres encore arrivent également sur le marché.
Ces outils sont utilisés aussi bien par des veilleurs disposant de budgets très limités que par des professionnels disposant d’outils de veille ou de recherche professionnels payants et qui y ont recours en complément à ces outils.
Lire aussi :
« Comment surveiller Google Actualités ? »
Lorsque le RSS est apparu au début des années 2000, dans la mouvance de ce que l’on appelait à l’époque le web 2.0, il a été très vite utilisé et même promu sur les sites web. La grande majorité arboraient le petit logo orange qui signalait sa présence et les internautes étaient largement invités à souscrire, gratuitement, aux flux proposés pour les consulter dans leur lecteur/agrégateur favori ; il s’agissait de Netvibes ou Google Reader la plupart du temps.
Puis les éditeurs de sites web ont changé leur fusil d’épaule. L’utilisation massive des flux RSS par les internautes pour suivre le contenu mis à jour, a en effet rapidement provoqué une baisse de la fréquentation en ligne de leur site. En outre, ces mêmes éditeurs n’avaient plus aucun moyen de capter l’identification de leur audience, ne serait-ce que par une adresse e-mail, comme ils peuvent le faire très facilement au moyen de l’inscription à une newsletter…
Déjà abonné ? Connectez-vous...
Lancée en 2013, la recherche sur les valeurs numériques est une des valeurs ajoutées, originale, de l’offre du serveur STN qui propose, rappelons-le, un ensemble de banques de données dans le domaine de la littérature scientifique (références bibliographiques) et des brevets (références bibliographiques ou fulltext).
Le nombre de propriétés recherchables jusqu’à présent était de 55 telle que la charge électrique (en Coulomb), la force (en Newton), la fréquence (en Hertz), la masse moléculaire (en g/mol), la pression (en Pascal), etc.
On en trouve la liste en cherchant HELP NPS si l’on est connecté à STNext et plus précisément à une des bases offrant cette possibilité.
Sinon, on trouvera la liste à l’adresse http://www.stn-international.de/en/productsservices/products-services.
La mise à jour récente a ajouté la possibilité de rechercher sur quatre valeurs numériques supplémentaires, en peu moins classiques, portant leur nombre total à 59. Il s’agit de :
Déjà abonné ? Connectez-vous...
Lancée le 18 décembre 2019, le « new PubMed » (voir figure 1.) est devenu le 18 mai dernier la plateforme par défaut de PubMed, la précédente (legacy PubMed) restant en ligne au moins jusqu’au 30 octobre 2020.
Cette période de cinq mois a été mise à profit pour réaliser différents tests et recueillir les réactions des premiers utilisateurs.
L’outil gratuit Pubmed a été lancé en 1996 comme un site Web expérimental et revendique aujourd’hui 3,4 millions d’utilisateurs pour un jour de semaine moyen, effectuant des recherches dans un corpus de plus de 31 millions de références bibliographiques.
Lire aussi :
Les outils documentaires du CHU de Rouen : CISMeF, LiSSa et HeTOP
Figure 1. Nouvelle interface de recherche de Pubmed
Dans cet article, nous revenons sur l’histoire de Pubmed pour bien comprendre son positionnement actuel, nous analysons ensuite le contenu de la plateforme et enfin nous comparons l’ancienne et la nouvelle plateforme en termes de fonctionnalités.
Déjà abonné ? Connectez-vous...
L’information qui gravite autour de la veille et de la recherche d’information est toujours aussi dense en ce mois de septembre 2020.
Une rumeur a secoué le monde des moteurs de recherche au mois d’août dernier. Apple pourrait prochainement lancer son propre outil de recherche. Mais qu’en est-il vraiment ?
Aujourd’hui, seuls Google, Bing et Yandex (et probablement Weibo pour la Chine) disposent de leur propre index. Tous les autres moteurs qui vont et viennent sur la scène de la recherche web utilisent en réalité pour la plupart l’index de Bing et parfois, mais c’est beaucoup plus rare, l’index de Google ou de Yandex.
Mais le fait de partir d’un index existant n’a rien de très surprenant. Il est en effet pratiquement impossible de créer aujourd’hui un index à partir de zéro tant cela serait chronophage et couteux, sans compter que des acteurs comme Google font cela depuis maintenant plus de 20 ans.
Seul Apple serait en mesure de créer un véritable moteur de recherche car il dispose d’un robot crawler de sites appelé Applebot qui existe depuis 2015. Contrairement aux autres donc, il ne partirait pas de rien (mais 5 ans reste insignifiant par rapport aux 20 ans d’ancienneté de Google...)
Plusieurs experts des moteurs ont récemment relevé plusieurs indices laissant supposer qu’Apple pourrait se lancer dans la création de son propre moteur :
Déjà abonné ? Connectez-vous...
Les réseaux sociaux les plus populaires Facebook, Twitter et Instagram, ont un rôle essentiel pour certains types de veilles : ils s’imposent comme des ressources clés pour les métiers du marketing et de la communication (veille image, e-réputation, influence et veille produit).
Même si parmi eux, Twitter se distingue véritablement par son offre de contenu et de fonctionnalités de recherche et veille, leur intérêt est tel qu’ils font tous trois l’objet de beaucoup d’efforts en termes d’intégration dans les dispositifs de veille, ainsi que dans les plateformes spécialisées.
Lire aussi :
Comment rendre Twitter plus puissant pour la veille et la recherche ?
Ils s’appellent :
Apparus il y a des années ou récemment lancés, ces réseaux sociaux que nous qualifierons « d’atypiques » sont des espaces d’expression pourtant bien présents dans l’écosystème informationnel du veilleur. Chacune de ces plateformes est très singulière dans son fonctionnement, elles n’attirent pas les mêmes publics et leur popularité varie considérablement selon le pays. Néanmoins, elles peuvent se révéler tout à fait pertinentes dans le cadre d’une veille ou d’une recherche d’information.
Certes, ces réseaux sont, pour l’instant, moins pris en compte dans les démarches de veille en raison des nombreuses difficultés qu'ils soulèvent : difficulté d’évaluer le temps d’investigation nécessaire et leur potentiel informationnel, complexité technique d’intégration dans des process de veille existants, manque d’outils connexes pour simplifier le crawling de ces plateformes… Ou encore, simple méconnaissance de leur fonction, de leur audience et du contenu qu’elles proposent.
Ces réseaux sociaux nous paraissent être cependant des sources d’information à part entière, qui évoluent et s’enrichissent en permanence. Écarter d’emblée ces nouvelles sources sans les évaluer et suivre leur évolution reviendrait à risquer de passer à côté de contenus qui peuvent se révéler pertinents dans le cadre de veille ou de recherche ciblée. Cet article vise donc à déterminer si ces réseaux sociaux présentent un intérêt pour la veille.
Déjà abonné ? Connectez-vous...