La recherche sur le Web évolue de plus en plus vite et ce, en raison des avancées rapides de l’IA, du machine learning et du traitement du langage naturel et leur intégration dans les moteurs de recherche.
On ne peut plus rechercher sur le Web et sur les moteurs de recherche en 2020 comme on recherchait il y a à peine 5 ans. Google, tout particulièrement, évolue rapidement et annonçait il y a à peine quelques semaines plusieurs innovations majeures.
Lire aussi :
Méthodologie et outils pour la recherche de statistiques
Pour suivre de près les grandes évolutions de la recherche et de la veille mais aussi du métier de professionnel de l’information, on peut bien sûr suivre l’actualité des différents acteurs de la recherche sur le Web et plus particulièrement des moteurs de recherche. Une autre solution tout aussi intéressante consiste à assister aux différentes conférences francophones et internationales dédiées aux professionnels de l’information.
Pour doper au maximum ses performances de recherche sur le Web, nous conseillons de suivre, pour s’en inspirer, trois types de spécialistes du Web auxquels on ne pense pas en général : les experts du référencement (SEO), de l’OSINT (open source intelligence) et du Google Dorking (ou Google hacking).
Nous avons examiné et confronté leurs recommandations et découvertes, et livrons dans cet article la liste des opérateurs qui marchent le mieux sur Google, ainsi que les requêtes que l’on peut construire de façon originale, et dont on peut s’armer quand on cherche des choses «introuvables»…
Il est acté, parmi les veilleurs et professionnels de l’information aguerris, que les bases de données payantes constituent des outils de premier choix, tant en raison de la richesse de leurs contenus que des langages de requêtes intégrés, conçus précisément pour assurer la meilleure performance de recherche.
D’aucuns pourraient penser que le RSS, cette technologie vieille de 20 ans, autant dire une éternité à l’échelle du web, est à reléguer au rang des antiquités. Et pourtant, elle a remarquablement résisté aux années et survécu à la vague du web social. On pense à tort qu’elle a disparu, alors qu’elle reste incontournable pour les métiers de la veille.
Si les lecteurs de flux RSS ne sont en rien comparables avec les grandes plateformes de veille en termes de puissance et de fonctionnalités, certains ont su tirer leur épingle du jeu et se rendre utiles voire indispensables pour les veilleurs et ce, pour un coût modeste. C’est le cas d’Inoreader et Feedly, leaders aujourd’hui incontestés du RSS auprès des professionnels de l’information. D’autres acteurs ajoutent régulièrement des fonctionnalités intéressantes, d’autres encore arrivent également sur le marché.
Ces outils sont utilisés aussi bien par des veilleurs disposant de budgets très limités que par des professionnels disposant d’outils de veille ou de recherche professionnels payants et qui y ont recours en complément à ces outils.
Lire aussi :
« Comment surveiller Google Actualités ? »
Lancée en 2013, la recherche sur les valeurs numériques est une des valeurs ajoutées, originale, de l’offre du serveur STN qui propose, rappelons-le, un ensemble de banques de données dans le domaine de la littérature scientifique (références bibliographiques) et des brevets (références bibliographiques ou fulltext).
Le nombre de propriétés recherchables jusqu’à présent était de 55 telle que la charge électrique (en Coulomb), la force (en Newton), la fréquence (en Hertz), la masse moléculaire (en g/mol), la pression (en Pascal), etc.
On en trouve la liste en cherchant HELP NPS si l’on est connecté à STNext et plus précisément à une des bases offrant cette possibilité.
Sinon, on trouvera la liste à l’adresse http://www.stn-international.de/en/productsservices/products-services.
Lancée le 18 décembre 2019, le « new PubMed » (voir figure 1.) est devenu le 18 mai dernier la plateforme par défaut de PubMed, la précédente (legacy PubMed) restant en ligne au moins jusqu’au 30 octobre 2020.
Cette période de cinq mois a été mise à profit pour réaliser différents tests et recueillir les réactions des premiers utilisateurs.
L’outil gratuit Pubmed a été lancé en 1996 comme un site Web expérimental et revendique aujourd’hui 3,4 millions d’utilisateurs pour un jour de semaine moyen, effectuant des recherches dans un corpus de plus de 31 millions de références bibliographiques.
Lire aussi :
Les outils documentaires du CHU de Rouen : CISMeF, LiSSa et HeTOP
L’information qui gravite autour de la veille et de la recherche d’information est toujours aussi dense en ce mois de septembre 2020.
Une rumeur a secoué le monde des moteurs de recherche au mois d’août dernier. Apple pourrait prochainement lancer son propre outil de recherche. Mais qu’en est-il vraiment ?
Aujourd’hui, seuls Google, Bing et Yandex (et probablement Weibo pour la Chine) disposent de leur propre index. Tous les autres moteurs qui vont et viennent sur la scène de la recherche web utilisent en réalité pour la plupart l’index de Bing et parfois, mais c’est beaucoup plus rare, l’index de Google ou de Yandex.
Les réseaux sociaux les plus populaires Facebook, Twitter et Instagram, ont un rôle essentiel pour certains types de veilles : ils s’imposent comme des ressources clés pour les métiers du marketing et de la communication (veille image, e-réputation, influence et veille produit).
Même si parmi eux, Twitter se distingue véritablement par son offre de contenu et de fonctionnalités de recherche et veille, leur intérêt est tel qu’ils font tous trois l’objet de beaucoup d’efforts en termes d’intégration dans les dispositifs de veille, ainsi que dans les plateformes spécialisées.
Lire aussi :
Comment rendre Twitter plus puissant pour la veille et la recherche ?
Twitter est aujourd’hui le réseau social le plus utile dans un contexte de veille et de recherche d’information professionnelles. Il est également celui qui propose les fonctionnalités de recherche les plus abouties et les plus en adéquation avec les besoins des professionnels de l’information.
Pour autant, Twitter n’intègre pas (du moins pas encore) toutes les fonctionnalités utiles dans un contexte de veille ou de recherche, même si de nouvelles options sont régulièrement ajoutées. Il faut donc faire appel à de petits outils externes souvent gratuit ou freemiums pour répondre à certains besoins d’information.
Dans cet article :
La veille, qu’elle soit stratégique, concurrentielle, scientifique ou technique est généralement associée aux contenus et sources numériques : presse, sites d’actualités, blogs, réseaux sociaux, sites institutionnels, articles scientifiques, brevets, bases de données, etc.
Les livres, plus naturellement associés au papier qu’au numérique malgré l’existence des ebooks, sont souvent les grands absents des projets de veille. Alors qu’ils renvoient pourtant aux origines mêmes du métier de professionnel de l’information.
Il manque aux livres et ouvrages cette « fraîcheur » et instantanéité de l’information associée aux contenus numériques. Il n’est pas non plus simple de rechercher numériquement sur ce type de contenus pour lesquels on ne dispose souvent que des références bibliographiques. Enfin, ils ne sont pratiquement jamais accessibles gratuitement (à l’exception des livres en open access encore rares ou des ouvrages qui ne sont plus couverts par le droit d’auteur).
Inclure les livres à sa veille n’a pas de sens pour tous les types de veilles et pour tous les sujets. Mais ils ont toute leur place pour l’investigation et l’analyse en profondeur de certaines thématiques.
Avec les années, les réseaux sociaux prennent de plus en plus d’importance dans le processus de veille et de recherche d’information et Facebook ne déroge pas à la règle.
Seul problème, Facebook n’est absolument pas conçu pour la veille et la recherche professionnelle et s’avère beaucoup plus difficile à intégrer dans son process que certains de ses concurrents et notamment Twitter. En mars dernier, Facebook a lancé une nouvelle interface pour tous ses utilisateurs à travers le monde. Si le design et l’ergonomie ont bien évidemment évolué ce qui affectera peu le veilleur, quelques fonctionnalités de recherche et filtres ont également changé.
Lire aussi :
« Facebook incontournable pour la veille et la recherche ? Fantasme ou réalité ? »
Si les logiciels de détection du plagiat sont connus et utilisés depuis plusieurs années dans le monde universitaire, on peut se demander s’ils peuvent également servir à alimenter une démarche de veille et d’intelligence économique en entreprise.
- D’une part, en détectant des contenus plagiés par d’éventuels concurrents.
- D’autre part, en les détournant légèrement de leur utilisation première pour trouver des contenus similaires qui pourront venir enrichir son sourcing ou faire émerger des informations sur des thématiques proches.
Le plagiat se définit comme l’acte de faire passer pour sien une publication d’autrui. Tous les domaines sont concernés, car à la racine du plagiat se trouve l’intention d’utiliser l’idée de quelqu’un d’autre sans les lui attribuer.
Après plusieurs mois pendant lesquels le coronavirus occupait la majorité des actualités de la veille et de la recherche d’information avec de nouvelles ressources et de nouveaux outils dédiés, on sent bien que la vie professionnelle reprend progressivement son cours avec le lancement de nouveaux outils et de nouvelles fonctionnalités et l’aboutissement de projets en cours.
Il y a quelques mois, nous avions eu l’occasion de parler d’un nouvel outil 2D Search qui permet de créer ses requêtes sur des moteurs et bases de données en 2 dimensions. L’idée étant que les requêtes peuvent être parfois longues et complexes et sont propices aux erreurs. En créant sa requête sous forme de blocs combinables, la requête est plus lisible et plus facilement modifiable. À l’époque, l’outil intégrait déjà Google, Google Scholar (même si nous ne recommandions pas son utilisation sur la suite Google), Bing, Pubmed et quelques autres.
Lire aussi :
Des outils pour optimiser ses stratégies de recherche
BASES DE DONNEES
• Korean Medical Database, p. 7
METHODOLOGIE • Comment surveiller Google Actualités ? pp. 8-10
BREVES DE VEILLE • L’actualité de la veille, p. 11
Nous avions, avec Philippe Bodart (Total Research & Technology, Feluy-CFIB) déploré dans un précédent numéro de BASES la baisse régulière depuis plusieurs années du nombre d’articles d’origine asiatique référencés dans les bases de données/agrégateurs/serveurs occidentaux ».
Le producteur de Chemical Abstracts Services nous avait à cette occasion, expliqué que le nombre de brevets déposés dans cette zone croissait fortement et qu’ils avaient, au moins pour un temps, privilégié les brevets par rapport à la littérature. Les références à cette dernière étant supposées, à terme, ré-augmenter suite à l’embauche de nouveaux experts.
Nous avions annoncé alors que nous explorerions les bases de données de certains de ces pays avec l’aide du bureau Asie de l’OEB (Office Européen des Brevets) à Vienne que nous tenons à remercier ici.
Lire aussi :
Forte chute des références d’articles en langue asiatique dans Chemical Abstracts
DBpia (DataBase Periodical Information Academic - https://www.dbpia.co.kr ) a été lancée en octobre 1998 sous forme d’un CD-Rom mais est passée à Internet dès l’année suivante.
De nombreux développements ont été réalisés régulièrement. Le dernier en date (en 2019), a vu une réorganisation complète du site et le remplacement du moteur de recherche.
DBpia se présente comme la première base de données de contenus académiques d’origine coréenne à destination, en priorité, des universités coréennes.
Clarivate, qui n’a rien de coréen, est une autre banque de données payante référençant des articles d’origine coréenne dans le cadre de son produit Web of Science. Elle donne accès aux références de plus de 1,4 million d’articles parus dans plus de 2 500 publications, qui constituent la KCI Korean Journal Database produite par la National Research Foundation of Korea.
Auteur : François Libmann, Directeur de BASES Publications
La « Korean Association of Medical Journal Editors » (KAMJE) offre une série de services gratuits donnant accès au contenu de publications coréennes couvrant la médecine, les soins dentaires, les soins infirmiers, et les soins vétérinaires, ainsi que la nutrition.
On peut considérer que le point central est la base de données d’abstracts KoreaMed qui, en août 2017, référençait plus de 260 000 articles publiés par 256 éditeurs membres de KAMJE (derniers chiffres disponibles).
Pour l’année 2019, on trouve plus de 12 000 références dont environ 9 000 à des publications en anglais et environ 3 000 à des publications en coréen.
Dans KoreaMed, on dispose d’une recherche simple et d’une recherche avancée laquelle permet de combiner plusieurs lignes de recherche avec les opérateurs AND, OR ou NOT. Dans chaque ligne, on a le choix entre la recherche dans tous les champs ou bien de choisir dans une douzaine de champs. On dispose aussi de filtres, en particulier sur la langue de l’article, anglais ou coréen.
RISS International (http://intl.riss.kr/) est une banque de données produite par le KERIS (Korea Education and Research Information Service), un organisme appartenant au ministère coréen de l’Éducation.
Les missions du KERIS sont multiples autour d’un concept mêlant éducation et information numérique.La production et la diffusion de la banque de données RISS font partie de ses missions.
Elle propose plus de 6 millions d’articles dont près de 30% proviennent de KERIS même et les autres de « commercial vendors », principalement de DBpia, Scola, et Kiss, plus de 2 millions de thèses provenant de 227 universités coréennes, plus de 9 millions de livres, pas nécessairement d’origine coréenne, ainsi que quelques rapports de recherche.
Koreascience (Koreascience.or.kr) est produite par The Korea Institute of Science and Technology Information (KISTI). Celui-ci a beaucoup évolué depuis sa création en 1962 sous le nom de KORSTIC (Korea Center for Science and Technology Information).
Cet organisme met à disposition des Coréens la plateforme NDSL, qui propose environ 100 millions de documents de toutes natures et de toutes origines, tant au niveau des brevets non coréens, que de la littérature. Cela a donc peu d’intérêt pour des utilisateurs européens qui disposent de beaucoup d’autres sources plus faciles d’accès.
Il existe une autre base de données coréenne proposant des informations biomédicales gratuites.
Cette banque de données baptisée Korean Medical Article Database (KMbase) (http://en.medric.or.kr/)propose des références de 1 027 publications coréennes et de 4 892 publications non coréennes.
L’objectif des producteurs de cette base de donnée est de référencer le maximum de publications médicales d’origine coréenne. Ils attirent attire l’attention de leurs utilisateurs sur le fait qu’elle n’effectue aucune évaluation des articles dont elle fournit les références, renvoyant cette évaluation à ses utilisateurs.
Dans la recherche avancée, on peut combiner des étapes en les liant avec des opérateurs booléens et on peut aussi limiter les dates.
Auteur : François Libmann, Directeur de BASES Publications
Google News, ou Google Actualités dans sa version francophone, est l’un des services incontournables de Google pour les veilleurs et les professionnels de l’information. Il peut paraître plutôt simpliste a priori, mais les moyens d’y accéder et de le surveiller ne sont pas si limpides.
C’est pourquoi nous nous proposons de faire ici un point sur son contenu, son histoire, ses points d’accès et enfin les différents paramétrages, méthodes et outils à disposition pour surveiller une requête dans Google Actualités, qui comme on va le voir, peuvent faire considérablement varier les résultats.
En cette période particulière, l’actualité de la veille et de la recherche d’information est très différente du paysage habituel. Une majorité des actualités et informations traitent des ressources d’information autour du coronavirus, la gratuité temporaire de certains outils et sources d’information ainsi que du thème du télétravail.
MÉTHODOLOGIE • Faut-il proscrire les opérateurs booléens sur Google : nous avons testé, pp. 1-3
DATAVIZ • Enrichir ses livrables de veille grâce à la datavisualisation, p. 4-5
OUTIL DE VEILLE • Mediatree veut faire profiter les veilleurs et professionnels de l’information de sa technologie de veille audiovisuelle, p. 6-8
BASES DE DONNEES • Knoema et Statista, deux portails incontournables pour la recherche de statistiques, pp. 9-10
BASES DE DONNEES • De nouvelles ressources gratuites sur le COVID-19 p. 11
Pour les professionnels de l’information, les opérateurs booléens représentent la clé de voûte d’une stratégie de recherche et de veille réussie.
Si de plus en plus d’outils de recherche (notamment gratuits) font disparaître les opérateurs booléens et encore plus les opérateurs de recherche avancés (opérateurs de proximité, troncature, etc.), Google, lui, n’a pas choisi cette voie-là.
Le géant américain qui reste un outil incontournable pour la veille et la recherche d’information permet depuis ses débuts (en 1998 déjà !) d’utiliser les opérateurs booléens AND
(par défaut), OR
et NOT
(matérialisé sous la forme d’un tiret -
).
L’une des difficultés dans l’exploitation de données consiste à associer le bon visuel pour valoriser l’information qui en découle. Le choix d’un mauvais support visuel peut entraîner une confusion et une mauvaise interprétation des données.
Dans cet article, nous expliquerons comment construire sa datavisualisation qui peut devenir un précieux outil lorsqu’il s’agit de traduire un ensemble de données chiffrées en information intelligible et opérationnelle. Dans un contexte professionnel, qu’elle soit sous forme d’infographie ou représentation graphique PowerPoint par exemple, la datavisualisation vient en soutien aux arguments stratégiques et s’avère extrêmement efficace dans la communication interne de l’organisme.
Si la société Mediatree a été créée dès 2007 et se proclame « leader de la veille audiovisuelle en France », elle reste pourtant méconnue des professionnels de l’information. Grâce à des technologies de pointe brevetées, cette société française est en mesure de capter et d’indexer en temps réel le contenu de plus de 5 000 chaînes de télévision et radio dans le monde.
Ses premiers clients furent des sociétés de production audiovisuelle désireuses de retrouver des extraits sonores ou vidéo et de pouvoir les réutiliser au sein d’émissions ou de documentaires. Mais ce service a très vite aussi intéressé les responsables de communication au sein de services gouvernementaux, de sociétés de grandes marques ou d’associations, qui souhaitaient disposer d’un outil leur permettant de couvrir les médias audiovisuels pour y réaliser toutes sortes de recherches, de veilles d’image ou de réputation.