Nous avons déjà, à de multiples reprises, parlé des documents scientifiques d’origine chinoise référencés dans les banques de données et les serveurs d’origine chinoise ou occidentale.
Dès 2006, nous avions évoqué cette question notamment dans un article consacré au marché chinois de l’information à partir d’une conférence donnée au Salon Online de Londres (demander le BASES n°233 - décembre 2006 à Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.).
Depuis, les initiatives chinoises se sont multipliées et l’offre et l’accessibilité se sont élargies de plusieurs façons :
Lire aussi :
Retour de l’indexation de la littérature chinoise dans Chemical Abstracts
DBpia une base de données académique coréenne
Brevets et littérature scientifique: l'irrésistible développement de la Chine
Nous avons donc choisi pour cet article de faire un tour d’horizon des principales bases de données qui, à ce jour, nous paraissent apporter une réelle valeur ajoutée par rapport à une offre déjà très riche des serveurs occidentaux, dans le domaine de l’information scientifique et technique en général : articles, thèses, normes, etc.
Nous excluons de ce tour d’horizon les banques de données biomédicales qui représentent un monde à part, compte tenu des nombreuses informations disponibles concernant la médecine chinoise traditionnelle (TCM, « Traditional Chinese Medicine ») incluant des comparaisons avec la médecine occidentale.
Déjà abonné ? Je me connecte ici...
Dans le cadre d’une recherche d’informations, le premier réflexe pour identifier des sources est généralement de cibler des médias, des experts, voire des annuaires. Mais il existe une autre ressource utile pour fournir de l’information et à laquelle on pense moins : les listes de sources disponibles sur des tableurs en ligne comme Google Sheets ou Airtable et qui se multiplient.
La volonté de partager des listes de sources sur le Web a toujours existé, surtout avec l’avènement du Web 2.0. Mais le format ainsi que les outils de partage et d’hébergement de ces listes ont évolué. Il y a eu le temps des annuaires (qui sont finalement des sortes de listes), le temps des blogrolls sur les blogs, des outils de bookmarking, des FollowFriday et des listes sur Twitter, etc.
Aujourd’hui, outre Google Sheets, de nouveaux outils de création de bases de données ‘no-code’ et de tableurs en ligne ont vu le jour, dont le plus connu est Airtable (https://airtable.com/). Ces tableurs sont souvent partagés publiquement par des experts, consultants ou autres acteurs d’un secteur particulier, qui disposent en échange de la gratuité du service.
Ces listes plus ou moins exhaustives peuvent se révéler précieuses, car elles constituent un pré-tri de l’information opéré par une personne suffisamment intéressée et experte pour entreprendre ce travail de recherche et de structuration. Elles permettent donc d’aller au-delà pour dénicher des sources utiles, voire des pépites, ou même des idées de structuration de l’information.
Mais elles présentent un problème : la difficulté à les identifier. Souvent nées d’une initiative personnelle, elles sont :
On découvre donc souvent ces listes un peu au hasard de ses pérégrinations sur le Web. Nous nous proposons donc de présenter ici une démarche construite, avec une recherche structurée en ligne, pour éviter de passer à côté de ces pépites.
Déjà abonné ? Je me connecte ici...
Recherche législative française et européenne facilitée, augmentation de la visibilité des questions citoyennes…
Le début d’année 2023 a été riche pour l’information institutionnelle. Or, le suivi et l’analyse de l’activité des institutions publiques et de leurs représentants permettent d’anticiper l’évolution d’un cadre réglementaire et d’y déceler des opportunités. Mais, doté d’un jargon et d’un circuit de l’information propres, ce type de sources reste parfois difficile d’accès. Zoom sur les nouveautés à retenir et les nouveaux outils à découvrir !
Après les agrégateurs de sources ouvertes Pappers Entreprise, puis Pappers Justice, Pappers Politique met en avant l’information institutionnelle française et européenne, de l’élaboration à la promulgation d’une loi.
Voir notre article Une nouvelle fonctionnalité pour Pappers, BASES n° 409, décembre 2022
Lire aussi :
Bercy crée son propre annuaire des entreprises
Une nouvelle fonctionnalité pour Pappers
Sélection des sources d’information institutionnelles (françaises et internationales)
Pour cela, il utilise les données quotidiennes de l’Assemblée nationale, du Sénat et de Lex-Europa (site officiel de la législation européenne), à partir de juin 2017 pour la France et de janvier 2018 pour l’Europe :
Cinq filtres de recherche sont proposés :
La consultation de Pappers Politique est particulièrement bien conçue pour faciliter la compréhension des documents et de leur contexte législatif. Contrairement à une liste de liens non structurée, chaque document est présenté sous forme d’extrait surtitré et d’indicateurs. Sous chaque extrait, des tags cliquables précisent la nature du document (Question écrite, Question au gouvernement, Dossier législatif) ; l’institution et le député concernés.
Et chaque document est contextualisé par une frise chronologique de son évolution au sein des institutions.
Cette version bêta manque d’exhaustivité, mais, l’élargissement à la couverture européenne est très intéressant (d’autant qu’elle est gratuite), car elle n'existait pas sur ce type d’outils comme Légifrance, ou sur les plateformes de veille institutionnelle payantes comme Dixit (https://www.dixitplatform.com/) ou Follaw (https://www.follaw.sv/).
Déjà abonné ? Je me connecte ici...
L’actualité politique est un jeu de ping-pong. Elle est faite de prises de position, et en retrouver l’origine permet de couvrir ses rebonds avec précision et fiabilité. Mais qu’il s’agisse de débats, d’interviews ou de discours, la surveillance et la vérification des interventions publiques constituent une vraie difficulté technique pour les professionnels de l’information.
Premièrement, car ce type de contenu est en grande partie diffusé dans un format audiovisuel, alors que les méthodes et les outils des professionnels de la veille reposent surtout sur du texte. Et même quand ces discours, interviews et citations existent au format textuel (dans des articles de presse par exemple), ils restent très difficiles à identifier et il est nécessaire d’avoir recours à des requêtes longues et complexes pour explorer tout le champ lexical de la prise de parole. Pour savoir comment rechercher des déclarations au format textuel, on pourra se référer à l’article « Retrouver les déclarations d’une personnalité : sources et méthodes » BASES n° 341 - Octobre 2016 qui reste encore d’actualité pour ce qui est des méthodes proposées.
Deuxièmement, parce que ces sources audiovisuelles restent difficiles à intégrer dans un livrable de veille. Cette étape peut alors nécessiter une écoute longue et minutieuse, une transcription parfois coûteuse, quand il ne s’agit pas de faire soi-même un montage pour en supprimer des extraits… Et tout cela, pour en tirer une ou deux lignes de citations pertinentes, généralement, donc… au format écrit.
Retrouver des discours et déclarations de personnalités publiques issues de sources audiovisuelles représente donc un double défi !
Lire aussi :
Retrouver les déclarations d’une personnalité : sources et méthodes
Pour la veille audiovisuelle, il existe bien Mediatree (https://www.mediatree.fr/), acteur « historique » du secteur (Voir notre article « Mediatree veut faire profiter les veilleurs et professionnels de l’information de sa technologie de veille audiovisuelle », BASES n° 380, avril 2020) mais ses fonctionnalités de recherche se focalisent sur la recherche de mots-clés cités dans une vidéo et pas spécifiquement les discours de personnalités publiques. Et l’autre outil intéressant dont nous parlions en 2016, Storyzy (https://storyzy.com/), ne s’intéresse plus aux citations et s’oriente aujourd’hui vers l’OSINT et la lutte contre la désinformation.
Dans ce « désert », l’arrivée du moteur de recherche et d’analyse pluralisme.fr(https://www.pluralisme.fr/), qui suit automatiquement et en temps réel - ou presque - les prises de parole de 1 400 personnalités politiques dans des dizaines de radios et télévisions françaises est donc une excellente nouvelle pour les professionnels de l’information. Nous l’avons testé pour voir ce qu’il avait à nous offrir.
Déjà abonné ? Je me connecte ici...
Une citation est, dans un document donné, une référence à un autre document antérieur, traitant en général d’un sujet connexe. Les citations sont bien connues dans le domaine des articles scientifiques où leur nombre est souvent utilisé pour évaluer la qualité d’une publication.
Le développement du mouvement de la science ouverte (open access mais aussi open citations) donne un coup de projecteur aux citations et références, ainsi qu’à leur rôle dans le processus de recherche d’informations et de veille.
De nombreux outils s’emparent de ces données, désormais accessibles librement, pour proposer des fonctionnalités de recherche spécifiques et on voit également l’apparition de nombreux petits outils, souvent gratuits, qui se donnent pour mission d’explorer les réseaux de citations, offrant une autre manière de rechercher des documents pertinents et/ou d’identifier des experts.
On trouve aussi les citations dans les brevets. Et même si elles sont librement accessibles depuis longtemps, la recherche par les citations reste un champ trop peu exploré lors d’une recherche brevets.
Lire aussi :
Le brevet est-il un signal faible pour l'innovation ? (10/2022)
Savoir utiliser les publications défensives dans une stratégie brevet (05/2022)
Déterminer la valeur d’un brevet : des outils stratégiques pour l’entreprise (03/2022)
La recherche de citations et de références boostée par l’IA et les « open citations »
Nous allons voir dans cet article qu’elles offrent une large gamme de possibilités pour un public très divers : PME détentrice de brevets, désireuse de savoir qui empiète sur son territoire ; inventeur, souhaitant évaluer la nouveauté de son invention ; analyste financier, souhaitant évaluer la valeur d’un brevet ; historien des sciences et techniques mais aussi bien sûr le professionnel de l’information et veilleur ! Penchons-nous sur la multitude d’informations que l’on peut tirer de l’exploitation de ces citations.
Déjà abonné ? Je me connecte ici...
2023 sera-t-elle l’année où l’utilisation de l’intelligence artificielle (IA) se démocratise au sein de l’activité de veille ? En attendant de le confirmer, notre sélection dans l’actualité de la veille montre que l’IA s’intègre, doucement mais sûrement, dans nos outils quotidiens. Florilège.
L’outil de traduction automatique DeepL Translator, devenu incontournable pour les professionnels de l’information, étend son champ de compétences à la réécriture. Auréolé de son nouveau statut de Licorne, DeepL vient de sortir la version bêta de DeepL Write, un outil de rédaction par une Intelligence artificielle.
Lire aussi :
Son fonctionnement est le même que celui de DeepL Translator : il suffit de copier-coller un texte que l’on souhaite améliorer dans la fenêtre de gauche, pour voir apparaître la proposition de DeepL à droite. Plusieurs versions sont parfois suggérées, et c’est à l’auteur de choisir celle qu’il préfère.
DeepL Write n’a pas vocation à créer des textes, mais à améliorer des textes existants. On sort donc d’un contexte de consultation et de traduction d’un texte lu pour entrer dans un contexte de rédaction. Pour l’heure DeepL Write ne fonctionne qu’en anglais et en allemand. C’est donc un outil dont on profitera pour reformuler un email, une introduction, un commentaire, une traduction, mais surtout un livrable, écrits dans un anglais ou un allemand approximatifs.
Déjà abonné ? Je me connecte ici...
C’est une question qui revient régulièrement : retrouver la trace d’une personne décédée aux siècles précédents dans le but d’identifier dans quel cimetière elle a été enterrée, retrouver des informations pour comprendre les raisons de son décès, garder une trace d’un fait divers pour l’inclure et illustrer un dossier documentaire ou une biographie, etc.
Toutes ces demandes ont un point commun : elles nécessitent d’entrer dans le monde des archives et dans l’idéal même le monde des archives en ligne, ce qui évite de se déplacer.
On sort alors complètement des sources que l’on peut avoir l’habitude d’interroger sur le Web et ce type de requête demande une démarche spécifique.
Lire aussi :
Tous les outils pour rechercher dans les archives du Web (02/2022)
La recherche d’information appliquée aux personnes (04/2019)
Dans cet article, nous retraçons la méthode à suivre mais aussi les sources à connaître quand il s’agit de retrouver la trace de personnes ayant vécu avant l’arrivée d’Internet.
Nous prendrons comme exemple une demande qui nous avait été envoyée par un lecteur : trouver le lieu de sépulture de Victor-Napoléon Vuillerme-Dunand, un des marionnettistes les plus connus du 19e siècle, fidèle disciple du créateur du théâtre de Guignol à Lyon qui est né en 1810 à Turin et serait décédé le 4 mai 1876.
Ce sont donc les seules informations dont nous disposons à ce stade de l'investigation.
Déjà abonné ? Je me connecte ici...
Linkedin a une place de plus en plus importante pour les professionnels de la veille et les derniers déboires de Twitter ne font que renforcer sa place comme source d’information incontournable. D’où la nécessité de trouver des outils et méthodes pour l’inclure au mieux dans ses processus de veille.
Hélas, la plateforme de LinkedIn propose peu de fonctionnalités de recherche, encore moins de veille, et son API extrêmement restrictive limite considérablement le nombre d’outils qui pourraient permettre de rechercher, analyser ou encore récupérer des données issues de LinkedIn.
Dans ce contexte, le récent lancement de WhatsIn, une extension Chrome, qui permet d’analyser et d’évaluer de manière visuelle un profil LinkedIn constitue une vraie nouveauté et ouvre un éventail de possibilités jusqu’alors inaccessibles au veilleur. Nous l’avons testée pour vous.
Lire aussi :
Réussir à utiliser LinkedIn pour la veille et la recherche d’information (06/2022)
Le veilleur face au défi de la représentation des données (12/2022)
Quelles dataviz tout au long du process de veille ? (12/2022)
L’outil a été créé par François-Xavier Nion, le créateur de l’outil de veille Wabtch. On a donc ici un outil et par extension un créateur, qui, même s’il ne s’adresse pas uniquement au veilleur, comprend les problématiques spécifiques de la veille et les besoins d’informations qui en découlent.
Nous avions eu l’occasion de parler de Watch dans l’article « Wabtch, entre bookmarking et recommandation de contenus » (cf. NETSOURCES N°155, Novembre 2021)
L’outil existe en version freemium. Sa version payante est de 30 euros pour 100 profils mais on peut tester avec 10 crédits, puis 5 crédits gratuits par mois.
Cet outil va pouvoir jouer un rôle à différents niveaux en permettant notamment de :
Déjà abonné ? Je me connecte ici...
Depuis le rachat effectif de Twitter par Elon Musk en octobre dernier (après des mois de tergiversations et de retournements en tous genres), le volume d’information et d’articles publiés à propos de Twitter a été très important avec une grande diversité de thèmes abordés : changements au niveau de la politique, licenciements massifs, avis négatifs et positifs sur le rachat, prospective sur l’avenir de ce réseau social, nouvelles fonctionnalités ou disparition de fonctionnalités existantes, etc.
Mais avec l’annonce il y a quelques semaines du départ d’Elon Musk du poste de PDG, même s’il reste propriétaire de Twitter, le soufflé médiatique est rapidement retombé.
Maintenant que la situation se stabilise, il est temps de se pencher sur ce qui a changé chez Twitter au cours des derniers mois surtout en termes de services et de fonctionnalités. Car il y a eu de nombreux changements, souvent éclipsés par les nombreuses polémiques et ces changements viennent modifier certaines pratiques de veille et de recherche d’information que l’on pouvait avoir sur Twitter.
Ce dernier est quoi qu’on en dise toujours à ce jour le réseau social le plus important pour les professionnels de l’information, que ce soit en termes de contenus ou de fonctionnalités.
Elon Musk n’est pas connu pour proposer des transitions en douceur ni de changements progressifs et c’est exactement ce qu’il a fait avec les fonctionnalités et services de Twitter au cours des trois derniers mois. Il a ainsi supprimé pratiquement du jour au lendemain un certain nombre de fonctionnalités, dont certaines avaient un réel intérêt pour le professionnel.
Alors que ces dernières années, Twitter avait choisi de diversifier ses contenus au-delà des tweets classiques avec des espaces audio, un service de newsletter, etc., Elon Musk a pris le chemin inverse en se recentrant sur les tweets.
Déjà abonné ? Je me connecte ici...
Le ministère de l’Économie et des Finances a annoncé il y a quelques semaines l’arrivée d’un nouvel annuaire des entreprises, officiel. Ce dernier a été créé par Etalab, le département d’ouverture des données de la Direction Interministérielle du Numérique, et la Direction Générale des Entreprises.
Trois filtres de recherche sont proposés : la zone géographique, le nom du dirigeant et la situation administrative (état administratif/type de structure/labels et certificats/Domaine d’activité/Code NAF ou APE).
Ils permettent de retrouver les données publiques détenues par l’administration sur une entreprise, une association ou une administration.
Les conventions collectives ;
Cet annuaire est toutefois plus utile aux entreprises qu’au professionnel de l’information car il permet à celles-ci d’intégrer plus facilement leurs justificatifs dans une API afin de les rendre publics. Pour le veilleur, en revanche, cet annuaire n’a pas de valeur ajoutée en comparaison de Pappers, le moteur open data gratuit qui ne cesse de s’améliorer.