Les plus anciens de nos lecteurs ont certainement entendu parler de Madeleine Wolff-Terroine, l’ont rencontrée ou ont travaillé avec elle.
Elle vient de nous quitter à l’âge de 99 ans.
Personnalité marquante du monde de l’infodoc, elle a eu une carrière extrêmement riche tant en France (elle a été présidente de l’ADBS dans les années 70) qu’à l’étranger, en travaillant pour de nombreux organismes internationaux.
Elle a aussi écrit régulièrement dans BASES dans les années 90.
PANORAMA
• L’information sur le Web est éphémère : quel impact et quelles solutions pour la recherche d’information ?
COMPTE-RENDU DE CONFÉRENCE
• Internet Librarian International : le salon incontournable des professionnels de l’information anglophones
A LIRE
• Le professionnel de l’information peut-il se réinventer en entrepreneur ?
Déjà abonné ? Connectez-vous...
Quand on recherche de l’information sur le Web, on a souvent l’impression que tout ce qui a, un jour, été publié sur le Web ouvert doit pouvoir se retrouver d’une manière ou d’une autre, notamment en tirant parti des fonctionnalités avancées des moteurs de recherche comme Google. Or l’information sur le Web ouvert est bien plus éphémère qu’on ne pourrait le croire...
Dans la réalité, une très grande partie de ce qui a été publié sur le Web dans les années 1990 et 2000 n’existe plus en tant que tel. Les sites Web ont été refaits ou ont tout simplement disparu. Et de fait, bon nombre de ces contenus sont désormais inaccessibles par les moteurs de recherche classiques.
Et, comme nous le verrons par la suite, cette obsolescence rapide des contenus Web ne se limite pas uniquement à ce qui est ancien.
Comment faut-il donc appréhender une recherche d’antériorité sur le Web ? Quelles sont les meilleures méthodes pour retrouver de l’information ancienne via les moteurs classiques ? Comment faire quand l’information n’est plus accessible par ces mêmes moteurs ? Quelles sont aujourd’hui les initiatives d’archivage du Web en Europe et dans le Monde et comment en tirer parti pour la recherche d’information ?
Si les contenus publiés sur le Web ouvert ont l’immense avantage d’être accessibles gratuitement, leur durée de vie n’est malheureusement pas si longue et cela peut avoir un impact dans un contexte professionnel de recherche d’information.
Plusieurs études se sont intéressées à la durée de vie moyenne d’un site Web et d’une page Web et les résultats méritent d’être signalés.
Selon les différentes sources que nous avons pu consulter, la durée de vie moyenne d’un site Web se situe entre 2 et 5 ans.
Et quant à la durée moyenne d’une page Web, les chiffres varient d’une étude à l’autre mais toutes convergent vers une durée de vie plutôt courte :
Ainsi, même s’il est impossible de connaître précisément la durée de vie moyenne d’un site et d’une page Web, on peut en conclure aisément qu’elle est courte.
Sur un même sujet et une même requête, une recherche Web effectuée en 2018 produira des résultats différents d’une recherche effectuée en 2017, en 2016 et ainsi de suite...
Cependant, tous les contenus publiés sur le Web ouvert ne sont pas impactés de la même manière. Car pour les informations structurées, même si l’information disparaît de son site d’origine, il existe souvent des sources, outils et bases de données gratuits ou payants qui conservent une grande antériorité.
Pour la presse en ligne par exemple, on peut retrouver aisément des articles anciens en se tournant vers les bases de données et agrégateurs de presse. Les bases de données sont aussi d’un grand secours pour les données financières ou les statistiques anciennes.
Et pour la production scientifique et les brevets en libre accès, il existe des bases de données et serveurs scientifiques et brevets qui proposent une très grande antériorité.
Mais pour les informations publiées sur d’autres types de sites et pages Web, on se retrouve beaucoup plus démuni...
On pensera notamment aux :
Et quand ces sites ferment leurs portes ou sont tout simplement refondus, les contenus mais également les documents qui y sont hébergés et qui sont souvent de grandes valeurs disparaissent parfois à tout jamais du Web.
On pensera ainsi aux rapports techniques, notes, évaluations, guides, newsletters, protocoles, etc. qui s’apparentent à ce qu’on appelle la « littérature grise »1.
Quand on effectue une recherche sur les moteurs Web, il faut donc avoir conscience que certains résultats Web pertinents n’existent peut-être déjà plus ou n’apparaissent pas ou plus dans les résultats proposés. On rappellera en effet que Google propose de moins en moins de résultats visualisables (aux alentours de 200/300 seulement maximum).
Quelle méthode adopter pour retrouver ces contenus dont on ne soupçonne même pas toujours l’existence ?
Déjà abonné ? Connectez-vous...
Nous avons cette année pu nous rendre au salon Internet Librarian International qui avait lieu à Londres les 16 et 17 octobre derniers et qui fêtait cette année ses 20 ans. Cette conférence de deux jours précédée d’une journée de Workshops se définit comme « The library innovation conference » et vise tous les professionnels de l’information dans leur ensemble qu’ils travaillent dans des bibliothèques publiques, universitaires ou des centres de documentation ou services de veille publics ou d’entreprise.
Pour beaucoup de professionnels qui avaient l’habitude de se rendre au salon Online et dont la dernière édition date de 2013, ce salon est devenu le rendez-vous incontournable de la profession, du moins en Europe. Nous avons ainsi pu y croiser des professionnels du monde entier, des anglais et américains surtout mais également de nombreux représentants des pays du nord de l’Europe et quelques personnes venues d’Asie.
Le modèle de la conférence est assez loin de ce qu’on a l’habitude de voir sur des salons comme I-expo par exemple. Ici, il n’est pas véritablement question d’exposants - seuls quelques sponsors disposaient d’une table dans le hall d’entrée avec quelques prospectus - mais de conférences plénières (une trentaine) réparties dans trois parcours thématiques. L’accès à l’ensemble de l’événement est entièrement payant.
La veille de l’ouverture se tenaient également quelques Workshops payants dédiés au Marketing des bibliothèques et à la recherche d’information.
Et parallèlement à cet événement, avait lieu la même conférence aux Etats-Unis sous le nom de « Internet Librarian », cette dernière s’étalant sur 3 jours.
Si globalement, on constatera que le public comme les sujets de conférences étaient tout de même plus orientés bibliothèques universitaires et publiques, il y avait quelques Workshops et quelques interventions particulièrement intéressantes dédiées à la recherche d’information et la veille. Nous reviendrons dans cet article sur tout ce qui concerne les dernières grandes tendances, innovations et l’avenir du métier.
Comme dans toutes les conférences et salons du domaine qui ont eu lieu en 2018, impossible d’échapper à l’Intelligence Artificielle et son impact sur le métier et les outils.
On retrouvera donc cette thématique en filigrane de plusieurs interventions.
Déjà abonné ? Connectez-vous...
Anne-Marie Libmann, directrice opérationnelle de FLA Consultants, et précédemment co-présidente de l'ADBS, a lu le nouveau livre de Jean-Philippe Accart, écrit en collaboration avec Clotilde Vaissaire-Agard : « Bibliothécaires, documentalistes, tous entrepreneurs ?
Comment un professionnel de l’information, héritier de décennies de croyances dans le bien-fondé intrinsèque de la pratique documentaire, peut-il se construire une nouvelle carrière, voire se reconstruire après le passage de Google et la fragilisation des métiers de « l’info-doc »?
Comment, sur ce terrain déconstruit par Internet et une information devenue (très) globalement accessible, développer un nouveau modèle, de nouvelles pratiques, un nouveau système de croyances et, osons le terme, un « business » ?
C’est dans le fond le problème, dramatique, que pose ce livre. Un dilemme semble d'ailleurs d’emblée s’inscrire dans le point d’interrogation même du titre. Un dilemme entre la volonté, et même la nécessité, de regarder l’avenir avec courage et la difficulté à sortir d’un passé glorieux, intellectuel, désormais intellectualisé et fantasmé.
Il est pour toute personne difficile, parfois douloureux, de devoir faire le choix d’un nouveau chemin professionnel. A la lecture de ce livre on peut se demander si ce n’est pas encore plus difficile pour un professionnel de l’information, documentaliste, bibliothécaire, archiviste, dont on sent qu’il s’est retrouvé véritablement dépossédé d’un métier et des valeurs nobles qu’il portait. L’auteur nous rappelle à juste titre : « une histoire riche remontant aux plus anciennes civilisations qui avaient pour souci de consigner les savoirs sous différentes formes et supports ». Un héritage lourd à porter pour certains d’entre nous…
Déjà abonné ? Connectez-vous...
BREVETS
• Intelligence artificielle et propriété intellectuelle
EN BREF
• Une actualité des moteurs très chargée
MÉTHODOLOGIE
• Comment retrouver sur le Web des articles de presse écrite au format original ?
Déjà abonné ? Connectez-vous...
Depuis plus d’un an maintenant, l’intelligence artificielle (IA) est au cœur de l’actualité et des discussions professionnelles. Mais s’il est beaucoup question d’IA et de machine learning, appliqués aux moteurs de recherche grand public, aux outils de traduction ou encore aux outils de veille, elle se fait plus discrète pour tout ce qui a trait à l’information scientifique et technique et les brevets. Et pourtant, elle y est bien présente et mérite qu’on s’y intéresse.
Lors de la dernière réunion annuelle du CFIB, le Club Francophone de l’Information Brevet, elle a d’ailleurs été au centre des discussions. L’une des présentations consacrée à l’intelligence artificielle et la propriété intellectuelle a ensuite fait l’objet d’un article très intéressant dans la lettre du CFIB.
Rappelons que le CFIB (Club Francophone de l’Information Brevet) réunit environ 160 membres tous pratiquant effectivement des recherches d’information brevet, à l’exception donc des vendeurs de solutions (serveurs, logiciels, etc.), afin de laisser la parole libre. Les personnes intéressées par une adhésion doivent la soumettre au bureau de l’association (https://lecfib.net) qui valident ou non ces demandes.
Le marché de l’IA devrait passer de 8 milliards $ en 2016 à plus de 47 milliards $ en 2020. Les investissements dans l’IA ont augmenté de plus de 300% en 2017 par rapport à l’année précédente. Des machines intelligentes, des algorithmes IA envahissent notre quotidien.
Aussi, la réglementation des activités liées à l’intelligence artificielle est devenue un enjeu majeur de politique publique. Les juristes, les décideurs mais également les entreprises doivent maîtriser les principaux défis juridiques de l’IA pour être bien positionnés dans cette révolution, parce que les effets perturbateurs de l’IA se feront sentir très vite sur les modèles d’affaires traditionnels et en particulier sur la propriété intellectuelle.
En effet, l’IA défie les notions juridiques les plus traditionnelles en matière de propriété intellectuelle, telles que la «copie», l’«originalité», le «créateur», l’«auteur» ou l’«inventivité».
Il n’est question ici que d’exposer les problèmes qui se posent, pas d’apporter des réponses à des questions qui font encore débat chez les juristes eux-mêmes.
Un robot peut faire l’objet de plusieurs protections : droit d’auteur, droit de modèle, brevet… Mais qu’en est-il de l’oeuvre du robot lui-même ?
Vis-à-vis du droit d’auteur, le robot a-t-il une personnalité et fait-il des choix libres et créatifs ? Vis-à-vis des bases de données, le robot est-il le producteur, en prend-il l’initiative, assume-t-il les risques de l’investissement ? Vis-à-vis du droit des brevets, que veut dire l’inventivité d’une solution technique quand elle est apportée par un robot ?
Voilà quelques-unes des questions qui se posent.
Déjà abonné ? Connectez-vous...
Pas toujours facile de suivre toutes les évolutions de Google quand on sait par exemple qu’il modifie son algorithme plus de 1 600 fois par an. Heureusement, toutes ces modifications ne revêtent pas la même importance et toutes n’ont pas d’impact sur la recherche d’information professionnelle.
Toujours est-il qu’en ce mois de septembre, les nouveautés sont nombreuses et méritent d’être signalées.
On commencera donc par le lancement d’un nouveau moteur dédié aux données publiques appelé « Google Dataset Search » accessible à l’adresse suivante : https://toolbox.google.com/datasetsearch.
On rappellera qu’un dataset ou jeu de données en français est « un ensemble de données où chaque valeur est associée à une variable et un commentaire. Ces données sont stockées dans des tables qui contiennent des colonnes et des lignes comme dans un tableau Excel. Ainsi, une base de données, ou database, est constituée de plusieurs jeux de données, structurés afin d’être exploitables par un programme informatique. » (source : www.matlo.com ).
Depuis le développement de l’Open Data, de nombreux organismes publics mettent à disposition des jeux de données librement accessibles tels que les horaires ou la ponctualité des trains, l’emplacement des lampadaires dans une ville, le Cadastre, la liste des organismes de formation, etc. Et du côté de l’information scientifique et technique, on voit également se développer la mise à disposition des données de la recherche par les chercheurs sous la forme de jeux de données accessibles sur le Web.
Les premiers retours d’experts et blogueurs sur le produit sont plutôt mitigés et pointent la faiblesse et l’absence de fonctionnalités de recherche dignes de ce nom mais également le fait que le moteur est très loin de donner accès à l’ensemble des jeux de données éparpillés sur le Web.
Voir aussi notre dossier spécial : Datasets : un nouvel enjeu pour la recherche d’information et la veille ?
Concernant le moteur Web, on a ainsi pu apprendre que :
Google a également décidé de revoir l’interface et les fonctionnalités de Google Images en proposant :
Comme Google, il a annoncé des améliorations à son moteur d’images Bing Visual Search :
Seul problème, on ne sait pas encore si cela sera accessible à tout le monde où bien uniquement aux internautes américains.
Enfin, Microsoft a annoncé vouloir unifier ses outils de recherche sur ses différents produits et services.
Microsoft Search deviendra l’outil de recherche principal pour Windows, Office et Bing. Les utilisateurs pourront donc obtenir des résultats Web (venant de Bing) mais également des résultats internes et locaux liés aux applications et services de Microsoft auxquels ils ont accès. Et comme on sait que la veille et la recherche d’information nécessitent bien souvent de combiner de l’information externe et interne, on suivra donc ces évolutions avec intérêt même si elle ne sont limitées qu’aux produits Microsoft...
La recherche d’articles de presse est un exercice classique pour les professionnels de l’information.
Pour autant, s’il existe de multiples outils et méthodes pour retrouver en ligne le contenu textuel d’articles parus dans des revues et journaux papier, cela s’avère nettement plus compliqué lorsque l’on souhaite retrouver les articles avec leur mise en page originale.
Bien souvent, lorsque l’on effectue des recherches dans la presse, seul le fond et le contenu ont de l’importance. La forme n’est que très secondaire.
Cependant, il existe des cas où il est préférable et parfois même requis de fournir l’article dans son format original :
Déjà abonné ? Connectez-vous...
CAS PRATIQUE
• Recherche d’information académique : enfin une comparaison concrète entre gratuit et payant
IC-SDV 2018
• Le premier IC-SDV à Nice
Déjà abonné ? Connectez-vous...