Quelles perspectives pour le veilleur à l'heure de pratiques prédatrices de son temps et de son discernement ?

CORINNE DUPIN, Consultante du cabinet Ourouk
Bases no
435
publié en
2025.04
478
Acheter ce no
Tags
IA | professionnel de l'information
Quelles perspectives pour le veilleur à l'heure de ... Image 1

L’avenir du métier de veilleur est assuré… pour peu qu’il joue à plein sa fonction d’éclaireur, garant du pluralisme et apôtre du temps long.

Récemment invitée à m’exprimer sur l’avenir du métier de veilleur devant une communauté de praticiens de la veille, je me suis souvenue d’avoir été sollicitée sur le même sujet il y a une dizaine d’années (1). Il faut croire que tous les 10 ans environ, une évolution technologique vient perturber le quotidien professionnel et la sérénité des veilleurs.

A l’époque, les préoccupations portaient sur les flux RSS (en passe de submerger le quotidien du veilleur et de l’aliéner au temps réel), la démocratisation de la curation (qui allait de pair avec la quête d’autonomie des usagers/clients), le règne de la conversation à l’heure des réseaux sociaux. Aujourd’hui, l’inquiétude est plutôt le fait de l’irruption des IA génératives avec l’avènement soudain, horizontal et gratuit, de ChatGPT.

Il y a 10 ans, je considérais déjà l’activité de veille comme une activité en mutation, qui s’orientait résolument vers l’accompagnement, le conseil, le transfert méthodologique. Il était de la même façon question de « destruction créatrice » (applicable aux usages comme aux métiers) promise par le numérique. Les réseaux sociaux sont toujours là, prêts sans désemparer à nous soumettre, si nous n’y prenons garde, à un régime d’alertes permanentes et à une réactivité maximale. La donne actuelle est complétée par la multiplication des contenus trompeurs (fake news, faux journaux scientifiques, revues et congrès prédateurs (2)…). Des conférences récentes, notamment à l’occasion de Documation, s’interrogent sur l’avenir des métiers de l’information, de l’intelligence économique et de la connaissance face à ces nouveaux défis et invitent à leur « réinvention » (quand la plupart des intervenants à la tribune ont préféré minimiser les efforts à produire en ne parlant que d’adaptation…).

Lire la suite...

Préprints biomédicaux : bioRxiv et medRxiv intègrent openRxiv, une structure de gouvernance indépendante

François LIBMANN
Bases no
435
publié en
2025.04
377
Acheter ce no
Tags
science ouverte | open access | littérature scientifique | ist | information scientifique et technique | biomédical | abstracts
Préprints biomédicaux : bioRxiv et medRxiv intègrent ... Image 1

L’écosystème des préprints dans le domaine biomédical connaît une évolution majeure avec la création d’openRxiv, une structure indépendante à but non lucratif destinée à piloter et développer les serveurs de préprints bioRxiv et medRxiv. 

Ces deux plateformes publient les articles scientifiques qui leur sont soumis dès que leurs auteurs les jugent comme terminés, sans attendre une peer review pour décider de la publication dans le journal auquel ils auraient été envoyés. En effet, les délais avant décision peuvent atteindre plusieurs mois et parfois dépasser un an.

● bioRxiv a été créé en 2013 et propose aujourd’hui environ 274 000 documents écrits par 970 000 auteurs, et 4 000 nouveaux documents sont ajoutés chaque mois.

● Pour sa part, medRxiv a été créé en 2019 et propose aujourd’hui près de 66 000 documents écrits par plus de 380 000 auteurs, et 1 000 nou­veaux documents sont ajoutés chaque mois.

Ces deux plateformes ont joué un rôle important pendant la pandémie de COVID 19 au cours de laquelle la diffusion rapide de l’information scien­tifique a été cruciale.

Lire la suite...

Crise de reproductibilité : quand la science peine à confirmer ses propres résultats

François LIBMANN
Bases no
435
publié en
2025.04
432
Acheter ce no
Tags
protocole | méthodologie | ist | information scientifique et technique
Crise de reproductibilité : quand la science peine à ... Image 1

Un constat alarmant sur les méthodes de recherche

Un article publié en décembre 2021 a provoqué une onde de choc dans la communauté scientifique (1). Consul­té plus de 20 400 fois, téléchargé près de 2 000 fois et ayant fait l’objet de 141 citations à ce jour, cette étude révèle un problème fondamental dans la recherche scientifique.

Les chercheurs ont tenté de reproduire 193 expériences décrites dans 53 articles à fort impact, dont les protocoles et plans d’analyse avaient été validés par des pairs avant leur publication. Le résultat est préoccupant : seules 50 expériences (26 %) issues de 23 articles (43 %) ont pu être reproduites. Plus troublant encore, 32 % des auteurs contactés ont refusé de répondre ou sont restés silencieux face aux demandes de précisions.

Lire la suite...

Comment échapper aux conférences prédatrices dans le domaine scientifique

FRANÇOIS LIBMANN
Bases no
435
publié en
2025.04
513
Acheter ce no
Tags
Reddit | information scientifique et technique | ist | conférences salons | agenda
Comment échapper aux conférences prédatrices dans le ... Image 1

Les conférences sont un des vecteurs essentiels de diffusion de l’information scientifique et académique. Ce canal présente un intérêt particulier, car il est fréquent que des conférences soient le cadre de la divulgation de nouvelles théories ou de résultats expérimentaux récents.

Si l’on fait déjà partie d’un milieu scientifique bien défini, il y a toutes les chances que l’on soit informé personnellement des prochaines conférences et/ou de les voir signalées dans les publications spécialisées de ce domaine.

Mais pour les personnes qui ne sont pas dans ce cas de figure, qu’elles s’intéressent à un domaine moins familier ou qu’elles soient en début de carrière, se pose la question de l’identification de conférences potentiellement intéressantes.

C’est là que cela se complique.

Lire la suite...

IA Générative : état des lieux d’une course effrénée

ULYSSE RAJIM
Netsources no
175
publié en
2025.04
767
Acheter ce no
Tags
recherche Web | IA
IA Générative : état des lieux d’une course effrénée Image 1

L’intelligence artificielle générative évolue à une vitesse vertigineuse, rendant la prospective à long terme particulièrement ardue. Pourtant, une convergence de signaux faibles récents - avancées techniques, annonces des laboratoires d’IA, avis d’experts - suggère une nouvelle phase d’accélération. Une course mondiale s’est engagée entre les principaux acteurs, chacun cherchant à définir la prochaine frontière de l’IA.

Cet article propose un état des lieux de cette compétition intense, des avancées technologiques attendues dans les prochains mois, et explore leurs implications immédiates pour les professionnels de l’information.

Lire la suite...

Deep Research : l’âge de raison des IA ?

VÉRONIQUE MESGUICH
Netsources no
175
publié en
2025.04
735
Acheter ce no
Tags
IA
Deep Research : l’âge de raison des IA ? Image 1

Depuis le début de l’année, les géants du numérique ont rivalisé d’annonces autour du Deep Research, ces nouveaux outils d’IA destinés à automatiser des recherches complexes sur le web. OpenAI, Google Gemini, Claude, DeepSeek, Perplexity et d’autres encore proposent désormais, parfois uniquement en version payante, de nouveaux modèles d’IA agentiques capables de mener en plusieurs étapes des recherches approfondies.

Dans le prochain numéro de Netsources, le sujet du Deep Research sera décliné sous un angle pratique.

Ces agents vont en effet composer le processus de recherche en plusieurs tâches automatisées : recherche de documents (pages HTML, images, documents PDF…), extraction et analyse des données pertinentes, puis production d’un rapport synthétique structuré mentionnant les sources utilisées.

Pour autant, ces agents automatisés sont-ils capables de détecter les sources les plus pertinentes, et d’en extraire les éléments utiles ? Quel sera l’impact de ces nouveaux agents sur les pratiques de recherches ? La profondeur d’analyse annoncée est-elle réelle ? Quelles sont leurs limites actuelles ? Commençons par nous pencher sur les modèles de raisonnement développés récemment, et qui sous-tendent ces nouveaux outils.

Lire la suite...

Google, moteur de transformation ? une évaluation de l’IA dans les produits numériques de Google

RYAN MULHOLAND
Netsources no
175
publié en
2025.04
589
Acheter ce no
Tags
recherche Web | IA
Google, moteur de transformation ? une évaluation de l’IA ... Image 1

Ryan MULHOLAND est Research Librarian à l’Université Wesleyan du Tennessee aux États-Unis. L’article de Ryan a été traduit par notre équipe.Précisons que la fonctionnalité des Overviews décrite dans cet article n'est pas encore présente en France, même si elle l'est déjà dans certains pays d'Europe.

À nouvelle année, nouvelle série d’avancées dans le monde de l’intelligence artificielle. De la nouvelle capacité de génération d’images de ChatGPT avec la folie autour du style « Studio Ghibli », jusqu’à Grok qui déploie enfin sa propre application en version bêta, 2025 suscite déjà beaucoup d’effervescence autour de ces outils émergents.

Parmi les acteurs en lice, Google se démarque en intégrant des fonctionnalités d’assistance par IA à plusieurs de ses services gratuits, notamment Docs, Sheets, Slides, Maps, Search, Chrome et bien d’autres.

L’effervescence ne s’arrête pas là, car Google a déployé sa fonctionnalité Overviews (littéralement : « vue d’ensemble ») - aux États-Unis - le 14 mai de l’année dernière, puis Deep Research (« Recherche approfondie ») avec Gemini pour tous les utilisateurs le 13 mars de cette année. La première traite les requêtes complexes et tente de les résumer de manière facilement assimilable, tandis que la seconde permet aux utilisateurs de la version gratuite de générer trois rapports de recherche gratuits par jour pour une exploration plus poussée des sujets.

Lire la suite...

Socrate se fait prompter par Glaucon (article en open access)

CHRISTIAN VIGNE
Netsources no
175
publié en
2025.04
613
Acheter ce no
Socrate se fait prompter par Glaucon (article en open ... Image 1
Chroniques amusées sur l’intelligence artificielle par Christian Vigne

Christian Vigne, anciennement Product Manager chez Google, s’amuse dans ses chroniques à explorer l’impact de l’IA sur nos vies. Il est amené à conseiller les entreprises sur leurs stratégies IA (cadrage, priorisation, formation, conduite du changement).

Qui se souvient de ses cours de philo de terminale ? Moiiiiii. Et en particulier de l’étude de La République de Platon. Vous souvenez-vous de Glaucon and friends, aka « les disciples » qui donnent la réplique à Socrate ? À travers les nombreux échanges qu’ils ont avec Socrate et ainsi le dialogue qui en naît, ils font advenir une réflexion, un cheminement vers une vérité. Attention les philosophes, je tente un truc au risque de vous froisser : les questions de Glaucon pourraient être à Socrate ce que nos requêtes sont à ChatGPT : des prompts. 

Lire la suite...

Une nouvelle forme de peer review se développe rapidement

FRANÇOIS LIBMANN
Bases no
434
publié en
2025.03
1457
Acheter ce no
Tags
abstracts | archives ouvertes | biomédical | information scientifique et technique | ist | littérature scientifique | open access | références bibliographiques | science ouverte
Une nouvelle forme de peer review se développe rapidement Image 1

Le peer review d’un article académique est, traditionnellement, une revue par les pairs avant publication. Il reste le fondement du fonctionnement de la majorité des éditeurs, qu’ils publient selon le schéma traditionnel dans lequel le lecteur paie en s’abonnant, ou qu’ils publient en open access, schéma dans lequel l’auteur, son institution ou un sponsor règle les frais (Article processing charges, soit APC).

Les limites du peer review traditionnel

Si cette procédure est supposée garantir aux articles publiés un haut niveau de qualité, elle présente l’inconvénient majeur d’imposer un délai parfois long entre le dépôt du manuscrit et la publication effective de l’article.

Cela devient de moins en moins supportable alors même que les développe­ments de la recherche connaissent une accélération significative comme on a pu le constater, en particulier, lors de la pandémie du COVID-19.

S’ajoute la difficulté croissante à trouver des reviewers (en règle générale bénévoles) disponibles, conséquence à la fois de l’inflation du nombre de publications et de la pression que subissent les chercheurs pour publier toujours plus, ce qui leur laisse moins de temps pour se consacrer aux reviews.

Et enfin, rien ne garantit que deux ou trois reviewers (au mieux) auront pu détecter toutes les failles potentielles d’un article. En effet, ces failles pourraient n’apparaître que lorsqu’un nombre plus important de scientifiques aura pu en prendre connaissance.

Lire la suite...

Avant que l’IA ne l’enterre, quelques mots sur la classification internationale des brevets

PHILIPPE BORNE
Bases no
434
publié en
2025.03
1184
Acheter ce no
Tags
brevets | IA
Avant que l’IA ne l’enterre, quelques mots sur la ... Image 1

L’arrangement de Strasbourg, cela vous dit quelque chose ? On pourrait imaginer un quizz du type : c’est (1) le traité par lequel Louis XIV a réuni Strasbourg à la France le 30 septembre 1681 (2) un projet d’urbanisme de Catherine Trautmann lorsqu’elle était maire de Strasbourg (3) le texte qui a établi la classification internationale des brevets en 1971. Évidemment c’est la troisième réponse qui est la bonne. À l’heure où l’environnement médiatique est saturé par l’IA, nous allons, sans trop rentrer dans des détails théoriques, montrer par un simple exemple que cet outil de recherche conserve son intérêt, et qu’il reste même pour l’instant plus complémentaire qu’antagoniste avec les techniques basées sur l’IA. Le titre de cet article était donc seulement provocateur.

Un bref rappel

La Classification Internationale des Brevets (abrégé CIB) ou, en anglais, International Patent Classification (IPC) a été mise en place pour répondre au défi de rechercher des documents au sein d’une masse croissante de brevets, dans un contexte caractérisé par le multilinguisme, et une syntaxe, qui outre les problématiques habituelles de synonymie, peut être très déconcertante : en « langue brevet », un ballon peut être un « dispositif sphérique de loisir », et une bouteille un « contenant pour liquide ». Chercher par des mots-clés se heurte donc vite à certaines limites.

Lire la suite...

IA : Google, xAI et Anthropic dévoilent chacun le modèle le plus intelligent du moment

ANNE-MARIE LIBMANN
Bases no
434
publié en
2025.03
1108
Acheter ce no
Tags
IA
IA : Google, xAI et Anthropic dévoilent chacun le modèle le ... Image 1

Google : des mises à jour majeures pour ses modèles Gemini, Gemma, sans oublier Gemini Live

Il est difficile de suivre ce qui se passe dans la Galaxie IA Google, tant les annonces de fonctionnalités et projets sont nombreuses.

La stratégie de la division IA Google DeepMind s’articule autour de deux modèles : Gemini et Gemma (hors développements spécifiques image et vidéo). Gemini est un modèle ultra puissant, mais fermé, utilisé à la fois pour les services grand public tels que le Search et pour les applications professionnelles ; à l’opposé, Gemma est un système beaucoup moins gourmand en ressources, en open-source, conçu pour la communauté des développeurs.

Lire la suite...

Pour la première fois, un article écrit par une IA franchit avec succès l'étape de l'évaluation par les pairs (« peer review »)

1304
Pour la première fois, un article écrit par une IA franchit ... Image 1

SAKANA AI, une start up japonaise fondée par deux anciens chercheurs de Google,  a développé l’outil AI scientist est capable d’écrire des articles de recherche d’une qualité suffisante pour être acceptée par une revue par les pairs (peer review).

Certes, sur les trois articles qui avaient été soumis, un seul a obtenu une évaluation suffisante. Mais cela est considéré comme un grand succès, car, d’après la société, c’est la première fois que cela arrive. Les chercheurs ont l’honnêteté de préciser que le jury auquel avaient été présentés les trois articles parmi 43 savait que certains articles pouvaient avoir été écrits par une IA.

Lire aussi : Une nouvelle forme de Peer Review se développe rapidement

Ces trois articles ont été générés de bout en bout par l'IA, sans aucune intervention humaine. L'IA Scientist-v2 a développé une hypothèse scientifique, conçu des expériences pour la valider, rédigé et perfectionné le code pour les exécuter, analysé les données et les a présentées sous forme de chiffres. Elle a également rédigé l'ensemble du manuscrit scientifique, du titre à la référence finale, en incluant la mise en place des figures et l'intégralité du formatage.

L’outil AI Scientist a été entrainé dans trois sous-domaines du « machine learning ». 

Les chercheurs de SAKANA AI ont  fusionné différents modèles de fondation plutôt que de partir de zéro et la nouveauté réside dans l’algorithme créé, qui s’inspire de la nature,  pour automatiser le processus.

On peut sans trop de risque faire l’hypothèse que ce premier succès risque de générer de profonds changements dans le monde de la publication scientifique.

The AI Scientist Generates its First Peer-Reviewed Scientific Publication

The AI Scientist: Towards Fully Automated Open-Ended Scientific Discovery, LIU et al 2024

Quand l’IA invisibilise les sources : vers une ère sans données de référence ?

ANNE-MARIE LIBMANN
Netsources no
174
publié en
2025.02
1580
Acheter ce no
Tags
IA | professionnel de l'information
Quand l’IA invisibilise les sources : vers une ère sans ... Image 1

Deux ans après l’irruption fulgurante de l’IA générative dans nos vies, peut-on craindre une réécriture ou un effacement progressif de nos savoirs fondamentaux ?

Le paysage est contrasté. D’un côté, des avancées technologiques spectaculaires - notamment en santé ou en traduction automatique. De l’autre, une remise en question profonde de nos méthodes traditionnelles d’accès à la connaissance, d’analyse critique et de validation. À la clé, un risque réel : perdre pied dans un écosystème informationnel où la traçabilité devient optionnelle.

Le salon I-Expo/Documation, qui vient de tenir sa session annuelle, offrait un reflet saisissant de cette dualité. L’affluence remarquable aux conférences centrées sur l’IA témoignait d’un intérêt évident et d’une volonté de comprendre le phénomène dans son ensemble. Mais elle allait de pair avec une inquiétude et une prise de conscience : la nécessité d’encadrer ces outils et de préserver nos repères humains ainsi que l’accès à une information sourcée, fiable et compréhensible.

Particulièrement révélateurs à cet égard étaient les discours des éditeurs de logiciels de veille. D’un côté, ils valorisaient l’intégration des fonctionnalités d’IAG dans leurs plateformes, notamment pour la traduction, le résumé, l’analyse, avec même parfois un package de prompt engineering pour faciliter les interactions du veilleur avec le modèle d’IA. Parallèlement, ils réaffirmaient leur engagement à maintenir le rôle primordial des experts et de l’intelligence humaine dans l’analyse stratégique au service de la prise de décision, et mettaient en garde contre la « boîte noire » de l’IAG.

Lire la suite...

Du SEO au GEO : quelle visibilité pour les contenus web ?

VÉRONIQUE MESGUICH
Netsources no
174
publié en
2025.02
1416
Acheter ce no
Du SEO au GEO : quelle visibilité pour les contenus web ? Image 1

Le SEO (Search Engine Optimisation) participe à l’accès à la connaissance, en influençant directement la manière dont l’information est indexée, trouvée, hiérarchisée et diffusée sur le web.

Cependant, à l’heure où les robots conversationnels sont de plus en plus capables d’effectuer des recherches et synthèses de pages web, les créateurs de contenus web se voient confrontés à la nécessité de réévaluer leurs stratégies de référencement : il s’agit en effet de rendre les contenus visibles dans ce nouvel environnement aussi mouvant que concurrentiel.

Les professionnels de l’information (au sens large du terme) sont également concernés, et doivent adapter leurs stratégies de recherche à cette période de transition où les critères de visibilité des contenus sur le web se complexifient.

Ce bouleversement pose de nombreuses questions : comment les sites web peuvent-ils maintenir, voire améliorer leur visibilité lorsque les internautes ne recherchent plus uniquement via les moteurs classiques comme Google ou Bing, mais interagissent avec des IA conversationnelles telles que ChatGPT, Mistral ou DeepSeek ? Comment optimiser le contenu pour être « consulté » et relayé par des chatbots qui se comportent de plus en plus comme des agents autonomes ?

L’avenir du SEO (Search Engine Optimization, ou référencement naturel) se résume souvent à la chronique d’une mort annoncée, et ce, depuis plusieurs années. Et pourtant, la pratique du SEO reste indispensable, pour optimiser la visibilité des contenus, non seulement via les résultats du moteur Google, mais aussi dans un environnement multiplateforme incluant notamment des réseaux comme TikTok.
Ce contexte dynamique nous invite à explorer l’impact des IA génératives sur les stratégies SEO et à découvrir l’émergence d’une nouvelle tendance : le GEO ou Generative Engine Optimisation.
Lire la suite...

Pourquoi utiliser Mistral et n’intéresse-t-il que les francophones ?

ULYSSE RAJIM
Netsources no
174
publié en
2025.02
1442
Acheter ce no
Pourquoi utiliser Mistral et n’intéresse-t-il que les ... Image 1

Depuis son lancement officiel fin 2023, Mistral AI s’est imposé comme l’un des acteurs incontournables de l’intelligence artificielle générative en Europe. Fondée par trois anciens chercheurs de Meta et de Google DeepMind, cette startup française a rapidement levé plus de 600 millions d’euros, atteignant une valorisation de 6 milliards d’euros en moins d’un an d’existence.

Si Mistral AI est souvent présentée comme le champion français de l’IA, sa stratégie et ses ambitions dépassent largement les frontières hexagonales. Dans cet article, nous examinerons le positionnement de Mistral face aux géants américains, nous analyserons les fonctionnalités phares de son application Le Chat, et nous tenterons de comprendre l’attrait de ses modèles au-delà des utilisateurs francophones.

Une réponse européenne aux géants américains ?

« En IA, nous pouvons rivaliser avec Google ou OpenAI », affirmait Arthur Mensch, CEO de Mistral AI, dans une interview avec Le Monde. Cette déclaration résume l’ambition affichée par la startup face aux géants américains qui dominent actuellement le marché de l’IA générative, à savoir OpenAI (ChatGPT), Anthropic (Claude) ou encore les solutions de Google (Gemini), Meta (Llama) et xAI (Grok).

Face à cette hégémonie, Mistral AI propose une alternative européenne avec une offre différenciée, notamment par son approche « open-weight ». Cette approche « open-weight » s’inscrit dans le mouvement de l’open source, mais se limite à rendre publics les paramètres des modèles d’IA (plutôt que le code source complet). Cela permet l’utilisation de ces modèles et leur modification par la communauté des développeurs sans nécessairement révéler tous les détails de l’entraînement. Cette approche est devenue l’une des marques de fabrique de l’entreprise. Dans une interview avec Xavier Niel sur France Inter, Arthur Mensch comparait d’ailleurs Mistral au « Deepseek français », faisant écho à cette entreprise chinoise également reconnue pour sa publication de modèles IA performants en accès libre.

Lire la suite...

Sur les épaules des géants : Mistral AI vu par un professionnel de l’information américain

RYAN MULHOLAND
Netsources no
174
publié en
2025.02
1388
Acheter ce no
Sur les épaules des géants : Mistral AI vu par un ... Image 1

Ryan MULHOLAND est Research Librarian à l’Université Wesleyan du Tennessee aux États-Unis. L’article de Ryan a été traduit avec l’aide, pour les tournures idiomatiques, de Mistral et de Claude.

Une « course aux armements de l’IA » sans précédent se déroule à l’échelle mondiale, bouleversant tout sur son passage. En ce début 2025, l’IA continue de dominer les discussions, des campus universitaires aux premières pages des sites d’actualités et d’affaires. Bien sûr, les habituels acteurs américains comme OpenAI et Google sont en première ligne, avec des offres conçues pour répondre à presque tous les besoins d’information des utilisateurs. De son côté, la Chine présente DeepSeek, dont le modèle R1 rivalise avec les meilleures offres américaines, mais à un coût bien inférieur.

Et qu’en est-il de l’Union européenne ? Regardons Mistral AI, un acteur français de premier plan dans le paysage mondial de l’IA.

Jeune expert en sciences de l’information, habitué à utiliser des modèles comme ChatGPT et Perplexity, je n’avais pas encore eu l’occasion de travailler avec Mistral, mais j’étais curieux de découvrir comment ce modèle français se positionnait par rapport à ses concurrents américains.

J’avais entendu parler de Mistral pour la première fois par une collègue en France, qui souhaitait connaître mon avis en tant qu’Américain.

Étant donné que je travaille principalement avec des étudiants universitaires et que l’utilisation de l’IA dans l’apprentissage et la rédaction académique est un sujet brûlant, il m’a semblé opportun d’explorer les meilleurs cas d’usage de ce modèle.
Lire la suite...

Periscops : l’accès aux références des publications scientifiques de Belgique francophone

François Libmann
Bases no
433
publié en
2025.02
1466
Acheter ce no
Tags
ist | archives ouvertes | recherche publique | thèses | références bibliographiques | information scientifique et technique
Periscops : l’accès aux références des publications ... Image 1

Les universités belges francophones viennent de lancer la plateforme Periscops, qui met gratuitement à disposition les références des publications que leurs chercheurs ont déposées dans leurs différents répertoires institutionnels.

Ces universités de la Fédération Wallonie-Bruxelles sont au nombre de cinq : l’Université de Liège, l’Université Catholique de Louvain, l’Université Libre de Bruxelles, l’Université de Mons et l’Université de Namur.

L’objectif affiché est de faciliter l’accès à la science pour le grand public, mais aussi d’accroître la visibilité de la science belge à l’international. Cette visibilité s’appuie sur la très grande expérience de référencement à l’international d’ORBI, le dépôt institutionnel de l’Université de Liège.

L’appel d’offres lancé par le FNRS (Fonds de la Recherche Scientifique) a été remporté par l’Uliege Library qui a développé la plateforme, maintenant gérée par le FNRS.

Lire la suite...

Surveiller les nouveaux brevets par un flux RSS

Philippe BORNE
Bases no
433
publié en
2025.02
1217
Acheter ce no
Surveiller les nouveaux brevets par un flux RSS Image 1

Les données brevets constituent une source d’information de choix pour effectuer des recherches d’état de l’art, de brevetabilité ou de liberté d’exploitation par exemple. Au-delà d’une recherche ponctuelle, il est souvent utile de surveiller régulièrement l’apparition de nouveaux documents, comme dans le cadre d’une veille technologique ou d’une veille concurrentielle. Patentscope, la base de données brevet de l’OMPI, offre une telle possibilité via la mise en place d’un flux RSS.

Créer une surveillance via un flux RSS sur Patentscope 

Nous allons montrer comment créer une surveillance basée sur des codes de la Classification Internationale des Brevets (CIB) ou de sa « fille », la CPC (Classification Coopérative des brevets).
Lire la suite...

Encadrer l’usage de l’intelligence artificielle générative en milieu académique : retour d’expérience d’une professionnelle de l’information

Christel RONSIN
Bases no
433
publié en
2025.02
1297
Acheter ce no
Encadrer l’usage de l’intelligence artificielle générative ... Image 1
Interview de Valérie Rostowsky, Responsable de la Library de NEOMA Business School. Interview menée par Christel RONSIN

Nous avons souhaité interroger Valérie Rostowsky afin de recueillir son témoignage sur la mise en place et l’utilisation de l’Intelligence artificielle générative à la Library (bibliothèque) d’une grande école de commerce, NEOMA Business School.

Valérie Rostowsky a tour à tour été responsable du Learning Center du Pôle Léonard de Vinci puis responsable de la Library de NEOMA Business School depuis 2018. Son équipe est composée de huit personnes, réparties sur les campus de Reims et de Rouen. Membre du bureau de l’ADBS durant deux ans, Valérie est actuellement Présidente de l’ACIEGE (Association des responsables des Centres d’Information des Écoles de Gestion).

CHRISTEL RONSIN :Valérie, comment l’intelligence artificielle générative (IAG) est-elle arrivée à NEOMA Business School ?

Lire la suite...

De l’intrusion à l’innovation : collecte de données, nouveaux navigateurs web, agents intelligents chinois et percée française, les tendances IA en février 2025

Anne-Marie LIBMANN
Bases no
433
publié en
2025.02
993
Acheter ce no
De l’intrusion à l’innovation : collecte de données, ... Image 1

Données personnelles et IA : ce que les modèles font vraiment avec nos données

La société de cybersécurité Surfshark a publié une étude très intéressante sur les pratiques de collecte de données des chatbots IA.

. La plupart des applications de chatbot IA collectent des données utilisateurs, avec en moyenne 11 types sur 35. Environ 40 % collectent des données de localisation et 30 % les utilisent à des fins publicitaires ou de revente.

. Google Gemini est la plus intrusive, collectant 22 types de données, y compris des informations sensibles comme la localisation précise et l’historique de navigation.

. ChatGPT et DeepSeek collectent modérément(10 et 11 types) mais présentent des risques, notamment des fuites de données comme Celle qui a touché le Chinois DeepSeek fin janvier dernier.

Naviguer autrement : Comet, le nouveau navigateur IA de Perplexity défie les géants du web

Perplexity AI, désormais un acteur majeur dans la recherche assistée par l’IA, avec plus de 100 millions de requêtes traitées chaque semaine, a laissé filtrer quelques informations concernant le lancement de Comet, son nouveau navigateur web.

Lire la suite...

Quels sont les champions des articles retractés ?

1218
Quels sont les champions des articles retractés ? Image 1

On parle de plus en plus du problème des articles (scientifiques) rétractés.

Plusieurs raisons peuvent conduire à la rétractation d’un article :  

. Mauvaise conduite scientifique telle qu'invention ou falsification de données

. Plagiat ou auto-plagiat

. Erreurs non intentionnelles, par exemple biais expérimentaux ou erreurs statistiques

. Problème d’éthique par exemple concernant le bien-être animal

. Article soumis à plusieurs revues ou morcellement d’une étude en multiples articles

. Utilisation de textes ou d’images protégées

. Article issu d’une « paper mill »(entreprises vendant des articles fictifs ou plagiés)

Comme on le voit, les raisons ne manquent pas.

Si le phénomène est choquant avec 40 000 articles rétractés pendant les dix dernières années, il faut cependant rapporter ce chiffre au 50 millions d’articles publiés durant cette période, ce qui représente moins de 0,1% même si ce chiffre est sûrement sous-évalué. 

Comme on peut s’en douter il y a des champions  tels que la Chine d’où sont issus près de 60% des articles rétractés. Ce sont les petits hôpitaux ou les universités dans le domaine médical qui se distinguent particulièrement.

En dehors de la Chine, d’autres champions sont la Ghazi University au Pakistan, la Addis Ababa University en Ethiopie l’Institute of Engineering and Technology à Coimbatore en Inde. La King Saud University à RiYadh en Arabie Saoudite est également bien placée. 

On trouvera des informations beaucoup plus détaillées dans l’excellent article de Nature « These universities have the most retracted scientific articles » du 20 février 2025 Vol 638 pp 596-599.

L’éditeur Wiley a étudié l’utilisation de l’IA par les chercheurs

1262
L’éditeur Wiley a étudié l’utilisation de l’IA par les ... Image 1

Wiley a récemment mené une étude auprès de près de 5 000 chercheurs sur leurs utilisations actuelles de l’IA et la probabilité de leurs futures utilisations.

Le questionnaire a porté sur 43 cas d’utilisations spécifiques de l’IA dans l’ensemble du processus de recherche.

Les principaux résultats sont les suivants :

  • Les utilisations actuelles de l’IA sont limitées à quelques tâches, mais les chercheurs attendent une extension rapide de son utilisation tout au long du processus de recherche 
  • Les chercheurs sont très intéressés par l’IA, et une majorité estime que l’IA surpasse actuellement les humains pour plus de la moitié des 43 cas d’utilisation
  • La Chine et l’Allemagne sont en tête en matière d’utilisation de l’IA
  • Plus de 60 % des chercheurs considèrent que le manque de directives et de formation est un obstacle à l’augmentation de leur utilisation de l’IA
  • Ce sont les domaines de l’informatique et de la médecine dans lesquels les chercheurs souhaitent le plus être des « adopteurs précoces » de l’IA ; c’est l’inverse, dans le domaine des sciences de la vie.

À la suite de cette étude, Wiley élabore des directives à destination des auteurs pour une utilisation efficace et responsable de l’IA.

Le rapport est disponible sur ce site. 

IndexPresse réinvente un avenir à Delphes, la base de données bibliographiques créée il y a près de quarante ans

Francois LIBMANN
Bases no
432
publié en
2025.01
1434
Acheter ce no
Tags
références bibliographiques | agrégateurs de presse | information business | études de marché
IndexPresse réinvente un avenir à Delphes, la base de ... Image 1

Des racines historiques à une nouvelle stratégie

Delphes est une des plus anciennes banques de données bibliographiques toujours disponibles. Elle propose des résumés, avec indexation, d’une sélection d’articles parus dans la presse économique française au sens large, à l’exception des quotidiens.

Issue de la fusion en 1988 des banques de données Grappe et ISIS créées respectivement en 1979 et 1981, toutes deux par des CCI (Chambres de Commerce et d’industrie), elle a été abandonnée fin 2005 et reprise par la société IndexPresse basée à Grenoble.

Lire la suite...

Des ondes sonores aux résumés : l'analyse des podcasts par l'IA change la donne

Ryan Mulholand
Bases no
432
publié en
2025.01
1240
Acheter ce no
Tags
évaluation outils | podcast | IA | veille audiovisuelle
Des ondes sonores aux résumés : l'analyse des podcasts par ... Image 1

Dans le paysage en constante expansion des podcasts, où des millions d’heures de contenu sont produites quotidiennement, une nouvelle frontière émerge. L’intelligence artificielle (IA), autrefois réservée à la science-fiction, révolutionne aujourd’hui la façon dont nous consommons le contenu audio. L’IA est entrée dans l’arène, offrant une solution révolutionnaire qui transforme le son brut en transcriptions et en résumés avec rapidité et précision.

Ce saut technologique n’est pas seulement une question de commodité, il remodèle tout le paysage de l’accessibilité des podcasts. Qu’il s’agisse de professionnels très occupés cherchant à obtenir rapidement les éléments importants ou de chercheurs réalisant du data mining, la capacité de l’IA à distiller des heures de conversation en extraits digestes est tout simplement incroyable.

Mais à quel point l’IA est-elle efficace dans cette tâche ?

Traduit de l’anglais par l’équipe de BASES PUBLICATIONS

Lire la suite...

L'IA début 2025 : Raisonnement avancé et agents autonomes - OpenAI vs. la concurrence chinoise

Anne-Marie LIBMANN
Bases no
432
publié en
2025.01
1144
Acheter ce no
L'IA début 2025 : Raisonnement avancé et agents autonomes - ... Image 1

Avec o3, OpenAI démocratise l’accès au raisonnement avancé

OpenAI a dévoilé o3, une avancée dite significative dans sa gamme de modèles de raisonnement. Cette annonce s’inscrit dans un contexte d’une course à l’innovation qui semble toujours plus forte, notamment avec l’arrivée du Chinois DeepSeek et son modèle R1. 

Cette évolution s’inscrit dans une stratégie plus large d’OpenAI :

• Démocratiser l’accès au raisonnement avancé tout en maintenant différents niveaux de service

• Répondre à la concurrence croissante du secteur, notamment open source

• Optimiser le rapport performance/coût pour les usages professionnels

L’o3-mini propose trois niveaux de raisonnement permettant d’ajuster la profondeur de l’analyse en fonction de la complexité de la tâche. En sélectionnant le niveau de raisonnement approprié (faible, moyen ou élevé), le modèle ajuste le temps consacré à l’analyse en fonction des exigences de la tâche. 

Des tests ont montré que o3-mini offre des réponses 24 % plus rapides que son prédécesseur, o1-mini, ainsi qu’une diminution de 39 % des erreurs significatives sur des questions complexes.

La version complète de l'o3 avait été annoncée mais au dernier moment, OpenAI a fait volte face en annonçant que le modèle d'intelligence artificielle "o3" ne sera pas publié en tant que produit autonome, mais sera intégré dans le système GPT-5 pour simplifier les offres de l'entreprise et créer des systèmes d'IA capables de gérer une variété de tâches.
Lire la suite...

« Publish or Perish », un jeu de société inspiré de la recherche académique...

987
« Publish or Perish », un jeu de société inspiré de la ... Image 1

« Publish or Perish » est une expression très courante dans les milieux universitaires et de la recherche.

Elle signifie que sans un flux suffisant d’articles publiés dans de « bonnes revues », la carrière d’un chercheur est sérieusement compromise.

Cette préoccupation des chercheurs concernant la publication de leurs articles est une constante dans une carrière et elle est très souvent évoquée, en particulier dans le milieu de la recherche. Elle fait souvent aussi l’objet de polémiques.

L’expression « Publish or Perish » est, en effet, très fréquemment utilisée, et ce, depuis longtemps, si l’on en juge par le nombre de réponses affichées par Google, à savoir 964 000, même si l’on sait que l’on ne pourra pas toutes les visualiser. Le serveur Dialog quant à lui annonce que 19 400 documents contiennent l’expression, documents que l’on peut, en théorie, effectivement visualiser.

Peu d’expressions couramment employées, surtout dans le milieu professionnel, en particulier si elles sont quelque peu polémiques, deviennent le prétexte d’un jeu de société. C’est pourtant ce qui est en train d’arriver avec cette expression. En effet, d’après la publication bien connue NATURE, un psychosociologue américain du nom de Max BAI a lancé en bêta un jeu s’appelant « The Publish or Perish game ».

Ce jeu de société centré sur la publication académique — ce qui est très original — ressemble au bien connu et historique Monopoly, à ceci près que le vainqueur est celui qui a obtenu le plus grand nombre de citations d’articles qu’il a publiés. Mais tout cela se passe de façon caricaturale, le plagiat étant possible, voire encouragé, de même que le sabotage des actions des chercheurs concurrents au moyen de dénigrement ou en leur faisant subir des restrictions budgétaires.

Nous ne résistons pas au plaisir de citer les titres de certains de ces articles improbables :

« Unpacking the Aerodynamics of Flying Pigs », « Why Dogs Follow You Into the Bathroom: Insights into Canine Codependency » ou encore « The economics of Santa Claus: an analysis of infinite resource management ».

Ce jeu peut tout à fait séduire le grand public, mais les éléments satiriques auront une résonance particulière pour ceux qui auront passé suffisamment de temps dans le milieu universitaire.

D’après l’article de Nature dans lequel nous avons trouvé cette information, le jeu sera en vente dans quelques mois sur la plateforme Kickstarter. Pour être informé du lancement effectif du jeu, vous pouvez vous inscrire ici.

DeepL annonce surpasser ses concurrents

882
Tags
outils de traduction | IA
DeepL annonce surpasser ses concurrents Image 1

La société allemande DEEPL, un des acteurs majeurs de la traduction automatique, annonce qu’il va surpasser ses concurrents que sont Google Translate et ChatGPT.

Cela devrait se faire grâce à son dernier modèle de langage LLM.

En effet, ce nouvel LLM ne s’appuie pas, pour s’entrainer, sur des données d’Internet en général, mais sur son propre jeu de données propriétaires sélectionnées et adaptées à la création de contenu et à la traduction linguistique.

Il prétend donc qu’il sera meilleur que Google Translate qui rencontre des problèmes de traduction littérale ou incorrecte.

Quant à ChatGPT, son offre de traduction automatique serait secondaire par rapport à l’ensemble de son offre alors que "DeepL est très spécialisé, ce qui est particulièrement utile dans des domaines exigeant une haute précision ». Bref, il sera meilleur là aussi.

Ces améliorations devraient faire gagner en temps et en efficacité, car il y aura moins de temps consacré à la vérification et à la correction.

Loin de vouloir concurrencer les traducteurs professionnels il se positionne comme leur « allié indispensable », une affirmation qui peut laisser songeur...

Google accélère fortement sur les langues

1758
Tags
Google
Google accélère fortement sur les langues Image 1

Google intensifie sa politique de diversité linguistique en annonçant l'ajout de huit nouvelles langues aux options de traduction de ses résultats de recherche, portant le total à 21. Parmi les langues ajoutées figurent l'arabe, le gujarati (une langue indienne), le coréen, le persan, le thaï, l'ourdou (parlé en Inde et au Pakistan), et le vietnamien. 

Par ailleurs, Google Translate s'enrichit considérablement avec l'introduction de 110 nouvelles langues, y compris des langues régionales de France telles que le breton et l'occitan.

Les langues africaines sont également mises à l'honneur, un quart des nouvelles langues étant parlées sur le continent africain, comme le wolof, le fon, le kikongo.

Par ailleurs, on notera le tibétain et le cantonais, principal dialecte chinois depuis longtemps réclamé. Ces ajouts permettent à Google Translate de toucher plus de 614 millions de personnes supplémentaires.

Cette initiative s'inscrit dans le cadre du projet ambitieux lancé en 2022 visant à traduire les 1 000 langues les plus parlées à travers le monde. 

En outre, Google améliore la reconnaissance vocale en apprenant à comprendre une multitude d'accents issus de diverses langues, renforçant ainsi son accessibilité et sa pertinence à l'échelle mondiale.

Zapping Veille du 5/7/24 : Les dernières innovations en IA avec SCOPUS AI d’Infotoday, la plateforme Lexis+AI, les illustrations en réalité augmentée de Karger et 37% des recherches Google sans clic!

822
Zapping Veille du 5/7/24 : Les dernières innovations en IA ... Image 1

Notre article sur SCOPUS AI publié par l’éditeur américain Infotoday

Notre article sur SCOPUS AI paru dans le numéro 425 (Mai 2024) de BASES a été publié en anglais parmi les « featured articles » sur la plateforme de l’éditeur américain Information TODAY. 

LexisNexis a lancé en France ce 1° juillet Lexis+AI, une plateforme de recherche et d’analyse juridique

Cette solution d’IA générative permet d’interagir avec la base de données juridique de LexisNexis et ses contenus exclusifs. Elle fournit des liens directs vers les sources citées dans les réponses, permettant ainsi de réduire le risque de sources inventées. 

Les illustrations d’articles scientifiques de Karger en réalité augmentée en 3D

La société norvégienne Ludenso a passé un accord avec l’éditeur Karger Publishers pour illustrer les données des articles scientifiques avec de la réalité augmentée en 3D.

Cela ne concerne cependant pas tous les articles, sans que l’on sache quel est le critère.

Un gros tiers de recherches sur Google n’aboutissent à aucun clic

Rand Fishkin est cofondateur et CEO de SparkTORO qui propose des logiciels dans le domaine de l’analyse des audiences.

Il vient de publier un article faisant apparaître qu’environ 37% des recherches menées sur Google ne sont suivies d’aucun clic, ce résultat étant valable aussi bien aux Etats-Unis qu'en Europe.

Zapping Veille du 28/6/24 : Businesscoot utilise l'IA pour les recherches sectorielles avec Indexpresse - l'IA générative bouleverse les médias et le droit d'auteur - ResearchGate élargit son offre op ...

1530
Tags
droit d'auteur | études de marché | IA
Zapping Veille du 28/6/24 : Businesscoot utilise l'IA pour ... Image 1
BUSINESSCOOT, spécialiste français des études sectorielles, rachète INDEXPRESSE

Nouvelle étape pour la longue vie de la banque de données Delphes qui était commercialisée ces dernières années par IndexPresse.

Businesscoot, spécialiste français des études sectorielles rachète Indexpresse. Cela conduira à l’offre SectorGPT qui grâce aux informations des études ajoutées à celles de la banque de données Delphes proposera des recherches sectorielles en utilisant l’IA.

Les réponses sont annoncées comme fiables et traçables.

Le "nouvel IndexPresse" étant commercialisé prochainement, nous le testerons de façon complète dans le BASES de septembre 2024.

"Journalisme de confiance à l’ère de l’IA générative" : la question du droit d'auteur vue par  L’EBU News Report 

L'IA générative est un facteur potentiel de redéfinition du paysage médiatique, transformant en profondeur la manière dont les contenus sont créés et distribués. Elle menace ainsi les modèles économiques traditionnels qui reposent fortement sur les droits d'auteur pour générer des revenus.

  1. Protection du copyright et transparence : les systèmes d'IA doivent créditer correctement les sources et assurer une rémunération équitable aux titulaires de droits. Les propriétaires des systèmes d'IA sont appelés à maintenir un registre transparent du contenu journalistique utilisé.
  2. Utilisation des données : comment les médias et journalistes doivent-ils naviguer dans un paysage dans lequel les modèles de langue peuvent utiliser leur contenu sans permission explicite?
  3. Des modèles de gouvernance : les médias et ingénieurs de l’IA doivent collaborer pour créer des modèles de gouvernance respectant les droits d'auteur tout en soutenant l'innovation.

Lire aussi :  Le droit d’auteur face à l’IA générative : Interview de Philippe Masseron (gf2i) sur les enjeux juridiques et économiques des métiers de l’information et de la donnée.


ResearchGate continue à charger des publications en open access

Comme nous l’avons décrit dans notre récent article de BASES : « ResearchGate développe ses liens avec les éditeurs », ce réseau social continue à développer son activité d’agrégateur.

Il a ainsi chargé récemment :

  • Les 10 publications de la UK Royal Society
  • Des publications de l’éditeur hongrois Akademiai Kiado
  • Les 14 publications de PLOS toutes en open access
  • 6 publications de Bentham Science Publishers, un éditeur situé aux Emirats Arabes Unis
  • 9 publications de World Scientific Publishing basé à Singapour 
  • 1
  • 2
  • ›
  • Fin