Intéressons-nous maintenant à la recherche d’images. Nous avons choisi ici de nous focaliser sur la recherche d’images pour trouver des informations ou répondre à une question dans un cadre professionnel.
Nous n’aborderons pas la question des images libres de droits ou photos de stocks pour illustrer ses livrables.
La recherche d’images est plus complexe qu’elle n’y paraît au premier abord, car il coexiste différentes façons de rechercher :
il y a tout d’abord la recherche classique par mot-clé où la recherche porte sur des métadonnées ou - c’est encore très rare - sur du contenu textuel présent dans des images ;
la recherche inversée par l’image où le point de départ est une image et non du texte et où l’on recherche des images identiques ou similaires.
Lire aussi :
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche sur les contenus audios : un segment encore pauvre
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
Les moteurs de recherche spécialisés (recrutement, juridique, santé) étaient à l’honneur cette année.
Et tous ces acteurs s’intéressent à la façon dont ils peuvent faire évoluer leurs outils en tirant parti du développement de l’IA tout en restant à l’écoute de leurs utilisateurs.
Trois acteurs étaient venus présenter certains axes de recherche sur lesquels ils ont travaillé récemment pour améliorer leurs moteurs.
Nous commencerons avec un outil de recherche spécialisé dans le recrutement et les ressources humaines appelé Texternel, fondé en 2011 à Amsterdam. Il s’agit d’un moteur principalement utilisé par les services RH des entreprises et qui permet de rechercher sur des bases de CV et réseaux sociaux afin d’identifier les bons candidats pour un poste.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Des nouveaux moteurs qui tirent parti des contenus multimédia
Le SEO et la veille au défi des moteurs
On ne recherche pas des vidéos comme on recherche des images ou des contenus audio. Chaque type de contenus multimédias dispose de ses propres outils et il y a finalement assez peu d’outils qui englobent toutes ces dimensions.
Pour rechercher des vidéos, il existe trois grandes catégories de sources et d’outils :
d’une part les moteurs de vidéos développés par les grands acteurs du Web comme Google, Bing, Qwant, Yandex, etc. ;
il y a ensuite les grandes plateformes d’hébergement de vidéos comme YouTube, Dailymotion (de moins en moins utilisé) ou encore Vimeo qui disposent tous trois de leurs propres moteurs internes.
enfin, il existe toute une panoplie de petits outils plus confidentiels et spécialisés à connaître et à savoir mobiliser dans certains cas précis.
Lire aussi :
La révolution multimédia bouscule la veille
Outils de recherche sur les contenus audios : un segment encore pauvre
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
Très éloignée des autres présentations, celle de Dawn Anderson, spécialiste du SEO (Search Engine Optimization) était néanmoins intéressante dans la mesure où elle faisait écho à ce que vivent les professionnels de l’information.
Le monde du SEO et de ceux qui développent les moteurs sont des mondes avec très peu de connexions.
Le SEO est encore trop souvent perçu par les informaticiens comme des personnes qui manipulent les résultats de recherche et sont souvent associés à l’image du spam.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Des nouveaux moteurs qui tirent parti des contenus multimédia
La recherche d’information professionnelle de contenus audio va essentiellement porter sur les émissions radios et podcasts d’information.
Pour rechercher sur des contenus radios et podcasts, on retrouve tout d’abord quelques outils communs à la recherche vidéo :
- les sites d’archives audiovisuelles comme l’INA;
- Internet Archive;
- les agrégateurs de presse qui indexent des contenus télé et radio. On notera que Newsdesk propose également des podcasts (1000 au total, mais seulement 3 pour la France).
Lire aussi :
La veille face aux nouveaux médias : podcasts, Stories, Lives, etc.
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
Newsdesk, le produit LexisNexis à mi‑chemin entre un agrégateur de presse et une plateforme de veille, change de nom et devient Nexis Newsdesk.
Ce changement est effectif depuis novembre.
Lire aussi :
BASES N°244 de Décembre 2007 à commander en direct en nous écrivant à : Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.
Lorsque nous nous étions intéressés à l’évolution de la banque de données RAPRA, devenue Polymer Library, nous avons découvert qu’elle était produite maintenant par WTI-Frankfurter- digital GmbH qui est également un des serveurs qui l’héberge.
Ce serveur fort peu connu a été créé fin 2010 ou début 2011 (les sources divergent) sous le nom de WTI Frankfurter eG par le personnel de FIZ Technik après la faillite de cet organisme.
Début 2019, la société a été refondée sous le nom de WTI-Frankfurt-digital GmbH, à la fois un producteur et un serveur de banque de données et qui met en avant son indépendance vis-à-vis des éditeurs.
Comme nous avons pu le voir, rechercher des contenus multimédias est déjà un défi en soi. Mettre en place une veille sur ces contenus en est un autre.
Les outils de recherche de vidéos, d’images, ou de contenus audio proposent très rarement des fonctionnalités d’alertes et les flux RSS se font plutôt rares ou alors sont très bien cachés.
Sur Dailymotion, les flux RSS existaient il y a encore peu de temps, mais ils étaient bien cachés.
Il suffisait d’ajouter /rss après www.dailymotion.com. Malheureusement, nos récents tests montrent que cela ne fonctionne plus...
Lire aussi :
La veille face aux nouveaux médias : podcasts, Stories, Lives, etc.
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Outils de recherche sur les contenus audios : un segment encore pauvre
Comment valoriser les contenus multimédias dans un livrable de veille ?
Une fois les vidéos, images ou contenus audios identifiés dans le cadre d’une veille ou d’une recherche d’information, il n’est pas si simple de les valoriser et notamment d’analyser, sauvegarder, utiliser et retranscrire ces contenus dans ses livrables.
D’une part parce qu’il s’agit souvent de contenus éphémères qui peuvent disparaître du jour au lendemain sans laisser de traces.
Et d’autre part parce qu’il est très difficile de retranscrire ces contenus de manière intelligible et efficace dans un livrable.
Il est en effet peu satisfaisant de transmettre un simple lien vers une vidéo ou un podcast en indiquant que le passage intéressant se situe à la 75e minute...
Lire aussi :
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Outils de recherche sur les contenus audios : un segment encore pauvre
Mettre en place une veille sur les contenus multimédias
COMPTE-RENDU DE CONFÉRENCE
ILI 2019 : une vision anglo-saxonne de l avenir des professionnels de l information
TENDANCES
Les nouveaux Netflix de la presse vont-ils concurrencer Factiva, Nexis Newsdesk, Press edd et les autres ?
BASE DE DONNEES
CAS Formulations database : une nouvelle banque de données sur STN