Face à la dégradation de Google Actualités et à l’absence d’alternatives réelles en matière d’agrégateurs de presse gratuits, on pourrait être tenté de considérer que seuls les agrégateurs de presse payants peuvent permettre de réaliser de bonnes recherches d’information sur la presse.
Sur le papier, leurs corpus de sources continuent de s’enrichir et se diversifier avec les années et les fonctionnalités de recherche expertes restent présentes tandis que de nouvelles se développent.
Les agrégateurs de presse payants sont-ils aujourd’hui la seule solution pour réaliser des recherches d’information de qualité ? Ou bien à l’image des agrégateurs de presse gratuits, eux aussi seraient-ils en réalité sur une pente descendante ?
Lire aussi :
Google Actualités : la tendance n’est pas au beau fixe
Quelles alternatives crédibles à Google Actualités en 2020 ?
Presse, réseaux sociaux, contenus multimédias, littérature scientifique, données ... : rechercher sur des contenus très disparates
DOSSIER SPECIAL CONFERENCE SEARCH SOLUTIONS 2019 - Londres
• Le SEO et la veille au défi des moteurs
BREVES • LexisNexis Newsdesk devient Nexis Newsdesk
SERVEURS • WTI : des ressources allemandes peu connues
INDEX • Les lettres de BASES 2019
Pour la troisième année consécutive, nous avons assisté à la journée « Search Solutions » à Londres où se côtoient ceux qui font les moteurs (ingénieurs, data scientists, informaticiens, etc.) et ceux qui les utilisent (professionnels de l’information et du SEO).
L’intelligence artificielle et plus particulièrement le machine learning et le NLP (Natural Language Processing) étaient encore une fois au cœur de la très grande majorité des présentations.
Lire aussi :
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Des nouveaux moteurs qui tirent parti des contenus multimédia
Le SEO et la veille au défi des moteurs
Après les moteurs spécialisés sur le juridique, le recrutement ou la santé, il a également été question de nouveaux moteurs qui tirent parti des contenus multimédia.
On le sait, les contenus multimédia prolifèrent et il est de plus en plus important de les inclure dans son dispositif de veille et ses recherches d’information. Pourtant, ce sont des contenus difficiles d’accès car peu représentés dans les outils traditionnels et surtout peu « recherchables » car la recherche ne porte généralement que sur les métadonnées.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Le SEO et la veille au défi des moteurs
TENDANCES • La révolution multimédia bouscule la veille
PANORAMA
• Outils de recherche de vidéos : des métadonnées au speech to text
• Outils de recherche sur les contenus audios : un segment encore pauvre
• Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
METHODOLOGIE • Mettre en place une veille sur les contenus multimédias
OUTILS DE VEILLE • Comment valoriser les contenus multimédias dans un livrable de veille ?
INDEX • Index NETSOURCES 2019
Etre un expert de la veille et de la recherche d’information, et maintenir son expertise, est plus que jamais un challenge car le monde de l’information est en perpétuel mouvement.
Les outils de recherche et de veille évoluent très rapidement, de nombreux acteurs apparaissent et disparaissent régulièrement, les sources d’information évoluent et changent de business model, ce qui nécessite une surveillance large de son environnement.
La veille ou la recherche de contenus connaît certainement aujourd’hui un réel bouleversement qu’il est encore difficile de bien mesurer : la présence de plus en plus forte de vidéos, podcasts, infographies comme médias d’information à part entière.
Coexistant à côté des sources d’information traditionnelles, ou encore, cas plus complexe, intégrés dans ces mêmes médias traditionnels, de plus en plus de journaux, surtout dans la sphère économique, sociale et politique, en créent et diffusent (incluent) dans leur version numérique.
Les veilleurs et plus généralement tous les professionnels de l’information, traditionnellement orientés vers la recherche et l’analyse de contenus textuels, vont devoir rapidement se préoccuper de l’intégration de ces nouveaux réservoirs d’informations pour au moins deux raisons.
- D’une part, les données présentes dans ces vidéos, podcasts ou encore infographies risquent de ne pas se retrouver sur les supports textuels.
- D’autre part, ces nouveaux formats sont plus que de simples supports, ils constituent, du fait de leur professionnalisation, de plus en plus des moyens d’information à part entière, avec leurs propre dynamiques, recherches et analyses.
Lire aussi :
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche sur les contenus audios : un segment encore pauvre
Outils de recherche d’images : vers la reconnaissance de texte, objet et visage
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
La première intervention de cette conférence annuelle à Londres revenait en détail sur le fonctionnement de la recherche sémantique, qui, rappelons-le, est aussi mise en œuvre dans des moteurs comme Google depuis quelques années.
Andreas Kaltenbrunner est directeur de la recherche chez NTENT, une société qui propose un moteur de recherche sémantique en marque blanche pour les entreprises.
Il est revenu en détail sur le fonctionnement de leur moteur. Pour créer un moteur sémantique, il faut tout d’abord une ontologie, un lexique (un par langue) associé à l’ontologie, un « onomasticon » (une sorte de glossaire des noms propres) et des règles linguistiques.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Moteurs de recherche spécialisés : entre IA et approche traditionnelle
Des nouveaux moteurs qui tirent parti des contenus multimédia
Le SEO et la veille au défi des moteurs
Intéressons-nous maintenant à la recherche d’images. Nous avons choisi ici de nous focaliser sur la recherche d’images pour trouver des informations ou répondre à une question dans un cadre professionnel.
Nous n’aborderons pas la question des images libres de droits ou photos de stocks pour illustrer ses livrables.
La recherche d’images est plus complexe qu’elle n’y paraît au premier abord, car il coexiste différentes façons de rechercher :
il y a tout d’abord la recherche classique par mot-clé où la recherche porte sur des métadonnées ou - c’est encore très rare - sur du contenu textuel présent dans des images ;
la recherche inversée par l’image où le point de départ est une image et non du texte et où l’on recherche des images identiques ou similaires.
Lire aussi :
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche sur les contenus audios : un segment encore pauvre
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?
Les moteurs de recherche spécialisés (recrutement, juridique, santé) étaient à l’honneur cette année.
Et tous ces acteurs s’intéressent à la façon dont ils peuvent faire évoluer leurs outils en tirant parti du développement de l’IA tout en restant à l’écoute de leurs utilisateurs.
Trois acteurs étaient venus présenter certains axes de recherche sur lesquels ils ont travaillé récemment pour améliorer leurs moteurs.
Nous commencerons avec un outil de recherche spécialisé dans le recrutement et les ressources humaines appelé Texternel, fondé en 2011 à Amsterdam. Il s’agit d’un moteur principalement utilisé par les services RH des entreprises et qui permet de rechercher sur des bases de CV et réseaux sociaux afin d’identifier les bons candidats pour un poste.
Lire aussi :
Un avant-goût de l'avenir de la recherche sur le Web avec Search Solutions 2019
Comprendre les évolutions des moteurs Web généralistes pour mieux les utiliser
Des nouveaux moteurs qui tirent parti des contenus multimédia
Le SEO et la veille au défi des moteurs
