Outils de recherche sur les contenus audios : un segment encore pauvre

Carole Tisserand-Barthole
Netsources no
143
publié en
2019.12
1554
Acheter ce no
Tags
veille audiovisuelle | multimédia | outils de recherche
Outils de recherche sur les contenus audios : un segment ... Image 1
Outils de recherche sur les contenus audios : un segment ... Image 1

La recherche d’information professionnelle de contenus audio va essentiellement porter sur les émissions radios et podcasts d’information.

Pour rechercher sur des contenus radios et podcasts, on retrouve tout d’abord quelques outils communs à la recherche vidéo :

- les sites d’archives audiovisuelles comme l’INA;

- Internet Archive;

- les agrégateurs de presse qui indexent des contenus télé et radio. On notera que Newsdesk propose également des podcasts (1000 au total, mais seulement 3 pour la France).

Et comme pour les contenus vidéos, seules les sources professionnelles payantes comme les agrégateurs de presse permettent de rechercher sur les contenus des émissions radio et podcasts (speech to text). Les autres ne permettent de rechercher que sur les métadonnées.

Lire aussi : 

La veille face aux nouveaux médias : podcasts, Stories, Lives, etc.
La révolution multimédia bouscule la veille
Outils de recherche de vidéos : des métadonnées au speech to text
Outils de recherche d’images : des métadonnées à la reconnaissance de texte, d’objets et de visages
Mettre en place une veille sur les contenus multimédias
Comment valoriser les contenus multimédias dans un livrable de veille ?


Pour la recherche de radio et podcasts en ligne, il existe plusieurs outils de recherche :

  • L’agrégateur de podcasts français Majelan (recherche uniquement possible sur l’app) ;
  • Deezer ou Spotify qui permettent de rechercher sur les métadonnées des podcasts et radios qu’ils indexent ;
  • Riptide, un moteur de recherche de podcasts (uniquement en anglais) : https://riptide.fm ;
  • le moteur Listen Notes, qui reste assez simpliste, mais s’avère un peu meilleur que la plupart ;
  • Audioburst, un service de veille et de recherche par mot-clé sur les podcasts (contenus anglophones uniquement) ;
  • FluiData, un moteur de podcasts qui recherche sur le contenu intégral (contenus anglophones surtout) : https:// fluiddata.com ;
  • Tootak.fr qui s’appuie sur l’IA pour recommander des podcasts ;
  • Podcast & Radio addict, un agrégateur de podcasts (app uniquement) ;
  • Luminary, un autre agrégateur de podcasts avec des contenus français et internationaux : https:// luminarypodcasts.com ;
  • MyTuner un moteur de recherche de radios en ligne et de podcasts : https://mytuner-radio.com ;
  • Presshunt, une base de données de podcasts et journalistes : https://presshunt.co/ ;
  • Soundcloud, plutôt orienté musique, mais qui indexe également des podcasts : https://soundcloud.com. 

Pour aller plus loin, nous vous conseillons la lecture ou relecture de notre article : « La veille face aux nouveaux médias : podcasts, Stories, Lives, etc. » - BASES n°371, juin 2019.

Google Podcasts propose également un moteur, mais uniquement dans son app Android et Ios. Cependant, si l’on dispose du nom de l’épisode que l’on souhaite écouter, on peut entrer dans le moteur desktop classique de Google une requête de type podcast nom de l’épisode et le voir apparaître dans les résultats. Une fois sur l’interface Web de Google Podcasts, on peut écouter l’épisode.

Depuis mars dernier, Google a indiqué que son application Google Podcasts générait automatiquement des transcriptions des podcasts présents sur sa plateforme. Il se sert ensuite de cette transcription automatique pour indexer les podcasts. Cela ressemble aux transcriptions de YouTube mais elles ne sont pas accessibles aussi simplement que sur YouTube.

Selon plusieurs experts américains, Google Podcasts intégrerait une transcription de chaque podcast directement dans le code source de la page. Il suffirait donc de se rendre sur le code source de la page et d’effectuer un contrôle F pour recherche sur le contenu intégral.

Malheureusement, nous avons fait le test sur plusieurs podcasts présents sur Google Podcasts et nous n’avons jamais réussi à trouver de transcriptions dans le code source de la page. Peut-être que Google l’a enlevé ou alors cela n’est pas disponible en Europe...

À ce jour, il n’est donc pas encore possible en France de rechercher sur le contenu intégral des podcasts, mais uniquement sur les métadonnées.

Notre conseil

Au final, la recherche d’information sur les émissions radio et podcasts s’avère encore plus difficile que sur les vidéos...

D’une part parce qu’ils sont éparpillés aux quatre coins du Web et qu’il n’existe aucun outil de recherche global sur ces contenus. D’autre part, parce que les quelques outils de recherche existants ont des fonctionnalités de recherche et des filtres extrêmement basiques.

Et enfin parce que l’on ne recherche pratiquement que sur les métadonnées. Certains acteurs prennent le temps de détailler précisément le contenu de leurs podcasts et émissions comme Europe1 par exemple, mais d’autres se contentent de quelques lignes.

Pour les radios, les émissions étant de plus en plus souvent filmées, on aura intérêt à les rechercher, regarder et analyser sur YouTube quand cela est possible. D’autre part, il n’est pas rare que les podcasts soient aussi mis en ligne sur YouTube sans vidéo associée.

Il ne reste plus qu’à espérer que Google, qui transcrit automatiquement les podcasts présents sur sa plateforme Google Podcasts pour le moment uniquement à ses fins personnelles, propose dans les prochains mois ou années un outil de recherche ou des fonctionnalités de recherche dédiées... Mais comme pour les vidéos, ces transcriptions automatiques peuvent poser question d’un point de vue juridique et Google n’a peut-être pas envie de se lancer sur terrain-là...