Figure 1. Transcription d’une vidéo en turc sur YouTube et traduction des sous-titres en français
Cela permet donc de comprendre le contenu d’une vidéo dont on ne maîtrise pas la langue.
La transcription quant à elle n’est malheureusement disponible que dans la langue de la vidéo (uniquement pour les 13 langues supportées) et il n’y a pas de traduction automatique possible.
Autre nouveauté : les transcriptions et sous-titres automatiques sont désormais accessibles sur mobile (Ios et Android).
Enfin, en ce qui concerne les langues prises en compte, l’ukrainien devrait être très prochainement ajouté aux 13 langues disponibles pour les transcriptions et sous-titres automatiques.
Impact sur la veille et la recherche :
👍 Google continue de mettre l’accent sur la transcription automatique et la traduction de contenus dans différentes langues, ce qui est une bonne nouvelle pour le professionnel de l’information de plus en plus confronté à des sujets internationaux qui nécessitent de rechercher dans des langues qu’on ne maîtrise pas nécessairement.
👍 Les transcriptions permettent de voir rapidement grâce à un simple Control F + mot-clé si la vidéo parle de ce qui nous intéresse et les sous-titres automatiques traduits permettent de comprendre le contenu dans une langue que l’on ne maîtrise pas.
👎 Il est cependant dommage qu’on ne puisse pas récupérer au format texte les sous-titres traduits. En attendant que Google se penche sur la question, on pourra toujours utiliser des services gratuits de téléchargement de sous-titres YouTube comme DownSub par exemple qui permettent de télécharger au format .TXT les sous-titres traduits dans la langue de son choix.
On attend également que Google élargisse ces fonctionnalités de transcription et de sous-titres à d’autres langues, car c’est là que se situerait la vraie valeur ajoutée. Cela ne devrait pas manquer d’arriver au cours des prochaines années. Il faut rester patient et en alerte.
Toujours plus d’intérêt pour Google Images avec plus d’IA et de machine learning
Quelques rappels
Google réaffirme son intérêt pour le format image et investit dans ces différents produits et services associés à l’image, comme Google Lens ou Google images.
- On rappellera que l’outil de reconnaissance d’image Google Lens, d’abord développé uniquement sur mobile, a finalement fait son apparition sur desktop l’année dernière et a été intégré à Google Images. Une excellente nouvelle car Google Lens permet d’effectuer des recherches d’images inversées de manière plus performante que ce que proposait Google Images jusqu’alors (voir notre article « Comment s’adapter aux nouveautés et restrictions de la recherche d’image inversée sur le Web ? » .
- Toujours l’année dernière, dans le cadre de sa stratégie IA, Google avait indiqué introduire un Knowledge Graph dans son moteur Google Images (pour en savoir plus sur les Knowledge Graphs, nous vous invitons à lire notre article « Les Knowledge Graphs vont-ils enfin révolutionner la recherche d’information professionnelle ? ») - Cela s’est matérialisé notamment par des mots-clés et concepts qui s’affichent au-dessus des résultats du moteur d’images et qui permettent d’affiner et de désambiguïser la recherche (cf. Figure 2. Matérialisation du Knowledge Graph dans Google images).
On rappellera que jusqu’il y a peu, le Knowledge Graph et plus largement l’introduction d’IA à grande échelle concernait avant tout le moteur Google Web, mais pas ses autres verticales.
Figure 2. Matérialisation du Knowledge Graph dans Google images
Les nouveautés
Et cette année, Google continue d’innover dans la recherche d’images et d’intégrer toujours plus d’IA dans ses produits liés à l’image.
Il a ainsi annoncé la possibilité de croiser la recherche d’images et la recherche textuelle dans une même requête. Il sera ainsi possible d’effectuer une recherche à partir d’une image (un motif floral par exemple) puis d’entrer des mots-clés pour orienter la recherche (chaussures par exemple pour retrouver des chaussures qui utilisent ce motif).
On vient également d’apprendre que Google Images allait rajouter des filtres liés à la couleur de peau en utilisant l’échelle MST (Monk Skin Tone) qui décrit les différents tons de couleurs de peau. Google prend l’exemple d’une requête sur le maquillage. Le filtre permettra de repérer des images qui correspondent mieux au profil de l’internaute.
Enfin, Google indique que les personnes mettant en ligne des images pourront ajouter de nouvelles métadonnées (couleur de peau, couleur des cheveux et texture de cheveux) aux images qui seront ensuite prises en compte par Google dans son moteur.
Impact sur la veille et la recherche :
Il est indéniable que Google porte un regain d’intérêt à son moteur d’images, qui n’avait pas beaucoup évolué au cours des dernières années. L’attention étant alors surtout sur Google Lens, sa fonctionnalité de reconnaissance d’image sur mobile.
Cela confirme l’importance d’utiliser le moteur d’images de Google (sans oublier celui de Bing qui est également très performant) dans ses recherches et ses veilles, d’autant que l’index de Google images n’est pas le même que celui de Google Web, ce qui peut donc faire émerger des résultats différents et complémentaires.
👍 La possibilité de croiser des recherches d’images avec de la recherche textuelle semble très prometteuse, mais on attendra que cela soit déployé en France pour vérifier si la pertinence est bien au rendez-vous.
👍 👎 Quant à la nouvelle fonctionnalité de filtre sur la couleur de peau, pas encore disponible en France, elle n’aura d’intérêt que dans des cas très précis et/ou pour la recherche de personnes. Et on peut se demander si elle ne posera pas quelques problèmes éthiques à l’avenir.
Mais on peut avoir l’espoir que si Google porte à nouveau de l’intérêt pour son moteur d’images, il développera de nouvelles fonctionnalités de recherche dans les années à venir.
Quelques pistes sur l’avenir de Google
La conférence 2022 confirme bien les angles stratégiques de Google : multimédia (avec les vidéos et les images), traduction et IA pour améliorer la compréhension des documents et des intentions de recherche pour Google et pour l’internaute.
- Parmi les innovations qui pourraient prendre de l’ampleur au cours des prochaines années, on notera que Google a aussi communiqué lors de sa conférence annuelle sur une fonctionnalité de résumé automatique disponible sur les documents hébergés sur Google Docs. Chaque document bénéficiera d’un résumé automatique avec 2/3 phrases contenant les éléments clés du document.
Si cette nouveauté reste pour le moment très simpliste et n’a que peu d’intérêt pour la veille et la recherche d’information, on peut se demander si ce n’est pas un premier pas vers une innovation majeure. Une fois que la qualité des résumés sera bien au rendez-vous, il n’est en effet pas impossible que Google utilise cette fonctionnalité dans ces outils de recherche et son moteur Web notamment.
Google exprime en effet régulièrement sa frustration vis-à-vis des méta descriptions fournies par les éditeurs de site Web qui servent à décrire le contenu d’une page et qui apparaissent en principe dans les résultats de recherche juste en dessous du titre du résultat. Google n’hésite d’ailleurs plus à remplacer les méta descriptions sans demander l’avis à quiconque lorsqu’il juge qu’elles ne sont pas assez parlantes et pertinentes. Il utilise alors une ou plusieurs phrases extraites de la page en question. Un résumé automatique de la page en guise de méta description pourrait alors représenter une solution plus satisfaisante pour Google, un peu moins pour les éditeurs de site Web qui perdraient encore un peu plus la main sur l’indexation de leurs contenus…
À l’avenir, nous ne rechercherons peut-être plus uniquement sur le contenu textuel d’une page web, mais également sur son résumé automatique.
- Et au regard des moyens importants mis en œuvre par Google pour tout ce qui a trait à la traduction de contenus, il n’est pas non plus impossible que Google propose un jour des résultats pertinents dans d’autres langues en partant d’une recherche faite dans sa langue natale.
Lors de la conférence de cette année, on s’étonnera tout de même de la grande absence des contenus audio comme les podcasts dans les annonces liés au multimédia, ce qui était pourtant un sujet important pour Google il y a encore un an à peine. Est-ce que Google considère que les podcasts font déjà partie du passé, les contraintes techniques pour rechercher sur du contenu audio sont-elles encore trop importantes ou bien les contraintes légales liées au droit d’auteur l’ont-elles découragé de poursuivre dans cette voie-là ? Seul l’avenir nous le dira.