Les nouveaux moteurs de recherche lancés en 2021
Plusieurs moteurs ont vu le jour en 2021 : Brave Search, You.com, Presearch ou encore Neeva.
Petit tour d’horizon de ces nouveaux moteurs, de leurs spécificités et de leur utilité potentielle pour les professionnels de l’information.
Brave Search : un moteur avec son propre index
Brave Search (https://brave.com/fr/search/) est un moteur développé par Brave, le navigateur allemand qui surfe sur le respect de la vie privée et qui gagne en popularité depuis quelques années (cf. Figure 1. Interface de Brave Search).
Le moteur lui aussi se positionne sur le créneau du respect de la vie privée et indique ne pas suivre les données, clics et recherche de ses utilisateurs.
Figure 1. Interface de Brave Search
Sa grande spécificité, c’est qu’il a développé son propre index, ce qui est aujourd’hui très rare. La majorité des moteurs, qui sont en réalité des métamoteurs, utilisent l’index de moteurs existants, Bing dans la grande majorité des cas, sur lequel ils appliquent ensuite leurs algorithmes de classement.
En juin, Brave Search a été lancé en version bêta privée puis a été ouvert au public dans le courant de l’été 2021.
Pour ce qui est des algorithmes de classement, Brave indique que « la recherche Brave n’utilise ni méthodes cachées ni algorithmes pour influencer ou censurer les résultats. Nous dépendons de contributions communautaires anonymes pour affiner les résultats et des modèles de classement alternatif issus des communautés pour garantir la diversité. »
Brave a ainsi développé le concept de « Goggles » pour réduire les biais de l’algorithme.
Il s’agit d’un ensemble de règles et filtres qui seraient utilisés pour définir les corpus de sources qui vont être exploités pour la recherche et les résultats. Il serait ainsi possible de limiter la recherche uniquement à des sites non commerciaux, des titres de presse indépendants ou encore des forums spécialisés par exemple.
Même si l’idée est très séduisante, nous n’avons pas trouvé trace de ces filtres lors de nos tests. Brave Search a communiqué sur les Goggles en juin dernier et il est donc probable que cela ne soit pas encore implémenté. À suivre !
En termes de fonctionnalités, Brave Search personnalise les résultats selon la localisation, mais l’internaute peut modifier ces paramètres et choisir un pays et même une localisation très précise.
Enfin, comme de nombreux autres moteurs, il propose différentes verticalesimages, actualités et vidéos. Chacune dispose de filtres spécifiques (filtre par date, format des images, licence des images, etc.).
À ce stade le moteur est gratuit et sans publicité, mais l’entreprise prévoit d’introduire de la publicité et de lancer en parallèle une version payante sans publicité.
Notre avis :
Brave dispose donc de nombreuses qualités pour répondre aux exigences des professionnels de l’information. Nous verrons dans la suite de cet article comment il se comporte face à nos requêtes et s’il mérite sa place dans l’arsenal des professionnels.
You.com : le métamoteur agrégateur
You.com est un petit nouveau lancé en version publique le 9 novembre dernier (cf. Figure 2. Interface de You.com). À l’origine de ce moteur, on retrouve Richard Socher, l’ancien chief scientist de Salesforce.
Son slogan : « The private search engine that summarizes the web for you » (le moteur de recherche privé qui résume le Web pour vous). Dans la réalité, il n’est absolument pas question de résumé automatique ni même de featured snippets à la Google ou Bing, mais d'agrégation de contenus issus de différents types de sources et d’univers.
Figure 2. Interface de You.com
Visuellement, les résultats sont composés de blocs de réponses qui varient selon la question posée comme Dictionary, Wikipédia, Résultats web, Stackoverflow, Reddit, Vidéos, News, LinkedIn, Twitter, Medium, Yelp. On navigue ensuite dans les résultats de chaque bloc de manière horizontale.
Ces blocs sont déplaçables et on peut choisir de mettre les résultats web ou par exemple les résultats issus de LinkedIn en haut de page si on juge qu’ils sont plus importants pour cette recherche.
Le moteur utilise des algorithmes de traitement de langage naturel (NLP) pour comprendre les requêtes, analyser les pages web et classer les résultats.
Pour le bloc « résultats web », You utilise le moteur Bing.
En termes de fonctionnalités de recherche et de filtres, l’outil ne permet rien, ce qui est décevant. Il n’y a même pas de filtres par date par exemple.
Notre avis :
You.com semble peu adapté pour les professionnels de l’information.
Sa principale force résiderait dans le fait qu’il agrège des résultats en provenance de multiples sources. Nous verrons dans la suite de cet article si cette agrégation peut apporter quelque chose à une recherche d’information professionnelle.
Presearch : le métamoteur qui vous récompense en cryptomonnaie
L’aventure de Presearch a commencé il y a pratiquement une dizaine d’années avec le lancement d’une startup fondée sur la blockchain.
Au début de l’année 2021, Presearch a lancé un moteur de recherche décentralisé du même nom (cf. Figure 3. Interface de Presearch). Son créneau principal : la confidentialité. Autre spécificité, les internautes sont rémunérés en jeton PRE, la cryptomonnaie développée par la startup en échange de leurs recherches sur le moteur. Cette monnaie peut être convertie en argent classique ou utilisée pour de la publicité sur le moteur.
Figure 3. Interface de Presearch
Le moteur propose plusieurs verticales : web, images, vidéos et actualités. Pour chaque requête, le moteur propose un lien direct pour relancer la recherche sur une centaine d’autres moteurs/providers comme Google, Bing, Yandex, Twitter, etc.
Les fonctionnalités de recherche et de filtres sont malheureusement quasi-inexistantes.
Notre avis :
Comme pour You.com, le bénéfice pour le professionnel de l’information n’est pas directement évident. Son principal atout réside dans son moteur qui utiliserait l’API de Bing, mais qui semble apporter des résultats quelque peu différents de ce qu’on peut trouver sur d’autres moteurs et dans sa capacité à pouvoir relancer les requêtes sur une centaine d’autres moteurs.
Neeva : encore à l'état de promesse…
Le moteur Neeva, lancé par des anciens de Google attise la curiosité des internautes depuis des mois. À ce stade, nous n’avons pas été en mesure de le tester, car il est n’est pas encore accessible à tous. Mais quelques experts et journalistes américains ont déjà eu la chance d’y avoir accès.
Voici donc un résumé des premières impressions sur le moteur par ces premiers « testeurs ». Si certains semblent très enthousiastes, d’autres sont à l’inverse plus réservés quant à l’avenir du moteur.
Car il s’agit d’un moteur entièrement payant (5 $/mois) qui, en échange, ne propose aucune publicité et respecte la vie privée des utilisateurs. Mais est-ce suffisant alors qu’il existe des moteurs sur un créneau similaire qui, eux, restent gratuits ?
D’après les premiers retours, les résultats sont bien différents de ceux que l’on peut avoir sur Google. Mais les résultats de Google resteraient tout de même meilleurs.
En termes d’index, il semblerait que Neeva agrège des résultats en provenance de différentes API (Bing, Wikipédia, IMDB, etc.), mais il crawlerait aussi le Web par lui-même pour ajouter certains éléments.
Au niveau des fonctionnalités, Neeva propose des filtres par type de contenus (blogs, forums,…), ce qui peut être très utile si on souhaite exclure les résultats commerciaux par exemple. Neeva propose également des « Spaces » qui sont des espaces thématiques où l’utilisateur peut bookmarker les résultats qu’il souhaite conserver. Chaque « Space » peut être ensuite partagé avec d’autres personnes.
Notre avis :
Même s’il est difficile de se prononcer sur un outil que l’on ne peut même pas tester, Neeva semble être en mesure d’avoir un rôle à jouer pour la recherche d’information professionnelle.
L’une des forces du moteur se situerait dans la personnalisation qui peut être faite : il est par exemple possible d’indiquer manuellement une localisation précise afin d’avoir des résultats locaux, d’indiquer ses sources préférées afin qu’elles apparaissent mieux dans les résultats. Enfin l’utilisateur peut connecter Neeva avec Google Drive, Dropbox ou encore Office 365 afin d’avoir des résultats « personnels » pertinents qui s’intègrent dans la liste de résultats.
Quels moteur ou métamoteur utiliser en 2021 ? Nous avons testé avec un cas pratique.
Il y a bien évidemment les nouveaux moteurs que nous venons de présenter dans cet article, mais il y en a aussi beaucoup d’autres. Le marché est en réalité très vaste même si tout le monde ne parle que de Google.
Il s’agit principalement de métamoteurs, car ils ne disposent pas de leurs propres index, mais comme ils appliquent leurs propres algorithmes sur les résultats, les résultats peuvent être différents de ce que l’on peut trouver sur Bing ou Google.
Dans le tableau ci-dessous, nous avons listé les principaux moteurs et métamoteurs aujourd’hui sur le marché en nous fondant en partie sur le recensement réalisé par le site https://www.searchenginemap.com/.
Nous avons volontairement exclu les moteurs locaux comme Baidu pour la Chine, Naver pour la Corée du Sud, etc.
Nous les avons ensuite tous testés à partir de 3 sujets de recherche très différents, mais représentatifs des besoins des professionnels.
Principaux moteurs et métamoteurs en 2021
URL | Moteur | Métamoteur | Index | Nationalité | |
Activesarchresults | https://www.activesearchresults.com/ | X | Index maison | USA | |
Ask | https://www.ask.com | X | USA | ||
Bing | X | Index maison | USA | ||
BraveSearch | https://brave.com/fr/search/ | X | Index maison | Allemand | |
Carrot2 | https://search.carrot2.org/#/search/web | X | Etools.ch | Polonais | |
DuckDuckGo | https://duckduckgo.com/ | X | Yandex et Bing | USA | |
Ecosia | https://www.ecosia.org/ | X | Bing | Allemand | |
Ekoru | https://ekoru.org/ | X | Bing (Yahoo) | Australien | |
Entireweb | https://www.entireweb.com/ | X | Yandex et Bing | Suédois | |
Etools.ch | https://www.etools.ch/ | X | Google, Mojeek et Bing et Yandex + ajout des moteurs Ask, Base, Brave, DuckDuckGo, Fastbot, Lilo, Moose, Qwant, Tiger, Wikipedia, Yahoo | Suisse | |
Exactseek | https://www.exactseek.com/ | X | Index maison | USA | |
Gigablast | https://gigablast.com/ | X | Index maison | USA | |
https://www.google.fr/ | X | Index maison | USA | ||
Infospace | https://www.infospace.com/ | X | Bing | USA | |
Lilo | https://www.lilo.org/ | X | Bing | Français | |
Lycos | https://www.lycos.com/ | X | Bing | USA | |
Millionshort | https://millionshort.com/ | X | Bing | Canadien | |
Mojeek | https://www.mojeek.com/ | X | Index maison | UK | |
Monstercrawler | https://www.monstercrawler.com/ | X | Bing | UK | |
OneSearch | https://www.onesearch.com/ | Bing | USA | ||
Oscobo | https://www.oscobo.com/ | X | Bing | UK | |
Presearch | https://www.presearch.org/ | X | Bing | Canadien | |
private.sh : | https://private.sh/ | X | Gigablast | NA | |
Qwant | https://www.qwant.com/ | X | X | Bing | Français |
Search Encrypt | https://www.searchencrypt.com/home | X | Bing | Iles Caimans | |
SearX | https://searx.space/ | X | Google et Bing | NA | |
Startpage | https://www.startpage.com/ | X | Néerlandais | ||
Swisscows | https://swisscows.com/ | X | Bing | Suisse | |
Whaleslide | https://whaleslide.com/ | X | Bing | UK | |
Yahoo | https://fr.yahoo.com | X | Bing | USA | |
Yandex | https://yandex.com/ | X | Index maison | Russe | |
You.com | https://you.com/ | Bing pour les résultats web et API de nombreux autres services (Wikipédia, Twitter, Linkedin, etc.) | USA | ||
Zapmeta | https://www.zapmeta.com/ | X | Bing | Néerlandais |
- Pour la première recherche, nous avons recherché un document précis en l’occurrence un ouvrage intitulé « Employment and disability: trends and issues for the 1990s » que nous avions déjà utilisé pour un précédent article. Nous savons que ce livre est disponible sur Archive.org.
- Pour la deuxième recherche, nous avons cherché à obtenir une liste de ressources sur un thème précis, en l’occurrence une liste d’outils permettant de prendre des notes sur des vidéos. Nous avons lancé la recherche en français puis en anglais, car certains moteurs ne sont performants que sur la langue anglaise. Nous avons entré la requête en langage naturel pour évaluer la capacité de compréhension des différents moteurs.
- Pour la dernière requête, nous avons voulu essayer de retrouver un maximum de retombées sur une actualité récente. Nous avons choisi une actualité qui n’allait pas générer trop de résultats, en l’occurrence la décision d’un maire (Karl Olive) de demander une caution aux mariés, suite à des dégradations lors des mariages dans sa mairie.
Requête 1 : recherche d’un document précis
La majorité des moteurs ont bien retrouvé le document, mais certains ont nécessité l’utilisation des guillemets pour la recherche d’expression exacte. Brave Search, qui n’avait pas réussi à retrouver le document le mois dernier lors d’un test pour un autre article a cette fois-ci retrouvé le document, preuve que son index ne cesse de grandir.
Seuls Activesearchresults, DuckDuckGo, Exactseek, Gigabast, Mojeek, Private.sh, SearX et Zapmeta n’ont pas du tout retrouvé le document.
Requête 2 : chercher des ressources/outils sur une thématique (en anglais et français)
- En français nous avons utilisé la requête suivante :
outils pour prendre des notes sur des vidéos
- En anglais nous avons utilisé la requête suivante :
tools to add notes on video
Globalement, la majorité des moteurs ont bien compris la question et proposaient des résultats pertinents aussi bien en français qu’en anglais.
Sur cette question, les moteurs dont la liste suit ont été mauvais et n’ont pas correctement compris la question ou n’ont proposé que très peu de résultats pertinents : ActiveSearch, Ask, Carrotsearch, Duckduckgo (mauvais en français seulement), Exactseek, Gigablast, Mojeek, Private.sh, SearX, Yandex (mauvais en français seulement).
Requête 3 : rechercher des retombées sur une actualité
La requête que nous avons utilisée était la suivante : karl olive caution
.
Pour cette requête, on a pu constater que le nombre de résultats variait considérablement d’un moteur à autre : certains n’en ont retourné aucun là ou d’autres en ont proposé une cinquantaine. Google a réussi à proposer 42 retombées.
Parmi les bons élèves, on citera ici Ekoru qui a proposé de nombreux résultats pertinents (même s’il y avait des doublons), Bing, Brave Search, Etools, Presearch, SearchX ou encore StartPage qui ont affiché des résultats complémentaires à ceux de Google.
Une dizaine de moteurs qui méritent de figurer dans la panoplie du professionnel de l’information
Nos tests ont mis en évidence que bon nombre de moteurs et métamoteurs n’ont aucune valeur ajoutée pour la recherche d’information professionnelle. Les moteurs comme Ecosia ou Lilo par exemple proposent des résultats quasiment identiques à ceux de Bing, mais avec moins de fonctionnalités. S’ils peuvent avoir une utilité dans un contexte privé, ils seront inutiles dans un contexte professionnel. D’autres moteurs proposent trop de résultats non pertinents pour mériter qu’on s’y intéresse.
Pour les professionnels de l’information, nous recommanderons donc en plus de Google :
- Bing pour ses fonctionnalités de recherche et sa capacité à afficher plus de résultats que Google ;
- Brave Search pour son index indépendant qui s’améliore de jour en jour et qui permet d’avoir des résultats complémentaires. On attend également les possibilités de personnalisation des sources avec impatience ;
- Carrot2 pour ses capacités de clustering qui permettent d’explorer les concepts autour d’une requête ou d’un mot-clé ce qui peut être utile quand on débute une recherche. Pour le reste, les résultats sont souvent très mauvais ;
- Ekoru qui arrive à trouver des résultats complémentaires et plus nombreux sur certaines questions ;
- Etools pour sa capacité à interroger de nombreux moteurs et proposer des résultats complémentaires ;
- Millionshort pour sa capacité à exclure les résultats des sites les plus visibles du Web, ce qui permet d’explorer des sources plus confidentielles ;
- Presearch pour sa capacité à proposer des résultats complémentaires ;
- Qwant qui, même si les résultats proposés ressemblent beaucoup à ceux de Bing, semble quand même utiliser son propre index pour quelques résultats, ce qui permet d’avoir des éléments complémentaires ;
- SearchX qui arrive à trouver des résultats complémentaires et plus nombreux sur certaines questions. Mais sur d’autres questions, il s’avère extrêmement mauvais ;
- Startpage qui arrive à trouver des résultats complémentaires et plus nombreux sur certaines questions.
En ce qui concerne les nouveaux moteurs, Brave Search est de loin celui qui mérite le plus d’attention, suivi de Presearch. You.com n’aura que peu d’utilité à ce stade. Il ne reste plus qu’à tester Neeva lorsqu’il sera disponible !