L’expertise humaine qui donne du sens à l'IA

La veille et la recherche d’information sur les startups est une tâche complexe, en raison de leur parcours souvent mouvementé. Chaque année, des milliers de startups voient le jour, tandis que d’autres meurent ou sont absorbées par des grands groupes.

A cause de ce taux de natalité et de mortalité élevé des startups, les identifier et réaliser une veille sur cette catégorie d’entreprise demande un travail permanent de mise à jour des sources. Et cela requiert de la méthode et des outils de recherche.

Il existe de multiples sources pour rechercher de l’information sur les startups : les sources classiques comme la presse, le web ouvert, les bases financières…, mais aussi de plus en plus de moteurs et bases de données entièrement dédiés aux startups. Si l’idée est séduisante (avoir en un seul et même endroit toute l’information utile sur cette catégorie d’entreprises), ces outils sont-ils vraiment suffisants pour la veille et la recherche sur les startups et ont-ils une réelle valeur ajoutée par rapport à des sources plus classiques ?

Nous avons décidé dans cet article de le vérifier en cherchant à identifier des startups qui proposent des produits et services innovants autour du vin en France et en Europe.

Sept moteurs et bases de données spécialisées à l’essai

Les outils spécialisés sur les startups sont légion mais nous avons décidé d’en sélectionner sept, que nous avons jugés intéressants pour une démarche de recherche : Crunchbase, Whogotfunded, Startuplynx, Startuptracker, CB Insights, ProductHunt et les Pépites Tech.

Déjà abonné ? Connectez-vous...

Connexion

Sommaire octobre 2020

Rédaction

Bases no

385

publié en

2020.10

2418

Acheter ce no

Tags

sommaire

TENDANCES

• Moteurs de recherche et innovation : du discours officiel à la réalité du terrain

METHODOLOGIE

• Peut-on innover sur les opérateurs de recherche en s’inspirant du SEO, de l’OSINT… et des hackers ?

Moteurs de recherche et innovation : du discours officiel à la réalité du terrain

Carole Tisserand-Barthole

Bases no

385

publié en

2020.10

3204

Acheter ce no

Tags

Bing | recherche Web | Google | tendances | outils de recherche

Moteurs de recherche et innovation : du discours officiel à ... Image 1

La recherche sur le Web évolue de plus en plus vite et ce, en raison des avancées rapides de l’IA, du machine learning et du traitement du langage naturel et leur intégration dans les moteurs de recherche.

On ne peut plus rechercher sur le Web et sur les moteurs de recherche en 2020 comme on recherchait il y a à peine 5 ans. Google, tout particulièrement, évolue rapidement et annonçait il y a à peine quelques semaines plusieurs innovations majeures.

Pour comprendre comment cette évolution affecte le professionnel de l’information, il faut tout d’abord comprendre les dernières grandes innovations des moteurs pour ensuite analyser ce que cela signifie pour la recherche et la veille mais aussi sur la fonction de professionnel de l’information.

Pour suivre de près les grandes évolutions de la recherche et de la veille mais aussi du métier de professionnel de l’information, on peut bien sûr suivre l’actualité des différents acteurs de la recherche sur le Web et plus particulièrement des moteurs de recherche. Une autre solution tout aussi intéressante consiste à assister aux différentes conférences francophones et internationales dédiées aux professionnels de l’information.

En cette année qui ne ressemble à aucune autre, ces événements, riches en informations et qui permettent d’avoir un état des lieux précis à un instant t sur le monde de l’information se sont pour beaucoup digitalisées.

Nous avons assisté pour vous cette année à trois événements majeurs pour la veille et la recherche d’information (un en présentiel et deux à distance) :

Internet Librarian Connect aux Etats-Unis
CPI, le congrès des professionnels de l’information au Québec
I-expo, le salon de la veille, de l‘information et des connaissances en France

Nous allons proposer plusieurs articles au cours des prochains numéros de BASES sur les thèmes-clés abordés lors de ces différents événements.

Nous aborderons notamment la question :

Des tendances et innovations de la recherche d’information sur le Web en 2020 ;
Du rôle et de la place des professionnels de l’information face à la désinformation ou aux fake news;
Des tendances et évolutions de la formation à la recherche d’information ;
Des rôles et compétences-clés des professionnels de l’information en 2020 et dans le futur;
Du marketing et du ROI des services d’information.

Dans ce premier article, nous nous intéresserons donc aux grandes tendances et innovations qui viennent bouleverser la recherche d’information sur le Web ouvert notamment à travers des grandes évolutions des moteurs de recherche Web.

Déjà abonné ? Connectez-vous...

Connexion

Peut-on innover sur les opérateurs de recherche en s’inspirant du SEO, de l’OSINT, …et des hackers ?

Anne-Marie Libmann

Bases no

385

publié en

2020.10

4680

Acheter ce no

Tags

recherche Web | Google | OSINT | SEO

Peut-on innover sur les opérateurs de recherche en ... Image 1

Pour doper au maximum ses performances de recherche sur le Web, nous conseillons de suivre, pour s’en inspirer, trois types de spécialistes du Web auxquels on ne pense pas en général : les experts du référencement (SEO), de l’OSINT (open source intelligence) et du Google Dorking (ou Google hacking).

Nous avons examiné et confronté leurs recommandations et découvertes, et livrons dans cet article la liste des opérateurs qui marchent le mieux sur Google, ainsi que les requêtes que l’on peut construire de façon originale, et dont on peut s’armer quand on cherche des choses «introuvables»…

Il est acté, parmi les veilleurs et professionnels de l’information aguerris, que les bases de données payantes constituent des outils de premier choix, tant en raison de la richesse de leurs contenus que des langages de requêtes intégrés, conçus précisément pour assurer la meilleure performance de recherche.

Pour ce public exigeant, le Web a néanmoins acquis progressivement un statut d’outil tout autant indispensable, grâce à des ressources, au sens premier et figuré, inestimables.

Mais à la différence des serveurs de bases de données détaillant les spécificités de leurs langages de requêtes, Google et Bing, dont la quasi-totalité de la clientèle est peu encline à faire des requêtes complexes, ne communiquent que de façon très succincte sur leurs opérateurs avancés. Tout juste dispose-t-on de quelques menus d’aide à la recherche dite avancée, à la fréquence de mise à jour incertaine.

Pour Google, nous retiendrons : https://www.google.com/advanced_search pour la recherche textuelle, https://www.google.com/advanced_image_search pour la recherche d’images.
Pour Bing : https://help.bing.microsoft.com/#apex/18/fr/op%C3%A9rateurs et https://help.bing.microsoft.com/#apex/18/fr/10001/-1

Rappelons que dans nos colonnes, Carole Tisserand-Barthole teste régulièrement les capacités de recherche avancée de Google et autres moteurs, avec un diagnostic de plus en plus pessimiste sur la performance réelle des requêtes complexes construites avec des opérateurs. Google et Bing publient d’ailleurs désormais des réserves sur l’utilisation des opérateurs via des messages sur leurs supports.

Google annonce ainsi que «certains opérateurs de recherche ne renvoient pas de résultats complets» (sic), (https://support.google.com/websearch/answer/2466433?hl=fr) et Bing prévient qu’«il est possible que certaines fonctions et fonctionnalités décrites ici ne soient pas disponibles dans votre pays ou région» (https://help.bing.microsoft.com/#apex/18/fr/op%C3%A9rateurs).

Déjà abonné ? Connectez-vous...

Connexion

Sommaire septembre 2020

Rédaction

Bases no

384

publié en

2020.09

2413

Acheter ce no

Tags

sommaire

PANORAMA • Quel lecteur de flux RSS choisir en 2020 ?

IST • La nouvelle plateforme de Pubmed

SERVEURS • STN enrichit la recherche sur les valeurs numériques

ACTUALITES • L'actualité de la veille et la recherche d’information

Quel lecteur de flux RSS choisir en 2020 ?

Aurélie Vathonne, Carole Tisserand-Barthole

Bases no

384

publié en

2020.09

3797

Acheter ce no

Tags

évaluation outils | flux RSS

Quel lecteur de flux RSS choisir en 2020 ? Image 1

D’aucuns pourraient penser que le RSS, cette technologie vieille de 20 ans, autant dire une éternité à l’échelle du web, est à reléguer au rang des antiquités. Et pourtant, elle a remarquablement résisté aux années et survécu à la vague du web social. On pense à tort qu’elle a disparu, alors qu’elle reste incontournable pour les métiers de la veille.

Si les lecteurs de flux RSS ne sont en rien comparables avec les grandes plateformes de veille en termes de puissance et de fonctionnalités, certains ont su tirer leur épingle du jeu et se rendre utiles voire indispensables pour les veilleurs et ce, pour un coût modeste. C’est le cas d’Inoreader et Feedly, leaders aujourd’hui incontestés du RSS auprès des professionnels de l’information. D’autres acteurs ajoutent régulièrement des fonctionnalités intéressantes, d’autres encore arrivent également sur le marché.

Ces outils sont utilisés aussi bien par des veilleurs disposant de budgets très limités que par des professionnels disposant d’outils de veille ou de recherche professionnels payants et qui y ont recours en complément à ces outils.

Dans cet article, nous avons analysé les forces d’Inoreader et Feedly pour le veilleur et avons évalué les autres acteurs actuellement sur le marché et leur adéquation avec les besoins des professionnels de l’information.

Un peu d’« histoire »

Lorsque le RSS est apparu au début des années 2000, dans la mouvance de ce que l’on appelait à l’époque le web 2.0, il a été très vite utilisé et même promu sur les sites web. La grande majorité arboraient le petit logo orange qui signalait sa présence et les internautes étaient largement invités à souscrire, gratuitement, aux flux proposés pour les consulter dans leur lecteur/agrégateur favori ; il s’agissait de Netvibes ou Google Reader la plupart du temps.

Puis les éditeurs de sites web ont changé leur fusil d’épaule. L’utilisation massive des flux RSS par les internautes pour suivre le contenu mis à jour, a en effet rapidement provoqué une baisse de la fréquentation en ligne de leur site. En outre, ces mêmes éditeurs n’avaient plus aucun moyen de capter l’identification de leur audience, ne serait-ce que par une adresse e-mail, comme ils peuvent le faire très facilement au moyen de l’inscription à une newsletter…

Déjà abonné ? Connectez-vous...

Connexion

STN enrichit la recherche sur les valeurs numériques

François Libmann

Bases no

384

publié en

2020.09

3031

Acheter ce no

Tags

serveur de bases de données | méthodologie | information scientifique et technique

STN enrichit la recherche sur les valeurs numériques Image 1

Lancée en 2013, la recherche sur les valeurs numériques est une des valeurs ajoutées, originale, de l’offre du serveur STN qui propose, rappelons-le, un ensemble de banques de données dans le domaine de la littérature scientifique (références bibliographiques) et des brevets (références bibliographiques ou fulltext).

Le nombre de propriétés recherchables jusqu’à présent était de 55 telle que la charge électrique (en Coulomb), la force (en Newton), la fréquence (en Hertz), la masse moléculaire (en g/mol), la pression (en Pascal), etc.

On en trouve la liste en cherchant HELP NPS si l’on est connecté à STNext et plus précisément à une des bases offrant cette possibilité.

Sinon, on trouvera la liste à l’adresse http://www.stn-international.de/en/productsservices/products-services.

La mise à jour récente a ajouté la possibilité de rechercher sur quatre valeurs numériques supplémentaires, en peu moins classiques, portant leur nombre total à 59. Il s’agit de :

l’activité catalytique (/CATA en kat),
la force du champ magnétique (/MFST en a/m),
l’indice de réfraction (/RI en ri),
la surface spécifique de masse (/SSAM, en m2/kg).

Déjà abonné ? Connectez-vous...

Connexion

La nouvelle plateforme de Pubmed

François Libmann

Bases no

384

publié en

2020.09

2568

Acheter ce no

Tags

évaluation outils | information scientifique et technique

La nouvelle plateforme de Pubmed Image 1

Lancée le 18 décembre 2019, le « new PubMed » (voir figure 1.) est devenu le 18 mai dernier la plateforme par défaut de PubMed, la précédente (legacy PubMed) restant en ligne au moins jusqu’au 30 octobre 2020.

Cette période de cinq mois a été mise à profit pour réaliser différents tests et recueillir les réactions des premiers utilisateurs.

L’outil gratuit Pubmed a été lancé en 1996 comme un site Web expérimental et revendique aujourd’hui 3,4 millions d’utilisateurs pour un jour de semaine moyen, effectuant des recherches dans un corpus de plus de 31 millions de références bibliographiques.

Figure 1. Nouvelle interface de recherche de Pubmed

Dans cet article, nous revenons sur l’histoire de Pubmed pour bien comprendre son positionnement actuel, nous analysons ensuite le contenu de la plateforme et enfin nous comparons l’ancienne et la nouvelle plateforme en termes de fonctionnalités.

Déjà abonné ? Connectez-vous...

Connexion

L’actualité de la veille et la recherche d’information

Carole Tisserand-Barthole

Bases no

384

publié en

2020.09

2670

Acheter ce no

Tags

outils de veille | outils de recherche

L’actualité de la veille et la recherche d’information Image 1

L’information qui gravite autour de la veille et de la recherche d’information est toujours aussi dense en ce mois de septembre 2020.

Un moteur de recherche pour Apple ?

Une rumeur a secoué le monde des moteurs de recherche au mois d’août dernier. Apple pourrait prochainement lancer son propre outil de recherche. Mais qu’en est-il vraiment ?

Aujourd’hui, seuls Google, Bing et Yandex (et probablement Weibo pour la Chine) disposent de leur propre index. Tous les autres moteurs qui vont et viennent sur la scène de la recherche web utilisent en réalité pour la plupart l’index de Bing et parfois, mais c’est beaucoup plus rare, l’index de Google ou de Yandex.

Tous ces outils sont en réalité des métamoteurs plus que des moteurs de recherche comme c’est le cas de Qwant, DuckDuckGo, etc. même si certains acteurs aimeraient faire croire le contraire.

Mais le fait de partir d’un index existant n’a rien de très surprenant. Il est en effet pratiquement impossible de créer aujourd’hui un index à partir de zéro tant cela serait chronophage et couteux, sans compter que des acteurs comme Google font cela depuis maintenant plus de 20 ans.

Seul Apple serait en mesure de créer un véritable moteur de recherche car il dispose d’un robot crawler de sites appelé Applebot qui existe depuis 2015. Contrairement aux autres donc, il ne partirait pas de rien (mais 5 ans reste insignifiant par rapport aux 20 ans d’ancienneté de Google...)

Plusieurs experts des moteurs ont récemment relevé plusieurs indices laissant supposer qu’Apple pourrait se lancer dans la création de son propre moteur :

une augmentation des offres d’emploi d’Apple pour des search engineers ;
le robot Applebot qui visite plus régulièrement les sites web et qui bénéficie d’une nouvelle page de support plus détaillée
une récente décision de justice où Apple a été épinglé par l’autorité de la concurrence britannique reprochant à Google de verser 1,2 milliard de livres à Apple pour rester le moteur par défaut sur Iphone, ce qui serait anti-concurrentiel. Apple pourrait décider de s’en affranchir pour éviter tout problème à l’avenir et gagner son indépendance.

Déjà abonné ? Connectez-vous...

Connexion