Quand la presse se contente de reprendre une dépêche ou un communiqué : comment faire le tri ?

Carole Tisserand-Barthole
Netsources no
120
publié en
2016.01
1166
Acheter ce no
Tags
presse en ligne | méthodologie | agrégateurs de presse
Quand la presse se contente de reprendre une dépêche ou un ... Image 1
Quand la presse se contente de reprendre une dépêche ou un ... Image 1

Que ce soit pour une veille ou une recherche d’informations, la presse reste une source privilégiée.

Néanmoins, on constate fréquemment que de nombreux articles de presse se contentent de reprendre le contenu d’une dépêche ou d’un communiqué de presse soit à l’identique, soit en modifiant le titre et en reformulant quelques phrases.

Or, s’il peut être intéressant pour un service communication de visualiser l’ensemble des retombées sur un sujet (événement, actualités de l’entreprise, etc.), dans la majorité des autres cas, il n’y a aucun intérêt à visualiser des dizaines voire des centaines d’articles répétant strictement la même chose. C’est même une perte de temps…

Alors comment faire pour éliminer ces articles sans valeur ajoutée et comment repérer ceux qui vont plus loin dans l’analyse et apportent des informations complémentaires ?

Pour cela, nous avons décidé de prendre un exemple concret : le rachat par Orange de la société Millicom (marque Tigo) en République Démocratique du Congo.

Nous nous limiterons ici à la presse francophone. Le but est de repérer des données sur le montant de la transaction, la stratégie envisagée derrière ce rachat ainsi que toute autre donnée stratégique.

Comme dans la majorité des informations orientées business, la nouvelle est en premier lieu diffusée par l’entreprise sous forme d’un communiqué de presse :

  • Sur le site Orange.com, on trouve un bref communiqué indiquant que le marché mobile en RDC est en pleine croissance (40 millions d’abonnés), qu’il s’agit donc d’un marché intéressant pour Orange et qu’il envisage de devenir leader dans ce pays. Cette transaction doit encore être validée par les autorités compétentes.
  • On trouve sur le site de Millicom un communiqué de presse en anglais. Celui-ci indique que l’entreprise va vendre 100% de ses parts à Orange pour un montant de 160 millions de dollars. Le CEO de Millicom indique que l’entreprise préfère se réorienter sur ses marchés les plus prometteurs et que cette vente leur permettra de réinvestir sur leurs marchés existants en Afrique et en Amérique Latine.
  • Les agences de presse sont bien souvent les premières à diffuser l’information :
  • L’AFP a publié une dépêche intitulée : Télécoms: Orange rachète les activités de Millicom en RDC. Cette dépêche mêle les informations publiées dans les deux communiqués (montant de la transaction, stratégie d’Orange et stratégie de Millicom). Seuls éléments complémentaires : on apprend qu’Orange est présent en RDC depuis 2012 et qu’il a également racheté récemment deux entreprises télécoms au Burkina Faso et en Sierra Leone à son concurrent indien Airtel.
  • Reuters publie quant à lui une très brève dépêche qui apporte moins d’informations que celle de l’AFP.
  • AOF (Agence Option Finance) a également publié une dépêche. Elle n’apporte pas d’élément supplémentaire

Pour effectuer une recherche presse, deux options s’offrent à nous : utiliser Google et plus précisément Google Actualités (ou un autre moteur) ou bien interroger un agrégateur ou une base de données de presse qui permet d’entrer des stratégies plus complexes, et qui donne accès à des articles de la presse écrite qui ne sont pas en libre accès sur le Web mais cela nécessite bien entendu d’avoir un abonnement auprès de ces services.

Une recherche sur Google News en croisant les termes Orange et Millicom nous ramène une trentaine de résultats. On remarque en bas de la page une indication de Google : « Afin d’afficher les résultats les plus pertinents, nous avons omis quelques entrées qui sont très similaires aux 32 entrées actuelles. Si vous le souhaitez, vous pouvez relancer la recherche pour inclure les résultats omis. ». Et si on relance la recherche sur ces résultats omis, on arrive alors à près de 200 articles ! Google effectue donc déjà un premier tri en supprimant les articles strictement identiques.

Google avait en effet indiqué il y a plusieurs années qu’il souhaitait mettre en avant l’article ou la source originale et éliminer les articles qui se contentent de reprendre à l’identique un autre article. Il est malheureusement impossible de savoir comment fonctionne l’algorithme de dédoublonnage de Google et s’il exclut uniquement les articles identiques ou bien également ceux qui sont similaires.

Malgré ce premier tri (qui élimine déjà plus de 150 articles !), on a toujours le sentiment que, parmi les résultats, certains n’apportent pas de réelle valeur ajoutée et ont au mieux reformulé quelques phrases. L’article du Point porte le même titre que celui de l’AFP ; en le consultant, on constate qu’il est très court (à peine 3 lignes) et que ces quelques lignes ne sont qu’un copié-collé de la dépêche de l’AFP (qui est d’ailleurs mentionnée). Pour Challenges, c’est la dépêche de Reuters à l’identique. Bref, il reste encore du tri à effectuer. La difficulté étant de trouver un juste milieu entre trop de tri (au risque de supprimer des articles qui disposaient d’informations complémentaires) et pas assez (la recherche et la consultation des articles est alors chronophage).

Du côté des agrégateurs de presse, nous avons interrogé Pressedd, Europresse (réputés pour leur couverture de la presse française) ainsi que Factiva et LexisNexis (presse internationale mais bonne couverture de la presse francophone et française).

Voici les résultats :

  • Pressedd : 53 articles
  • Europresse : 14 articles
  • Factiva : 40 articles
  • LexisNexis : 19 articles

La quasi-majorité des articles identifiés sont bien dans le sujet.

Mais à première vue, on a également le sentiment que certains articles ne font que reprendre la dépêche ou le communiqué.

Au final, en utilisant ces différents éléments de stratégie et en consultant dans le détail les articles qui nous semblaient potentiellement intéressants (mais ils ne l’étaient pas tous), nous n’avons conservé que quelques articles (cinq tout au plus) proposant une analyse approfondie ou des informations complémentaires. C’est finalement bien peu comparé aux 200 du départ !

Astuces sur les moteurs de recherche

  • Eliminer les articles avec un titre identique en utilisant l ‘opérateur NOT (symbolisé ici par le signe –). Exemple : Orange Millicom –« Télécoms: Orange rachète les activités de Millicom en RDC »
  • Eliminer de la requête des morceaux de phrases présentes dans la dépêche ou le communiqué .
  • Les journaux qui reprennent une dépêche doivent en principe citer leur source. On peut donc éliminer les articles citant les agences. Exemple : Orange Millicom –AFP –Reuters –AOF

On descend alors à 21 articles.

  • On peut supprimer les portails et agrégateurs d’informations ainsi que les sites financiers type boursorama, zone finance, etc. qui ne diffusent que des communiqués et dépêches.
  • Les dépêches indiquent parfois le nom d’un auteur. On peut donc supprimer les articles qui citent ces noms car ils ne feront que reprendre le contenu de la dépêche. Exemple : dans notre cas, la dépêche Reuters citait 2 auteurs et pour la dépêche AFP, on avait le nom du photographe ayant pris la photo illustrant la dépêche.

Astuces sur les serveurs et bases de données presse

  • On peut réutiliser les astuces présentées pour Google news (en pensant bien à adopter la syntaxe spécifique du serveur).
  • Certain serveurs proposent des options pour dédoublonner les articles identiques ou similaires grâce à un algorithme propriétaire. C’est le cas de Factiva (élimination des articles identiques ou similaires) et LexisNexis (élimination des articles avec une similarité moyenne ou élevée).
  • Tous les serveurs indiquent la taille des articles (en nombre de mots). On peut donc utiliser cette indication pour déterminer quels articles vont plus loin dans l’analyse.

Exemple : la dépêche de l’AFP fait environ 300 mots. Tous les articles avec un nombre de mots bien supérieur ont des chances de fournir des informations complémentaires comme par exemple l’article du Figaro intitulé « Orange poursuit son expansion en Afrique » qui compte 720 mots.