Dans les universités
, pour les mémoires, les thèses et autres publications de cette nature le plagiat est un mal auquel les directions ont répondu par l’usage quasi systématique d’outils de détection. Tout document rendu par les étudiants et, bien souvent aussi les enseignants chercheurs est passé au crible d’un logiciel pour détecter les passages purement copiés ou trop similaires à d’autres publications, voire les paraphrases. Parmi les outils les plus performants et utilisés, on peut citer Urkund (https://www.urkund.com/), Turnitin (https://www.turnitin.com/fr) et Compilatio (https://www.compilatio.net/fr/).
Quant aux articles scientifiques
(sciences dures autant que SHS), les revues à comité de lecture sont supposées faire plusieurs vérifications tant sur la forme que sur le fond. Pour les autres publications, la rigueur est plus variable, le pire étant les pratiques des revues dites prédatrices dont le seul but est de faire payer un droit de publication à l’auteur, détournant à leur profit les règles de l’open access.
En ce qui concerne les brevets et les marques
, les règles sont également bien établies :
- Un brevet doit en, particulier, répondre au critère de nouveauté absolue, et toute description de l’objet du brevet sous quelque forme que ce soit et sur quelque support que ce soit (journal, Internet, et même bande dessinée), antérieure au dépôt de ce brevet, et à condition qu’elle ait été publiquement accessible, lui enlève toute validité. Cela n’empêche pas de citer des brevets ou des publications proches pour bien mettre en avant l’originalité du brevet. Il n’y a donc pas plagiat.
- Pour les marques, l’INPI se charge de vérifier s’il existe une marque identique, auquel cas la demande de dépôt de la marque sera rejetée. En cas de contrefaçon de produits physiques, les autorités douanières et judiciaires sont compétentes.
Dans la presse
, on trouve fréquemment des articles très proches, voire identiques. Il peut s’agir de la reprise d’un communiqué de presse et l’organisme qui est à l’origine de ce communiqué sera d’autant plus satisfait que les reprises sont nombreuses, même à l’identique, ce qui est en fait assez rare, car cela créerait une sorte d’obligation de publier l’intégralité de communiqués de presse d’autres organisations. Le cas des communiqués émanant de syndicat est particulièrement sensible à ce sujet.
On trouve aussi des reprises de dépêches d’agences
(AFP, Reuters,..) mais cela est parfaitement normal puisque les publications qui s’abonnent aux fils d’agence achètent en même temps le droit de publier dans leur support tout ou partie de ces informations.
Plus rarement, il peut arriver que le correspondant local d’un journal national pille sans vergogne un article écrit par un confrère local.
Sur le web
, on peut également trouver :
- Des entreprises qui n’hésitent pas à piller l’argumentaire de leurs concurrents pour enrichir leurs sites web ;
- Des articles de blogs qui reprennent quasiment mot pour mot des articles de presse ou autres articles de blogs sans citer la source ;
- Ou encore des sites et blogs qui publient des billets a priori originaux mais qui ne sont en réalité que des traductions mot pour mot d’articles publiés dans d’autres langues sans citer la source.
Ces types de plagiat ne sont pas forcément simples à repérer.
Le plagiat concerne surtout les textes longs, détaillés, ayant une large part de technicité et faisant état d’une grande expertise du sujet traité comme on l’a dit précédemment.
Lorsque l’on pense aux outils anti-plagiat, on pense immédiatement à l’utilisation traditionnelle de ceux-ci, et aux implications pour les étudiants en université et les chercheurs dans le public ou salariés d’entreprise.
Mais il existe d’autres cas, notamment en entreprise, où ces outils pourraient avoir une utilité.
La détection de plagiat au service de l’IE
Le cas du département R&D
Si le monde universitaire a su s’organiser et sensibiliser ses parties prenantes au plagiat et développer des méthodes pour le repérer, les entreprises peuvent également faire face au plagiat qui concerne des publications, qu’il faut bien distinguer de la contrefaçon qui concerne en général des objets ou des procédés brevetés.
Dès lors que les auteurs d’un article « inspirant » sont correctement cités, et que l’article est loin d’être identique il n’y a pas plagiat et la citation contribue à la visibilité de l’auteur et de son organisation d’origine.
Pour éviter tout souci et éviter que des concurrents bénéficient de leurs avancées technologiques, de nombreuses sociétés n’autorisent pas, sauf cas exceptionnel, leurs chercheurs à publier des articles et choisissent soit le dépôt de brevet, soit l’établissement d’une stricte politique de secret. Elles sont donc, en général fort peu motivée par une politique de détection de plagiat de publications qu’il s’agisse ou non des leurs. Par contre elles peuvent avoir des politiques très développées et parfois très coûteuses de détection de contrefaçon tant dans le domaine de brevets que de celui des marques.
L’intérêt du brevet est d’ailleurs double puisque d’une part, il n’est publié que 18 mois après sa publication et que d’autre part il s’agit d’un actif qui peut être monnayable.
La question du preprint
Le preprint, est le fait de prépublier un article scientifique dans une base de données en accès libre, comme par exemple ArXiv (https://arxiv.org/) ou Hal, etc. Le preprint permet aux auteurs de soumettre leur article à l’évaluation de leurs confrères et consœurs afin d’y apporter des modifications, avant de publier l’article dans une revue scientifique, en particulier à comité de lecture.
Le preprint est donc un procédé ambivalent. Il est avantageux pour les chercheurs, car cela leur permet d’améliorer la présentation de leurs travaux et évite d’avoir à rétracter des articles potentiellement incomplets ou comportant des erreurs. Mais il est également risqué, car le preprint est une étape d’évaluation et de correction, ouvrant la porte à des pratiques de pillage des idées exposées pour les reprendre à son compte en transformant les noms et les données des expériences.
Le plagiat pour les contenus corporate
Que ce soit pour vérifier que les travaux et réalisations de ses salariés ne relèvent pas du plagiat (faisant ainsi risquer des poursuites judiciaires à l’entreprise) ou pour vérifier que le contenu de la page Web de l’entreprise n’a pas été indûment repris, des outils existent.
- Dans le premier cas, le logiciel de détection du plagiat Similarity checker, développé par Microsoft et proposé à l’utilisation sur le logiciel de traitement de texte Word permet de détecter les phrases mal citées, en s’appuyant sur Bing Search. Le logiciel indique la source sur Internet et propose une mise en forme pour la citer correctement. Il doit sortir en juillet, en anglais tout d’abord, puis dans d’autres langues au fur et à mesure.https://www.bleepingcomputer.com/news/microsoft/microsoft-word-to-get-bing-powered-plagiarism-checker/
- Dans le second cas, il peut être utile pour une société de surveiller si le contenu de son site Internet (slogans, descriptifs, phrases d’accroche, etc.) est utilisé sur d’autres pages. Lorsque ce contenu est mis à disposition pour la promotion de salons ou dans le cadre d’un partenariat, ce n’est pas problématique. Mais lorsqu’un concurrent reprend une phrase clé ou des explications de procédés, cela peut s’avérer problématique pour la visibilité, la réputation et in fine la profitabilité de la société.
L’outil Plagiashield (https://plagiashield.com/) surveille jusqu’à 500 pages à partir des URL renseignées. Les forfaits payants mensuels permettent d’augmenter cette limite. Les outils TinEye (https://tineye.com/) et Pixsy (https://www.pixsy.com/) permettent de détecter les images frauduleusement utilisées.
Les outils anti-plagiat pour le sourcing et la recherche d’information
L’ouvrage L’information à tout prix, écrit par Julia Cagé, Marie-Luce Viaud et Nicolas Hervé et publié par Ina Éditions en 2017, renseigne et quantifie à travers des infographies l’importance du copié-collé sur Internethttps://larevuedesmedias.ina.fr/64-de-ce-qui-est-publie-en-ligne-est-du-copie-colle-pur-et-simple. On y apprend que « 64 % de ce qui est publié en ligne est du copié-collé pur et simple ».
On peut donc imaginer qu’on pourrait tirer parti des outils anti-plagiat pour repérer des pages et sites reprenant des citations, parties d’articles ou même la totalité pour étoffer son sourcing ou sa recherche d’information. Et dans un monde où l’information et les sources sont moins visibles, car noyées dans la masse, ces outils pourraient faire émerger des informations et sources non trouvées ailleurs.
Mesurer l’impact médiatique d’une annonce ou communiqué
Les outils de détection du plagiat permettent de mettre en évidence les doublons d’un même contenu. Cela peut servir notamment pour les services de communication, qui souhaitent évaluer les retombées médiatiques d’une information concernant leur entreprise.
Repérer des sources
La fonctionnalité qui permet aux outils anti-plagiat de détecter la similarité entre le contenu soumis et un contenu extérieur peut être utilisée pour accroître son corpus de sources et d’informations sur un même sujet.
D’ailleurs, les outils anti-plagiat, en indiquant la source du contenu renseigné, font tout le travail de remonter à la source originale. Dès lors, si une information n’est pas correctement citée dans un contenu, il est possible de retrouver son origine via les outils anti-plagiat.
Ces outils ne pourront pas être considérés comme la pierre angulaire d’un sourcing ou d’une recherche d’information, mais dans certains cas, ils pourront faire émerger quelques informations, sources et contenus non repérés ailleurs. Et dans un contexte de surinformation où les moteurs de recherche permettent d’accéder en proportion à moins de contenus, il est toujours intéressant d’ajouter une nouvelle corde à son arc.
Panorama des outils anti-plagiat
La page Internet IlovePhD propose une liste d’outils de vérification du plagiat des thèses et articles académiques (https://www.ilovephd.com/10-free-plagiarism-checker-tool-for-thesis/). La liste opère une distinction entre les outils gratuits, en début de liste, et les outils payants, ensuite.
Thot Cursus propose un répertoire très complet de liens d’outils utilisés pour détecter le plagiat (https://cursus.edu/technologies/28697/repertoire-des-outils-anti-plagiat-prevention-et-detection#.XF227ZNKjQC)
Le tableau ci-dessous compile ces deux répertoires :
Nom de l’outil | Fonctionnalités | URL |
Grammarly (gratuit - création d’un compte) | S’appuie sur la base ProQuest et le Web indexé | https://www.grammarly.com/plagiarism-checker?q=plagiarism |
Scribbr (payant) | S’appuie sur Turnitin et Internet | https://www.scribbr.fr/logiciel-anti-plagiat/ |
DupliChecker (gratuit) | https://www.duplichecker.com/ | |
Quetext (gratuit - création d’un compte) | https://www.quetext.com/ | |
Turnitin (payant) | Pourcentages de similarité et détail selon les sources | https://www.turnitin.com/fr |
PlagScan (payant) | https://www.plagscan.com/fr/ | |
PlagiaShield (freemium) | https://plagiashield.com/ | |
Bartleby Write (création d’un compte) | https://www.bartleby.com/write/tool/edit | |
Oxford Similarity Checker | https://fr.oxsic.com/ | |
Plag Aware (freemium) | Système de crédits payants | https://www.plagaware.com/ |
Urkund (payant) | Pourcentages de similarité et détail selon les sources | https://www.urkund.com/ |
Compilatio (payant) | Pourcentages de similarité et détail selon les sources | https://www.compilatio.net/fr/ |
3YA (gratuit) | Lance trois recherches simultanées dans Google, Google Books et Google Scholar pour une même requête | http://michel.bernard.online.fr/plagiat/index.php |
Copyscape (gratuit) | Vérifie les pages similaires à l’adresse URL renseignée | https://www.copyscape.com/ |
TinEye (création d’un compte) | Vérification de l’utilisation d’images | https://tineye.com/ |
Pixsy (création d’un compte) | Vérification de l’utilisation d’images | https://www.pixsy.com/ |
DiffMerge (gratuit) | Application à télécharger | http://www.sourcegear.com/diffmerge/index.html |