SEO

Est-ce que spinner c’est plagier ?

En matière de rédaction Web et plus largement de content marketing, les techniques pour créer du contenu sont nombreuses et répondent plus ou moins aux besoins des professionnels pour optimiser le temps de production, proposer un texte plus performant, coller aux recommandations SEO, capter l’internaute et/ou apporter sans attendre, une information pertinente au visiteur. Le content spinning en fait partie.
Sujet clivant s’il en est dans le monde très imbriqué des référenceurs et des créateurs de contenus, le « spin » de son petit nom, a ses adeptes, ses pratiquants du masterspin, et ses détracteurs clamant haut et fort le manque d’éthique du procédé. Certains l’accuseraient même de se muer en plagiat. Mais, alors, est-ce que spinner c’est plagier ?

Tout d’abord, que veut dire spinner ?

Du point de vue de la méthode, la pratique est technique. Un musicien parlerait peut-être de variations, un physicien de dimensions parallèles, un écrivain de versions, un mathématicien de variables… Les rédacteurs Web, eux, évoquent le content spinning.

De l’anglais « To spin », littéralement « faire tourner », le content spinning confine au filage, au tissage ou à la rotation des contenus. Dans la pratique, le content spinning utilise un logiciel — ou se rédige à la main — pour générer en masse différentes versions d’un même texte. Le principe de base est alors d’utiliser le plus grand nombre de synonymes, de mots et de groupes grammaticaux, possible. En effet, plus un spin comporte de niveaux, plus sa structure est complexe ou profonde, meilleure est sa qualité.

Ex : Ce livre d’{aventure|épouvante|amour|histoire} est {formidable|angoissant|émouvant|passionnant}, il faut que je l’{offre|achète|acquiert|envoie} à ma {sœur|mère|cousine|copine}.

  • Ce livre d’aventure est formidable, il faut que je l’offre à ma sœur.
  • Ce livre d’épouvante est angoissant, il faut que je l’achète à ma mère.
  • Ce livre d’amour est émouvant, il faut que je le commande à ma cousine.
  • Ce livre d’histoire est passionnant, il faut que je l’envoie à ma copine…

Une technique « black HAT » vulgarisée ?

L’idée première avec le content spinning, est d’automatiser la production d’un grand nombre de contenus sur très peu de temps. À la fin des années 1990 et au début des années 2000, avant que le rédacteur Web ne mette son grain de sel dans l’histoire — le référenceur utilisait déjà le content spinning pour générer les contenus textes de dizaines de sites. D’aucuns vous diront qu’il s’agissait de remplissage et de contenus sans qualité. Sans doute, mais la méthode présentait l’avantage d’être simple et rapide, et si vous étiez adroit, même pas expert, elle vous assurait à l’époque, une certaine puissance dans les SERPs.

À ce moment-là, les algorithmes Google ne s’intéressaient pas au pouvoir des contenus. Content n’était pas encore King et le SEO bourrin était souverain.

Mais, parce qu’il y a un mais, internet qui n’était alors qu’un terrain de jeu pour grand geek averti, a rapidement évolué. Dans le même temps, les exigences des lecteurs — et des moteurs — se sont affinées. Le contenu a donc logiquement suivi la même trajectoire. Et le content spinning a lui aussi fait sa révolution.

Peut-on dire que Google pour ne pas le citer, a mené à la création et désormais à la professionnalisation du rédacteur Web ? Je ne sais pas. Toujours est-il que le contenu s’est en grande partie amélioré pour répondre à ses exigences.

Pourquoi le contenu dupliqué est un problème

Le duplicate content est à la rédaction de contenu, ce que la contrefaçon est à l’industrie du luxe, une pâle copie souvent moins qualitative, laquelle peut porter préjudice au texte/à l’objet original.

Outre cette considération de créateur, il n’est pas difficile d’imaginer que le contenu dupliqué puisse faire perdre son temps à l’internaute qui retombe plusieurs fois sur la même information, sans valeur ajoutée. De son côté, Google, comme n’importe quel autre moteur de recherche, pour sa qualité et la pertinence de ses SERP, ne souhaite pas proposer de résultats identiques pour une même requête.

Enfin, est-il vraiment nécessaire de rappeler qu’une page dupliquée, en plus de ne présenter aucun intérêt et de discréditer son auteur, finira presque systématiquement loin derrière ses concurrentes dans les résultats de recherche, prouvant là toute son inutilité ?

Comment s’assurer un spin de qualité ?

Comme c’est le cas pour toute technique rédactionnelle, il y a le bon spin et le mauvais spin. Le spin fait avec amour et le spin automatique (!). Le mauvais spin est facile à reconnaître, il se répète (trop), présente des fautes, n’apporte que peu (ou pas) d’informations pertinentes et flirte dangereusement avec le contenu dupliqué. À l’inverse, comme le précise ce très bon article par SEMRush, un texte spinné avec soin est :

  • Parfaitement lisible (attention aux apostrophes et aux accords notamment),
  • Toujours intéressant (l’information avant tout, les bases de données open source sont vos amies),
  • Cohérent (l’ordre des blocs de syntaxe reste logique, quelle que soit la variation),
  • Sans faute (on a dit de qualité !),
  • Riche en vocabulaire et en synonymes,
  • Suffisamment distinct pour afficher un taux de similarité faible (il est communément admis qu’un taux inférieur à 30 % [cela paraît énorme non ?!] serait suffisant).

Quelle meilleure façon pour s’assurer de cette qualité que de rédiger le contenu d’origine, celui que l’on nomme MasterSpin ? Un très bon article vous en parle ici, chez SEMRush. Il est LE texte à partir duquel toutes les autres versions sont produites et pour cette raison, se doit d’être le plus clair et riche possible. C’est à sa suite que viennent s’ajouter les variations des groupes grammaticaux, puis, à l’intérieur, celles des mots, verbes et adjectifs. Eh oui ! Master spinner n’est pas jouer. C’est pour ça que tu es créateur de contenu original, et pas Gad Elmaleh. 😉

Certains professionnels considèrent le content spinning et à plus forte raison la création de MasterSpins, comme une pratique élitiste. Qu’en pensez-vous ? Se pourrait-il vraiment que le spin se soit métamorphosé au fil des années pour devenir un exercice exigeant ? Est-ce que le simple fait de le rédiger à la main peut autant changer la donne ?

  • Quelques outils pour bien travailler

Il existe deux façons de travailler un spin, l’une est automatique, l’autre est manuelle. Pour ce qui est des logiciels, ils sont nombreux. Parmi eux, citons Effispin, ou Xspin, mais aussi Rewriteguru qui se présente plutôt comme un logiciel de reformulation doté d’une interface ludique.

Si vous préférez travailler à la main, alors, vos deux meilleurs alliés sont un logiciel de traitement de texte permettant de visualiser le langage HTML et un très bon dictionnaire des synonymes comme Crisco ou CNRTL.

Qu’en dit Google depuis Panda ?

D’abord, une présentation rapide de la bête. Google Panda est déployé en 2011 sous la forme d’un filtre – aujourd’hui partie intégrante de l’algorithme – chargé de repérer le contenu dupliqué et plus largement, le contenu de faible qualité et les contenus suroptimisés, potentiellement donc, les fermes a contenu. « Content is King » est son leitmotiv. Il est donc, logiquement, le caillou dans la chaussure pour qui a recours à la production de textes automatisée en masse et donc, au content spinning.

Sur le blog Abondance, l’avis de Google quant au content spinning : « le “content spinning” n’offre rien de nouveau aux internautes (si ce n’est un contenu déjà existant, rendu illisible) et est clairement destiné aux moteurs de recherche plutôt qu’aux utilisateurs. Par conséquent, des actions peuvent être prises sur les sites qui proposent ce genre de contenus et de pratiques. Il en va de même pour tout contenu réécrit, traduit automatiquement, ou modifié de façon à vouloir le faire apparaître comme unique au robot Googlebot. »

Pour passer sous les radars de Google Panda, chaque contenu doit être le plus UNIQUE possible et donc, présenter un taux de similarité bas quand il n’est pas de zéro.

Point d’étape sur le taux de similarité

Si vous êtes (un peu !) pointu en matière de rédaction Web, vous connaissez peut-être (ou pas) les trois crashs-tests utiles pour estimer le taux de similarité entre plusieurs contenus.

  • Le test de Levenshtein conçu par Vladimir Levenshtein en 1965 est une formule mathématique capable de déterminer le taux de similarité entre deux chaînes de caractères, l’une source et l’autre cible.
  • Le test de Jaccard permet d’évaluer la similarité entre des ensembles par rapport notamment au nombre de mots de deux textes. Normalisé entre 0 et 1, plus il est proche de 1, plus les contenus sont proches.
  • Le test de Simhash est utilisé depuis 2007 par le crawler de Google pour estimer la similarité entre deux pages de contenu. Webrankinfo met ici à votre disposition un article très complet sur le sujet.

Reste que, pour la plupart d’entre nous, professionnels des contenus et clients, l’utilisation d’outils comme Kill Duplicate (que nous utilisons), Screaming Frog (que nous utilisons aussi) ou encore Siteliner, est beaucoup plus simple et rapide. Pour savoir si un contenu – ou une partie de contenu – est dupliqué, ou pour savoir si plusieurs sites utilisent un contenu en particulier sans en avoir reçu l’autorisation, il peut aussi être judicieux de commencer par une simple recherche Google contenant les mots ou phrases potentiellement dupliqués, formulée entre « ». #LesVieillesAstuces

Quand parle-t-on de plagiat ?

Première chose, le plagiat n’est pas récent. Si le numérique et les nouvelles technologies l’ont rendu (beaucoup) plus facile à pratiquer, il existait déjà au temps des grands auteurs classiques. Il fallait alors simplement plus de mémoire et pas uniquement utiliser le copier-coller. Également, le plagiat est multiple, ce qui le rend d’autant plus difficile à repérer.

En France, le plagiat se rapporte au Code de la propriété intellectuelle. Si l’est possible de rédiger un article de plusieurs pages pour sa définition, majoritairement rapporté au milieu artistique, à la publication ou à la photographie, le plagiat se produit lorsqu’une personne s’approprie les écrits, les paroles ou les idées d’une autre (sous quelque forme que ce soit), sans lui en attribuer les mérites, la propriété et l’originalité.

En cas de plagiat avéré, le plagiaire s’expose d’ailleurs à de lourdes amendes. S’il est question de plagiat avéré ou non, c’est que la limite entre plagiat et imaginaire est parfois ténue. On peut ici citer Jean Giraudoux dans son livre « Siegfried et le Limousin » publié chez Grasset en 1922 « Le plagiat est la base de toutes les littératures, excepté de la première, qui d’ailleurs est inconnue ».

  • Plagiat direct ou copier-coller

Est suffisante la reproduction d’un sketch et sa pleine et entière attribution, pour recevoir le titre de plagiaire. 😉 À l’écrit, insérez un paragraphe d’auteur (ou de blogueur) dans votre contenu sans ajouter de guillemets ni de citation, et vous tombez dans le plagiat, directement.

  • L’auto-plagiat

Aucune tendance schizophrène ici, mais une réutilisation du contenu. Si, à l’intérieur d’une nouvelle production vous insérez une large partie d’un texte déjà publié par vous-même sans mentionner cette réutilisation, vous risquez l’auto-plagiat. Si l’acte de copie peut être discuté, le manque d’originalité croit en même temps que le taux de réutilisation.

  • La paraphrase sans citation

La paraphrase est une discipline qui consiste à reprendre et reformuler un texte, généralement en le rendant plus complexe et détaillé. Malgré tout, si vous ne citez pas l’auteur premier, vous le plagiez. La seule exception à la règle, subtile, est que le sujet exploité soit un lieu commun ou un concept connu de tous.

  • Plagiat mosaïque

Le plagiat mosaïque est sans doute le plus difficile à repérer. Insérez des séquences grammaticales, des morceaux de syntaxes et même les mots d’un autre dans votre travail, toujours sans les identifier ni les citer, et vous pratiquez le plagiat mosaïque, un plagiat dissimulé.

Mais alors, spinner c’est plagier, ou pas ?

Comme c’est le cas pour presque toutes les questions d’ordre éthique (mais aussi pour une majorité de questions en rédaction Web) : « ça dépend ». D’abord parce que prouver l’originalité d’un contenu n’est pas si simple, même si vous détenez l’originalité de sa publication, ensuite parce qu’il est souvent nécessaire d’en référer à un tribunal, d’engager des frais d’avocat… Il arrive aussi que cela se passe bien et que la copie soit tout simplement retirée ou attribuée. Mais revenons-en au content spinning.

Vous l’aurez compris, l’appréciation joue un grand rôle dans la définition du plagiat et divers degrés de content spinning permettent de produire des contenus de qualités différentes.

Peut-on parler d’auto-plagiat lorsque le rédacteur Web à l’origine d’un masterspin crée une multitude de copies de son propre texte ? Sans doute, puisque tous exploitent la même idée, mais peut-être pas tout à fait puisqu’il ne s’agit pas d’un copier-coller. Est-il alors plutôt coupable de plagiat mosaïque par un savant mélange de divers éléments empruntés ? Peut-être aussi un peu, mais pas tout à fait, puisqu’il est à la fois auteur et plagiaire.

Comment éviter aux contenus spinnés de glisser vers le plagiat ?

Il n’est pas certain qu’il existe une réponse ferme à cette question tant l’une et l’autre des pratiques sont sujettes à interprétations. Pourtant, content spinning et plagiat restent bien deux pratiques différentes. La première est une technique SEO de production et de duplication de contenu en masse. La seconde tient du vol d’une idée pour l’utiliser à son compte. Pourtant, la paraphrase sans citation est un type de plagiat… Dur, dur de s’y retrouver !

Toutefois, si content spinning et plagiat d’auteur sont deux concepts différents, ils sont tout autant décriés l’un que l’autre. Ainsi, si vous vous adonnez à l’art de la démultiplication de contenus, veillez à maîtriser le masterspin et ainsi, à toujours utiliser comme base un contenu original, entièrement rédigé par vous-même.

Catégorie : SEO
Pauline Dewinter
Posts created 1

Articles similaires

Commencez à saisir votre recherche ci-dessus et pressez Entrée pour rechercher. ESC pour annuler.

Retour en haut