Les 6 risques du contenu IA
Publié: 2023-04-181. Risque Google
En avril 2022, John Mueller de Google a partagé une position assez claire sur la validité du contenu généré par l'IA :
« Actuellement, tout va à l'encontre des directives des webmasters. Donc, de notre point de vue, si nous devions tomber sur quelque chose comme ça, si l'équipe de spam devait le voir, ils le verraient comme du spam.
L'inférence : que Google pénaliserait les sites créant du contenu IA, quelque chose que Mueller a comparé au "spinning" - le processus de prise de contenu existant et d'utilisation de synonymes et de réorganisation des mots pour créer quelque chose d'apparemment nouveau. Confronté à une technologie qui pourrait réduire le coût marginal de création de contenu à presque zéro (le rêve d'un webspammer), Google a pris la décision de dissuader son utilisation.
Mais comme nous l'avons expliqué précédemment, l'idée que Google pénaliserait - ou même pourrait - le contenu généré par l'IA était largement simplifiée :
- Le contenu généré par l'IA est, à bien des égards, original. GPT-4 ne fait pas tourner le contenu. Le contenu généré par l'IA contient des écrits originaux et peut même contenir des idées complètement nouvelles.
- La détection de contenu par IA est difficile et de plus en plus difficile. La technologie est une course aux armements, et il y a plus de dollars investis dans la génération de contenu que dans la détection de contenu. Il est peu probable que Google soit en mesure de détecter le contenu généré par l'IA avec un quelconque degré de cohérence.
- Il y a une ligne floue entre le contenu édité par l'homme et écrit par l'IA. Un article généré par l'IA compte-t-il toujours comme spam s'il est modifié ou réécrit par une personne réelle ?
Dix mois plus tard, en février 2023, Google a publié des directives mises à jour sur le contenu généré par l'IA. Cela vaut la peine de lire l'article source et de faire votre propre résumé, mais ce que je retiens est clair : visez à créer un contenu utile pour résoudre les problèmes, et Google sera largement ambivalent quant à la façon dont il est créé. Comme ils résument :
"L'automatisation est utilisée depuis longtemps dans l'édition pour créer du contenu utile. L'IA peut aider et générer du contenu utile de nouvelles manières passionnantes. »
Lorsque j'ai discuté du contenu de l'IA avec Ty Magnin, responsable de la marque chez Vendr, il a partagé : "Lorsque nous avons commencé (c'était en fait il y a quelques mois à peine), Google disait qu'il punirait les articles écrits avec l'IA. La plupart d'entre nous ont appelé leur bluff, mais c'était un risque potentiel réel en 2022. C'est incroyable de voir comment le profil de risque perçu de gen-AI continue de changer si rapidement.
Personne ne peut garantir que toute action sera à l'abri d'une pénalisation - Google est, après tout, une entreprise et non un service public, capable de prendre des décisions basées en grande partie sur ses propres caprices. Mais il y a de bonnes raisons de penser que la plupart des cas d'utilisation seront sûrs.
2. Risque de canal
En ce qui concerne le référencement, il y a un autre angle à considérer. Au lieu de penser au risque que Google représente pour votre utilisation de l'IA, il vaut la peine de considérer le risque que l'IA représente pour Google.
La concurrence pour les mots-clés devient chaque jour plus féroce. Les retours du SEO ont suivi une trajectoire longuement décroissante, et il est possible que l'IA générative accélère cette descente. Associez une vaste augmentation de la création de contenu alimentée par l'IA à un scepticisme croissant quant à la légitimité du contenu en ligne, et les rendements de la recherche pourraient chuter encore plus (ce que nous avons surnommé la « singularité de la recherche »).
Il y a plein de façons qui pourraient arriver :
Ce risque est spéculatif, mais il vaut la peine de garder l'esprit ouvert. L'IA générative peut représenter un moment décisif pour la recherche moderne. Que feriez-vous si le référencement - la raison d'être de nombreuses stratégies de contenu - exigeait soudainement beaucoup plus d'efforts ou offrait des rendements bien inférieurs ? Où réaffecteriez-vous vos dépenses ? C'est quelque chose auquel Ty pense déjà :
"Les moteurs de recherche expérimentent l'adoption du chat comme interaction principale, ce qui signifie que moins de clics iront vers d'autres sites Web. Ainsi, la création de contenu organique axé sur la recherche peut devenir moins précieuse pour les entreprises.
Il n'est pas clair comment un chat peut créditer ses sources et comment cela peut avoir un impact sur un entonnoir marketing.
3. Risque d'hallucinations
Lorsque vous utilisez l'IA générative, il existe un risque réel que votre contenu soit parsemé de mensonges et de fiction : des citations inventées attribuées à de vraies personnes, des données qui n'existent pas, des idées apparemment logiques qui s'effondrent après une inspection plus approfondie.
Ces erreurs (souvent appelées « hallucinations ») sont une propriété intrinsèque de l'IA générative, une conséquence de son objectif principal : prédire le meilleur mot suivant dans une séquence de mots donnée. Comme nous l'avons expliqué précédemment, l'IA générative est une machine à fausse confiance :
- Il n'y a pas de mécanisme de vérification des faits dans GPT-3 ou GPT-4 (et il est peu probable qu'il y en ait un).
- Ces modèles s'appuient sur des données sources souvent erronées.
- L'IA générative est conçue pour écrire à tout prix, en pompant du contenu même lorsque les données sont limitées dans l'ensemble de données.
L'hallucination est le risque le plus concret du contenu de l'IA, mais c'est aussi le plus facilement résolu. Les erreurs et les fautes peuvent être détectées et corrigées en mettant un humain dans la boucle, une personne chargée d'analyser la validité de la sortie, de rechercher les erreurs et les mensonges et d'apposer son approbation sur l'article fini.
Ce processus contribue également à la prochaine source de risque : juridique.
4. Risque juridique
La technologie a tendance à se développer plus rapidement que la réglementation ne peut suivre. L'IA générative a déjà créé une foule de questions auxquelles il faut répondre :
- Est-il éthique (ou légal) d'utiliser des données de site Web récupérées pour former un modèle d'IA ?
- Qui "possède" vraiment la sortie d'un outil d'IA générative ?
- Les artistes devraient-ils être rémunérés pour leur rôle dans la construction de données de formation ? ("Écrivez dans le style d'Ernest Hemingway", ou même "Écrivez dans le style du blog Animalz".)
Alors que certains de ces problèmes peuvent prendre des années ou des décennies à se démêler, d'autres présentent une préoccupation immédiate pour les entreprises utilisant l'IA générative. J'ai demandé à Aleksander Goranin, spécialiste des questions de propriété intellectuelle et d'intelligence artificielle et associé chez Duane Morris LLP (un cabinet auquel Animalz fait appel pour des services juridiques), de partager ses idées sur les domaines actuels de risque réglementaire :
- Fuite de données personnelles. Comme les modèles génératifs sont entraînés sur des ensembles de données publics, le contenu généré peut involontairement « divulguer » des données personnelles, exposant l'éditeur à des mesures d'exécution de la part de la Federal Trade Commission et des agences d'État, en particulier en Californie, à New York et dans l'Illinois. Les autorités réglementaires sont sensibles à la divulgation non autorisée d'informations d'identification personnelle.
- Contenu biaisé. Dans le même ordre d'idées, la FTC ou les autorités de l'État peuvent engager une action coercitive pour un contenu contenant des préjugés (comme des préjugés raciaux ou sexistes), même si ce préjugé découle implicitement des données sur lesquelles le modèle d'IA a été formé.
- Absence de protection du droit d'auteur. Comme l'explique Aleksander, « il existe un risque que le Bureau du droit d'auteur n'enregistre pas le contenu généré en tant qu'« œuvre » protégée. C'est le domaine dans lequel le Bureau du droit d'auteur a publié le plus grand nombre de directives actuellement - essentiellement, il faut divulguer dans la demande d'enregistrement la mesure dans laquelle l'IA a été utilisée et renoncer au droit d'auteur sur toutes les parties substantiellement générées par le LLM. Le Bureau du droit d'auteur exige un « auteur humain ».
Le cas d'utilisation le plus sûr pour l'IA générative est, sans surprise, la recherche de fond, le brainstorming et la génération d'idées. Pour tout le reste, la création d'un système de "révision humaine" pour le contenu généré devrait aider à atténuer le plus grand risque réglementaire.
5. Risque de médiocrité
Beaucoup de gens craignent que le contenu de l'IA ne soit manifestement mauvais. Mais je pense que c'est relativement peu risqué. GPT-4 est un meilleur écrivain que la plupart des gens : plus articulé, créatif et réceptif aux commentaires (et cela ne fera que s'améliorer avec les futurs modèles et interfaces).
Nous ne devrions pas prendre cela personnellement : GPT-4 est littéralement surhumain, du moins dans les dimensions de la lecture et de l'écriture. Comme le partage Ty, "Il était assez évident que la technologie est suffisamment performante pour qu'avec un peu d'amélioration, la qualité ne soit pas plus un problème avec un poste assisté par l'IA qu'avec un poste piloté par l'homme."
Mais le contenu n'a pas besoin d'être mauvais pour être problématique. Il y a un risque plus insidieux à considérer : que votre contenu soit fonctionnel mais oubliable.
Dans la poursuite d'une fréquence de publication accrue, il y a le risque de perdre le scintillement d'unicité que votre contenu possède actuellement. Votre contenu sera articulé, précis, voire exploitable… et ne fera toujours rien d'utile pour votre entreprise.
Un bon marketing de contenu ne se limite pas aux mots sur une page. Chaque article individuel nécessite une cohésion avec une stratégie plus large et ciblée. Elle repose sur une distribution efficace. Il doit aller plus loin que simplement répondre aux attentes de base du lecteur : il doit laisser une impression durable, ou résoudre un problème, ou divertir .
Comptez trop sur l'IA générative et trop peu sur l'expérience qualifiée, et vous risquez de créer une sorte d'imitation sans âme d'un bon contenu, un zombie vacillant avec l'apparence du "marketing de contenu" mais aucune de ses qualités utiles. L'IA générative doit être un outil dans votre boîte à outils, subordonné à votre stratégie - et non une fin en soi.
Comme l'écrit VC Tomasz Tunguz, « La question pour les startups d'évaluer la production de contenu automatisée : est-ce suffisant pour se démarquer dans l'esprit des acheteurs. Pour de nombreux cas d'utilisation, l'unicité n'a pas d'importance. Documentation produit, contenu permanent pour le référencement, réponses prédéfinies pour les e-mails. » L'inverse est également vrai : dans certaines situations, l'unicité est primordiale.
6. Risque de dernier arrivé
Lorsque Ty a déployé un programme de contenu assisté par l'IA, la principale préoccupation qu'il a entendue n'était pas le risque juridique ou la mauvaise qualité ; on craignait que la plus grande opportunité ne soit déjà passée :
"Certaines personnes pensaient qu'il était déjà trop tard pour augmenter le volume de contenu que nous produisions et que le marché serait saturé en quelques mois.
Mais je pense que les gens surestiment la rapidité avec laquelle les technologies sont adoptées. Je pense que les gens sont encore conscients de ce que le contenu généré par l'IA peut faire. »
Comme toute nouvelle technologie, l'IA générative offre une incertitude et un certain degré de risque, mais le risque s'accompagne d'opportunités. L'opportunité de construire un fossé défendable de classements et de backlinks avant vos concurrents. L'occasion d'expérimenter de tout nouveaux canaux de trafic. L'opportunité d'intégrer la personnalisation au cœur de votre marketing.
En ce qui concerne le contenu de l'IA, le risque le plus clair et le plus certain provient d'un échec à expérimenter et à apprendre. L'IA générative trouvera sa place dans toutes les stratégies marketing. C'est trop bon et trop bon marché pour autre chose. Bien que la « bonne » application de l'IA générative varie énormément d'une entreprise à l'autre - en fonction de la tolérance au risque, des attentes du public, des objectifs, des ressources et des croyances personnelles - il y aura une application dans presque toutes les entreprises.
Il est temps d'aller le chercher.