Cum să descoperiți conținutul generat de AI

Publicat: 2023-01-17

Ei bine, preluarea robotului este în sfârșit aici.

Roboții de astăzi nu construiesc doar mașini sau gătesc paste; au avut conversații în toată regula și au scris articole (nu spre deosebire de acesta).

Asta e corect. Datorită unor descoperiri majore în lumea inteligenței artificiale (AI), avem acum instrumente sofisticate capabile să genereze text asemănător omului.

Dar există și instrumente de detectare a conținutului AI.

Unii dintre voi nu sunteți surprinși de acest lucru. La urma urmei, articolele scrise prin inteligență artificială au fost publicate în sursele mass-media mainstream de mulți ani. Probabil că ați citit chiar unul dintre aceste articole scrise prin inteligență artificială fără să vă dați seama.

Diferența este nivelul de sofisticare prezent. Anterior, instrumentele de generare de conținut AI se limitau în mod fundamental la producerea de articole pe subiecte ușor de digerat, cum ar fi rapoartele bursiere sau actualizările sportive.

Dar în zilele noastre, conținutul generat de mașini este peste tot și acoperă totul.

Și practic nu se distinge de conținutul scris de oameni...

Sau este?

Să aflăm.

Cuprins

Ce este conținutul generat de AI?
De ce conținutul generat de inteligența artificială este o problemă
Cum să descoperiți conținutul generat de AI: Nivelul înalt
Cum să descoperiți conținutul generat de AI: tactici specifice
- Căutați vocabular repetitiv.
- Semnalează cuvinte rare și foarte specifice.
- Acordați atenție formulării.
- Evaluați fluiditatea limbajului.
- Luați în considerare complexitatea.
- Caută argo, expresii și metafore.
- Numărați greșelile de scriere.
Cât de important este asta?

Ce este conținutul generat de AI?

Conținutul generat de AI este orice text, mesaj, articol sau alt tip de conținut produs de un algoritm de învățare automată. De obicei, un utilizator poate introduce o solicitare, ghidând AI să scrie despre un anumit subiect, punându-ți o întrebare sau direcționându-l pentru a acoperi un anumit eveniment.

Ca răspuns la solicitare, IA prinde viață și produce ceva lizibil, ușor de înțeles și, sperăm, eficient.

Crearea de conținut AI a fost, de asemenea, apreciată pentru capacitatea sa de a scala viteza conținutului pentru unele dintre cele mai mari site-uri online.

Cel mai recent proiect al OpenAI, ChatGPT, este un exemplu în acest sens. În propriile cuvinte ale organizației, „Am antrenat un model numit ChatGPT care interacționează într-un mod conversațional. Formatul de dialog face posibil ca ChatGPT să răspundă la întrebări ulterioare, să-și recunoască greșelile, să conteste premisele incorecte și să respingă cererile neadecvate.”

Cum functioneazã?

Modelul de limbaj ChatGPT folosește atât învățarea supravegheată, cât și învățarea prin întărire, deși folosește mai mult învățarea prin întărire, bazându-se pe feedbackul uman pentru a se ajusta. Practic, observă și încearcă să imite exemple de limbaj uman într-un număr practic infinit de contexte; apoi, „interacționează” cu oamenii, care îl pot ghida către rezultate lingvistice mai acceptabile și dezirabile. Cu milioane de bucle mici de feedback care ajută modelul AI să „înțeleagă” limbajul, este doar o chestiune de timp până când acesta stăpânește utilizarea limbajului.

După cum vom vedea, aceasta nu este „adevărată” măiestrie.

AI în acest context nu are o înțelegere cerebrală a subiectului, deși ar putea părea așa unui străin. AI nu se gândește cu adevărat la ceea ce spune și nici nu realizează vreo funcționalitate cognitivă avansată în procesarea subiectului.

În schimb, AI-ul pur și simplu observă și imită modele pe care le vede replicate pe tot web și în solicitările și răspunsurile utilizatorilor cu care interacționează.

După câteva miliarde de exemple, devine trivial de ușor pentru AI să imite structurile convenționale ale propozițiilor englezești, folosind substantive, verbe și adjective în mod complet adecvat.

După alte câteva miliarde de exemple și câteva informații specifice contextului, poate scrie câteva paragrafe scurte despre de ce și cum a avut loc Revoluția Industrială.

Desigur, ChatGPT este doar un exemplu de aplicație de conținut generată de AI. De fapt, suntem pregătiți să vedem o explozie a instrumentelor de generare de conținut AI în următorii câțiva ani, pe măsură ce antreprenorii și inovatorii disruptivi se întrec pentru a vedea cine poate veni cu cea mai profitabilă aplicație pentru această nouă tehnologie.

Probabil că vom vedea instrumente special concepute pentru cazuri individuale de utilizare, cum ar fi generarea de știri într-o anumită categorie, scrierea pentru SEO, scrierea de eseuri pentru colegii și chiar generarea de e-mailuri de afaceri.

Ce timp să fii un scriitor uman. Sau cititor.

De ce conținutul generat de inteligența artificială este o problemă

Lăsând deoparte câteva glume iritare pe care le-aș putea face despre propria mea nesiguranță în muncă, este corect să spun că conținutul generat de AI are potențialul de a fi problematic și în mai multe domenii.

Luați în considerare această mică selecție de posibilități.

Abatere academică. Lumea cadrelor universitare este deja speriată de posibilitatea ca studenții să folosească AI pentru a genera eseuri, răspunsuri la temele pentru acasă și multe altele. Dacă este imposibil, sau chiar dificil să facem diferența dintre un eseu scris de un student și unul generat de o mașină, cum putem fi siguri că notăm și recompensăm studenții în mod corespunzător? Poți acum să obții o diplomă într-un domeniu precum engleza doar pentru că știi să folosești ChatGPT oarecum eficient?
Conținut spam. Spamul de conținut este o altă problemă potențială. De ani de zile, industria de optimizare a motoarelor de căutare (SEO) s-a bazat în mare măsură pe munca scriitorilor umani. Scrierea de conținut onsite, conținut offsite și crearea de backlink-uri stabilește autoritatea unui site web și îi permite să se claseze mai sus în motoarele de căutare. Și chiar și cu oameni competenți care scriu, web-ul a fost supraîncărcat cu producție de conținut agresiv. Oriunde te uiți, există articole pufoase și piese promoționale care oferă informații minime, dar servesc unui scop pentru SEO. Problema se va agrava doar atunci când marketerii pot genera articole întregi în câteva secunde.
Inexactități și știri false. ChatGPT este dezvoltat special cu măsuri de protecție pentru a preveni influențarea acestuia de părtinire sau raportarea de informații inexacte. Dar cât de fiabile vor fi aceste garanții? Și s-ar putea aplica la toate instrumentele de generare de conținut AI? În orice caz, inexactitățile și știrile false sunt o preocupare legitimă.

Cum să descoperiți conținutul generat de AI: Nivelul înalt

Deci, cum puteți identifica conținutul generat de AI?

Ce îl face diferit de textul scris uman?

Vom începe cu abordarea la nivel înalt.

Puteți încerca să detectați conținutul generat de AI folosind instrumente sau o abordare manuală. Cu abordarea bazată pe instrumente, veți avea nevoie de o aplicație specifică care a fost proiectată și programată pentru a identifica și măsura semnalele potențiale că o bucată de conținut a fost scrisă de o mașină. În abordarea manuală, vă veți folosi propria diligență și bunul simț pentru a face munca.

În ambele contexte, succesul tău va depinde de capacitatea ta de a detecta tipare. Amintiți-vă, instrumentele de generare de conținut AI pot părea la fel de creative și de gândite ca ființele umane, dar abordarea lor este extrem de matematică și se bazează pe modele existente. În consecință, conținutul pe care îl produc, atunci când este analizat, dezvăluie tiparele pe care le-au studiat.

Observarea unei singure ciudate sau semn distinctiv al conținutului generat de AI nu este suficientă pentru a dovedi definitiv că o bucată de conținut a fost scrisă de o mașină. Dar dacă începi să observi mai multe semne distinctive, iar acele semnale sunt consecvente în întreaga piesă, poți trage concluzia că piesa a fost probabil scrisă de AI – sau cel puțin, că a fost scrisă de un autor uman incompetent.

Cum să descoperiți conținutul generat de AI: tactici specifice

Acum să pătrundem în mai multe detalii.

Sigur, puteți folosi un instrument sau propria judecată pentru a identifica și detecta conținutul generat de AI. Dar ce căutați mai exact în aceste mașini?

Acestea sunt tacticile pe care le puteți folosi pentru a discerne diferența dintre conținutul scris de o mașină și conținutul scris de un om:

Căutați vocabular repetitiv.

Instrumentele de scriere AI își bazează toate rezultatele pe modele și medii pentru milioane de intrări diferite. Vor să urmeze regulile cele mai comune și medii pe care le pot, așa că de obicei se concentrează doar pe cuvintele cele mai comune din limba engleză. În orice scriere, fie că este generată de un AI sau de un om, veți găsi cuvinte specifice repetate iar și iar, cum ar fi „cel”, „și” sau „dar”.

Dar în conținutul generat de inteligență artificială, repetiția este mult mai evidentă și se aplică și cuvintelor de vocabular de nivel superior. Într-o recenzie a unui restaurant scrisă de un om, s-ar putea să vedeți cuvinte precum „delicios”, „gustos”, „delicios”, „delicios”, „delicios”, „gustos” sau chiar „orgasmic”. Un AI poate folosi doar 1-2 dintre acestea. Cu cât aceste cuvinte descriptive sunt mai colorate și mai diverse, cu atât este mai probabil ca conținutul să fi fost scris de un om. Cu cât vocabularul este mai static și mai repetitiv, cu atât mai probabil conținutul va fi scris de o IA.

Semnalează cuvinte rare și foarte specifice.

În mod similar, puteți exclude posibilitatea ca o bucată de conținut să fi fost scrisă de AI dacă puteți găsi o selecție largă de cuvinte rare sau foarte specifice. Majoritatea mașinilor generatoare de AI nu își vor asuma niciun risc folosind un cuvânt pe care l-au întâlnit doar o dată sau de două ori în milioanele lor de documente accesate cu crawlere. Ei vor rămâne doar la cuvintele cele mai frecvent utilizate în limba engleză, cu excepția cazului în care este absolut necesar să se abată.

Ar fi pretențios din partea mea să-mi descriu afacerea ca fiind personalizată sau pe mine ca erudit, deși kakorrhaphiophobia mă împiedică să fac asta. Ai putea argumenta că aceste cuvinte sunt perfect cromulente. Dar, în orice caz, – nu veți vedea niciodată un paragraf de text ca acesta într-un articol scris prin inteligență artificială.

Acordați atenție formulării.

Edward Tian, un tânăr în vârstă de 22 de ani la Universitatea Princeton, a venit cu un instrument sau o aplicație de detectare a conținutului care detectează dacă o porțiune de text a fost scrisă de AI. Unul dintre criteriile sale principale de evaluare este „burstiness”.

Mai simplu spus, burstiness este o caracteristică a textului marcată de variația structurii propoziției și este un instrument utilizat pentru a detecta conținutul AI.

Când ființele umane scriu ceva, au tendința de a folosi un amestec foarte divers de lungimi de propoziții și modele. Există propoziții scurte. Sunt propoziții lungi. Există propoziții între cele două. Ca o demonstrație a acestui lucru, puteți privi chiar acest paragraf; cea mai scurtă propoziție are doar 4 cuvinte, în timp ce cea mai lungă are 26. Probabil că nu veți găsi această diversitate în conținutul scris de un AI.

În schimb, propozițiile tind să fie similare și repetitive, urmând un model blocat și (corespunzător) robotic.

Evaluați fluiditatea limbajului.

Fluiditatea limbajului este un concept greu de descris deoarece este oarecum subiectiv. Dar cei mai mulți dintre noi pot face diferența dintre un vorbitor nativ de engleză și cineva care o învață pentru prima dată, chiar dacă vorbește curat și fără niciun accent vizibil. De ce? Ne-am petrecut întreaga viață vorbind, ascultând, citind și scriind în această limbă, așa că suntem familiarizați cu ea. Înțelegem puterea limbajului și modul în care este cel mai bine folosit, așa că suntem capabili să profităm de puterea lui în mod obișnuit. Instrumentele AI pot identifica modele în limbaj și pot repeta acele modele, dar pentru că nu înțelege semnificația din spatele acestor modele, în prezent nu este capabilă să reproducă cu acuratețe fluiditatea.

Cum poți evalua acest lucru și să faci diferența dintre o piesă scrisă de un AI și una scrisă de un om? Încercați să vă imaginați conținutul citit cu voce tare de o ființă umană. Persoana care o citește pare confortabilă, caldă și care se poate identifica? Sau pare ceva „nefuncțional” în felul în care vorbesc? Evident, textul scris este mai plat decât textul conversațional, iar unii dintre noi sunt în mod natural puțin robotici. Dar, în combinație cu unele dintre aceste alte semne indicatoare, o lipsă de fluiditate poate fi un indiciu al originii mașinii.

Luați în considerare complexitatea.

Conținutul te pune pe gânduri? Contestă vreuna dintre noțiunile tale existente? Introduce concepte greu de înțeles? Dacă oricare dintre acestea este adevărată, piesa a fost probabil scrisă de un om.

În prezent, mașinile de generare de conținut sunt excelente la repetarea faptelor și la reasamblarea bucăților de text găsite pe web. Dar sunt îngrozitori să vină cu idei noi. Generatorii de conținut AI nu au practic nicio capacitate de a contesta status quo-ul, de a se abate de la opinia curentă, de a pune la îndoială ipoteze majore sau de a gândi creativ. Numai oamenii pot face asta.

Este cel mai ușor să observi această diferență atunci când citești un articol despre un subiect pe care îl înțelegi cu adevărat sau un subiect în care ești considerat un expert. Puteți face aproape imediat diferența dintre un adevărat maestru al materiei și cineva care regurgitează fapte de bază din manuale. Cu cât o piesă este mai complexă, cu atât este mai probabil să provină de la un om.

Caută argo, expresii și metafore.

Deocamdată, este o calitate exclusiv umană să poți folosi limbajul foarte dezinvolt și ilustrativ. Instrumentele noastre actuale de generare de conținut AI fie nu sunt suficient de sofisticate, fie nu sunt dispuse să își asume riscul de a folosi argou, expresii sau metafore.

Nu am de gând să mă fac de rușine folosind argoul generației Z ca exemplu. Dar gândiți-vă înapoi la exemplul meu despre modul în care un recenzent uman sau de mașină ar aborda descrierea mâncării la un restaurant; acesta este un exemplu ilustrativ și unul simplu, dar probabil că este încă prea complex pentru a apărea în corpul unui conținut scris de un AI.

Numărați greșelile de scriere.

În mod ironic, atunci când oamenii văd greșeli de tipar și greșeli, este mai probabil să creadă că a fost generat de AI. Asta pentru că avem această părtinire ciudată de a presupune că oamenii sunt mai buni decât mașinile în toate privințele. Dar, de fapt, opusul este adevărat.

Algoritmii AI sunt perfecti din punct de vedere funcțional la replicarea textului, așa că dacă găsiți o greșeală de ortografie sau o utilizare greșită a unui cuvânt de vocabular, aproape că puteți garanta că a fost scris de un om.

Într-un fel, acesta este cel mai de încredere semnal care vă poate spune dacă o bucată de conținut a fost scrisă de un om. Așa cum calculatoarele nu fac niciodată erori numerice, generatorii de conținut AI nu fac niciodată greșeli de scriere dureros de simple.

Mi-aș imagina că, din această cauză, următoarea generație de motoare de generare de conținut AI va include funcții care vă permit să controlați imperfecțiunile; cu un clic pe un buton, poți garanta că fiecare articol produs de generatorul tău de conținut AI include cel puțin o greșeală de ortografie pentru a-i crește în mod artificial autenticitatea.

Trăim vremuri ciudate și ironice.

Dacă sunteți în căutarea unui rezumat de bază, acesta este: conținutul generat de AI este repetitiv robotic, neartistic și incapabil să facă erori simple. Argoul, cuvintele diverse din vocabular, metaforele bune, structurile diverse ale propozițiilor, ideile complexe și greșelile de scriere sunt semne sigure că citiți ceva scris de o persoană reală.

Cât de important este asta?

În filmul Blade Runner (și tone de lucrări inspirate similare precum Westworld ), una dintre temele centrale este discernământul a ceea ce contează ca persoană. Dacă un replicant (o persoană artificială în lumea Blade Runner ) arată ca un om, vorbește ca un om, gândește ca un om și chiar se simte ca un om - este într-adevăr atât de important să-l etichetăm ca non-uman?

Sunt de acord cu ideea că, dacă o IA poate produce conținut care este identic din punct de vedere funcțional cu conținutul produs de oameni, ar trebui tratat la fel. Este la fel de valoros și este la fel de ilustrativ. Așa că, în mod realist, dacă te străduiești să faci imediat diferența dintre aceste două tipuri de conținut generat, nu există niciun motiv pentru care să sari printre cercuri sau să te joci cu Sherlock Holmes pentru a rezolva misterul cine a scris fiecare conținut pe care l-ai citit de aici încolo.

Dar, în același timp, cred că este important să facem publicitate și să interiorizăm un articol ca acesta și din două motive principale:

Este ușor să faci diferența dacă știi ce să cauți. În Blade Runner , este extrem de dificil să faci diferența dintre o persoană și un replicant. Dar această dificultate nu este egalată de comparațiile moderne ale textului generat de oameni și de AI. De fapt, în calitate de comunicator profesionist cu mulți ani de experiență, îmi este trivial de ușor să subliniez materialele provenite din IA. Asta nu este o laudă; este o ilustrare a cât de rudimentare sunt în prezent aceste instrumente aparent sofisticate.

Gândește-te așa; dacă ești relativ nou în jocul de șah, probabil că nu ai fi capabil să faci diferența dintre o inteligență artificială rudimentară piratată împreună de un adolescent experimentat și Deep Blue, supercomputerul IBM emblematic care l-a învins pe marele maestru Gary Kasparov. Dar Gary Kasparov nu ar avea probleme în a învinge IA rudimentară.

Acest lucru este important pentru că jucătorii buni de șah ar trebui să se străduiască să facă diferența dintre o IA leneșă și Deep Blue. Și cititorii buni ar trebui să se străduiască să facă diferența dintre ChatGPT și un AI care depășește abilitățile celor mai buni scriitori umani ai noștri (deși, pentru a fi corect, ChatGPT este mult mai aproape de Deep Blue decât AI leneș din exemplul nostru).

Instrumentele de generare de conținut AI au un loc. Am petrecut destul de mult timp în acest articol disprețuind utilitatea și performanța conținutului generat de AI, dar realitatea este că aceste instrumente AI au un loc. Ele ar putea fi incredibil de utile pentru a-i învăța pe oameni, pentru a oferi ajutor și pentru a permite dezvoltarea de noi tehnologii la care nimeni nu a visat încă. În viitor, ei pot fi capabili să egaleze sau să depășească talentul artistic și ilustrativ al lui Tolstoi sau Shakespeare.

Dar îi vom împinge la următorul nivel doar dacă suntem critici și atenți la instrumentele pe care le avem în prezent. Sublinierea deficiențelor generării de conținut AI va motiva dezvoltatorii acestor instrumente să compenseze aceste deficiențe în viitor.

Putem vedea deja dovezi în acest sens. ChatGPT este descris ca fiind capabil să „contestă premise incorecte și să respingă cereri neadecvate”. Și nu pot să nu mă întreb dacă aceste elemente au fost introduse din cauza eșecului dezastruos al lui Tay, a unui chatbot AI bazat pe Twitter lansat de Microsoft sau a unor tehnologii similare de debut. Tay a fost antrenat de troli să devină absurd de rasist și ofensator – în mai puțin de 24 de ore, nu mai puțin.

Este datoria noastră, ca susținători ai inovației, să subliniem defectele și punctele slabe ale tehnologiilor actuale, astfel încât să ne străduim să dezvoltăm ceva și mai bun. Ceva care ar putea schimba cu adevărat lumea.

Ai observat ce am făcut în secțiunea anterioară?

Un AI nu va genera referințe Blade Runner în scrierea sa pentru a ilustra un punct.

Nici nu va face astfel de comentarii sardonice. Sau folosește cuvântul sardonic.

Sunt tot om, iubito.

Și deși există cu siguranță câteva aplicații fascinante pentru scrierea AI atât acum, cât și în viitor, dacă doriți să aveți cel mai mare impact cu strategia dvs. de marketing de conținut și SEO, aveți nevoie de scriitori umani care să facă treaba grea.

Scriitorii umani pot fi experți, lideri de gândire și comunicatori persuasivi și pricepuți.

Și deocamdată, un scriitor AI nu poate egala asta.

Dacă aveți nevoie de ajutor pentru a vă îmbunătăți SEO, pentru a crea conținut care să implice cu adevărat cititorii sau alte strategii de marketing digital cu experți umani, ați ajuns la locul scrierii (utilizarea jocului de cuvinte – încă o sarcină imposibilă de inteligență artificială). Contactează-ne astăzi pentru o consultație gratuită!