Jak wykrywać treści generowane przez sztuczną inteligencję

Opublikowany: 2023-01-17

Cóż, przejęcie robota jest w końcu tutaj.

Dzisiejsze roboty nie tylko budują samochody czy gotują makaron; prowadzą pełnowymiarowe rozmowy i piszą artykuły (podobnie jak ten).

Zgadza się. Dzięki kilku znaczącym przełomom w świecie sztucznej inteligencji (AI) dysponujemy teraz wyrafinowanymi narzędziami zdolnymi do generowania tekstu przypominającego człowieka.

Ale są też narzędzia do wykrywania treści AI.

Niektórych z Was to nie dziwi. W końcu artykuły napisane przez sztuczną inteligencję są publikowane w mediach głównego nurtu od wielu lat. Prawdopodobnie nawet przeczytałeś jeden z tych artykułów napisanych przez sztuczną inteligencję, nawet nie zdając sobie z tego sprawy.

Różnica polega na obecnym poziomie zaawansowania. Wcześniej narzędzia do generowania treści AI zasadniczo ograniczały się do tworzenia artykułów na łatwo przyswajalne tematy, takie jak raporty giełdowe lub aktualizacje sportowe.

Ale w dzisiejszych czasach treści generowane maszynowo są wszędzie i obejmują wszystko.

I jest praktycznie nie do odróżnienia od treści napisanych przez ludzi…

Albo to jest?

Dowiedzmy Się.

Spis treści

Co to jest treść generowana przez sztuczną inteligencję?
Dlaczego treści generowane przez sztuczną inteligencję stanowią problem
Jak rozpoznać treści generowane przez sztuczną inteligencję: wysoki poziom
Jak wykrywać treści generowane przez sztuczną inteligencję: określone taktyki
- Poszukaj powtarzającego się słownictwa.
- Oznacz rzadkie i bardzo specyficzne słowa.
- Zwróć uwagę na frazowanie.
- Oceń płynność języka.
- Rozważ złożoność.
- Szukaj slangu, idiomów i metafor.
- Policz literówki.
Jak ważne jest to?

Co to jest treść generowana przez sztuczną inteligencję?

Treść generowana przez sztuczną inteligencję to dowolny tekst, wiadomość, artykuł lub inny rodzaj treści tworzony przez algorytm uczenia maszynowego. Zazwyczaj użytkownik może wprowadzić monit, kierując sztuczną inteligencję do napisania na określony temat, zadając pytanie lub kierując ją w celu omówienia określonego wydarzenia.

W odpowiedzi na monit sztuczna inteligencja ożywa i tworzy coś czytelnego, zrozumiałego i, miejmy nadzieję, skutecznego.

Tworzenie treści AI było również reklamowane ze względu na możliwość skalowania szybkości treści w niektórych z największych witryn internetowych.

Przykładem tego jest najnowszy projekt OpenAI, ChatGPT. Według słów organizacji: „Wyszkoliliśmy model o nazwie ChatGPT, który wchodzi w interakcje w sposób konwersacyjny. Format dialogu umożliwia ChatGPT odpowiadanie na dodatkowe pytania, przyznanie się do błędów, kwestionowanie błędnych przesłanek i odrzucanie niewłaściwych próśb”.

Jak to działa?

Model językowy ChatGPT wykorzystuje zarówno uczenie nadzorowane, jak i uczenie się przez wzmacnianie, chociaż w większym stopniu wykorzystuje uczenie się przez wzmacnianie, opierając się na informacjach zwrotnych od ludzi, aby się dostroić. Zasadniczo obserwuje i próbuje naśladować przykłady ludzkiego języka w praktycznie nieskończonej liczbie kontekstów; następnie „wchodzi w interakcje” z ludźmi, którzy mogą poprowadzić go do bardziej akceptowalnych i pożądanych wyników językowych. Dzięki milionom drobnych pętli sprzężenia zwrotnego, które pomagają modelowi AI „zrozumieć” język, opanowanie posługiwania się językiem jest tylko kwestią czasu.

Jak zobaczymy, nie jest to „prawdziwe” mistrzostwo.

Sztuczna inteligencja w tym kontekście nie ma mózgowego zrozumienia tematu, chociaż może się tak wydawać osobie z zewnątrz. Sztuczna inteligencja tak naprawdę nie myśli o tym, co mówi, ani nie wykonuje żadnych zaawansowanych funkcji poznawczych w przetwarzaniu tematu.

Zamiast tego sztuczna inteligencja po prostu obserwuje i naśladuje wzorce, które widzi replikowane w całej sieci oraz w monitach i odpowiedziach użytkowników, z którymi wchodzi w interakcję.

Po kilku miliardach przykładów sztuczna inteligencja staje się banalnie łatwa do naśladowania konwencjonalnych angielskich struktur zdań, używając rzeczowników, czasowników i przymiotników całkowicie poprawnie.

Po kilku miliardach dodatkowych przykładów i pewnych informacjach kontekstowych można napisać kilka krótkich akapitów o tym, dlaczego i jak doszło do rewolucji przemysłowej.

Oczywiście ChatGPT to tylko jeden przykład aplikacji treści generowanej przez sztuczną inteligencję. W rzeczywistości jesteśmy gotowi na eksplozję narzędzi do generowania treści AI w ciągu najbliższych kilku lat, ponieważ przedsiębiorcy i przełomowi innowatorzy ścigają się, aby zobaczyć, kto może wymyślić najbardziej dochodowe zastosowanie dla tej nowej technologii.

Prawdopodobnie zobaczymy narzędzia specjalnie dostosowane do indywidualnych przypadków użycia, takie jak generowanie wiadomości w określonej kategorii, pisanie dla SEO, pisanie esejów na studia, a nawet generowanie biznesowych wiadomości e-mail.

Co za czas na bycie ludzkim pisarzem. Albo czytelnik.

Dlaczego treści generowane przez sztuczną inteligencję stanowią problem

Pomijając kilka żartobliwych żartów, które mógłbym zrobić na temat niepewności mojej własnej pracy, można uczciwie powiedzieć, że treści generowane przez sztuczną inteligencję mogą być problematyczne i to w więcej niż jednym obszarze.

Rozważ ten mały wybór możliwości.

Nierzetelność akademicka. Świat naukowców już wariuje na temat możliwości wykorzystania sztucznej inteligencji przez studentów do generowania esejów, odpowiedzi na zadania domowe i nie tylko. Jeśli niemożliwe lub nawet trudne jest odróżnienie eseju napisanego przez studenta od eseju wygenerowanego przez maszynę, skąd możemy mieć pewność, że odpowiednio oceniamy i nagradzamy uczniów? Czy możesz teraz uzyskać stopień naukowy w dziedzinie takiej jak angielski tylko dlatego, że wiesz, jak w miarę efektywnie korzystać z ChatGPT?
Spamowanie treści. Innym potencjalnym problemem jest spam treściowy. Przez lata branża optymalizacji pod kątem wyszukiwarek (SEO) w dużym stopniu polegała na pracy pisarzy. Pisanie treści na stronie, treści poza witryną i budowanie linków zwrotnych ustanawia autorytet witryny i pozwala jej na wyższą pozycję w wyszukiwarkach. I nawet jeśli kompetentni ludzie piszą, sieć jest przeładowana agresywną produkcją treści. Gdziekolwiek spojrzysz, znajdziesz puszyste artykuły i artykuły promocyjne, które dostarczają minimalnej ilości informacji, ale służą celom SEO. Problem będzie się tylko pogarszał, gdy marketerzy będą w stanie generować całe artykuły w kilka sekund.
Nieścisłości i fałszywe wiadomości. ChatGPT został specjalnie opracowany z zabezpieczeniami, aby zapobiec wpływom stronniczości lub zgłaszaniu niedokładnych informacji. Ale jak niezawodne będą te zabezpieczenia? I czy można je zastosować do wszystkich narzędzi do generowania treści AI? W każdym razie nieścisłości i fałszywe wiadomości są uzasadnione.

Jak rozpoznać treści generowane przez sztuczną inteligencję: wysoki poziom

Jak więc rozpoznać treści generowane przez AI?

Czym różni się od tekstu pisanego przez człowieka?

Zaczniemy od podejścia wysokiego poziomu.

Możesz spróbować wykryć treści generowane przez sztuczną inteligencję za pomocą narzędzi lub podejścia ręcznego. W przypadku podejścia opartego na narzędziach będziesz potrzebować specjalnej aplikacji zaprojektowanej i zaprogramowanej do identyfikowania i mierzenia potencjalnych sygnałów, że fragment treści został napisany przez maszynę. W podejściu ręcznym do wykonania pracy użyjesz własnej należytej staranności i zdrowego rozsądku.

W obu kontekstach Twój sukces będzie zależał od umiejętności wykrywania wzorców. Pamiętaj, że narzędzia do generowania treści AI mogą wydawać się równie kreatywne i przemyślane jak ludzie, ale ich podejście jest niezwykle matematyczne i oparte na istniejących wzorcach. W związku z tym treści, które wytwarzają, po przeanalizowaniu ujawniają badane przez nich wzorce.

Zauważenie pojedynczego dziwactwa lub cechy charakterystycznej treści generowanej przez sztuczną inteligencję nie wystarczy, aby ostatecznie udowodnić, że część treści została napisana przez maszynę. Ale jeśli zaczniesz zauważać wiele cech charakterystycznych, a sygnały te są spójne w całym utworze, możesz dojść do wniosku, że utwór został prawdopodobnie napisany przez sztuczną inteligencję – lub przynajmniej, że został napisany przez niekompetentnego człowieka.

Jak wykrywać treści generowane przez sztuczną inteligencję: określone taktyki

Teraz zagłębimy się w więcej szczegółów.

Jasne, możesz użyć narzędzia lub własnego osądu do identyfikacji i wykrywania treści generowanych przez sztuczną inteligencję. Ale czego konkretnie szukasz w tych maszynach?

Oto taktyki, których możesz użyć, aby odróżnić treść napisaną przez maszynę od treści napisanej przez człowieka:

Poszukaj powtarzającego się słownictwa.

Narzędzia AI do pisania opierają wszystkie swoje dane wyjściowe na wzorcach i średnich z milionów różnych wpisów. Chcą przestrzegać najbardziej powszechnych, przeciętnych zasad, jakie mogą, więc zazwyczaj skupiają się tylko na najpopularniejszych słowach w języku angielskim. W każdym tekście, niezależnie od tego, czy jest on generowany przez sztuczną inteligencję, czy przez człowieka, znajdziesz określone słowa powtarzane w kółko, takie jak „the”, „i” lub „ale”.

Ale w treści generowanej przez sztuczną inteligencję powtórzenia są znacznie bardziej widoczne i dotyczy to również słów z wyższego poziomu. W recenzji restauracji napisanej przez człowieka możesz zobaczyć słowa takie jak „pyszne”, „smaczne”, „przepyszne”, „zachwycające”, „przepyszne”, „smaczne”, a nawet „orgazmiczne”. AI może użyć tylko 1-2 z nich. Im bardziej kolorowe i różnorodne są te opisowe słowa, tym bardziej prawdopodobne jest, że treść została napisana przez człowieka. Im bardziej statyczne i powtarzalne jest słownictwo, tym bardziej prawdopodobne jest, że treść została napisana przez sztuczną inteligencję.

Oznacz rzadkie i bardzo specyficzne słowa.

Podobnie możesz wykluczyć możliwość, że fragment treści został napisany przez sztuczną inteligencję, jeśli znajdziesz duży wybór rzadkich lub bardzo specyficznych słów. Większość maszyn generujących sztuczną inteligencję nie podejmie ryzyka, używając słowa, które napotkało tylko raz lub dwa razy w milionach przeszukiwanych dokumentów. Będą trzymać się tylko najczęściej używanych słów w języku angielskim, chyba że odstępstwo będzie absolutnie konieczne.

Byłoby pretensjonalne z mojej strony, gdybym opisał swój biznes jako „szytego na miarę”, a siebie jako erudytę, chociaż kakorrhaphiofobia powstrzymuje mnie przed zrobieniem tego. Można argumentować, że te słowa są doskonale cromulentne. Ale w każdym razie – nigdy nie zobaczysz takiego akapitu tekstu w artykule napisanym przez sztuczną inteligencję.

Zwróć uwagę na frazowanie.

Edward Tian, 22-letni student Uniwersytetu Princeton, opracował narzędzie lub aplikację do wykrywania treści, które wykrywają, czy fragment tekstu został napisany przez sztuczną inteligencję. Jednym z jego podstawowych kryteriów oceny jest „wybuchowość”.

Mówiąc najprościej, rozerwanie jest cechą tekstu charakteryzującą się zmiennością struktury zdań i jest narzędziem używanym do wykrywania treści AI.

Kiedy ludzie coś piszą, mają tendencję do używania bardzo zróżnicowanej kombinacji długości i wzorów zdań. Są krótkie zdania. Są długie zdania. Pomiędzy nimi są zdania. Aby to zademonstrować, możesz spojrzeć na ten właśnie akapit; najkrótsze zdanie ma tylko 4 słowa, a najdłuższe 26. Prawdopodobnie nie znajdziesz takiej różnorodności w treściach napisanych przez sztuczną inteligencję.

Zamiast tego zdania wydają się być podobne i powtarzalne, zgodnie z blokowym i (odpowiednio) wzorcem robota.

Oceń płynność języka.

Płynność języka to pojęcie trudne do opisania, ponieważ jest nieco subiektywne. Ale większość z nas potrafi odróżnić native speakera języka angielskiego od kogoś, kto uczy się go po raz pierwszy, nawet jeśli mówi czysto i bez wyraźnego akcentu. Czemu? Spędziliśmy całe życie na mówieniu, słuchaniu, czytaniu i pisaniu w tym języku, więc doskonale go znamy. Rozumiemy potęgę języka i wiemy, jak najlepiej go używać, więc jesteśmy w stanie swobodnie korzystać z jego mocy. Narzędzia sztucznej inteligencji mogą identyfikować wzorce w języku i powtarzać te wzorce, ale ponieważ nie rozumieją znaczenia tych wzorców, obecnie nie są w stanie dokładnie odtworzyć płynności.

Jak możesz to ocenić i odróżnić utwór napisany przez sztuczną inteligencję od utworu napisanego przez człowieka? Spróbuj wyobrazić sobie treść czytaną na głos przez człowieka. Czy osoba, która to czyta, wydaje się wygodna, ciepła i przyjazna? A może coś wydaje się „nie tak” w sposobie, w jaki mówią? Oczywiście tekst pisany jest bardziej płaski niż tekst konwersacyjny, a niektórzy z nas są naturalnie trochę robotyczni. Ale w połączeniu z niektórymi z tych innych charakterystycznych znaków brak płynności może wskazywać na pochodzenie maszyny.

Rozważ złożoność.

Czy treść skłania do myślenia? Czy kwestionuje któreś z twoich dotychczasowych wyobrażeń? Czy wprowadza jakieś trudne do zrozumienia pojęcia? Jeśli którakolwiek z tych informacji jest prawdziwa, utwór prawdopodobnie został napisany przez człowieka.

Obecnie maszyny do generowania treści doskonale radzą sobie z powtarzaniem faktów i składaniem fragmentów tekstu znalezionych w sieci. Ale są okropni w wymyślaniu nowatorskich pomysłów. Twórcy treści AI praktycznie nie mają możliwości kwestionowania status quo, odejścia od głównego nurtu opinii, kwestionowania głównych założeń czy kreatywnego myślenia. Tylko ludzie mogą to zrobić.

Najłatwiej zauważyć tę różnicę, gdy czytasz artykuł na temat, który naprawdę rozumiesz, lub na temat, w którym jesteś uważany za eksperta. Niemal natychmiast można odróżnić prawdziwego mistrza przedmiotu od kogoś, kto powtarza podstawowe fakty z podręczników. Im bardziej złożony jest kawałek, tym bardziej prawdopodobne jest, że pochodzi od człowieka.

Szukaj slangu, idiomów i metafor.

Na razie umiejętność używania języka w sposób bardzo swobodny i ilustracyjny jest cechą wyłącznie ludzką. Nasze obecne narzędzia do generowania treści AI albo nie są wystarczająco wyrafinowane, albo nie chcą ryzykować używania slangu, idiomów lub metafor.

Nie zamierzam się zawstydzać, używając slangu pokolenia Z jako przykładu. Ale pomyśl o moim przykładzie, w jaki sposób recenzent człowiek lub maszyna podszedłby do opisu jedzenia w restauracji; jest to przykład ilustracyjny i prosty, ale prawdopodobnie nadal jest zbyt złożony, aby pojawił się w treści treści napisanej przez sztuczną inteligencję.

Policz literówki.

Jak na ironię, kiedy ludzie widzą literówki i błędy, są bardziej skłonni pomyśleć, że to sztuczna inteligencja. To dlatego, że mamy to dziwne uprzedzenie polegające na założeniu, że ludzie są lepsi od maszyn pod każdym względem. Ale w rzeczywistości jest odwrotnie.

Algorytmy sztucznej inteligencji są funkcjonalnie doskonałe w replikowaniu tekstu, więc jeśli znajdziesz błąd ortograficzny lub rażące nadużycie słownictwa, możesz prawie zagwarantować, że zostało napisane przez człowieka.

W pewnym sensie jest to najbardziej wiarygodny sygnał, który może stwierdzić, czy treść została napisana przez człowieka. Tak jak kalkulatory nigdy nie popełniają błędów numerycznych, generatory treści AI nigdy nie robią boleśnie prostych literówek.

Wyobrażam sobie, że z tego powodu następna generacja silników generowania treści AI będzie zawierała funkcje, które pozwolą ci kontrolować niedoskonałości; jednym kliknięciem możesz zagwarantować, że każdy artykuł wyprodukowany przez Twój generator treści AI zawiera co najmniej jeden błąd ortograficzny, aby sztucznie zwiększyć jego autentyczność.

Żyjemy w dziwnych i ironicznych czasach.

Jeśli szukasz podsumowania, to jest ono następujące: treść generowana przez sztuczną inteligencję jest robotycznie powtarzalna, nieartystyczna i niezdolna do popełniania prostych błędów. Slang, różnorodne słownictwo, dobre metafory, różnorodne struktury zdań, złożone pomysły i literówki to pewne oznaki, że czytasz coś napisanego przez prawdziwą osobę.

Jak ważne jest to?

W filmie Łowca androidów (i wielu podobnych, inspirujących dziełach, takich jak Westworld ), jednym z głównych tematów jest rozpoznanie, co liczy się jako osobowość. Jeśli replikant (sztuczna osoba w świecie Łowcy androidów ) wygląda jak człowiek, mówi jak człowiek, myśli jak człowiek, a nawet czuje się jak człowiek – czy to naprawdę takie ważne, aby nazwać go nieludzkim?

Zgadzam się z poglądem, że jeśli sztuczna inteligencja może tworzyć treści, które są funkcjonalnie identyczne z treściami tworzonymi przez ludzi, powinna być traktowana tak samo. Jest tak samo wartościowy i tak samo ilustracyjny. Tak więc realistycznie, jeśli masz trudności z natychmiastowym odróżnieniem tych dwóch rodzajów generowanych treści, nie ma powodu, abyś przeskakiwał przez obręcze lub grał w Sherlocka Holmesa, aby rozwiązać zagadkę, kto napisał każdy fragment treści, który czytasz od tego momentu.

Ale jednocześnie uważam, że ważne jest, aby nagłośnić i zinternalizować taki artykuł, i to z dwóch głównych powodów:

Łatwo zauważyć różnicę, jeśli wiesz, czego szukać. W Blade Runner niezwykle trudno jest odróżnić człowieka od replikanta. Ale tej trudności nie dorównują współczesne porównania tekstu generowanego przez człowieka i przez sztuczną inteligencję. W rzeczywistości, jako profesjonalny komunikator z wieloletnim doświadczeniem, jest mi banalnie łatwo wskazać materiał stworzony przez AI. To nie jest przechwałka; jest to ilustracja tego, jak prymitywne są obecnie te pozornie wyrafinowane narzędzia.

Pomyśl o tym w ten sposób; jeśli jesteś stosunkowo nowy w grze w szachy, prawdopodobnie nie byłbyś w stanie odróżnić podstawowej sztucznej inteligencji zhakowanej razem przez eksperymentującego nastolatka od Deep Blue, przełomowego superkomputera IBM, który pokonał arcymistrza Gary'ego Kasparowa. Ale Gary Kasparow nie miałby problemu z pokonaniem podstawowej sztucznej inteligencji.

Jest to ważne, ponieważ dobrzy szachiści powinni starać się odróżnić leniwą sztuczną inteligencję od Deep Blue. A dobrzy czytelnicy powinni starać się odróżnić ChatGPT od sztucznej inteligencji, która przewyższa możliwości naszych najlepszych ludzkich pisarzy (chociaż, szczerze mówiąc, ChatGPT jest znacznie bliższy Deep Blue niż leniwa sztuczna inteligencja w naszym przykładzie).

Narzędzia do generowania treści AI mają swoje miejsce. Spędziłem sporo czasu w tym artykule, dyskredytując użyteczność i wydajność treści generowanych przez sztuczną inteligencję, ale w rzeczywistości te narzędzia sztucznej inteligencji mają swoje miejsce. Mogą być niezwykle pomocne w nauczaniu ludzi, udzielaniu pomocy i umożliwianiu rozwoju nowych technologii, o których nikt jeszcze nie śnił. W przyszłości mogą dorównać lub przewyższyć kunszt i zdolności ilustracyjne Tołstoja czy Szekspira.

Ale przesuniemy je na wyższy poziom tylko wtedy, gdy będziemy krytyczni i uważni na narzędzia, które obecnie posiadamy. Zwrócenie uwagi na wady generowania treści AI zmotywuje twórców tych narzędzi do nadrobienia tych niedociągnięć w przyszłości.

Widzimy już na to dowody. ChatGPT jest opisany jako zdolny do „kwestionowania niewłaściwych przesłanek i odrzucania niewłaściwych próśb”. I nie mogę przestać się zastanawiać, czy te elementy zostały wprowadzone z powodu katastrofalnej awarii Tay, chatbota opartego na sztucznej inteligencji opartego na Twitterze, wprowadzonego przez Microsoft, lub podobnych debiutujących technologii. Tay, dla przypomnienia, został wyszkolony przez trolle, aby stać się absurdalnie rasistowskim i obraźliwym – w mniej niż 24 godziny, nie mniej.

Naszym zadaniem jako zwolenników innowacji jest wskazywanie wad i słabości obecnych technologii, abyśmy mogli dążyć do opracowania czegoś jeszcze lepszego. Coś, co naprawdę może zmienić świat.

Czy zauważyłeś, co zrobiłem w poprzedniej sekcji?

Sztuczna inteligencja nie będzie generować odniesień do Blade Runner w swoim piśmie, aby zilustrować punkt.

Nie będzie też wygłaszać takich sardonicznych komentarzy. Lub użyj słowa sardoniczny.

Cały jestem człowiekiem, kochanie.

I chociaż z pewnością istnieje kilka fascynujących aplikacji do pisania AI, zarówno teraz, jak i w przyszłości, jeśli chcesz wywrzeć największy wpływ dzięki strategii marketingu treści i strategii SEO, potrzebujesz pisarzy-ludzi, którzy wykonają ciężkie prace.

Ludzcy pisarze mogą być ekspertami, liderami myśli i przekonującymi, pomysłowymi komunikatorami.

A na razie pisarz AI nie może się z tym równać.

Jeśli potrzebujesz pomocy w podniesieniu SEO, tworzeniu treści, które naprawdę angażują czytelników lub innych strategii marketingu cyfrowego z ekspertami, jesteś w miejscu pisania (gra słów – kolejne zadanie niemożliwe do wykonania przez sztuczną inteligencję). Skontaktuj się z nami, aby uzyskać bezpłatną konsultację już dziś!