AI 생성 콘텐츠를 찾는 방법

게시 됨: 2023-01-17

글쎄, 로봇 인수가 마침내 여기에 있습니다.

오늘날의 로봇은 단순히 자동차를 만들거나 파스타를 요리하는 것이 아닙니다. 그들은 본격적인 대화를 나누고 기사를 작성합니다(이 기사와 다르지 않음).

좋아요. 인공 지능(AI) 세계의 몇 가지 주요 혁신 덕분에 이제 우리는 사람과 같은 텍스트를 생성할 수 있는 정교한 도구를 갖게 되었습니다.

그러나 AI 콘텐츠 감지 도구도 있습니다.

여러분 중 일부는 이것에 놀라지 않습니다. 결국 AI로 작성된 기사는 수년 동안 주류 언론 매체에 게재되었습니다. 당신은 아마 깨닫지도 못한 채 AI가 쓴 기사 중 하나를 읽었을 것입니다.

차이점은 존재하는 정교함의 수준입니다. 이전에는 AI 콘텐츠 생성 도구가 기본적으로 주식 보고서나 스포츠 업데이트와 같이 소화하기 쉬운 주제에 대한 기사만 제작하는 것으로 제한되었습니다.

그러나 요즘 기계 생성 콘텐츠는 어디에나 있으며 모든 것을 다룹니다.

그리고 실제로 사람이 쓴 콘텐츠와 구별할 수 없습니다…

아니면?

알아 보자.

AI 생성 콘텐츠란?

AI 생성 콘텐츠는 기계 학습 알고리즘에 의해 생성된 모든 텍스트, 메시지, 기사 또는 기타 유형의 콘텐츠입니다. 일반적으로 사용자는 프롬프트를 입력하여 AI가 특정 주제에 대해 작성하도록 안내하거나 질문을 하거나 특정 이벤트를 다루도록 지시할 수 있습니다.

프롬프트에 대한 응답으로 AI가 살아나고 읽기 쉽고 이해하기 쉽고 효과적인 것을 생성합니다.

AI 콘텐츠 생성은 또한 온라인에서 가장 큰 일부 웹사이트의 콘텐츠 속도를 확장할 수 있는 능력으로 선전되었습니다.

OpenAI의 최신 프로젝트인 ChatGPT가 이에 대한 예입니다. 조직 자체에서 “우리는 대화 방식으로 상호 작용하는 ChatGPT라는 모델을 교육했습니다. 대화 형식을 통해 ChatGPT는 후속 질문에 답하고, 실수를 인정하고, 잘못된 전제에 이의를 제기하고, 부적절한 요청을 거부할 수 있습니다.”

어떻게 작동합니까?

ChatGPT 언어 모델은 지도 학습과 강화 학습을 모두 사용하지만 강화 학습을 더 많이 사용하여 자체 미세 조정을 위해 사람의 피드백에 의존합니다. 기본적으로 거의 무한한 수의 컨텍스트에서 인간 언어의 예를 관찰하고 모방하려고 시도합니다. 그런 다음 더 수용 가능하고 바람직한 언어 출력으로 안내할 수 있는 인간과 "상호 작용"합니다. AI 모델이 언어를 "이해"하는 데 도움이 되는 수백만 개의 작은 피드백 루프를 통해 언어 사용을 마스터하는 것은 시간 문제입니다.

앞으로 살펴보겠지만 이것은 "진정한" 숙달이 아닙니다.

이 맥락에서 AI는 외부인에게는 그렇게 보일 수 있지만 주제에 대한 대뇌 이해가 없습니다. AI는 말하는 내용에 대해 진정으로 생각하지 않으며 주제를 처리하는 데 고급 인지 기능을 수행하지도 않습니다.

대신 AI는 웹 전체와 상호 작용하는 사용자의 프롬프트 및 응답에서 복제되는 패턴을 관찰하고 모방합니다.

수십억 개의 예제 후에 AI가 명사, 동사 및 형용사를 완전히 적절하게 사용하여 기존의 영어 문장 구조를 모방하는 것이 사소하게 쉬워집니다.

수십억 개의 추가 예제와 일부 상황별 정보를 통해 산업 혁명이 발생한 이유와 방법에 대한 몇 개의 짧은 단락을 작성할 수 있습니다.

물론 ChatGPT는 AI 생성 콘텐츠 애플리케이션의 한 예일 뿐입니다. 사실, 기업가와 파괴적 혁신가들이 누가 이 새로운 기술에 대해 가장 수익성 있는 애플리케이션을 내놓을 수 있는지 경쟁함에 따라 우리는 향후 몇 년 안에 AI 콘텐츠 생성 도구의 폭발적인 증가를 보게 될 것입니다.

특정 범주 내에서 뉴스 기사 생성, SEO 작성, 대학 에세이 작성, 비즈니스 이메일 생성과 같은 개별 사용 사례에 특별히 맞춰진 도구를 보게 될 것입니다.

인간 작가가 되기에 얼마나 좋은 때인가. 또는 독자.

AI 생성 콘텐츠가 문제인 이유

내 자신의 직업 불안정에 대해 할 수 있는 농담은 차치하고, AI 생성 콘텐츠가 하나 이상의 영역에서 문제가 될 가능성이 있다고 말하는 것이 타당합니다.

이 작은 가능성을 고려하십시오.

학업 부정행위. 학계는 이미 학생들이 AI를 사용하여 에세이, 숙제에 대한 응답 등을 생성할 가능성에 대해 열광하고 있습니다. 학생이 작성한 에세이와 기계로 생성된 에세이를 구분하는 것이 불가능하거나 심지어 어려운 경우 어떻게 학생들을 적절하게 평가하고 보상하고 있는지 확인할 수 있습니까? 이제 ChatGPT를 어느 정도 효과적으로 사용하는 방법을 안다고 해서 영어와 같은 분야에서 학위를 받을 수 있습니까?
콘텐츠 스팸. 콘텐츠 스팸은 또 다른 잠재적인 문제입니다. 수년 동안 검색 엔진 최적화(SEO) 산업은 인간 작가의 작업에 크게 의존해 왔습니다. 온사이트 콘텐츠 작성, 오프사이트 콘텐츠 작성 및 백링크 구축은 웹사이트의 권위를 확립하고 검색 엔진에서 더 높은 순위를 차지할 수 있도록 합니다. 유능한 사람이 글을 쓰더라도 웹은 공격적인 콘텐츠 제작으로 과부하되었습니다. 당신이 보는 모든 곳에서 최소한의 정보를 제공하지만 SEO를 위한 목적을 제공하는 푹신한 기사와 판촉물이 있습니다. 마케팅 담당자가 몇 초 만에 전체 기사를 생성할 수 있을 때 문제는 더욱 악화될 것입니다.
부정확성과 가짜 뉴스. ChatGPT는 편견의 영향을 받거나 부정확한 정보를 보고하는 것을 방지하기 위한 보호 장치와 함께 특별히 개발되었습니다. 그러나 이러한 보호 장치는 얼마나 신뢰할 수 있습니까? 그리고 모든 AI 콘텐츠 생성 도구에 적용할 수 있을까요? 어쨌든 부정확성과 가짜 뉴스는 정당한 문제입니다.

AI 생성 콘텐츠를 찾는 방법: 높은 수준

그렇다면 AI 생성 콘텐츠를 어떻게 식별할 수 있을까요?

사람이 쓴 텍스트와 다른 점은 무엇입니까?

높은 수준의 접근 방식부터 시작하겠습니다.

도구 또는 수동 접근 방식을 사용하여 AI 생성 콘텐츠 탐지를 시도할 수 있습니다. 도구 기반 접근 방식을 사용하려면 콘텐츠가 기계에 의해 작성되었다는 잠재적인 신호를 식별하고 측정하도록 설계 및 프로그래밍된 특정 애플리케이션이 필요합니다. 수동 접근 방식에서는 자신의 실사와 상식을 사용하여 작업을 수행합니다.

두 경우 모두 성공 여부는 패턴을 감지하는 능력에 달려 있습니다. AI 콘텐츠 생성 도구는 인간만큼 창의적이고 사려 깊은 것처럼 보일 수 있지만 접근 방식은 매우 수학적이며 기존 패턴을 기반으로 합니다. 따라서 그들이 생산하는 콘텐츠는 면밀히 조사할 때 그들이 연구한 패턴을 드러냅니다.

AI가 생성한 콘텐츠의 단 하나의 특이점이나 특징을 알아차리는 것만으로는 콘텐츠의 일부가 기계에 의해 작성되었음을 확실히 증명하기에 충분하지 않습니다. 그러나 여러 특징을 발견하기 시작하고 이러한 신호가 전체 작품에서 일관되면 해당 작품이 아마도 AI에 의해 작성되었거나 적어도 무능한 인간 저자가 작성했다고 결론을 내릴 수 있습니다.

AI 생성 콘텐츠를 찾는 방법: 특정 전술

이제 자세한 내용을 파헤쳐 보겠습니다.

물론 AI 생성 콘텐츠를 식별하고 탐지하기 위해 도구나 자신의 현명한 판단을 사용할 수 있습니다. 하지만 이 기계에서 구체적으로 무엇을 찾고 있습니까?

다음은 기계가 작성한 콘텐츠와 사람이 작성한 콘텐츠의 차이를 식별하는 데 사용할 수 있는 전술입니다.

반복되는 어휘를 찾으십시오.

AI 쓰기 도구는 수백만 개의 서로 다른 항목에 대한 패턴 및 평균에 대한 모든 출력을 기반으로 합니다. 그들은 가능한 한 가장 일반적이고 평균적인 규칙을 따르기를 원하므로 일반적으로 영어에서 가장 일반적인 단어에만 집중합니다. AI가 생성했든 인간이 생성했든 모든 글에서 "the", "and" 또는 "but"와 같은 특정 단어가 반복해서 반복되는 것을 볼 수 있습니다.

그러나 AI 생성 콘텐츠에서는 반복이 훨씬 더 분명하며 고급 어휘에도 적용됩니다. 사람이 작성한 식당에 대한 리뷰에서 "맛있다", "맛있다", "맛있다", "유쾌하다", "맛있다", "맛있다" 또는 심지어 "절정"과 같은 단어를 볼 수 있습니다. AI는 이들 중 1-2개만 사용할 수 있습니다. 이러한 설명 단어가 더 다채롭고 다양할수록 콘텐츠가 사람에 의해 작성되었을 가능성이 높아집니다. 어휘가 더 정적이고 반복적일수록 콘텐츠가 AI에 의해 작성되었을 가능성이 더 큽니다.

드물고 매우 구체적인 단어에 플래그를 지정합니다.

마찬가지로 희귀하거나 매우 구체적인 단어를 충분히 선택할 수 있는 경우 콘텐츠의 일부가 AI에 의해 작성되었을 가능성을 배제할 수 있습니다. 대부분의 AI 생성 기계는 수백만 개의 크롤링된 문서에서 한두 번 만난 단어를 사용하여 위험을 감수하지 않을 것입니다. 그들은 벗어나는 것이 절대적으로 필요한 경우가 아니면 영어에서 가장 일반적으로 사용되는 단어만을 고수할 것입니다.

나의 카코라피오포비아 때문에 그렇게 하는 것을 주저하지만, 내 사업을 맞춤식으로 묘사하거나 나 자신을 박식하다고 묘사하는 것은 허세일 것입니다. 이 단어가 완벽하게 cromulent라고 주장할 수 있습니다. 그러나 어쨌든 – AI가 작성한 기사에서 이와 같은 텍스트 단락을 결코 볼 수 없습니다.

문구에 주의하세요.

Princeton University의 4학년생인 22세 Edward Tian은 텍스트의 일부가 AI에 의해 작성되었는지 여부를 감지하는 콘텐츠 감지 도구 또는 앱을 고안했습니다. 주요 평가 기준 중 하나는 "폭발성"입니다.

버스트성(Burstiness)은 간단히 말해서 문장 구조의 변형으로 표시된 텍스트의 특성으로 AI 콘텐츠를 감지하는 데 사용되는 도구입니다.

인간은 글을 쓸 때 매우 다양한 문장 길이와 패턴을 조합하여 사용하는 경향이 있습니다. 짧은 문장이 있습니다. 긴 문장이 있습니다. 둘 사이에 문장이 있습니다. 이를 증명하기 위해 바로 이 단락을 볼 수 있습니다. 가장 짧은 문장은 4단어이고 가장 긴 문장은 26단어입니다. AI가 작성한 콘텐츠에서는 이러한 다양성을 찾기 어려울 것입니다.

대신, 문장은 고르지 않고 (적절하게) 로봇 패턴을 따라 유사하고 반복되는 경향이 있습니다.

언어의 유동성을 평가합니다.

언어의 유동성은 다소 주관적이기 때문에 설명하기 어려운 개념이다. 그러나 우리 대부분은 영어를 모국어로 사용하는 사람과 영어를 처음 배우는 사람의 차이를 구별할 수 있습니다. 비록 그들이 깨끗하고 식별할 수 있는 악센트 없이 말하더라도 말입니다. 왜요? 우리는 평생 이 언어로 말하고 듣고 읽고 쓰면서 보냈기 때문에 이 언어에 매우 익숙합니다. 우리는 언어의 힘과 그것이 가장 잘 사용되는 방법을 이해하므로 아무렇지 않게 그 힘을 활용할 수 있습니다. AI 도구는 언어의 패턴을 식별하고 해당 패턴을 반복할 수 있지만 해당 패턴의 의미를 이해하지 못하기 때문에 현재로서는 유동성을 정확하게 복제할 수 없습니다.

이것을 평가하고 AI가 쓴 글과 인간이 쓴 글의 차이점을 어떻게 구분할 수 있습니까? 사람이 큰 소리로 읽는 콘텐츠를 상상해 보세요. 읽는 사람이 편안하고 따뜻하며 공감할 수 있습니까? 아니면 그들이 말하는 방식에 대해 뭔가 "이상"해 보이나요? 분명히 서면 텍스트는 대화형 텍스트보다 단순하며 우리 중 일부는 자연스럽게 약간 로봇입니다. 그러나 이러한 다른 숨길 수 없는 징후 중 일부와 함께 유동성 부족은 기계 기원의 표시가 될 수 있습니다.

복잡성을 고려하십시오.

콘텐츠가 당신을 생각하게 만드나요? 기존 개념에 도전합니까? 이해하기 어려운 개념을 소개합니까? 이 중 하나라도 사실이라면 그 작품은 아마도 인간이 쓴 것일 것입니다.

현재 콘텐츠 생성 기계는 사실을 반복하고 웹 전체에서 찾은 텍스트 조각을 재조립하는 데 탁월합니다. 그러나 그들은 참신한 아이디어를 생각해내는 데 끔찍합니다. AI 콘텐츠 생성자는 현상 유지에 도전하거나, 주류 의견에서 벗어나거나, 주요 가정에 의문을 제기하거나, 창의적으로 생각할 수 있는 능력이 거의 없습니다. 오직 인간만이 이것을 할 수 있습니다.

진정으로 이해하는 주제 또는 전문가로 간주되는 주제에 대한 글을 읽을 때 이러한 차이를 관찰하는 것이 가장 쉽습니다. 주제 자료의 진정한 대가와 교과서에서 기본 사실을 역설하는 사람 사이의 차이점을 거의 즉시 알 수 있습니다. 조각이 복잡할수록 인간에게서 나왔을 가능성이 높습니다.

속어, 숙어, 은유를 찾아보세요.

지금은 언어를 매우 캐주얼하고 예시적으로 사용할 수 있는 것은 전적으로 인간의 특성입니다. 현재 AI 콘텐츠 생성 도구는 충분히 정교하지 않거나 속어, 관용구 또는 은유를 사용하는 위험을 감수하지 않습니다.

저는 Z세대 속어를 예로 들어 제 자신을 부끄럽게 만들지 않을 것입니다. 그러나 인간 또는 기계 리뷰어가 식당에서 음식을 설명하는 방법에 대한 나의 예를 다시 생각해보십시오. 이것은 실례가 되는 간단한 예이지만 AI가 작성한 콘텐츠의 본문에 나타나기에는 여전히 너무 복잡할 수 있습니다.

오타를 세십시오.

아이러니하게도 사람들이 오타와 실수를 볼 때 AI가 생성했다고 생각할 가능성이 더 큽니다. 인간이 모든 면에서 기계보다 낫다고 가정하는 이상한 편견이 있기 때문입니다. 그러나 사실은 그 반대입니다.

AI 알고리즘은 텍스트를 복제하는 데 기능적으로 완벽하므로 철자 오류나 어휘의 심한 오용을 발견하면 거의 사람이 쓴 것이라고 확신할 수 있습니다.

어떤 면에서 이것은 콘텐츠가 사람에 의해 작성되었는지 여부를 알려줄 수 있는 가장 신뢰할 수 있는 신호입니다. 계산기가 수치 오류를 범하지 않는 것처럼 AI 콘텐츠 생성기는 고통스러울 정도로 간단한 오타를 범하지 않습니다.

이 때문에 차세대 AI 콘텐츠 생성 엔진에는 불완전성을 제어할 수 있는 기능이 포함될 것이라고 생각합니다. 버튼을 클릭하면 AI 콘텐츠 생성기가 생성한 모든 기사에 최소한 하나의 맞춤법 오류가 포함되어 인위적으로 진위를 높일 수 있습니다.

우리는 이상하고 아이러니한 시대에 살고 있습니다.

최종 요약을 찾고 있다면 AI 생성 콘텐츠는 로봇처럼 반복적이고 비예술적이며 단순한 오류를 만들 수 없습니다. 속어, 다양한 어휘, 좋은 은유, 다양한 문장 구조, 복잡한 생각, 오타는 모두 실제 사람이 쓴 글을 읽고 있다는 확실한 신호입니다.

이것이 얼마나 중요한가?

영화 Blade Runner (및 Westworld 와 같은 유사한 영감을 받은 수많은 작품)에서 중심 주제 중 하나는 인격으로 간주되는 것을 분별하는 것입니다. 리플리컨트( 블레이드 러너 세계의 인공인)가 인간처럼 보이고, 인간처럼 말하고, 인간처럼 생각하고, 심지어 인간처럼 느낀다면, 그것을 인간이 아닌 것으로 분류하는 것이 정말 중요합니까?

AI가 인간이 만든 콘텐츠와 기능적으로 동일한 콘텐츠를 만들 수 있다면 똑같이 취급해야 한다는 생각에 동의합니다. 그것은 그만큼 가치 있고 예시적입니다. 따라서 현실적으로 이 두 가지 유형의 생성된 콘텐츠 사이의 차이를 즉시 구별하기 위해 고군분투하는 경우 여기에서 읽는 각 콘텐츠를 누가 작성했는지에 대한 수수께끼를 풀기 위해 농구대를 뛰어넘거나 Sherlock Holmes를 플레이할 이유가 없습니다.

그러나 동시에 이와 같은 기사를 홍보하고 내면화하는 것이 중요하다고 생각하며 두 가지 주요 이유가 있습니다.

무엇을 찾아야 하는지 안다면 차이점을 쉽게 알 수 있습니다. Blade Runner 에서는 사람과 리플리컨트를 구분하는 것이 매우 어렵습니다. 그러나 이러한 어려움은 인간이 생성한 텍스트와 AI가 생성한 텍스트를 현대적으로 비교하는 것과 일치하지 않습니다. 사실 다년간의 경험을 가진 전문 커뮤니케이터로서 AI에서 비롯된 자료를 지적하는 것은 사소하게 쉽습니다. 그것은 자랑이 아닙니다. 이것은 겉으로 보기에 정교한 이러한 도구가 현재 얼마나 초보적인지를 보여줍니다.

이렇게 생각해보세요. 상대적으로 체스를 처음 접하는 사람이라면 실험적인 십대가 함께 해킹한 초보적인 AI와 그랜드마스터 게리 카스파로프를 이긴 획기적인 IBM 슈퍼컴퓨터인 Deep Blue의 차이를 구분하지 못할 것입니다. 그러나 Gary Kasparov는 초보적인 AI를 무찌르는 데 아무런 문제가 없을 것입니다.

좋은 체스 플레이어는 게으른 AI와 Deep Blue의 차이를 구분하기 위해 노력해야 하기 때문에 이것은 중요합니다. 그리고 좋은 독자는 ChatGPT와 최고의 인간 작성자의 능력을 능가하는 AI의 차이점을 구분하기 위해 노력해야 합니다(공평하게 말하면 ChatGPT는 우리 예에서 게으른 AI보다 Deep Blue에 훨씬 더 가깝습니다).

AI 콘텐츠 생성 도구가 자리를 잡았습니다. 저는 이 기사에서 AI 생성 콘텐츠의 유용성과 성능을 폄하하는 데 상당한 시간을 보냈지만 현실은 이러한 AI 도구가 자리를 잡고 있다는 것입니다. 그들은 사람들을 가르치고, 도움을 제공하고, 아무도 꿈꾸지 못한 새로운 기술의 개발을 가능하게 하는 데 매우 도움이 될 수 있습니다. 미래에 그들은 톨스토이나 셰익스피어의 예술성과 삽화적 기량에 필적하거나 능가할 수 있을 것입니다.

그러나 우리가 현재 가지고 있는 도구에 대해 비판적이고 주의를 기울이는 경우에만 다음 단계로 나아갈 수 있습니다. AI 콘텐츠 생성의 단점을 지적하는 것은 이러한 도구의 개발자에게 미래에 이러한 단점을 보완하도록 동기를 부여할 것입니다.

우리는 이미 이것에 대한 증거를 볼 수 있습니다. ChatGPT는 "잘못된 전제에 도전하고 부적절한 요청을 거부"할 수 있는 것으로 설명됩니다. 그리고 이러한 요소들이 마이크로소프트가 출시한 트위터 기반 AI 챗봇인 테이(Tay)나 유사한 데뷔 기술의 비참한 실패 때문에 도입된 것이 아닌지 궁금하지 않을 수 없습니다. 기록상 테이는 트롤들에게 터무니없을 정도로 인종 차별적이고 공격적으로 변하도록 훈련받았습니다.

현재 기술의 결점과 약점을 지적하여 더 나은 것을 개발하기 위해 노력하는 것이 혁신의 지지자로서 우리의 임무입니다. 세상을 진정으로 바꿀 수 있는 무언가.

이전 섹션에서 제가 한 일을 눈치채셨나요?

AI는 요점을 설명하기 위해 글을 쓸 때 Blade Runner 참조를 생성하지 않을 것입니다.

또한 그런 냉소적인 댓글을 달지 않을 것입니다. 또는 냉소적이라는 단어를 사용하십시오.

나는 모두 인간이야, 자기야.

그리고 현재와 미래에 AI 작성을 위한 몇 가지 매력적인 응용 프로그램이 분명히 있지만 콘텐츠 마케팅 및 SEO 전략에 가장 큰 영향을 미치려면 무거운 작업을 수행할 인간 작성자가 필요합니다.

인간 작가는 전문가, 사상가, 설득력 있고 능숙한 커뮤니케이터가 될 수 있습니다.

그리고 현재로서는 AI 작가가 그것을 따라잡을 수 없습니다.

SEO를 개선하는 데 도움이 필요하고, 진정으로 독자를 참여시키는 콘텐츠를 만들거나, 인간 전문가와 함께 다른 디지털 마케팅 전략을 만들기 위해 글을 작성해야 합니다(말장난 사용 - 또 다른 AI 불가능한 작업). 오늘 무료 상담을 위해 저희에게 연락하십시오!