Как определить контент, созданный ИИ

Опубликовано: 2023-01-17

Что ж, захват роботов наконец-то здесь.

Сегодняшние роботы не просто строят автомобили или варят макароны; они ведут полноценные беседы и пишут статьи (мало чем отличающиеся от этой).

Верно. Благодаря некоторым крупным прорывам в мире искусственного интеллекта (ИИ) у нас теперь есть сложные инструменты, способные генерировать человекоподобный текст.

Но есть также инструменты обнаружения контента AI.

Некоторых из вас это не удивляет. В конце концов, статьи, написанные ИИ, публикуются в основных СМИ уже много лет. Вы, вероятно, даже читали одну из этих статей, написанных ИИ, даже не осознавая этого.

Разница заключается в уровне сложности присутствующих. Раньше инструменты генерации контента с помощью ИИ были в основном ограничены созданием статей только на легко усваиваемые темы, такие как биржевые отчеты или спортивные новости.

Но в наши дни контент, генерируемый машинами, повсюду и охватывает все.

И это практически неотличимо от написанного человеком контента…

Либо это?

Давайте узнаем.

Оглавление

Что такое контент, созданный искусственным интеллектом?
Почему контент, созданный ИИ, является проблемой
Как определить контент, созданный ИИ: высокий уровень
Как определить контент, созданный ИИ: конкретные тактики
- Найдите повторяющуюся лексику.
- Отмечайте редкие и очень специфические слова.
- Обратите внимание на формулировку.
- Оцените плавность речи.
- Учитывайте сложность.
- Искать сленг, идиомы и метафоры.
- Считайте опечатки.
Насколько это важно?

Что такое контент, созданный искусственным интеллектом?

Контент, созданный ИИ, — это любой текст, сообщение, статья или другой тип контента, созданный с помощью алгоритма машинного обучения. Как правило, пользователь может ввести подсказку, направляя ИИ писать на определенную тему, задавая вам вопрос или направляя его для освещения определенного события.

В ответ на подсказку ИИ оживает и создает что-то читабельное, понятное и, надеюсь, эффективное.

Создание контента ИИ также рекламировалось за его способность масштабировать скорость контента для некоторых из крупнейших веб-сайтов в Интернете.

Последний проект OpenAI, ChatGPT, является примером этого. По словам самой организации, «мы обучили модель под названием ChatGPT, которая взаимодействует в диалоговом режиме. Формат диалога позволяет ChatGPT отвечать на дополнительные вопросы, признавать свои ошибки, оспаривать неверные предпосылки и отклонять неуместные запросы».

Как это работает?

Языковая модель ChatGPT использует как обучение с учителем, так и обучение с подкреплением, хотя она использует обучение с подкреплением в большей степени, полагаясь на отзывы людей для точной настройки. По сути, он наблюдает и пытается имитировать примеры человеческого языка в практически бесконечном количестве контекстов; затем он «взаимодействует» с людьми, которые могут привести его к более приемлемым и желательным языковым результатам. С миллионами крошечных петель обратной связи, помогающих модели ИИ «понимать» язык, это только вопрос времени, когда она освоит использование языка.

Как мы увидим, это не «истинное» мастерство.

ИИ в этом контексте не имеет интеллектуального понимания предмета, хотя постороннему это может показаться таким. ИИ на самом деле не думает о том, что говорит, и не выполняет никаких дополнительных когнитивных функций при обработке темы.

Вместо этого ИИ просто наблюдает и имитирует шаблоны, которые, как он видит, воспроизводятся по всей сети, а также в подсказках и ответах пользователей, с которыми он взаимодействует.

После нескольких миллиардов примеров ИИ становится тривиально легко имитировать обычные английские структуры предложений, используя существительные, глаголы и прилагательные совершенно уместно.

После еще нескольких миллиардов примеров и некоторой контекстно-зависимой информации он может написать пару коротких абзацев о том, почему и как произошла промышленная революция.

Конечно, ChatGPT — это всего лишь один пример приложения для контента, созданного искусственным интеллектом. На самом деле, мы готовы стать свидетелями взрыва инструментов для создания контента с помощью ИИ в ближайшие несколько лет, поскольку предприниматели и прорывные новаторы соревнуются в том, кто сможет придумать наиболее прибыльное приложение для этой новой технологии.

Скорее всего, мы увидим инструменты, специально предназначенные для отдельных случаев использования, таких как создание новостей в определенной категории, написание текстов для SEO, написание эссе для колледжа и даже создание деловых электронных писем.

Какое время быть человеческим писателем. Или читатель.

Почему контент, созданный ИИ, является проблемой

Если оставить в стороне некоторые ироничные шутки, которые я мог бы отпустить по поводу неуверенности в своей работе, справедливо будет сказать, что контент, созданный ИИ, может быть проблематичным, причем не в одной области.

Рассмотрим этот небольшой выбор возможностей.

Академический проступок. Мир академиков уже сходит с ума по поводу того, что студенты могут использовать ИИ для создания эссе, ответов на домашние задания и многого другого. Если невозможно или даже трудно отличить эссе, написанное студентом, от сочинения, созданного машиной, как мы можем быть уверены, что правильно оцениваем и вознаграждаем студентов? Можете ли вы теперь получить степень в такой области, как английский язык, только потому, что вы знаете, как использовать ChatGPT несколько эффективно?
Содержимый спам. Контент-спам — еще одна потенциальная проблема. В течение многих лет индустрия поисковой оптимизации (SEO) в значительной степени полагалась на работу людей-писателей. Написание контента на месте, контента за пределами сайта и создание обратных ссылок устанавливает авторитет веб-сайта и позволяет ему занимать более высокое место в поисковых системах. И даже когда компетентные люди пишут тексты, сеть перегружена агрессивным производством контента. Куда бы вы ни посмотрели, везде будут пушистые статьи и рекламные материалы, предоставляющие минимум информации, но служащие цели SEO. Проблема только усугубится, когда маркетологи смогут генерировать целые статьи за считанные секунды.
Неточности и фейковые новости. ChatGPT специально разработан с учетом мер предосторожности, чтобы предотвратить влияние предвзятости или предоставление неточной информации. Но насколько надежными будут эти гарантии? И могут ли они применяться ко всем инструментам генерации контента ИИ? В любом случае неточности и фейковые новости вызывают законную озабоченность.

Как определить контент, созданный ИИ: высокий уровень

Так как же определить контент, созданный ИИ?

Чем он отличается от написанного человеком текста?

Мы начнем с высокоуровневого подхода.

Вы можете попытаться обнаружить контент, созданный ИИ, с помощью инструментов или ручного подхода. При подходе, основанном на инструментах, вам потребуется специальное приложение, которое было разработано и запрограммировано для выявления и измерения потенциальных сигналов о том, что часть контента была написана машиной. При ручном подходе вы будете использовать собственную должную осмотрительность и здравый смысл для выполнения работы.

В обоих случаях ваш успех будет зависеть от вашей способности обнаруживать закономерности. Помните, что инструменты генерации контента с помощью ИИ могут показаться такими же творческими и продуманными, как и люди, но их подход чрезвычайно математический и основан на существующих шаблонах. Соответственно, контент, который они производят, при тщательном изучении выявляет закономерности, которые они изучали.

Заметить одну особенность или отличительную черту контента, сгенерированного ИИ, недостаточно, чтобы окончательно доказать, что часть контента была написана машиной. Но если вы начнете замечать несколько отличительных черт, и эти сигналы одинаковы для всего произведения, вы можете сделать вывод, что произведение, вероятно, было написано ИИ или, по крайней мере, что оно было написано некомпетентным автором-человеком.

Как определить контент, созданный ИИ: конкретные тактики

Теперь давайте углубимся в детали.

Конечно, вы можете использовать инструмент или собственный здравый смысл для идентификации и обнаружения контента, созданного ИИ. Но что вы в этих машинах ищете, конкретно?

Вот тактика, которую вы можете использовать, чтобы различить контент, написанный машиной, и контент, написанный человеком:

Найдите повторяющуюся лексику.

Инструменты для письма с искусственным интеллектом основывают весь свой вывод на шаблонах и средних значениях для миллионов различных записей. Они хотят следовать наиболее распространенным, усредненным правилам, поэтому обычно сосредотачиваются только на самых распространенных словах английского языка. В любом письме, созданном ИИ или человеком, вы найдете определенные слова, повторяющиеся снова и снова, такие как «то», «и» или «но».

Но в контенте, сгенерированном ИИ, повторение гораздо более очевидно, и это также относится к словарным словам более высокого уровня. В обзоре ресторана, написанном человеком, вы можете увидеть такие слова, как «вкусно», «вкусно», «восхитительно», «восхитительно», «восхитительно», «вкусно» или даже «оргазмически». ИИ может использовать только 1-2 из них. Чем красочнее и разнообразнее эти описательные слова, тем больше вероятность того, что контент был написан человеком. Чем более статичным и повторяющимся является словарный запас, тем более вероятно, что контент был написан искусственным интеллектом.

Отмечайте редкие и очень специфические слова.

Точно так же вы можете исключить возможность того, что часть контента была написана ИИ, если вы сможете найти достаточное количество редких или очень специфических слов. Большинство машин для генерации ИИ не собираются рисковать, используя слово, которое они встречали всего один или два раза в миллионах просканированных документов. Они будут придерживаться только наиболее часто используемых слов в английском языке, если не будет абсолютной необходимости отклоняться.

Было бы претенциозно с моей стороны называть свой бизнес индивидуальным или себя эрудированным, хотя моя какоррафофобия удерживает меня от этого. Вы можете возразить, что эти слова совершенно громоздки. Но в любом случае — вы никогда не увидите такого абзаца текста в статье, написанной ИИ.

Обратите внимание на формулировку.

Эдвард Тиан, 22-летний выпускник Принстонского университета, придумал инструмент или приложение для обнаружения контента, которое определяет, был ли текст написан искусственным интеллектом. Одним из его основных оценочных критериев является «разрывность».

Проще говоря, пакетность — это характеристика текста, отмеченная вариациями в структуре предложений, и это инструмент, используемый для обнаружения контента ИИ.

Когда люди что-то пишут, они, как правило, используют очень разнообразное сочетание длин предложений и шаблонов. Есть короткие фразы. Есть длинные фразы. Между ними есть предложения. В качестве демонстрации этого вы можете посмотреть на этот самый абзац; в самом коротком предложении всего 4 слова, а в самом длинном — 26. Вероятно, вы не найдете такого разнообразия в содержании, написанном ИИ.

Вместо этого предложения, как правило, похожи и повторяются, следуя блочному и (соответственно) роботизированному шаблону.

Оцените плавность речи.

Текучесть языка — понятие, которое трудно описать, поскольку оно несколько субъективно. Но большинство из нас может определить разницу между носителем английского языка и тем, кто изучает его впервые, даже если они говорят чисто и без какого-либо заметного акцента. Почему? Мы всю жизнь говорили, слушали, читали и писали на этом языке, так что мы хорошо с ним знакомы. Мы понимаем силу языка и то, как его лучше всего использовать, поэтому мы можем небрежно использовать его силу. Инструменты ИИ могут выявлять шаблоны в языке и повторять эти шаблоны, но, поскольку он не понимает смысла этих шаблонов, в настоящее время он не может точно воспроизвести текучесть.

Как вы можете оценить это и определить разницу между произведением, написанным ИИ, и произведением, написанным человеком? Попробуйте представить, что часть контента читает вслух человек. Кажется ли человеку, читающему это, удобным, теплым и родственным? Или что-то кажется «неправильным» в том, как они говорят? Очевидно, письменный текст более плоский, чем разговорный, и некоторые из нас от природы немного роботизированы. Но в сочетании с некоторыми другими контрольными признаками отсутствие текучести может указывать на машинное происхождение.

Учитывайте сложность.

Заставляет ли вас задуматься содержание? Оспаривает ли это какое-либо из ваших существующих представлений? Вводит ли он какие-либо концепции, которые трудно понять? Если что-то из этого правда, то произведение, вероятно, было написано человеком.

В настоящее время машины для генерации контента отлично справляются с повторением фактов и перекомпоновкой фрагментов текста, найденных в Интернете. Но они ужасно придумывают новые идеи. Генераторы контента ИИ практически не имеют возможности оспаривать статус-кво, отклоняться от общепринятого мнения, подвергать сомнению основные предположения или мыслить творчески. Это могут сделать только люди.

Эту разницу легче всего заметить, когда вы читаете статью на тему, которую действительно понимаете, или на тему, в которой вы считаетесь экспертом. Вы почти сразу сможете отличить настоящего мастера предметного материала от человека, повторяющего основные факты из учебников. Чем сложнее произведение, тем больше вероятность того, что оно создано человеком.

Искать сленг, идиомы и метафоры.

На данный момент это исключительно человеческое качество — использовать язык очень небрежно и иллюстративно. Наши нынешние инструменты генерации контента с помощью ИИ либо недостаточно сложны, либо не готовы рисковать, используя сленг, идиомы или метафоры.

Я не собираюсь ставить себя в неловкое положение, используя сленг поколения Z в качестве примера. Но вспомните мой пример о том, как рецензент-человек или машина подойдет к описанию еды в ресторане; это наглядный и простой пример, но, вероятно, он все еще слишком сложен, чтобы появляться в теле части контента, написанного ИИ.

Считайте опечатки.

По иронии судьбы, когда люди видят опечатки и ошибки, они с большей вероятностью думают, что это было сделано искусственным интеллектом. Это потому, что у нас есть эта странная предвзятость, предполагающая, что люди лучше машин во всех отношениях. Но на самом деле все наоборот.

Алгоритмы искусственного интеллекта функционально идеально подходят для воспроизведения текста, поэтому, если вы обнаружите орфографическую ошибку или грубое неправильное использование словарного слова, вы можете почти гарантировать, что это было написано человеком.

В некотором смысле это самый надежный сигнал, который может сказать вам, был ли контент написан человеком. Точно так же, как калькуляторы никогда не допускают числовых ошибок, генераторы контента ИИ никогда не допускают до боли простых опечаток.

Я полагаю, что из-за этого следующее поколение движков генерации контента ИИ будет включать функции, которые позволят вам контролировать несовершенства; одним нажатием кнопки вы можете гарантировать, что каждая статья, созданная вашим генератором контента AI, содержит по крайней мере одну орфографическую ошибку, чтобы искусственно повысить ее подлинность.

Мы живем в странное и ироничное время.

Если вам нужен итоговый итог, то вот он: контент, сгенерированный ИИ, повторяется автоматически, нехудожественный и неспособен совершать простые ошибки. Сленг, разнообразные словарные слова, хорошие метафоры, разнообразные структуры предложений, сложные идеи и опечатки — все это верные признаки того, что вы читаете что-то, написанное реальным человеком.

Насколько это важно?

В фильме « Бегущий по лезвию» (и множестве подобных вдохновенных работ, таких как « Мир Дикого Запада ») одной из центральных тем является определение того, что считается личностью. Если репликант (искусственный человек в мире « Бегущего по лезвию» ) выглядит как человек, говорит как человек, думает как человек и даже чувствует себя человеком — неужели так важно называть его нечеловеком?

Я согласен с тем, что если ИИ может создавать контент, который функционально идентичен контенту, создаваемому людьми, с ним следует обращаться так же. Это так же ценно и так же иллюстративно. Так что на самом деле, если вы изо всех сил пытаетесь сразу же определить разницу между этими двумя типами сгенерированного контента, у вас нет причин прыгать через обручи или играть в Шерлока Холмса, чтобы разгадать тайну того, кто написал каждый фрагмент контента, который вы читаете с этого момента.

Но в то же время я считаю важным опубликовать и усвоить такую статью по двум основным причинам:

Легко сказать разницу, если вы знаете, что искать. В « Бегущем по лезвию » чрезвычайно сложно отличить человека от репликанта. Но эта трудность не соответствует современным сравнениям текста, созданного человеком, и текста, созданного искусственным интеллектом. На самом деле, как профессиональный коммуникатор с многолетним опытом, мне очень легко указать на материал, созданный искусственным интеллектом. Это не хвастовство; это иллюстрация того, насколько рудиментарными в настоящее время являются эти, казалось бы, сложные инструменты.

Подумайте об этом таким образом; если вы относительно новичок в шахматах, вы, вероятно, не сможете увидеть разницу между рудиментарным искусственным интеллектом, собранным подростком-экспериментатором, и Deep Blue, выдающимся суперкомпьютером IBM, победившим гроссмейстера Гэри Каспарова. Но Гэри Каспарову не составило бы труда победить примитивный ИИ.

Это важно, потому что хорошие шахматисты должны стремиться отличить ленивый ИИ от Deep Blue. И хорошие читатели должны стремиться показать разницу между ChatGPT и ИИ, который превосходит способности наших лучших писателей (хотя, честно говоря, ChatGPT намного ближе к Deep Blue, чем ленивый ИИ в нашем примере).

Инструменты для создания контента с помощью ИИ имеют место быть. Я потратил довольно много времени в этой статье, пренебрегая полезностью и производительностью контента, созданного ИИ, но реальность такова, что у этих инструментов ИИ есть место. Они могут быть невероятно полезными для обучения людей, предоставления помощи и обеспечения возможности разработки новых технологий, о которых никто еще не мечтал. В будущем они, возможно, смогут сравниться или превзойти артистизм и иллюстративное мастерство Толстого или Шекспира.

Но мы подтолкнем их к следующему уровню только в том случае, если будем критичны и внимательны к инструментам, которые у нас есть в настоящее время. Указание на недостатки генерации контента с помощью ИИ будет мотивировать разработчиков этих инструментов исправить эти недостатки в будущем.

Мы уже можем видеть доказательства этого. ChatGPT описывается как способный «оспаривать неправильные предпосылки и отклонять неуместные запросы». И я не могу не задаться вопросом, были ли эти элементы введены из-за катастрофического провала Tay, созданного Microsoft чат-бота с искусственным интеллектом на основе Twitter, или аналогичных дебютных технологий. Для протокола, Тай был обучен троллями, чтобы стать абсурдно расистским и оскорбительным - менее чем за 24 часа, не меньше.

Наша работа как сторонников инноваций состоит в том, чтобы указать на недостатки и слабости существующих технологий, чтобы мы могли стремиться разработать что-то еще лучшее. Что-то, что действительно может изменить мир.

Вы заметили, что я сделал в предыдущем разделе?

ИИ не собирается генерировать отсылки к « Бегущему по лезвию» в своем письме, чтобы проиллюстрировать точку зрения.

Он также не собирается делать такие сардонические комментарии. Или используйте слово сардонический.

Я всего лишь человек, детка.

И хотя, безусловно, есть несколько интересных приложений для написания ИИ как сейчас, так и в будущем, если вы хотите оказать наибольшее влияние с помощью своей стратегии контент-маркетинга и SEO, вам нужны писатели-люди, которые сделают тяжелую работу.

Писатели-люди могут быть экспертами, мыслителями и убедительными, искусными коммуникаторами.

И на данный момент писатель ИИ не может сравниться с этим.

Если вам нужна помощь в продвижении вашего SEO, для создания контента, который действительно привлекает читателей, или других стратегий цифрового маркетинга с экспертами-людьми, вы пришли к месту написания (использование каламбура — еще одна невыполнимая задача для ИИ). Свяжитесь с нами для бесплатной консультации сегодня!