Сайты-мусорки: насколько серьезна проблема с junk websites и при чем здесь ИИ

Контент теперь создается со скоростью 1200 статей в день

Сайты-мусорки (junk websites), или сайты, наполненные низкосортным контентом, создаются с разной целью: от распространения вирусов до заработка средств и влияния на общественное мнение. Они всегда были проблемой, но пока их созданием занимались люди — не столь серьезной.

С развитием ИИ эксперты забили тревогу: сайты-мусорки начали появляться значительно быстрее, принося их создателям доход до $ 1000 при значительно меньших затратах на поддержку.

В этом материале разбираемся, насколько ИИ упростил процесс создания junk websites, чем они вредят и можно ли что-нибудь с ними сделать.

Какие бывают сайты

Есть простые одностраничные сайты (лендинги) и более сложные, которые представляют собой образовательные порталы, новостные ресурсы, магазины и т. д. Оба вида можно условно разделить на «доброкачественные» и «мусорки»:

«Доброкачественные» сайты — это платформы, наполненные оригинальным контентом. На них мало или отсутствует реклама, а также нет кликбейта.
«Мусорки» же содержат посредственный контент, там есть кликбейтные заголовки и куча рекламы. Зачастую этот тип сайтов также распространяет вирусы.

Как «доброкачественные» сайты, так и «мусорки» можно создавать с помощью ИИ. Но если раньше junk websites наполняли с помощью «ферм» копирайтеров, которым давали заказы на огромные объемы низкооплачиваемых текстов, то теперь все чаще начинка этих сайтов — тексты и изображения, сгенерированные ИИ. Силами ChatGPT делать это стало не просто дешево, а бесплатно.

Более того, автоматизировать некоторые из технических процессов создания сайтов, используя ИИ-инструмент, тоже достаточно легко.

Как ChatGPT может создавать мусорные сайты

«Набросать базовую структуру сайта и выдать структуру HTML: html, body, section, navbar и т. д. — такую задачу легко решить с помощью ChatGPT», — рассказывает Данил Бойко, Technical Leader в N-IX с опытом работы 6+ лет в FullStack-разработке. «Также можно автоматизировать код. Я говорю: «ChatGPT, у меня есть 10 полей, у меня есть такая структура, внутри этой структуры вставь эти 10 полей». Вместо того чтобы я писал это самостоятельно, это сделает он».

Данил Бойко, Technical Leader в N-IX

Так же можно и проверить код на ошибки, особенно орфографические, добавляет Данил. «Если код более сложный, я не могу как девелопер подписаться за его качество, поэтому я за ним самостоятельно все проверяю. Но с простыми задачами он справится хорошо», — делится разработчик.

Данил говорит, что пока сам по себе ИИ не может сделать что-нибудь большое. Но перед нами уже стоит задача овладеть им — потому что обученный человек будет впереди того, кто этим инструментом не пользуется. К сожалению, необязательно этот человек будет создавать что-нибудь полезное.

Уже сейчас компания NewsGuard, которая занимается оценкой сайтов, с апреля 2023 года еженедельно обнаруживает около 25 новых сайтов, созданных ИИ: 217 из них сделаны на 13 языках. Некоторые из них более сложные и убедительные, а некоторые — наполнены сгенерированными ИИ фотографиями и фальшивыми биографиями несуществующих авторов материалов.

На одном таком сайте с помощью ИИ могут создаваться 1200 статей в день.

Можно ли отличить сайт, созданный человеком, от написанного с помощью ИИ?

«Сегодня искусственный интеллект не может самостоятельно сделать сайт, для этого нужно позаботиться о многих моментах: поднять сервер, купить домен и привязать его к серверу, сделать SSL-сертификат и т .д. За каждым сайтом все еще будет человек. Конечно, есть готовые решения, чтобы быстро развернуть сайт, но это все равно требует усилий», — говорит Данил Бойко.

На скриншоте ниже показан сайт о кошках в стиле Барби, который Данил попросил написать человека с нулевым опытом программирования. Чтобы создать сайт, этот человек ставил разные задачи ChatGPT. Как видим, результат не выглядит как сайт с первой страницы Google и явно не оказывает общественного влияния:

Скриншот сайта, созданного человеком с нулевым опытом программирования с помощью ChatGPT

ИИ не отнимет работу у человека, с ним сам же человек может выполнять больший объем работы, уверен Данил. К примеру, после появления машин рабочие часы на фабрике не уменьшились, зато повысилось количество произведенной продукции. Так же и сейчас: опытный разработчик может ускорить свою разработку с помощью ИИ.

«Нужно понимать, что ИИ не пишет сам, он использует предположения, а основой этих предположений используется код, добавленный человеком до 2021 года, — добавляет Данил. — Именно поэтому X (бывший Twitter), Reddit и другие берут деньги за считывание данных».

Также разработчик говорит, что отличить сайт, на котором был задействован ИИ, можно, если обращать внимание на контент. «ChatGPT имеет свой стиль письма, который выдает его сразу, если в текст не вносить правки».

Как NewsGuard ищет и оценивает сайты, созданные ИИ

Выше мы уже упоминали NewsGuard, инструмент, который оценивает доверие к новостным и информационным веб-сайтам, а также отслеживает дезинформацию в интернете. Его можно установить как расширение браузера или отдельным мобильным приложением.

NewsGuard работает с помощью различных инструментов ИИ, также они владеют наибольшим набором данных о новостях. Они ставят аббревиатуру UAIN на сайты, где контент создан с помощью ИИ. Но уже сейчас многие журналисты используют ИИ в своей работе.

В NewsGuard утверждают, что не будут маркировать сайты, в которых заранее указывается использование ИИ в своей работе, потому что эта аббревиатура должна нести предупреждение именно о недоброкачественном сайте.

Поскольку многие сайты-мусорки наполняются без присмотра человека, они часто пронизаны сообщениями об ошибках, типичными для систем ИИ. Например, на сайте CountyLocalNews.com были сообщения вроде:

«Извините, я не могу выполнить эту подсказку, поскольку это противоречит этическим и нравственным принципам (…) Как модель языка ИИ, я отвечаю за предоставление фактической и достоверной информации».

Алгоритмы NewsGuard ищут и такие сообщения тоже.

Могут ли сайты, созданные с помощью ИИ, обмануть Google

Данил Бойко, Technical Leader в N-IX, не верит, что сайт, полностью написанный ИИ, может обмануть поисковые системы.

«Даже опытные маркетологи и разработчики очень стараются попасть на первую страницу Google, — говорит разработчик. — А в самом Google работают одни из лучших представителей IT-индустрии, которые точно знают, что и как проверить. Даже если GoogleAds будет подключен к недоброкачественным сайтам, еще не факт, что это принесет деньги их владельцам».

Выделяют два основных типа монетизации сайтов через рекламу:

Оплата за количество переходов по рекламе.
Оплата за количество ее просмотра на странице сайта.

Посещаемость можно легко накрутить ботами, но вместо прибыли легче получить бан, говорит Данил. Также в Google существуют целые департаменты, чтобы защитить свой бизнес: Ad Fraud and Bot Traffic, Validating Impressions, Bot Mitigation, Monitoring and Reporting, а также ИИ, который будет искать другой ИИ.

Тем не менее Google Ads, крупнейшую биржу в интернете, неоднократно критиковали за размещение рекламы на недоброкачественных сайтах в прошлом, хотя ее собственные нормативно-правовые акты запрещают сайтам размещать рекламу Google на страницах с «автоматически созданным содержимым спамом».

Около четверти сайтов, на которые обратили внимание NewsGuard, содержали программные объявления от крупных брендов. Из 393 объявлений от крупных брендов, найденных на созданных искусственным интеллектом сайтах, 356 обслуживал Google.

Сайт MedicalOutline.com, написанный с помощью ИИ, содержал статьи, распространявшие дезинформацию о здоровье, с заголовками вроде «Может ли лимон вылечить кожную аллергию?», «Какие 5 природных средств от СДВГ?» и «Как предотвратить рак естественным путем?». По данным NewsGuard, на сайте через Google была размещена реклама девяти крупных брендов.

Являются ли некачественные сайты проблемой интернета

Сайты-мусорки создают с разными целями. Имеющие большую аудиторию часто направлены на влияние общественного мнения и сбор персональных данных. Но за такими сайтами стоит много работы — исключительно ИИ не в состоянии обработать запрос человека на 100 % правильно.

Маленькие и простые junk websites могут создаваться в целях обогащения на показах рекламы, но это сомнительный метод заработка, потому что тоже требует множество ресурсов.

«Я думаю, что некачественные сайты не представляют угрозы, ибо привлечь аудиторию — очень сложная задача. Это то, над чем трудятся отделы маркетологов. Я не могу представить, чтобы сайт, который я добавил на скриншоте выше, мог повлиять на кого-то. Человек проведет на нем не больше 10 секунд», — делится мнением Данил Бойко.

Но нужно беспокоиться, чтобы сайты не использовали в целях мошенничества, добавляет он. «Хотя человек без опыта не сможет этого сделать, это могут быть разработчики. Но следует помнить, что развитие рынка мошеннических сайтов провоцирует и развитие защиты от них».

В свою очередь, специалисты в сфере кибербезопасности также могут использовать ИИ для усиления защиты. Как именно — читайте в интервью с Михаилом Кольцовым, внешним консультантом The World Bank Group в области анализа данных и кибербезопасности.

Автор: Дарина Валерко