ИИ? Плати!
Создатели контента и сайты враждебно относятся к ИИ-компаниям, которые бесплатно используют их материалы для обучения моделей. Это понятно. ИИ-компании утверждают, что они используют данные законно по принципу fair use (добросовестного использования), как студенты или исследователи. Авторы считают, что ИИ получает коммерческую выгоду без согласия, и это недопустимо. Это воспринимается как масштабное воровство: художники, писатели, журналисты, музыканты создавали контент, а теперь ИИ зарабатывает на нем. Особенно раздражает, что ИИ может генерировать тексты/картинки, подменяя самих авторов, даже копируя их стиль. Это лишает их заработка. ИИ-системы используют сайты вроде StackOverflow, Reddit, Википедии, Quora и новостных изданий как бесплатный обучающий материал, а потом заменяют их, не давая трафика и денег.
Множество судебных процессов уже идут, особенно в США, Великобритании и ЕС. Художники против Stability AI и Midjourney (за использование их работ без разрешения). Журналисты, The New York Times, The Intercept и другие — против OpenAI и Microsoft (за копирование и генерацию контента по мотивам их статей).
Известные сайты, такие как The Guardian, CNN, NYT, Reddit, уже блокируют сканирование своими robots.txt или ставят API за деньги. Некоторые сайты предлагают свои материалы ИИ-компаниям только за деньги, как лицензированный набор. Reddit взял миллионы с Google и OpenAI за доступ к данным.
Но все это как-то выглядит громоздко или надо заключать контракты.
Сегодня создатели контента часто сталкиваются с непростым выбором: либо полностью открыть свои материалы для ИИ-программ, либо же вовсе их заблокировать. Это лишает их контроля над собственной работой и возможности получить за нее справедливое вознаграждение. Однако Cloudflare предлагает третье, более гибкое решение под названием «оплата за сканирование». Эта система позволяет владельцам веб-сайтов взимать плату с ИИ-сканеров за доступ к своему контенту, монетизируя его в масштабах Интернета.
Технически это реализуется с помощью малоиспользуемого, но весьма подходящего HTTP-кода ответа 402 «Требуется оплата». Владельцы сайтов получают полный контроль над своей стратегией монетизации: они могут настроить систему так, чтобы разрешить бесплатный доступ сканеру, потребовать оплату по установленной цене или полностью заблокировать его. Когда ИИ-сканер запрашивает платный контент, он получает код 402 с указанием цены, после чего может согласиться на оплату или же изначально предложить свою максимальную цену. Cloudflare при этом выступает посредником, обрабатывая все финансовые расчеты и перечисляя средства издателям.
Эта инициатива — важный шаг к тому, чтобы создатели могли полностью контролировать и ценить свои цифровые активы. В будущем Cloudflare видит потенциал для развития системы, где интеллектуальные программы смогут полностью автоматически договариваться о доступе к информации. Представьте, что вы можете установить цену за вход в свой цифровой архив, а не просто оставить его ворота либо распахнутыми, либо наглухо закрытыми.
Было бы неплохо, если можно было сконцентрироваться на контенте, а ИИ-системы сами бы обо всем договаривались и создатель контента автоматически просто получал бы деньги на счет, когда к его контенту ИИ тянет свои шаловливые ручонки :-)
Просмотр ссылок доступен только зарегистрированным пользователям