В сентябре 2025 года издательство Encyclopedia Britannica и его дочерняя компания Merriam-Webster подали в федеральный суд Нью-Йорка иск к Perplexity AI. По их словам, сервис вопросов и ответов не просто ищет информацию, а воспроизводит словарные статьи и определения практически дословно.
В материалах дела приведены примеры, где ответы совпадают с формулировками Merriam-Webster без изменений. Для Britannica, как и многих других издателей, это принципиальный вопрос выживания: пользователи получают готовый ответ у ИИ и уже не заходят на сайт, где размещена реклама и платный контент.
Иск стал еще одним делом в глобальной линии противостояния, где на одной стороне стоят издатели и медиакомпании, опирающиеся на авторское право и долгую традицию защиты интеллектуальной собственности, а на другой технологические компании, воспринимающие тексты, фото и видео как бесплатные данные для своих алгоритмов. Напряжение становится все более острым, и каждое новое дело только поднимает ставки.
Чтобы обучать языковые и генеративные модели, разработчики собирают колоссальные объемы данных: от художественных книг до научных статей, от архивных фото до телепередач. Значительная часть этих материалов охраняется авторским правом. И именно здесь возникает главный вопрос, могут ли алгоритмы использовать этот контент без разрешения и компенсации?
Технологические компании в США опираются на доктрину fair use, которая допускает ограниченное заимствование при условии, что оно трансформативно и не вредит рынку оригинала. Но для издателей эта логика звучит как оправдание бесплатного использования их труда. Более того, риски становятся очевидными, когда модели начинают не просто учиться на материалах, но и воспроизводить их почти дословно. Характерным примером стало разбирательство Getty Images против Stability AI в Лондоне. Издательство утверждает, что модель Stable Diffusion обучалась на базе изображений Getty без лицензии. В качестве доказательств в суде представлены картинки с частично сохранившимися водяными знаками фотобанка. Для Getty это прямое свидетельство, что контент не только служил источником обучения, но и «просачивается» в готовый продукт, разрушая ценность оригинала.
Современная система авторского права сформировалась в XIX–XX веках, когда появились международные конвенции и единые правила защиты книг, музыки, фильмов и фотографий. Но начало было раньше. Уже в XVIII веке в Британии приняли Statute of Anne, который можно назвать первым законом, который прямо закрепил права авторов. Никто тогда не мог представить, что в будущем алгоритмы смогут за месяцы обработать миллионы произведений и на их основе выдавать новые тексты и изображения. Сегодня юристы вынуждены применять эти старые правила к технологиям, о которых законодатели прошлого даже не догадывались, и это неизбежно ведет к противоречивым решениям.
Характерен пример процесса Thomson Reuters против Ross Intelligence. Юридический стартап использовал аннотации из базы Westlaw, чтобы обучить свою систему. Эти аннотации создаются редакторами и охраняются авторским правом. Ross утверждал, что это подпадает под fair use. В феврале 2025 года суд решил иначе, и копирование признали нарушением, а доводы о трансформативности отклонили.
Эта история перекликается с более старыми кейсами. Вспомним громкое дело Google Books середины 2000-х. Тогда Google оцифровал миллионы книг и сделал их доступными в поиске. Издатели подали иски, но спустя годы суд признал проект законным, потому что пользователи видели лишь фрагменты, а не полный текст. Разница в том, что нейросети не ограничиваются отрывками и способны выдать готовый текст, близкий к оригиналу. В этом и кроется разрыв между старыми доктринами и новой реальностью.
В США ключевой ориентир по-прежнему fair use, но практика выходит неоднозначная. Летом 2025 года суд по делу Bartz против Anthropic признал допустимым обучение модели на книгах, если они получены легально и не подрывают рынок оригинала. Однако там же подчеркнули, что использование пиратских копий является прямым нарушением. В других делах против Meta (признана экстремистской и запрещена в России) спор вновь сводится к происхождению данных. Получается, что суды вынуждены ставить «сито» на источники, но универсальной формулы пока нет.
В Европе действует исключение для text and data mining: данные можно использовать для анализа и обучения, если автор заранее не запретил. С августа 2025 года в ЕС вступил в силу AI Act, требующий от разработчиков раскрывать источники обучения. Это шаг к прозрачности, но не к снятию конфликтов. В марте 2025 года французские ассоциации авторов и издателей подали иск против Meta (признана экстремистской и запрещена в России), заявив, что их книги массово использовались без уведомлений.
В Китае акцент смещается на роль человека. Пекинский интернет-суд в 2023 году признал изображение, созданное с помощью нейросети, объектом авторского права, потому что автор подбирал подсказки и отбирал результат. Однако в других городах решения были противоположными. В 2020 году, например, суд Шэньчжэня (Shenzhen, Китай) вынес беспрецедентное решение наказать нарушителя за незаконное использование интеллектуальной собственности, созданной искусственным интеллектом (ИИ). Пока практика строится на прецедентах, а не на единых правилах.
В России и СНГ прямых норм пока нет, хотя количество судебных дел по интеллектуальной собственности растет и появляются первые кейсы по ИИ. В Москве в 2024 году рассматривали дело о deepfake-видео и пришли к выводу, что охрана сохраняется, если был творческий вклад человека. Это создает основу для признания так называемых гибридных произведений, где алгоритмы сочетаются с авторским трудом. Параллельно действуют правовые «песочницы» для тестирования ИИ, но они не решают основной проблемы, можно ли брать чужие тексты и изображения для обучения без разрешения.
Судебные тяжбы лишь вершина айсберга. Под поверхностью лежит более серьезный процесс, который связан срадикальным удешевлением производства контента.
Сгенерировать статью или картинку теперь почти ничего не стоит. Любой может создать десятки «экспертных» материалов за несколько минут. В результате рынок захлестывает синтетика, а внимание аудитории ограничено. Возникает эффект, который исследователи еще в начале 2000-х назвали экономикой спама. Тогда речь шла о массовых рассылках электронной почты: отправить миллион писем ничего не стоило, а издержки ложились на получателей. Сегодня то же самое происходит с текстами и видео, только в несравнимо большем масштабе.
Последствия уже видны. В научной сфере издательства отзывали сотни статей, написанных так называемыми paper mills. На YouTube появилась обязательная маркировка синтетических роликов. По данным NewsGuard, к 2025 году в сети работает более тысячи сайтов, где новости полностью пишутся алгоритмами. Рынок контента перенасыщен, а доверие становится главным дефицитом. Пользователи ищут источники, которые способны доказать свою надежность, востребованы проверенные редакции, бренды с историей, авторы, чьи материалы не спутаешь с машинной подделкой.
Для издателей это двойной удар. Они теряют юридическую защиту, когда их материалы используют без разрешения, и экономическую ценность, когда публикации легко воспроизводимы и дешевеют. Схожая ситуация уже происходила с музыкой в эпоху Napster, когда рынок тоже погрузился в кризис, пока индустрия не нашла баланс через лицензии и стриминг.
Пока суды остаются главным инструментом, но это путь без стратегического будущего. Постоянные иски создают хаос и показывают, насколько сильно законы отстают от технологий.
Более устойчивым сценарием может стать лицензирование. Музыкальная индустрия уже проходила через подобный кризис: пиратские mp3 почти разрушили рынок, но договоры со стримингами и сервисами вроде Spotify вернули музыке экономическую ценность. Сегодня похожая модель начинает формироваться для текстов, фото и видео. Первые сделки между издателями и ИИ-компаниями заключены, и именно они могут стать основой для баланса.
Параллельно государства выстраивают новые рамки. В Европе это AI Act, в Китае акцент на роли человека, в России экспериментальные режимы. Эти шаги пока неполные, но они показывают направление движения.
В конечном счете искусственный интеллект не может существовать без человеческого контента, а авторы теряют смысл своей работы, если она превращается в бесплатное сырье. Баланс возможен только там, где технологии помогают быстрее распространять знания, а создатели получают справедливую компенсацию. И если этот сценарий возобладает, рынок сможет превратиться из поля конфликта в систему сотрудничества, где выигрывают не самые агрессивные, а те, кто умеет сочетать технологии и уважение к интеллектуальному труду.
Обсудить