Нарушают ли ИИ-генераторы интеллектуальные права?

20.01.2023

В современности происходит масштабная революция в области искусственного интеллекта (ИИ). Такие инструменты, как ChatGPT, Midjourney, Stable Diffusion, Dall-E и Copilot, позволяют пользователям генерировать текст, изображения, компьютерный код и другой контент исключительно на основе подсказок на естественном «человеческом» языке. Креативность, детализация и человекоподобное качество результатов ИИ поражают, вызывая всеобщее волнение, страх и гнев, поскольку мыслящие машины заставляют нас подвергать сомнению давние предположения о предполагаемой уникальности человеческой изобретательности и размышлять о том, приносит ли ИИ нас ближе к фантастике, человеческому устареванию или чему-то среднему. Эти экзистенциальные вопросы не находят пока своего ответа и вызывают спорные дискуссии по всему миру. Однако вопрос, нарушает ли ИИ права на интеллектуальную собственность (ИС), похоже, в 2023 году найдет свое разрешение. Юридические последствия действий ИИ разнообразны, они постоянно развиваются и сложны по своей природе, но пересекают ли действия ИИ права на ИИ, в частности в результате ввода человеком в ИИ контента для его обучения. Фундаментальный вопрос заключается в следующем: имеют ли право создатели контента разрешать или запрещать системам ИИ собирать и использовать их контент в качестве обучающих данных? Этот вопрос затрагивает не только сложные вопросы права, но и важные вопросы государственной политики. Какие правила в отношении ИИ будут оптимально «способствовать прогрессу науки и полезных искусств»?

Эти вопросы находятся в центре двух коллективных исков, возбужденных против поставщиков ИИ-генераторов, допустивших использование контента без разрешения. Оба дела были поданы в Окружной суд Соединенных Штатов Северного округа Калифорнии одними и теми же юристами. В третьем иске, поданном Getty Images в Соединенном Королевстве, разбирается примерно аналогичная ситуация. Устанавливая юридические параметры машинного обучения ИИ, эти споры могут сильно повлиять на ускорение, внедрение и качество систем ИИ. Ниже приводится краткое изложение трех судебных процессов, за которым следует обсуждение некоторых ключевых юридических вопросов, а именно, авторского права, легальность веб-скрапинга и приоритета авторского права, которые, вероятно, будут предметом ожесточенных судебных баталий в этих делах.

Иск 1. «Доу против GitHub», 22 Civ. 6823 (Северная Каролина, 10 ноября 2022 г.). В первом случае разработчики подали в суд на GitHub (популярный репозиторий с открытым исходным кодом), OpenAI (владелец GPT-3, языковой модели, лежащей в основе ChatGPT) и Microsoft (владелец GitHub и ведущий инвестор OpenAI). Предмет иска сформирован вокруг действий Copilot, инструмент искусственного интеллекта на основе подписки, разработанный совместно GitHub и OpenAI с использованием GPT-3, который «обещает помочь программистам, предоставляя или заполняя блоки кода с использованием искусственного интеллекта». Разработчики утверждают, что ответчики использовали защищенный авторским правом исходный код, который разработчики разместили на GitHub под различными лицензиями с открытым исходным кодом, в качестве обучающих данных для Copilot. В деле приводятся различные основания для иска, в том числе нарушения раздела «Информация об управлении авторскими правами» Закона об авторском праве в цифровую эпоху (для удаления CMI из исходного кода), 17 USC § 1202; и нарушение контракта (за неуказание имени автора, уведомлений об авторских правах и копии лицензии на исходный код с открытым исходным кодом). При этом в иске не говорится о прямом нарушении авторских прав. Возражение разработчиков должно быть представлено 9 марта 2023 г., а ответ – 6 апреля 2023 г.

Иск 2. «Сара Андерсон и др. против Stability AI Ltd» (Северная Каролина, 13 января 2023 г.). Второй случай, инициированный тремя визуальными художниками. Группа художников борется с генераторами ИИ Stability AI Ltd., Midjourney Inc. и DeviantArt Inc. в первом в своем роде коллективном иске о нарушении авторских прав, связанном с использованием изображений, защищенных авторским правом, для обучения инструментов ИИ. Как и в случае с GitHub, истцы утверждают, что ответчики – компании, занимающиеся искусственным интеллектом, для обучения своих систем ИИ использовали работы художников без разрешения, которые затем используют работы ИИ для создания новых и предположительно нарушающих авторские права производных работ. В отличие от GitHub в жалобе на создателей ИИ выдвигаются требования о нарушении авторских прав – рассматривается, как их прямой, так и косвенный умысел. Интересно, что истцы подчеркивают способность определенных инструментов ИИ создавать произведения «в стиле» конкретного художника.

Иск 3. «Getty Images против Stability AI» (Соединенное Королевство, январь 2023). 17 января 2023 года лицензиар стоковых изображений Getty Images объявил, что подает иск против Stability AI в Соединенном Королевстве. Getty Images отметила, что предоставляет лицензию для технологических компаний, позволяющую осуществлять тренировку ИИ, при этом уважая права. Stability AI не приобрела подобную лицензию и, по мнению компании, проигнорировала лицензионные опции ради своих целей. По утверждению истцов «Stability AI незаконно скопировал и обработал миллионы изображений, защищенных авторским правом, и связанные с ними метаданные, принадлежащие или представленные Getty Images, без лицензии в интересах коммерческих интересов Stability AI и в ущерб создателям контента». Getty также заявила, что она предлагает лицензии, «связанные с обучением систем искусственного интеллекта таким образом, чтобы уважать права личности конкретных авторов-физических лиц и их интеллектуальной собственности», но вместо того, чтобы получить лицензию, Stability AI преследовала свои собственные «самостоятельные коммерческие интересы».

Во всех трех случаях, центральное значение будет иметь авторское право, даже если оно не рассматривается напрямую в случае с GitHub. В Соединенных Штатах авторское право сохраняется в отношении оригинальных авторских работ, зафиксированных в материальных средствах выражения. Это касается всего контента, о котором идет речь в трех судебных процессах, включая визуальный дизайн, фотографии и исходный код.

Доктрина добросовестного использования. Если оставить в стороне договорные или другие права, которые могут защищать эти работы, степень, в которой генераторы ИИ могут использовать без разрешения работы, защищенные авторским правом, скорее всего, сведется к вопросу о добросовестном использовании, которые уже рассматривались в следующих трех исках.

Иск 1) «Гильдия авторов против HathiTrust» (2-й округ 2014 г.) и «Гильдия авторов против Google» (2-й округ 2015 г.). В двух случаях организация по защите авторских прав и группа отдельных авторов подали в суд на Google и несколько исследовательских библиотек за нарушение авторских прав после того, как они отсканировали и проиндексировали миллионы книг, защищенных авторским правом, с целью сделать книги доступными для поиска в Интернете. Второй округ нашел справедливое применение в обоих случаях. Не имело значения, что миллионы произведений, защищенных авторским правом, использовались без разрешения их авторов или что Google стремился монетизировать эти произведения. В деле HathiTrust суд постановил, что «создание базы данных с возможностью полнотекстового поиска является типичным преобразующим использованием», поскольку оно «не заменяет объекты или цели первоначального создания», а скорее добавляет «что-то новое с другой целью и другой персонаж». В деле против Google, суд постановил, что «Google делает цифровую копию для обеспечения функции поиска . . . увеличивает общественное знание, делая доступной информацию о книгах истцов, не предоставляя публике существенную замену материалам, охраняемым интересами авторского права истцов в оригинальных произведениях или их производных». Суд HathiTrust отклонил довод авторов о том, что несанкционированное использование библиотеками их книг лишило авторов возможности лицензирования, постановив, что «функция полнотекстового поиска не заменяет книги, поиск по которым осуществляется». было «неважно, что библиотеки могут захотеть приобрести лицензии, чтобы участвовать в их преобразовательном использовании (если использование будет сочтено недобросовестным)».

Иск 2) «Oracle против Google» (США, 2021 г.). В этом случае Oracle, которой принадлежат авторские права на язык программирования Java, подала в суд на Google за нарушение авторских прав на основании несанкционированного использования Google примерно 11 500 строк кода из Java SE, которые были частью интерфейса прикладного программирования (API), для создания мобильной операционной системы Android от Google. В иске рассматривалось, подлежит ли код API защите авторских прав, и если да, то является ли его использование Google добросовестным. Верховный суд постановил, что, даже если предположить, что код API защищен авторским правом (суд на этот вопрос не ответил), использование Google кода API было добросовестным. Суд внимательно изучил характер кода API и обнаружил, что его цель – предоставление программистам доступа к другому коду, благоприятствовала добросовестному использованию.

Иск 3) «Энди Уорхол против Голдсмита» (2-й округ 2020 г.). В этом случае Верховный суд рассматривает применение и дальнейшую жизнеспособность критерия «преобразующего использования», который Верховный суд установил почти тридцать лет назад в деле Кэмпбелл против Акафф-Роуз. В 1981 году фотограф Линн Голдсмит сфотографировала Принца. Энди Уорхол создал серию шелкографии и иллюстраций на основе фотографии. Работы Уорхола внесли в фотографию некоторые визуальные изменения, но они остались «узнаваемо производными» от оригинала. Голдсмит подал в суд на Фонд Энди Уорхола за нарушение авторских прав. Отменив окружной суд, Второй округ постановил, что сериал Уорхола не был достаточно преобразующим, чтобы считаться добросовестным использованием. Фонд подал апелляцию, и Верховный суд согласился рассмотреть дело. Художественный взгляд на ранее существовавшую работу, так и более широкий доктринальный вопрос – разграничение или замена теста преобразующего использования, могут иметь серьезные последствия для дел, рассматривающих принципы работы систем ИИ.

У ИИ ненасытный аппетит к информации. Но где и как системы ИИ получают ценный вклад? Нужно ли системам ИИ разрешение от владельцев контента для сбора и использования их контента в качестве обучающих данных? Им нужно разрешение? К счастью, существует множество полезных прецедентов, рассматривающих легальность парсинга веб-страниц – действий по сбору контента с веб-сайтов для использования в сторонних приложениях. К сожалению, закон, регулирующий веб-скрапинг, содержит множество нюансов, в которых задействованы многочисленные дублирующие друг друга правовые доктрины. Жалобы на веб-скраперы часто включают претензии в соответствии с Законом о компьютерном мошенничестве и злоупотреблениях («CFAA») (за получение несанкционированного доступа к компьютерной системе), нарушение контракта (за нарушение условий обслуживания), посягательство на движимое имущество (за проникновение в виртуальную собственность без разрешения), нарушение авторских прав (для воспроизведения защищенного контента) и недобросовестная торговая практика. Исходы в делах о парсинге веб-страниц неоднозначны. В целом веб-скрапинг был критически важным компонентом и неизбежной реальностью веб-разработки с момента появления Интернета. Большинство платформ допускают, а иногда даже принимают парсинг веб-страниц, и обычно предпринимают юридические действия только тогда, когда парсеры совершают оскорбительные действия, обходя технические средства контроля, облагая налогом серверы платформы или используя собственные данные платформы для прямой конкуренции с ней. Общие правила, которые возникли в отношении парсинга веб-страниц, служат полезным руководством для оценки границ использования контента ИИ, и дела, которые установили эти правила, несомненно, сыграют важную роль в недавно поданных исках, связанных с ИИ. Но более интересный и неприятный вопрос касается политики: выиграем ли мы как общество, ограничив или максимизировав общедоступные источники данных, доступные системам ИИ? Должна ли общедоступная информация быть открыта для использования ИИ, потому что это сделает инструменты намного лучше, или люди должны иметь возможность контролировать, используются ли их данные, несмотря на потенциальную услугу общественным интересам?

В недавнем постановлении об отклонении претензий CFAA, которые LinkedIn выдвинула против конкурента, занимающегося парсингом веб-страниц, Девятый округ признал этот важный политический вопрос: «Мы согласны с окружным судом в том, что предоставление таким компаниям, как LinkedIn полной свободы действий для принятия решения о том, кто может собирать и использовать данные на любом основании порождает риск создания информационных монополий, которые не служили бы общественным интересам». Так в деле HiQ Labs, Inc. против LinkedIn Corp. (9-й округ 2019 г.) примечательно признание судом общественной заинтересованности в «максимизации свободного потока информации в Интернете». В деле, касающемся веб-скрапинга, как процесса, а не защиты авторского права, Девятый округ повторил конституционную директиву о «содействии прогрессу науки и полезных искусств», в соответствии с аргументацией решений о добросовестном использовании, рассмотренных выше, и предоставил руководящий принцип для судов, рассматривающих споры. с участием машинного обучения.

Нормы авторского права. Для разрешения вопросов, возникающих в связи с несанкционированным машинным обучением ИИ, приоритет авторских прав будет иметь доминирующее значение, хотя, как видно из рассмотренных выше примеров о легальности веб-скрапинга, авторское право – не единственный доступный инструмент для защиты контента. Онлайн-контент часто публикуется на веб-сайтах, регулируемых пользовательскими соглашениями, и эти условия обычно направлены на ограничение коммерческого использования и извлечения их контента из Интернета. Когда кто-то собирает и использует контент в нарушение этих условий, это является нарушением договора, даже если такое использование не будет представлять собой нарушение авторских прав (например, поскольку использование является лицензированным или добросовестным). Являются ли претензии о нарушении контракта, основанные на использовании контента с нарушением условий предоставления услуг, более приоритетными в соответствии с Законом об авторском праве? Иногда да, иногда нет. Суды действительно бились над этим вопросом. Во многих случаях, в том числе во втором судебном округе, результат зависит от того, содержит ли иск о нарушении какие-либо «дополнительные элементы, которые качественно отличают его от иска о нарушении авторских прав». Briarpatch Ltd., LP против Phoenix Pictures, Inc., 373 F.3d 296 (2-й округ, 2004 г.). Например, было установлено, что договорное обещание заплатить представляет собой «дополнительный элемент», исключающий преимущественную силу авторских прав. Второй округ не нашел такого «дополнительного элемента» в деле «Genius против Google» (2-й округ 2022 г.). В этом случае веб-сайт с текстами песен Genius.com подал в суд на Google за очистку и отображение его текстов в результатах поиска, предположительно в нарушение условий обслуживания Genius, который не подавал (и не мог) подавать в суд за нарушение авторских прав, потому что Genius не владеет авторскими правами на тексты песен. Однако условия обслуживания Genius запрещают пользователям коммерческое воспроизведение или распространение любой части контента, размещенного в Genius, в результате компания подала в суд на Google за нарушение этих условий, но Второй округ постановил, что иск упрежден и «качественно не отличался от иска об авторских правах». Компания Genius обратилась в Верховный суд с ходатайством о пересмотре этого решения. В ответ Google заявил, что Genius ненадлежащим образом пытается использовать свои условия обслуживания для «изобретения новых прав», которые эквивалентны авторскому праву и уступают ему место. 12 декабря 2022 года Верховный суд предложил Генеральному солиситору США подать краткое изложение своих взглядов на дело, сигнализируя о возможном предоставлении определения. В зависимости от исхода предполагаемой защиты от добросовестного использования, Genius и другие дела о преимущественном праве на авторские права могут сыграть ключевую роль в определении обоснованности требований закона, возникающих в связи со сбором и использованием общедоступных данных для ИИ.

Все нововведения происходят чрезвычайно быстро. Несколько лет назад работы, созданные с помощью ИИ, были строго прерогативой передовых художников, ученых и специалистов по авторскому праву. Внезапно за последние несколько месяцев инструменты ИИ стали широко распространены – не только для экспериментов и шумихи в СМИ, но и для коммерческого использования, образования и т.д. Закон всегда старается не отставать от технологий. Фундаментальный вопрос заключается в следующем: имеют ли право создатели контента разрешать или запрещать системам ИИ собирать и использовать их контент в качестве обучающих данных?

IT-новости в области права