22.11.2024
Этой осенью OpenAI согласилась предоставить две виртуальные машины, чтобы адвокаты The Times и Daily News могли выполнять поиск своего защищённого авторским правом контента в обучающих наборах ИИ. Теперь The New York Times и Daily News, которые подали в суд на OpenAI за то, что она якобы копировала их работы для обучения своих моделей ИИ без разрешения, утверждают, что инженеры OpenAI случайно удалили данные, потенциально имеющие отношение к делу. Адвокаты издателей заявили, что с 1 ноября они и нанятые ими эксперты потратили более 150 часов на поиск обучающих данных OpenAI. Однако 14 ноября инженеры компании удалили все поисковые данные, хранящиеся на одной из виртуальных машин. OpenAI попыталась восстановить данные, что прошло, в основном – успешно. Однако, поскольку структура папок и имена файлов были «безвозвратно» утеряны, восстановленные данные «не могут использоваться для определения того, где скопированные статьи истцов из новостных агентств использовались для построения моделей». «Истцы были вынуждены воссоздавать свою работу с нуля. Только вчера они узнали, что восстановленные данные непригодны для использования и что целая неделя работы их экспертов и юристов ушла впустую», – написал адвокат The Times и Daily News. Он отмечает, что не считает удаление преднамеренным. По мнению защиты, у OpenAI больше возможностей отыскать в своих собственных наборах данных потенциально нарушающий авторские права контент, если компания будет использовать собственные инструменты. Ранее OpenAI утверждала, что обучение моделей с использованием общедоступных данных, включая статьи из The Times и Daily News, является добросовестным. Компания считает, что ей не требуется лицензировать или иным образом платить за такой контент. При этом OpenAI уже заключила лицензионные соглашения с Associated Press, Axel Springer, Financial Times, People Dotdash Meredith и News Corp. Компания отказалась обнародовать условия этих соглашений, но, как сообщается, Dotdash получает по договору не менее $16 млн в год. Также источники рассказывали, что OpenAI ведёт переговоры с CNN, Fox и Time об использовании материалов изданий для обучения чат-бота ChatGPT и предлагает издательствам от $1 млн до $5 млн в год за использование новостного контента. В декабре 2023 года New York Times подала в суд на OpenAI и Microsoft, обвинив их в нарушении авторских прав. В феврале 2024 года отдельный иск к компаниям с аналогичными обвинениями предъявили Intercept, Raw Story и AlterNet.