Anthropic уничтожила миллионы книг для обучения ИИ
Компания Anthropic, разработчик чат-бота Claude, закупила и уничтожила миллионы печатных книг для их последующей оцифровки и использования при обучении искусственного интеллекта. Книги приобретались оптом — в том числе у поставщиков возвратов Amazon и библиотек, распродающих фонды. После покупки переплеты распарывались, страницы сканировались, а сами экземпляры утилизировались. Руководитель отдела партнерств Том Турви, ранее работавший в Google Books, в письмах коллегам писал, что цель — "получить все книги, которые только возможно".
Федеральный суд в Калифорнии признал эту практику законной. Суд постановил, что уничтожение и оцифровка купленных книг подпадают под принцип "добросовестного использования" (fair use), поскольку речь идет о трансформирующем применении без ущерба для рынка оригинальных произведений. Такое решение суд сравнил с прецедентом Google Books.
Однако отдельное обвинение касается использования пиратского контента. Согласно материалам дела, Anthropic загрузила с сайтов вроде Z-Library около 7 миллионов нелегальных книг. Эти данные входили в так называемый корпус Books3, который также использовался другими компаниями, но позднее был удален из обучающих выборок. Тем не менее Anthropic придется ответить за это в суде в декабре 2025 года.
Истцами выступают несколько авторов, утверждающих, что их произведения были использованы без разрешения. Они добиваются компенсации и обвиняют компанию в массовом нарушении авторских прав. В свою очередь, представители Anthropic заявили, что компания отказалась от использования пиратских источников и придерживается норм авторского права.