Колективний позов проти Adobe щодо авторських прав та навчання у сфері штучного інтелекту

  • Автори звинувачують Adobe у використанні книг, захищених авторським правом, для навчання своєї моделі SlimLM.
  • Колективний позов зосереджений на наборах даних SlimPajama-627B, RedPajama та Books3.
  • Ця справа може створити ключові прецеденти щодо авторського права та навчання у сфері штучного інтелекту в США та Європі.
  • Ця суперечка ставить під сумнів модель даних генеративного штучного інтелекту та обіцянку Adobe щодо «відповідального штучного інтелекту».

Колективний позов проти Adobe щодо авторських прав та навчання у сфері штучного інтелекту

Юридична битва навколо навчання моделей штучного інтелекту за допомогою творів, захищених авторським правом Нова глава була додана, коли Adobe опинилася в центрі бурі. Компанія, історично пов'язана з креативним сектором, тепер стикається з... колективний позов що ставить під сумнів те, як компанія отримала деякі дані, що використовуються для навчання одного зі своїх штучних інтелектів.

Основна увага у позові приділяється SlimLM, сімейство легких мовних моделей, розроблених для завдань допомоги з документами, особливо в мобільнийУ скарзі стверджується, що для навчання цієї системи використовувалися такі засоби: піратські книги та інші твори, захищені авторським правом без дозволу його авторів, що відкриває делікатний фронт не лише для Adobe, але й для всієї індустрії генеративного штучного інтелекту, також у Європі та Іспанії, де починають загострюватися дебати щодо законного використання даних для ШІ.

Контекст колективного позову та походження конфлікту

Правовий контекст колективного позову проти Adobe

El 17 грудня 2025Adobe було повідомлено про запропоновані колективні дії перед федеральним судом Північного округу Каліфорнії. Позов, поданий автором з Орегону Елізабет Ліонзвинувачує компанію у зловживанні піратські версії книг —включаючи кілька його власних робіт — для попереднього навчання його моделей штучного інтелекту.

У позові стверджується, що Adobe використовувала його тексти як частину оброблена підмножина даних, що слугували основою для SlimLM. Цей матеріал мав би стати частиною ланцюжка добре відомих наборів даних в екосистемі штучного інтелекту: Книги3, включений до Червона піжама, а потім інтегровані в набір даних SlimPajama-627B, який використовувався для попереднього навчання моделі Adobe. За словами позивачів, у цьому процесі нібито використовувалися тисячі творів, захищених авторським правом, без дозволу, зазначення авторства чи компенсації.

Ліон стверджує, що виконує роль виконавця обов'язків від імені інших авторів та правовласників які опинилися б у подібній ситуації, що робить справу потенційно далекосяжний колективний позовХоча конкретна цифра поки що не оприлюднена, позов вимагає значної фінансової компенсації, відшкодування юридичних та інших збитків, а також сплати судових витрат та чіткої декларації про навмисне порушення з боку Adobe.

Компанія, зі свого боку, стверджувала, що SlimLM було навчено за допомогою SlimPajama-627B., що описується як набір даних з відкритим кодом, опублікований компанією Cerebras у червні 2023 року та складається з даних, нібито отриманих з кілька відкритих та дедуплікованих корпусівСуть правового конфлікту полягає саме у визначенні того, чи є цей «відкритий» характер достатнім для легітимізації використання охоронюваних творів, які б опинилися в наборі даних без згоди їхніх авторів.

Наразі процес перебуває на початковій стадії. Adobe уникає публічного розголошення деталей, а такі ЗМІ, як Reuters, зазначили, що компанія не відповіла на деякі запити про коментарі. Однак Ліон наголосив, що це рішуче налаштований рішуче просувати справу і що воно має ресурси, щоб довести справу до кінця, що передбачає тривалу та широко розрекламовану судову тяжбу.

Як SlimLM вписується в стратегію Adobe щодо штучного інтелекту

Модель SlimLM від Adobe та навчання ШІ

Один з елементів, який робить цей випадок особливо вражаючим, полягає в тому, що розглянута модель не є світляк, найпомітніший для широкої публіки пакет креативних рішень Adobe, але SlimLMнабагато більш дискретна система, спрямована на виконання завдань допомога з документами та допоміжні функції на задньому плані. Тобто, мова йде не про штучний інтелект, який генерує вражаючі зображення для рекламних кампаній, а про моделі, що допомагають обробляти, узагальнювати або керувати текстом за лаштунками додатків.

Досі наратив Adobe щодо штучного інтелекту значною мірою спирався на Firefly. приклад «відповідального штучного інтелекту», навчений — за словами самої компанії — з ліцензований контент (наприклад, Adobe Stock), матеріали, що є суспільним надбанням, та інші ресурси, на які вона претендує на чіткі права. Крім того, компанія просувала компенсаційні програми для учасників Adobe Stock з метою зміцнення іміджу компанії як союзника фотографів, ілюстраторів та творців контенту.

Однак, позов не зосереджується на цьому дуже помітному фронті. У центрі уваги — SlimLM та… походження даних, що використовуються для попереднього навчаннясаме в області, менш помітній для кінцевого користувача. Ця різниця важлива, оскільки вона демонструє, що дебати щодо використання творів, захищених авторським правом, не обмежуються інструментами, які створюють вражаючі зображення чи креативні тексти, а й Це також впливає на тихіші моделі підтримки.інтегровані у продукти повсякденного вжитку.

Згідно з наданою документацією, SlimLM мав би пройти навчання з SlimPajama-627B, варіант більшого набору даних, Червона піжама, дуже популярний у спільноті штучного інтелекту. Це, у свою чергу, інтегрує Книги3колекція приблизно 191.000 книг що неодноразово цитували в судових процесах щодо авторських прав. У позові стверджується, що якщо SlimPajama безпосередньо походить від RedPajama, а RedPajama включає Books3, то Роботи Ліона та інших авторів були б скопійовані та оброблені під час попередньої підготовки без чіткої правової основи.

Для Adobe це питання виникає у делікатний час, під час розширення послуг, які компанія надає. Генеративний штучний інтелект та допоміжні інструменти інтегровано в її екосистему креативних та офісних продуктів. Імідж компанії як захисника творців, який вона ретельно культивувала, щоб відрізнити себе від інших технологічних гігантів, таким чином піддається особливо пильній увазі, зокрема серед креативних професіоналів в Іспанії та Європі, які щодня використовують такі інструменти, як Photoshop, Illustrator, Acrobat та Premiere.

Роль наборів даних Books3, RedPajama та SlimPajama

Щоб зрозуміти, чому цей попит виходить далеко за рамки окремого випадку, варто на мить зупинитися та розглянути, як навчаються сучасні моделі штучного інтелекту. Великі мовні моделі та багато генеративних штучних інтелектів навчаються на величезних обсягах тексту.Веб-сторінки, статті, книги, код, технічна документація тощо. Чим різноманітніший та ширший цей корпус, тим краще, як правило, працюють моделі, за умови, що обробка даних та проектування системи відповідають вимогам.

У цьому контексті, такі набори даних, як Книги3, величезна колекція книг, походження яких давно викликає підозри, та Червона піжама, проект, метою якого є відтворення наборів даних у стилі, що використовується великими лабораторіями для навчання своїх моделей. SlimPajama-627B Це був би дедуплікований та вдосконалений варіант того матеріалу, який Cerebras зробив доступним для спільноти як відкритий набір даних у 2023 році.

Згідно з позовом проти Adobe, SlimPajama нібито був створений «копіювання та маніпулювання» RedPajama, включаючи розділ Books3. Саме це включення, теоретично, приносить тисячі творів, захищених авторським правом протягом усього ланцюжка. У звинуваченні стверджується, що навіть якби Adobe не складала книги безпосередньо, той факт, що вона покладалася на набір даних, який їх містить, все одно є шахрайством. завантажувати, копіювати та обробляти багаторазово матеріал, захищений на етапі попередньої обробки та попереднього навчання.

Ця суперечка не нова: обидва Книги3 як RedPajama Їх вже згадували в інших судових позовах проти технологічних компаній, зокрема у справах, де такі компанії, як Apple та Salesforce, звинувачували у використанні цих даних для навчання своїх внутрішніх моделей. В основі всіх цих суперечок лежить одне й те саме питання: Чи можна вважати законним повторне використання «відкритих» наборів даних, що містять твори, захищені авторським правом? без попереднього отримання дозволу від усіх причетних авторів?

Таким чином, судове провадження проти Adobe доповнює цівка судових позовів що підштовхує галузь до перегляду своєї практики. На практиці кожен новий випадок створює тиск на створення механізмів для відстеження данихЧіткі системи відмови для творців та спеціальні моделі ліцензування для навчання ШІ, на що в Європі також може вплинути Регламент ЄС про штучний інтелект та чинні правила авторського права.

Юридичний фронт, який вже впливає на всю індустрію штучного інтелекту

Позов проти Adobe не виник у вакуумі. З 2023 року триває Хвиля позовів щодо авторських прав проти компаній, що розробляють генеративний штучний інтелектвключаючи такі назви, як OpenAI, Stability AI, Meta, Anthropic та Midjourney. Багато з цих справ обертаються навколо однієї й тієї ж ідеї: несанкціоноване використання творів, захищених авторським правом, для навчання моделей, здатних генерувати тексти, зображення чи музику, які часом можуть дуже нагадувати стиль оригінальних авторів.

Однією з останніх подій стала угода, досягнута компанією Anthropic, який погодився заплатити близько 1.500 млн. Кілька авторів засудили використання піратських версій своїх книг для навчання чат-бота Клода. Цю широко обговорювану угоду було інтерпретовано як можливу точка перегину у тому, як технологічні компанії розглядають такі типи позовів, і відкрили двері для очікувань суттєвої компенсації в майбутніх судових процесах.

Тим часом, такі американські ЗМІ, як TechCrunch, Reuters, The Verge та The New York Times, документували пов'язані випадки Ці проблеми впливають майже на всіх основних гравців у сфері штучного інтелекту. Схема має тенденцію повторюватися: величезні набори даних, які включають все: від вебсторінок до репозиторіїв коду і навіть цілих книг; відсутність чітких механізмів отримання згоди; та дедалі потужніші моделі, які використовують цей матеріал для надання складних відповідей, резюме, аналізів або створення креативного контенту.

Справа Adobe додає важливий нюанс: компанія побудувала частину своєї комерційної концепції навколо ідеї «відрізнятися» від інших захист творців. Ось чому підозра, що одна з його моделей могла бути заснована на піратських книгах, зачіпає творчий сектор, зокрема в таких країнах, як Іспанія, де письменники, перекладачі, журналісти та видавці Вони з певним занепокоєнням спостерігають, як їхні каталоги можуть опинитися, прямо чи опосередковано, у навчальних наборах даних.

За межами Сполучених Штатів за судовими рішеннями у цих справах уважно стежитимуть і в Європі. Судова практика США щодо добросовісного використання А копіювання для трансформаційного використання не зовсім відповідає європейській системі, яка більше захищає правовласників. Навіть попри це, рішення, що надходять, можуть вплинути на те, як європейські судді тлумачитимуть такі питання, як масове використання даних для навчальних цілей або необхідність спеціальної компенсації для авторів.

Потенційний вплив у Європі та для творців в Іспанії

Хоча позов проти Adobe було подано до суду США, його наслідки можуть відчуватися по обидва боки Атлантики. Великі технологічні компанії працюють з глобальні моделі а їхній спосіб управління даними рідко обмежується однією юрисдикцією. Якщо суди США зрештою вирішать, що використання певних наборів даних порушує авторські права, цілком ймовірно, що ті ж моделі або практики слід переглянути також у Європі.

У конкретному випадку Adobe, багато її інструментів на основі штучного інтелекту вже широко використовуються в Іспанські дизайн-студії, рекламні агентства, видавництва та ЗМІМожлива присутність іспанських літературних творів у наборах даних, таких як Books3, без дозволу викликає зростаюче занепокоєння у авторів та професійних груп. Якщо буде підтверджено, що книги, зареєстровані в Іспанії, використовувалися для навчання моделей, можуть виникнути нові проблеми. індивідуальні або колективні канали для скарг також у європейських юрисдикціях.

El Регламент Європейського Союзу щодо штучного інтелекту, яка запроваджує зобов'язання щодо прозорості для певних систем, а також правила Співтовариства щодо авторське правоЦі фактори будуть ключовими у визначенні того, які практики є прийнятними. Наприклад, вимога документувати використані набори даних або пропонувати правовласникам чіткі механізми відмови може бути посилена, якщо випадки, подібні до випадку з Adobe, стануть більш поширеними.

Для європейської креативної екосистеми цей тип судових процесів підсилює уявлення про необхідність обговорення нових форм відпусток та оплати праці пов’язане з навчанням у сфері штучного інтелекту. Йдеться не лише про запобігання несанкціонованому використанню, а й про дослідження способів, якими видавці, агентства з управління правами та технологічні платформи можуть узгодити умови доступу до каталогів літературні або візуальні твори в обмін на справедливу винагороду.

З точки зору інновацій, викликом буде узгодження розробки потужних моделей зі справжньою повагою до інтелектуальної власностіВ Іспанії, де видавнича галузь, аудіовізуальний та рекламний сектори мають значну вагу, за результатами позову проти Adobe будуть дуже уважно стежити як компанії, які вже використовують штучний інтелект, так і юридичні фірми, що спеціалізуються на цифровому праві та інтелектуальній власності.

Уроки для стартапів та технологічних компаній, що використовують штучний інтелект

Справа Adobe є прямим сигналом для екосистема технологічних стартапівЯк в Америці, так і в Європі походження даних має велике значення. Хоча багато молодих компаній не розробляють власні великі мовні моделі, вони часто покладаються на... відкриті набори даних, сторонні API та попередньо навчені моделі які можуть несвідомо нести ті самі правові проблеми, що зараз обговорюються в судах.

Перший урок полягає в необхідності ретельно перевіряти джерела данихПросте маркування набору даних як «відкритого» або розміщення його у публічному репозиторії не гарантує автоматичної безпеки його авторських прав. Перегляньте документацію, визначте будь-які компоненти, захищені авторським правом, і, якщо є сумніви, шукайте чистіші альтернативи або домовляйтеся про конкретні ліцензії Це може запобігти серйозним проблемам у майбутньому.

Друге має відношення до дотримання міжнародних нормативних вимогСтартапи, що працюють з Іспанії або Латинської Америки, але прагнуть охопити користувачів у Європі чи Сполучених Штатах, повинні пам’ятати, що вони можуть підпадати під кілька юрисдикцій одночасноЦе вимагає розробки чітких правил з самого початку щодо збору даних, їх зберігання, згоди та реагування на запити на видалення або претензії щодо авторських прав.

По-третє, це відкриває благодатний ґрунт для нові бізнес-моделі зосереджені на відповідальному управлінні даними. Інструменти відстеження наборів даних, служби перевірки дозволів, платформи, що сприяють ліцензуванню культурних каталогів, або рішення, що дозволяють правовласникам контролювати використання своїх творів у системах штучного інтелекту, можуть стати дуже цінні продукти в наступні роки.

Зрештою, варто пам'ятати, що репутація Він став таким же важливим активом, як і сама технологія. Для будь-якої компанії, яка розробляє або інтегрує штучний інтелект, потрапляння в конфлікт щодо неправомірного використання контенту, захищеного авторським правом, може... викликати недовіру серед клієнтів, партнерів та користувачівФормування культури поваги до інтелектуальної власності — це не лише юридичне питання, а й розумний спосіб виділитися на ринку, який дедалі більше перенасичений обіцянками «етичного ШІ» або «відповідального ШІ».

Можливі сценарії та що може статися далі

Як і багато інших судових позовів такого типу, справа проти Adobe відкриває низку можливостей. юридичні сценаріїСуд може вирішити повністю визнати колективний позов, обмежити його обсяг, відхилити його, якщо вважатиме, що підстав недостатньо, або, як це сталося в інших провадженнях, спір може бути вирішений шляхом позасудове врегулювання що включає фінансову компенсацію та зобов'язання щодо зміни практики з боку компанії.

Для Adobe, окрім економічних витрат, найбільший вплив може полягати в необхідності ретельно переглянути свої ланцюги постачання данихЦе включатиме аудит того, які набори даних використовувалися в кожній моделі, яка частина навчання спирається на власні дані, які ліцензії покривають ці види використання, та як прозоро повідомляти про все це клієнтам та регуляторним органам.

Технологічна галузь загалом перебуває на роздоріжжі. Зі зростанням кількості судових позовів щодо авторських прав та посиленням правил, особливо в Європейському Союзі, здається дедалі менш життєздатним базувати розробку штучного інтелекту на величезні обсяги інтернет-джерел та сумнівні колекції книг чи зображеньНатомість, ідея моделей, навчених за допомогою куровані дані з чіткими дозволами та, в багатьох випадках, з угодами про компенсацію.

У цьому мінливому середовищі справа Adobe слугує дзеркалом як для великих технологічних компаній, так і для малого бізнесу, які прагнуть використовувати штучний інтелект без юридичних пасток. Рішення суду з цього питання буде вирішальним. колективний позов щодо авторських прав та навчання у сфері штучного інтелекту Це вплине не лише на конкретну модель, таку як SlimLM, але й може переосмислити те, як доступ до креативних даних усвідомлюється в епоху штучного інтелекту.

Як видати книгу
Пов'язана стаття:
Як видати книгу