Apple stoi przed proponowanym pozwem zbiorowym w Sądzie Okręgowym Stanów Zjednoczonych dla Północnego Okręgu Kalifornii, złożonym przez autorów Grady'ego Hendrixa i Jennifer Roberson. W pozwie zarzuca się firmie nielegalne wykorzystywanie książek chronionych prawem autorskim do szkolenia modeli sztucznej inteligencji, w tym tych wykorzystywanych w Apple Intelligence.
W centrum sprawy znajduje się zbiór danych o nazwie Books3, o którym powszechnie wiadomo, że zawiera pirackie dzieła z „bibliotek cieni”, takich jak Bibliotik. Autorzy twierdzą, że Apple polegało na Books3 poprzez połączenie z RedPajama, zbiorem danych używanym do uczenia OpenELM, wielkojęzykowego modelu firmy o otwartym kodzie źródłowym. Ponieważ OpenELM został publicznie udokumentowany przez Apple w 2024 r., powodowie twierdzą, że ten sam piracki materiał mógł zostać również wykorzystany do szkolenia podstawowych modeli językowych Apple.
W pozwie podkreślono, że Apple nie ubiegał się o pozwolenie, nie udzielał kredytów ani nie płacił rekompensaty za prace autorów, mimo że wykorzystywał je do szkolenia systemów stanowiących podstawę potencjalnie dochodowego przedsięwzięcia. Powodowie twierdzą, że praktyka ta rozwodniła rynek ich książek i pozbawiła ich kontroli nad ich własnością intelektualną. Domagają się odszkodowania, zadośćuczynienia, honorariów adwokackich, a nawet zniszczenia modeli sztucznej inteligencji Apple zawierających pirackie dane szkoleniowe.
Sprawa ta jest następstwem fali procesów sądowych skierowanych przeciwko firmom rozwijającym generatywną sztuczną inteligencję. Firma Anthropic zgodziła się niedawno zapłacić 1,5 miliarda dolarów w ramach rekordowej ugody z autorami w związku z podobnymi roszczeniami. Tymczasem Meta skutecznie obroniła się przed oskarżeniami o naruszenie praw autorskich, a sąd uznał, że jej praktyki szkoleniowe wchodzą w zakres dozwolonego użytku. Microsoft i OpenAI również stanęły przed procesami sądowymi dotyczącymi niewłaściwego wykorzystania książek chronionych prawem autorskim.
Dla Apple moment jest znaczący. Firma publicznie podkreśliła swoje wysiłki na rzecz odpowiedzialnego szkolenia systemów sztucznej inteligencji, w tym oferowanie wydawcom umów licencyjnych i podpisywanie umów z dostawcami treści, takimi jak Shutterstock. Firma Apple zobowiązała się również do przestrzegania ograniczeń witryn, takich jak plik robots.txt, podczas pobierania danych. Pomimo tych środków w pozwie wskazano, że firma w dalszym ciągu czerpała korzyści ze zbiorów danych powiązanych z pirackimi materiałami.
Sprawa sprawdzi, w jaki sposób sądy równoważą prawa własności intelektualnej z potrzebami rozwoju sztucznej inteligencji. W miarę rozwoju batalii prawnej jej wynik może zmienić przyszłość Apple Intelligence i ustanowić precedens w podejściu firm technologicznych do pozyskiwania danych w celu szkolenia swoich modeli.
Więcej czytania:Meta oskarżona o wykorzystanie 81,7 TB pirackich książek do szkolenia modeli sztucznej inteligencji
(przezReutera)
