Openai debiutuje GPT-OSS, lekka rodzina modelowa do użytku typu open source

Openai wprowadził GPT-Oss, nową rodzinę małych modeli języków otwartych, zaprojektowanych dla społeczności typu open source. Modele te są zoptymalizowane pod kątem wydajności, szybkości i szerokiej kompatybilności z szeregiem sprzętu, co czyni je idealnymi dla programistów i badaczy, którzy chcą konfigurowalnych narzędzi AI bez polegania na infrastrukturze na dużą skalę.

GPT-OSS jest wydawany w trzech rozmiarach modelu: 120 milionów, 410 milionów i 1,1 miliarda parametrów. Każda wersja jest dostosowana do instrukcji i obsługuje wiele języków. Modele te są mniejsze niż GPT-3.5 i GPT-4, ale zostały zaprojektowane tak, aby zapewnić szybką wydajność na urządzeniach krawędziowych i działają dobrze w środowiskach offline lub ograniczonych. Pomimo ich niewielkich rozmiarów modele wykazują silne wyniki na różnych testach porównawczych, w tym MMLU i GSM8K.

Celem GPT-OSS jest oferowanie lekkiej, elastycznej alternatywy dla większych modeli, szczególnie w przypadkach użycia, w których priorytetyzowane są niskie opóźnienia, interpretację lub efektywność energetyczną. Modele mają również służyć jako silne podstawy bazowe do badań akademickich lub eksperymentów dostrajania. Openai stwierdza, że porównali GPT-OSS przeciwko porównywalnym modele otwartym i stwierdzili, że są konkurencyjne w ogólnych zadaniach językowych.

W przeciwieństwie do Chatgpt lub GPT-4, modele GPT-OSS nie są połączone z szerszym ekosystemem Openai. Nie ma natywnej integracji API, pamięci ani obsługi przeglądania. Zamiast tego są wydawane z licencją otwartą i dostępne na GitHub i przytulanie twarzy, zapewniając programistom pełną kontrolę nad wdrażaniem, dostosowywaniem i lokalnym użytkowaniem. Wagi są wyposażone w karty modelowe i wskaźniki oceny dla przezroczystości.

Wydanie GPT-Oss Openai pojawia się w czasie, gdy lekkie modele zyskują popularność aplikacji na urządzeniach i prywatnych wdrożeń. Wraz ze wzrostem zainteresowania modelami otwartymi i potrzebą powtarzalnych badań, GPT-OSS dodaje nowy punkt wejścia dla osób poszukujących LLM na mniejszą skalę z wiarygodnością infrastruktury szkoleniowej Openai. Firma podkreśliła, że modele te nie zostały przeszkolone przy użyciu danych użytkowników prywatnych i że oceny bezpieczeństwa zostały udokumentowane w kartach modelowych.

Przeczytaj także:Model AI z otwartą AI w Chinach „Goku” rzuca wyzwanie dominacji USA

Podczas gdy GPT-OSS nie będzie rywalizować z GPT-4 w rozumowaniu lub jakości czatu, jego dostępność, stosunek wydajności do wielkości i łatwość eksperymentów sprawiają, że jest to cenny wkład w ekosystem modeli otwartych. Deweloperzy mogą teraz budować z GPT-OSS lokalnie, dopracowywać go do określonych domen lub używać go jako testu testowego do badań architektury.