Subantha Mukherjee i Anna Tong
SZTOKHOLM/SAN FRANCISCO (Reuters): Na początku nakłonienie modeli sztucznej inteligencji, takich jak ChatGPT lub jego rywal Cohere, do emitowania reakcji przypominających ludzkie, wymagało dużych zespołów tanich pracowników, którzy pomagali modelom rozróżniać podstawowe fakty, takie jak to, czy zdjęcie przedstawia obiekt. Samochód albo marchewka.
Jednak bardziej wyrafinowane aktualizacje modeli sztucznej inteligencji na wysoce konkurencyjnej arenie wymagają obecnie szybko rozwijającej się sieci trenerów ze specjalistyczną wiedzą – od historyków po naukowców, niektórzy z doktoratami.
„Rok temu mogliśmy z powodzeniem zatrudnić studentów, aby ogólnie uczyć sztuczną inteligencję, jak się doskonalić” – powiedział współzałożyciel Cohere, Evan Chang, mówiąc o wewnętrznych trenerach ludzkich.
„Teraz mamy lekarzy z uprawnieniami do nauczania modelek, jak zachować się w środowisku medycznym, albo analityków finansowych i księgowych”.
W celu dalszego szkolenia Cohere, którego wartość ostatnio wyceniano na ponad 5 miliardów dolarów, współpracuje ze start-upem o nazwie Invisible Tech. Cohere jest jednym z głównych konkurentów OpenAI i specjalizuje się w sztucznej inteligencji dla przedsiębiorstw.
Startup Invisible Tech zatrudnia tysiące trenerów, pracujących zdalnie i stał się jednym z kluczowych partnerów firm AI od AI21 po Microsoft w szkoleniu ich modeli AI w celu redukcji błędów, znanych w świecie AI jako halucynacje.
„Mamy 5000 osób w ponad 100 krajach na całym świecie, które mają tytuły doktora, magistra i specjalistów w dziedzinie wiedzy” – powiedział Francis Pedraza, założyciel Invisible.
Invisible płaci do 40 dolarów za godzinę, w zależności od lokalizacji pracownika i złożoności pracy. Niektóre firmy, takie jak Outlier, płacą do 50 dolarów za godzinę, podczas gdy inna o nazwie Labelbox twierdzi, że płaci do 200 dolarów za godzinę za tematy „wysoce specjalistyczne”, takie jak fizyka kwantowa, ale zaczyna się od 15 dolarów za tematy podstawowe.
Firma Invisible została założona w 2015 roku jako firma zajmująca się automatyzacją przepływu pracy, która obsługuje takie firmy jak DoorDash, firmę dostarczającą żywność, w celu digitalizacji ich menu dostaw. Wszystko się jednak zmieniło, gdy wiosną 2022 r., przed publicznym uruchomieniem ChatGPT, zwróciła się do nich stosunkowo nieznana firma badawcza o nazwie OpenAI.
„OpenAI zwróciło się do nas z problemem polegającym na tym, że zadawanie pytań we wczesnej wersji ChatGPT powodowało delirium. Nie można było ufać odpowiedzi” – powiedział Pedraza agencji Reuters.
„Potrzebowali zaawansowanego partnera szkoleniowego w zakresie sztucznej inteligencji, który zapewniłby uczenie się przez wzmacnianie w oparciu o opinie ludzi”.
OpenAI nie odpowiedziało na prośbę o komentarz.
Generatywna sztuczna inteligencja tworzy nową treść w oparciu o poprzednie dane użyte do jej szkolenia. Czasami jednak nie potrafi rozróżnić informacji prawdziwych od fałszywych i generuje fałszywe wyniki zwane halucynacjami. Jednym z godnych uwagi przykładów jest to, że w 2023 r. chatbot Google udostępnił w filmie promocyjnym niedokładne informacje o satelicie, który jako pierwszy wykonał zdjęcia planety poza Układem Słonecznym Ziemi.
Firmy zajmujące się sztuczną inteligencją zdają sobie sprawę, że halucynacje mogą zmniejszać atrakcyjność GenAI dla przedsiębiorstw, i próbują na różne sposoby je ograniczyć, w tym wykorzystując ludzkich trenerów do nauczania pojęć fakt i fikcja.
Od czasu dołączenia do OpenAI firma Invisible twierdzi, że stała się partnerem szkoleniowym w zakresie sztucznej inteligencji dla większości firm GenAI, w tym Cohere, AI21 i Microsoft. Cohere i AI21 potwierdziły, że są klientami. Microsoft nie potwierdził, że jest klientem Invisible.
„Są to wszystkie firmy, które borykały się z wyzwaniami szkoleniowymi, gdzie pierwszym kosztem była moc obliczeniowa, a drugim kosztem wysokiej jakości szkolenie” – powiedział Pedraza.
Jak to działa?
OpenAI, które zapoczątkowało szaleństwo wokół GenAI, ma zespół badaczy zwany „Human Data Team”, który współpracuje z trenerami AI w celu gromadzenia specjalistycznych danych w celu uczenia swoich modeli, takich jak ChatGPT.
Źródło zaznajomione z działalnością firmy twierdzi, że badacze OpenAI przeprowadzili różne eksperymenty, takie jak redukcja halucynacji lub poprawa stylu pisania oraz współpraca z trenerami AI od Invisible i innych dostawców.
W dowolnym momencie prowadzonych jest dziesiątki eksperymentów, niektóre z wykorzystaniem narzędzi opracowanych przez OpenAI, a inne z narzędzi dostawców, powiedziała ta osoba.
W zależności od tego, czego chcą firmy zajmujące się sztuczną inteligencją – poprawy szwedzkiej historii lub modelowania finansowego – Invisible przydziela do tych projektów pracowników z odpowiednimi stopniami, odciążając tym samym ciężar zarządzania setkami przeszkolonych przez firmy AI.
„OpenAI zatrudnia jednych z najbardziej niesamowitych informatyków na świecie, ale niekoniecznie są oni ekspertami w szwedzkiej historii, chemii, biologii czy czymkolwiek, o co można zapytać” – powiedział Pedraza, dodając, że ponad 1000 pracowników kontraktowych świadczy swoje usługi OpenAI. Samotny.
Zhang z Cohere powiedział, że osobiście korzystał z trenerów Invisible, aby znaleźć sposób na nauczenie swojego modelu GenAI znajdowania odpowiednich informacji z dużego zbioru danych.
wyścig
Konkurentami w tej przestrzeni jest Scale AI, prywatny start-up wyceniony niedawno na 14 miliardów dolarów, który zapewnia firmom zajmującym się sztuczną inteligencją zbiory danych szkoleniowych. Podjęła także działalność w zakresie zapewniania trenerów AI i zalicza OpenAI do swoich klientów. Scale AI nie odpowiedziało na prośby o wywiad na temat tej historii.
Invisible, który przynosi zyski od 2021 r., zebrał kapitał zalążkowy wynoszący zaledwie 8 mln dolarów.
„W 70% należymy do zespołu, a tylko w 30% do inwestorów” – powiedział Pedraza. „Ułatwiamy rundy wtórne, a ostatnia cena transakcyjna wyniosła pół miliarda dolarów”. Reutersowi nie udało się potwierdzić tej oceny.
Trenerzy ludzi po raz pierwszy zajęli się szkoleniem w zakresie sztucznej inteligencji poprzez klasyfikację danych, która wymagała mniejszych kwalifikacji i była również niższa niż 2 dolary, a zajmowali się nią głównie ludzie z krajów afrykańskich i azjatyckich.
W miarę jak firmy zajmujące się sztuczną inteligencją wprowadzają bardziej zaawansowane modele, rośnie zapotrzebowanie na wyspecjalizowanych trenerów w kilkudziesięciu językach, tworząc dobrze płatną niszę, w której pracownicy różnych dziedzin mogą zostać trenerami sztucznej inteligencji, nawet nie wiedząc, jak kodować.
Popyt ze strony firm AI tworzy więcej firm świadczących podobne usługi.
„Moja skrzynka odbiorcza jest pełna nowych firm, które pojawiają się tu i tam” – powiedział Zhang. „Postrzegam to jako nową przestrzeń, w której firmy po prostu zatrudniają ludzi do generowania danych dla laboratoriów sztucznej inteligencji, takich jak nasze”.
(Raport: Supantha Mukherjee w Sztokholmie i Anna Tong w San Francisco; redakcja: Kenneth Lee i Claudia Parsons)