Ostatnio Wyniki Badacze Apple kwestionują matematyczne możliwości dużych modeli językowych (LLM), kwestionując pogląd, że sztuczna inteligencja (AI) znajduje się na granicy ludzkiego rozumowania.
Firma Apple odkryła, że w teście obejmującym 20 absolwentów MBA wyniki w rozwiązywaniu problemów matematycznych w szkole podstawowej spadały po nieznacznej modyfikacji pytań lub dodaniu nieistotnych informacji. Dokładność spadła aż o 65,7%, ukazując niesamowitą kruchość systemów sztucznej inteligencji w obliczu zadań wymagających silnego logicznego myślenia.
Ta słabość może mieć daleko idące konsekwencje dla firm, które polegają na sztucznej inteligencji przy podejmowaniu złożonych decyzji. W szczególności instytucje finansowe mogą być zmuszone do ponownej oceny wykorzystania sztucznej inteligencji do zadań wymagających złożonych obliczeń lub oceny ryzyka.
W sercu tej debaty leży Sztuczna inteligencja ogólna Koncepcja AGI – Święty Graal sztucznej inteligencji, który w różnych zadaniach może dorównać lub przewyższyć ludzką inteligencję. Chociaż niektórzy liderzy technologii przewidują rychłe pojawienie się sztucznej inteligencji ogólnej, odkrycia te sugerują, że możemy być dalej od tego celu, niż wcześniej sądzono.
„Każda aplikacja w świecie rzeczywistym, która wymaga rozumowania, które można ostatecznie zweryfikować (lub nie), jest zasadniczo niemożliwa, aby tytuł MBA osiągnął sukces przy jakimkolwiek stopniu spójności”. Selmera Bringsjordaprofesor kl Instytut Politechniczny Rensselaerapowiedział PYMNTS.
Bringsjord wyraźnie oddziela sztuczną inteligencję od tradycyjnego przetwarzania danych: „To, czego kalkulator może dokonać na smartfonie, jest czymś, czego nie może zrobić LLM – ponieważ gdyby ktoś naprawdę chciał się upewnić, że wynik obliczeń, o który prosiłeś na iPhonie, jest prawidłowy… ostatecznie i trwale Apple będzie mogło zweryfikować lub sfałszować ten wynik.
Ograniczenia i zrozumienie
Nie dla wszystkich ekspertów ujawnione w raporcie Apple ograniczenia uznają za równie problematyczne. „Ograniczenia opisane w tym badaniu prawdopodobnie będą miały niewielki wpływ na rzeczywiste zastosowania LLM. Dzieje się tak dlatego, że większość rzeczywistych zastosowań LLM nie wymaga zaawansowanego rozumowania matematycznego. Aravinda Chandramouliszef sztucznej inteligencji w firmie zajmującej się analizą danych Handelpowiedział PYMNTS.
Istnieją potencjalne rozwiązania, takie jak dostrajanie lub szybkie projektowanie wstępnie wytrenowanych modeli dla określonych dziedzin. Specjalistyczne modele, takie jak CzarodziejMatematyka I MatematykaGPTzaprojektowany do zadań matematycznych, mógłby zwiększyć możliwości sztucznej inteligencji w obszarach wymagających rygorystycznego logicznego rozumowania.
Debata wykracza poza matematykę i obejmuje podstawowe pytanie: czy te systemy sztucznej inteligencji naprawdę cokolwiek rozumieją? Problem ten ma kluczowe znaczenie w dyskusjach na temat sztucznej inteligencji ogólnej i poznania maszynowego.
„LLM nie mają zielonego pojęcia o tym, co robią. Po prostu szukają w przechowywanych danych wzorców językowych, które są statystycznie podobne do tych w tych danych” – stwierdził Bringjord.
„Chociaż ich spójne odpowiedzi mogą stwarzać iluzję zrozumienia, umiejętność wyciągnięcia korelacji statystycznych z danych nie oznacza, że naprawdę rozumieją zadania, które wykonują” – stwierdziła Chandramouli. Spostrzeżenie to podkreśla wyzwanie, jakim jest rozróżnienie między wyrafinowanym rozpoznawaniem wzorców a prawdziwym zrozumieniem w systemach AI.
Erica Pravikadyrektor generalny firmy Inicjatywa podniesionauznaje obecne ograniczenia, ale widzi potencjalne rozwiązania. „Duże modele językowe (LLM) nie są przystosowane do wykonywania obliczeń matematycznych. Nie rozumieją matematyki” – stwierdził jednak, że połączenie studiów MBA ze wyspecjalizowanymi podsystemami sztucznej inteligencji mogłoby prowadzić do dokładniejszych wyników.
„W połączeniu z wyspecjalizowanymi podsystemami sztucznej inteligencji wyszkolonymi w matematyce mogą uzyskiwać dokładne odpowiedzi, zamiast generować je na podstawie wyszkolonych modeli statystycznych tworzenia języka” – powiedział Pravik. Pojawiające się technologie, np Generacja odzyskiwania i wzmacniania Systemy RAG i multimodalne systemy AI mogą przezwyciężyć obecne ograniczenia w rozumowaniu AI.
Rozwijająca się dziedzina
Dziedzina sztucznej inteligencji nadal szybko się rozwija, a studia MBA wykazują imponujące umiejętności w zakresie przetwarzania i generowania języka. Jednak ich zmagania z logicznym rozumowaniem i zrozumieniem matematycznym pokazują, że nadal potrzeba znacznej pracy, aby osiągnąć sztuczną inteligencję ogólną.
Dokładna ocena i testowanie systemów sztucznej inteligencji ma nadal kluczowe znaczenie, zwłaszcza w przypadku zastosowań o dużej stawce, które wymagają wiarygodnego rozumowania. Badacze i programiści mogą znaleźć obiecujące ścieżki w podejściach takich jak dokładne strojenieOraz modele specjalistyczne Multimedialne systemy sztucznej inteligencji Pracują nad wypełnieniem luki między obecnymi możliwościami sztucznej inteligencji a przewidywaną potężną inteligencją ogólną.