Salesforce AI Research proponuje „DeepTime”, model oparty na głębokim wskaźniku czasu, który jest trenowany za pomocą składni meta-uczenia, aby automatycznie uczyć się funkcji reprezentacji na podstawie danych szeregów czasowych.

Salesforce AI Research proponuje „DeepTime”, model oparty na głębokim wskaźniku czasu, który jest trenowany za pomocą składni meta-uczenia, aby automatycznie uczyć się funkcji reprezentacji na podstawie danych szeregów czasowych.

W wielu zastosowaniach komercyjnych i naukowych wyzwanie polegające na przewidywaniu lub przewidywaniu przyszłych wartości w oparciu o wartości historyczne ma kluczowe znaczenie. Dzieje się tak, ponieważ prognozowanie może pomóc w podejmowaniu krytycznych decyzji, takich jak ilość zapasów danego produktu, które należy mieć pod ręką lub jak efektywnie alokować zasoby w centrum danych. Dane szeregów czasowych — sekwencyjny zestaw danych liczbowych zbieranych zwykle w regularnych odstępach czasu — są używane do prognozowania. Niektóre przykłady obejmują całkowitą dzienną sprzedaż określonego produktu z platformy handlu elektronicznego lub wykorzystanie procesora przez serwer w centrum danych minuta po minucie. Dwa typy danych szeregów czasowych to dane statyczne i niestacjonarne. Niezmienność opisuje prawidłowość statystycznych wzorców szeregów czasowych i wartości danych, które pozostają w pewnym zakresie. W przeciwieństwie do niestabilności, która jest zjawiskiem, w którym rozkład statystyczny danych szeregów czasowych nie pozostaje stały, stacjonarne szeregi czasowe zachowują informacje statystyczne danych szeregów czasowych (takie jak średnia lub wariancja).

Ludzie często przyswajają nowe koncepcje szybciej i skuteczniej niż modele uczenia maszynowego, które do prawidłowego funkcjonowania często wymagają ogromnych ilości danych szkoleniowych. Techniki meta-uczenia się często starają się odtworzyć rodzaj szybkiego uczenia się, który ludzie widzą dzięki wykorzystaniu wewnętrznej i zewnętrznej pętli uczenia się. Wewnętrzna pętla uczenia się szybko pobiera nowe informacje z gęstego zestawu próbek, znanego jako grupa wsparcia. Zdolność wewnętrznej pętli do szybkiej adaptacji do nowych grup wsparcia zapewnia zewnętrzna pętla uczenia się. Uczenie na zestawie zapytań — zestaw przykładów z początkowego zestawu obsługi, które są porównywalne, ale odrębne — osiąga to.

Wraz z rozwojem infrastruktury IT pojawia się możliwość gromadzenia większych ilości tych danych, co skutkuje bardzo długimi szeregami czasowymi zbiorów danych. Ponieważ dane są gromadzone w dużych ilościach w czasie, mechanizm generujący dane również prawdopodobnie ulegnie zmianie. Na przykład dzienna sprzedaż może znacznie wzrosnąć, jeśli produkt stanie się popularny w porównaniu z poprzednimi latami. W rezultacie wzorce zagregowanych danych zmieniają się w czasie, tworząc niestacjonarne szeregi czasowe.

READ  Bandai Namco uruchamia program dla Taiko no Tatsujin: Rhythm Festival

Chociaż dostęp do większej ilości danych jest zwykle przydatny w uczeniu maszynowym (ML), stanowi wyzwanie podczas stosowania algorytmów uczenia maszynowego do takich danych, ponieważ większość technologii działa lepiej z równomiernie rozproszonymi danymi. Transformacja zmiennych i dystrybucja warunkowa to dwa problemy z danymi, które degradują modele, gdy system przechodzi przez zmianę. Przesunięcie współzmiennej występuje, gdy zmieniają się statystyki wartości szeregów czasowych, natomiast przesunięcie rozkładu warunkowego występuje, gdy zmienia się metoda użyta do wytworzenia danych.

W związku z tym wydajność obecnych metod prognozowania szeregów czasowych może ulec pogorszeniu z powodu niestabilności. Aby przezwyciężyć te wady, badacze z Salesforce opracowali nowe podejście do prognozowania niestacjonarnych szeregów czasowych o nazwie DeepTime. Ta metoda rozwiązuje problemy związane z sekwencjonowaniem danych długich szeregów czasowych poprzez rozszerzenie tradycyjnych modeli indeksu czasowego na model głębokiego uczenia się. DeepTime wykorzystuje nowe sformułowanie zadania przewidywania metauczenia, aby obejść problem nadekspresyjnych sieci neuronowych. To sprawiło, że Salesforce jako pierwsza firma w branży wprowadziła sposób wykorzystania modeli indeksu głębokiego czasu do prognozowania szeregów czasowych.

Metodologia wykorzystuje modele głębokich wskaźników czasu, w których wcześniej zdefiniowana funkcja jest zastępowana przez głęboką sieć neuronową, w przeciwieństwie do tradycyjnych metod wskaźników czasu, które ręcznie określają korelację między właściwościami wskaźnika czasu a wartościami wyjściowymi. Zamiast ręcznie definiować te korelacje, model może uczyć się ich na podstawie danych. Głębokie sieci neuronowe są nadmiernie ekspresyjne i często powodują przeciążenie danych, w ten sposób naiwnie generując prognozy niespełniające standardów. Aby rozwiązać ten problem, naukowcy wykorzystali formułę meta-uczenia.

Salesforce Deeptime rozwiązuje problem niestabilności za pomocą założenia lokalnej dystrybucji statycznej. W rezultacie, nawet jeśli wydłużona sekwencja nie jest spójna, uzasadnione jest przypuszczenie, że bliskie kroki czasowe nadal wykazują te same wzorce i rozkład, które mogą się stopniowo zmieniać w czasie. W efekcie długie szeregi czasowe można podzielić na zadania, które mają być statyczne. Szereg czasowy podzielony jest na okno przeglądu (dane historyczne) oraz horyzont prognozy dla każdego zadania (wartości, jakich należy oczekiwać). Horyzont przewidywania to zapytanie ustawione w systemie meta-learningu, a okno rewizji to grupa wsparcia.

READ  Granie w swoje epickie gry na Steam Deck stało się o wiele łatwiejsze

Głębokie sieci neuronowe mają wiele parametrów, których możesz się nauczyć; Zatem metauczenie całego modelu może być pracochłonne i czasochłonne. Aby rozwiązać ten problem, naukowcy zmodyfikowali strukturę modelu, aby skrócić okres szkolenia. Kluczową koncepcją jest wykorzystanie tylko etapu adaptacji wewnętrznej pętli meta-uczenia się na zboczu grzbietu, który jest ostatnią warstwą i można go szybko obliczyć podczas treningu. Dzięki tej formule DeepTime może przezwyciężyć problemy przesunięcia dystrybucji modalnej i przesunięcia zmiennych.

Zespół przetestował swoje podejście, wykorzystując zarówno dane syntetyczne, jak i rzeczywiste. DeepTime może ekstrapolować ukryte funkcje zawierające nowe wzorce, do których nie przyznano dostępu w danych treningowych podczas pracy z danymi syntetycznymi. Platforma osiąga przełomową wydajność w 20 z 24 ustawień (w oparciu o skalę błędu średniokwadratowego) na sześciu rzeczywistych zestawach danych szeregów czasowych z różnych obszarów zastosowań i prognoz. Architektura premium wykazuje również wyjątkową wydajność, przewyższając wszelkie standardy pod względem kosztów pamięci i czasu pracy.

Zastosowanie regresji grzbietowej przez DeepTime umożliwia frameworkowi osiągnięcie dokładnego jednoetapowego rozwiązania zamiast przybliżonego rozwiązania iteracyjnego, zapewniając, że oczekiwane wartości są bliższe rzeczywistym. W rezultacie DeepTime zapewnia doskonałą metodę opracowywania odpowiedzi w zakresie prognozowania szeregów czasowych. Jedną z głównych zalet DeepTime jest to, że jest szybszą, dokładniejszą i ostatecznie bardziej użyteczną technologią przewidywania szeregów czasowych niż inne technologie. Może również dostarczać dokładniejszych prognoz dotyczących wpływu na gospodarkę i biznes, co może pomóc w podejmowaniu kolejnych decyzji, w tym alokacji zasobów (w przypadku prognozowania sprzedaży) lub planowania centrum danych. Ponadto zastosowanie modelu prognostycznego w biznesie może zmniejszyć ślad węglowy dzięki wydajności lepszych ram.

This Article is written as a research summary article by Marktechpost Staff based on the research paper 'DEEPTIME: DEEP TIME-INDEX META-LEARNING FOR NON-STATIONARY TIME-SERIES FORECASTING'. All Credit For This Research Goes To Researchers on This Project. Check out the paper, github link and reference article.

Please Don't Forget To Join Our ML Subreddit


READ  Firma Microsoft przedłuża obsługę starszej bazy danych Apache Cassandra 3.11 • Log

Asif Razak jest dziennikarzem AI i współzałożycielem Marktechpost, LLC. Jest wizjonerem, przedsiębiorcą i inżynierem, który chce wykorzystać moc sztucznej inteligencji na dobre.

Najnowszy projekt Asifa to rozwój platformy medialnej sztucznej inteligencji (Marktechpost), która zrewolucjonizuje sposób wyszukiwania istotnych wiadomości związanych ze sztuczną inteligencją, nauką o danych i uczeniem maszynowym.

Asif został przedstawiony przez Onalytica w „Who’s Who in AI? (Influential Voices & Brands)” jako jeden z „Wpływowych dziennikarzy AI” (https://onalytica.com/wp-content/uploads/2021/09/Whos-Who – W AI.pdf). Jego wywiad został również przedstawiony przez Onalytica (https://onalytica.com/blog/posts/interview-with-asif-razzaq/).


Halsey Andrews

„Lekarz gier. Fanatyk zombie. Studio muzyczne. Kawiarni ninja. Miłośnik telewizji. Miły fanatyk alkoholik.

Rekomendowane artykuły

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *