University of Illinois Urbana-Champaign (UIUC) współpracuje z Amazon, Apple, Google, Meta, Microsoft i partnerami non-profit w projekt dostępu mowy. Projekt ma na celu poprawę istniejących możliwości rozpoznawania mowy, tak aby każdy, w tym osoby niepełnosprawne i o różnych stylach mowy, mógł korzystać z systemów rozpoznawania mowy.
„Wybór komunikacji i obsługi urządzeń za pomocą mowy ma kluczowe znaczenie dla każdego, kto ma dziś kontakt z technologią lub gospodarką cyfrową”, powiedział Mark Hasegawa Johnson, profesor inżynierii elektrycznej i komputerowej na UIUC, który kieruje projektem. „Interfejsy mowy powinny być dostępne dla wszystkich, w tym dla osób niepełnosprawnych”.
Obecnie wiele systemów rozpoznawania mowy, takich jak asystenci głosowi i narzędzia tłumaczeniowe, nie rozpoznaje szerokiego zakresu wzorców mowy, w tym często związanych z niepełnosprawnością, taką jak choroba Lou Gehriga lub stwardnienie zanikowe boczne, choroba Parkinsona, porażenie mózgowe i zespół Downa
Dlatego osoby należące do tych społeczności często nie mogą skorzystać z korzyści, jakie oferuje oprogramowanie do rozpoznawania mowy. Jednak wykorzystując sztuczną inteligencję i uczenie maszynowe, firmy technologiczne mogą ulepszyć oprogramowanie do rozpoznawania głosu, co jest celem projektu dostępu do mowy.
„To zadanie było trudne, ponieważ wymaga dużej ilości infrastruktury, najlepiej takiej, jaką mogą obsługiwać wiodące firmy technologiczne, dlatego stworzyliśmy unikalny multidyscyplinarny zespół z doświadczeniem w zakresie lingwistyki, mowy, sztucznej inteligencji, bezpieczeństwa i prywatności, aby pomóc w tym to ważne wyzwanie” – powiedział Hasegawa Johnson.
Projekt Speech Access będzie zbierać próbki mowy od osób reprezentujących różne style mowy poprzez rekrutację opłacanych wolontariuszy, aby dostarczyli nagrane próbki. Za pomocą próbek naukowcy z UIUC stworzą prywatny, niezidentyfikowany zestaw danych, który zostanie wykorzystany do trenowania modeli uczenia maszynowego, aby lepiej zrozumieć szerszy zakres wzorców mowy. Projekt będzie koncentrował się na amerykańskim angielskim.
„Lekarz gier. Fanatyk zombie. Studio muzyczne. Kawiarni ninja. Miłośnik telewizji. Miły fanatyk alkoholik.