Pomimo szybkiego postępu w sztucznej inteligencji, sztuczna inteligencja nie jest jeszcze bliska gotowości do zastąpienia człowieka w praktyce naukowej. Ale to nie znaczy, że nie mogą pomóc zautomatyzować części ciężkiej pracy wynikającej z codziennych eksperymentów naukowych. Na przykład kilka lat temu badacze objęli sztuczną inteligencją kontrolę nad zautomatyzowanym sprzętem laboratoryjnym i nauczyli go, jak kompleksowo klasyfikować wszystkie interakcje, które mogą wystąpić pomiędzy zestawem surowców.
Chociaż jest to przydatne, nadal wymaga dużej interwencji badaczy, aby przede wszystkim wyszkolić system. Grupa z Uniwersytetu Carnegie Mellon wymyśliła teraz, jak sprawić, by system sztucznej inteligencji nauczył się radzić sobie z chemią. System wymaga zestawu trzech instancji AI, z których każda specjalizuje się w innych procesach. Ale kiedy już go skonfigurujesz i zaopatrzysz w surowce, wystarczy, że powiesz mu, jakiego rodzaju reakcję chcesz wywołać, a on to zrozumie.
Trójca sztucznej inteligencji
Naukowcy zauważają, że są zainteresowani zrozumieniem możliwości, jakie duże modele językowe (LLM) mogą zaoferować przedsięwzięciu naukowym. Zatem wszystkie AI użyte w tej pracy to LLM, głównie GPT-3.5 i GPT-4, chociaż inne – Claude 1.3 i Falcon-40B-Instruct – również zostały przetestowane. (Najlepiej wypadły GPT-4 i Claude 1.3.) Zamiast jednak używać jednego systemu do obsługi wszystkich aspektów chemii, badacze stworzyli odrębne przykłady współpracy w ustalaniu podziału pracy, który nazwali „kosmicznym światem”.
Trzy systemy, z których korzystali, to:
Wyszukiwarka internetowa. Ma to dwie główne możliwości. Jednym z nich jest użycie interfejsu API wyszukiwarki Google do znalezienia stron, które mogą być warte uwagi ze względu na zawarte w nich informacje. Drugim jest pobranie tych stron i wydobycie z nich informacji — pomyśl o tym jako o kontekście analogicznym do kontekstu poprzednich części rozmowy, który Chat GPT może zachować w celu uzyskania dalszych odpowiedzi. Badaczom udało się prześledzić, gdzie jednostka ta spędza czas, a około połowa odwiedzanych przez nią miejsc to strony Wikipedii. Pięć najczęściej odwiedzonych stron obejmowało czasopisma publikowane zarówno przez Amerykańskie Towarzystwo Chemiczne, jak i Królewskie Towarzystwo Chemii.
Badacz dokumentacji. Pomyśl o tym jako rtfm Przykład. Sztuczna inteligencja miała otrzymać kontrolę nad różnorodnymi urządzeniami do automatyzacji laboratorium, takimi jak automatyczne podajniki cieczy i tym podobne, często sterowanymi za pomocą wyspecjalizowanych poleceń lub czegoś w rodzaju interfejsu API Pythona. Ta instancja AI uzyskała dostęp do wszystkich instrukcji obsługi tego urządzenia, dzięki czemu może nauczyć się nim sterować.
Plan. Planista może wydawać polecenia obu pozostałym instancjom AI i przetwarzać ich odpowiedzi. Ma dostęp do piaskownicy wykonawczej kodu Pythona, umożliwiającej wykonywanie obliczeń. Ma także dostęp do zautomatyzowanego sprzętu laboratoryjnego, co pozwala mu wirtualnie przeprowadzać i analizować eksperymenty. Można więc myśleć o planiście jako o części systemu, który musi działać jak chemik, ucząc się z literatury i próbując wykorzystać sprzęt do wdrożenia zdobytej wiedzy.
Planista może również zidentyfikować, kiedy pojawiają się błędy programistyczne (w skryptach Pythona lub podczas prób sterowania automatami), co pozwala mu skorygować błędy.
Uruchom system
Początkowo system miał zsyntetyzować szereg substancji chemicznych, takich jak acetaminofen i ibuprofen, co potwierdziło, że po przeszukaniu Internetu i literatury naukowej ogólnie rzecz biorąc, może znaleźć realną formułę. Pytanie brzmi zatem, czy system jest w stanie wykryć urządzenia, do których ma dostęp, na tyle dobrze, aby uruchomić jego zdolności koncepcyjne.
Na początek badacze wykorzystali standardową płytkę na próbki zawierającą szereg małych dołków ułożonych w prostokątną siatkę. System został poproszony o wypełnienie kwadratów, ukośnych linii lub innych wzorów przy użyciu płynów o różnych kolorach i był w stanie to zrobić skutecznie.
Kontynuując, umieścili trzy różne kolorowe rozwiązania w losowych miejscach sieci studni; System został poproszony o zidentyfikowanie studzienek i ich koloru. Coscientist sam w sobie nie wiedział, jak to zrobić. Kiedy jednak przypomniano mu, że różne kolory będą wykazywać różne widma absorpcji, użył spektrometru, do którego miał dostęp i był w stanie zidentyfikować różne kolory.
Ponieważ podstawowe dowodzenie i kontrola pozornie działały, badacze postanowili spróbować chemii. Wyposażyli płytkę z próbkami w studzienki wypełnione prostymi substancjami chemicznymi, katalizatorami i tym podobnymi, i poprosili o przeprowadzenie określonej reakcji chemicznej. Kosmolog od początku dobrze opanował chemię, ale jego próby uruchomienia syntezy nie powiodły się, ponieważ wysłało nieprawidłowe polecenie do maszyn, które podgrzewają i sterują reakcjami. Spowodowało to powrót do modułu dokumentacji, co umożliwiło mu naprawienie problemu i przeprowadzenie interakcji.
I zadziałało. W mieszaninie reakcyjnej występowały widma żądanych produktów, których obecność potwierdzono metodą chromatografii.
ulepszyć
Gdy podstawowe reakcje zadziałały, badacze poprosili następnie system o optymalizację wydajności reakcji i przedstawili proces optymalizacji jako grę, w której wynik rósł wraz z wynikiem reakcji.
System dokonał kilku błędnych przypuszczeń w pierwszej rundzie testów, ale szybko skupił się na osiągnięciu lepszych zwrotów. Naukowcy odkryli również, że mogliby uniknąć złych wyborów w pierwszej rundzie, dostarczając Naukowcowi informacji o wynikach uzyskanych przez kilka losowych mieszanin początkowych. Oznacza to, że niezależnie od tego, skąd naukowiec czerpie informacje – czy to z własnej informacji zwrotnej, czy z zewnętrznego źródła informacji – jest on w stanie włączyć je do swojego planowania.
Badacze doszli do wniosku, że Coscicient posiada szereg godnych uwagi umiejętności:
- Planowanie syntezy chemicznej z wykorzystaniem informacji ogólnych.
- Nawiguj i przetwarzaj instrukcje techniczne złożonych urządzeń.
- Wykorzystaj tę wiedzę do sterowania szeroką gamą sprzętu laboratoryjnego.
- Zintegruj te możliwości oprzyrządowania z przepływem pracy w laboratorium.
- Przeanalizuj jego reakcje i wykorzystaj te informacje do zaprojektowania ulepszonych warunków reakcji.
Pod wieloma względami przypomina to doświadczenie, jakie może mieć student na pierwszym roku studiów wyższych. W idealnej sytuacji absolwent będzie osiągał dalsze postępy. Ale może GPT-5 też będzie w stanie.
Jeszcze bardziej niebezpieczne jest to, że architektura naukowa, która opiera się na interakcji wielu wyspecjalizowanych systemów, jest podobna do sposobu działania umysłów. Jest oczywiste, że wyspecjalizowane systemy mózgowe są zdolne do wykonywania szerokiego zakresu czynności, a jest ich wiele. Jednak tego rodzaju struktura może mieć kluczowe znaczenie dla umożliwienia bardziej złożonego zachowania.
Jednak sami badacze są zaniepokojeni niektórymi zdolnościami naukowca. Istnieje wiele substancji chemicznych (np. środków paraliżujących), których nie chcielibyśmy, aby były łatwiejsze w produkcji. Ustalenie, jak powiedzieć instancjom GPT, aby czegoś nie robiły, okazuje się ciągłym wyzwaniem.
Natura2023. Identyfikator cyfrowy: 10.1038/s41586-023-06792-0 (O identyfikatorach cyfrowych).