Uwielbiam gotować i robię to każdego wieczoru dla mojej rodziny, ale nie cierpię wymyślać czegoś nowego lub innowacyjnego do podania. Ponieważ modele AI mogą teraz zobaczyć świat, a przynajmniej to, co im przedstawia na fotografii, postanowiłem sprawdzić, czy mogą mi pomóc.
Aby ich sprawdzić i upewnić się, że nie oszukuję systemu, podając łatwe składniki, poprosiłem Mike'a Prospero, redaktora naczelnego Tom's Guide w USA, o zrobienie zdjęcia losowo wybranych składników w stylu tajemniczego pudełka.
I nie zawiódł, serwując pyszne dania, takie jak ciasto na pizzę, brzoskwinie w puszkach, anchois, ostry sos i świeżą mozzarellę. Osobiście, biorąc pod uwagę tylko te składniki, zrobiłbym pizzę z ostrym sosem i polewą z mozzarelli – ale to my pozwalamy AI wybierać nasze menu.
Do eksperymentu używamy Google Gemini, OpenAI ChatGPT i Anthropic Claude, ponieważ wszystkie one mają modele wizji.
Jak dobrze wybierają składniki?
Pierwszym zadaniem chatbotów i głównym punktem tego wyzwania jest sprawdzenie, jak dobrze potrafią rozpoznać komponenty. Powyższy obraz jest wyraźny, ma wysoką rozdzielczość, a podzespoły wyświetlane są na normalnej powierzchni – co dla żadnego z nich nie powinno stanowić większego problemu.
Korzystam z wersji premium każdego chatbota, ponieważ OpenAI i Anthropic dają dostęp do modelu wizji tylko wtedy, gdy płacisz 19,99 USD miesięcznie. Google obsługuje bezpłatną wersję Gemini, ale korzystanie z mniej wydajnej wersji modelu Google byłoby niesprawiedliwe.
Zaczynamy prosto. Daj każdemu z nich obrazek i tekst podpowiedzi: „Co widzisz na tym obrazku?” Test ten sprawdza, jak dobrze potrafią opisać obrazek i czy potrafią pomyśleć o celu obrazka – czy potrafią nazwać składniki.
Zarówno Claude, jak i Jiminy wspomnieli o słowie „składniki”, a ChatGPT określił je jako „składniki odżywcze”, ale ChatGPT ogólnie lepiej radził sobie z rozpoznawaniem składników.
Bliźnięta pominęły jeden element i błędnie nazwały inny. Claude wynalazł szósty składnik, którego nie ma na zdjęciu. ChatGPT nie tylko dostało odpowiedni produkt, ale także znaki towarowe.
Do przepisów
Poprosiłem ich o wymyślenie trzech przepisów, które przetestowałyby szybkość sztucznej inteligencji w dążeniu do zdolności i kreatywności. Poprosiłam też o zabawny tytuł dla każdego przepisu.
1. Wszystkie komponenty
Najpierw poprosiłam ich o przepis, w którym wykorzystano wyłącznie składniki pokazane na zdjęciu i w taki czy inny sposób uwzględniono każdy z nich – dla przypomnienia, był w nim zarówno anchois, jak i brzoskwinie w puszkach. Mogą używać przedmiotów z szafek sklepowych, takich jak olej i mąka.
Czat GPT Plus
ChatGPT umieścił mozzarellę bezpośrednio na spodzie pizzy, wyjął anchois z ostrego sosu i ułożył je na pizzy z brzoskwiniami. Następnie zmieszano ostry sos i ostry sos anchois, tworząc mżawkę, którą polewano pizzę po jej ugotowaniu.
Zaawansowane Bliźnięta
Gemini użyło ostrego sosu jako substytutu sosu pomidorowego, który choć mniej wytrawny niż wersja ChatGPT, byłby nadal intensywny. Następnie na wierzchu ułożono ser mozzarella i plasterki brzoskwiń. Zapomniałam o anchois, właściwie nie zauważyliście ich na zdjęciu. Kiedy zwróciłem na to uwagę, kazano mi położyć to na mojej pizzy obok plasterków brzoskwiń.
Klaudiusz 3 Op
Claude również miał trudności z identyfikacją sardeli. Powiedziałem mu to przed stworzeniem przepisu na pizzę, a on zastosował to samo podejście, co ChatGPT. Bez sosu, brzoskwinie na cieście z anchois. Różnica polega na tym, że przed gotowaniem brzoskwinie i anchois polewane są ostrym sosem, a na wierzchu układana jest mozzarella.
2. Tylko składniki
Następny test to niewielka, ale istotna różnica. Poprosiłem ich, aby wymyślili przepis, w którym wykorzystane zostaną wyłącznie składniki widoczne na zdjęciu, ale nie muszą zostać wykorzystane wszystkie. Dodałem zastrzeżenie, że musi zawierać co najmniej połowę, bo inaczej mielibyśmy paluszki chlebowe z ciasta na pizzę.
Czat GPT Plus
ChatGPT Użyj ciasta na pizzę, aby przygotować podpłomyk. Myślę, że to było trochę oszustwo, gdy powiedziałem „bez pizzy”, a to była po prostu długa pizza. Jako dodatki: mozzarellę równomiernie rozsmarowano na cieście, brzoskwinie na mozzarelli, a sardele na brzoskwiniach. Użyłem sosu anchois i ostrego sosu, aby zrobić mżawkę – ponownie.
Zaawansowane Bliźnięta
Gemini zrobił bruschettę, która w rzeczywistości była po prostu kwadratową pizzą. Różnica polegała na tym, że najpierw posmarował brzoskwinie ostrym sosem. Poza tym było to samo – wszystko na cieście i ugotowane.
Klaudiusz 3 Op
Claude zrobił wersję quesadilli. Ciasto podzielić na osiem części i rozwałkować na cienki, okrągły kształt (mała pizza). Chociaż tutaj jest inaczej, bo każe nam rozgrzać dużą patelnię i roztopić masło lub oliwę.
Ciasto smażono na patelni z kilkoma plasterkami brzoskwiń na połowie każdej powierzchni. Skropić ostrym sosem i serem mozzarella, następnie uformować półksiężyc, smażyć do chrupkości i podawać.
3. Daj z siebie wszystko
Na koniec poprosiłem ich, aby stworzyli przepis, w którym wykorzystano wszystkie składniki widoczne na zdjęciu, ale mogli użyć dowolnych innych składników, jakie chcieli, znajdujących się w bardzo dobrej spiżarni.
Czat GPT Plus
ChatGPT przygotował chleb (niespodzianka) na swoje ostatnie danie. W szczególności „chleb nadziewany wyśmienitymi brzoskwiniami i anchois”. Oprócz naszych pięciu składników zamówiłem miód, ocet balsamiczny, ser ricotta i czosnek.
Tym razem ciasto na pizzę rozwałkowano na duży prostokąt, na wierzch położono warstwę sera ricotta, następnie na ricottę ułożono brzoskwinie i anchois z liśćmi czosnku i bazylii. Polewy polano sosem anchois i ostrym sosem, a na wierzchu ułożono mozzarellę. Na koniec są one składane i zwijane jak bułka szwajcarska, a następnie pieczone.
Zaawansowane Bliźnięta
Bliźnięta chciały do galette mąkę kukurydzianą, jajka, masło, szczypiorek, cytrynę, ekstrakt waniliowy, cynamon i cukier. Zrobiłam masło z anchois, zrobiłam bazę do pizzy, a następnie posmarowałam ciasto nowym masłem.
Brzoskwinie, cukier, skrobię i inne słodkie składniki łączy się z kroplą ostrego sosu i umieszcza na środku ciasta. Przed pieczeniem posypano go serem mozzarella, a brzegi zawinięto na nadzienie.
Klaudiusz 3 Op
Claude zrobił chleb nadziewany mozzarellą. Poprosiła o suszone pomidory, oliwki, rozmaryn, nasiona sezamu i jajko. Przepis sugerował uformowanie ciasta w duży, cienki prostokąt.
Anchois, pomidory, oliwki, czosnek i rozmaryn wymieszano w misce i równomiernie rozprowadzono na cieście. Na wierzchu ułożono brzoskwinie, polano ostrym sosem i mozzarellą. Następnie ciasto zwija się w ciasny wałek, a jego brzegi zgrzewa się, a następnie posypuje ubitym jajkiem i nasionami sezamu i piecze.
Która sztuczna inteligencja uzyskała najlepszą odpowiedź?
Nie jestem pewien, czy zjem którekolwiek z dań stworzonych przez chatboty, chociaż poprosiłem ich, aby wyświetlili mi monit dla MidJourney o wizualizację ich posiłków i wyglądają lepiej niż czytane.
Ogólnie rzecz biorąc, myślę, że Claude miał lepsze przepisy, ale ChatGPT lepiej poradził sobie ze zrozumieniem obrazu, co oznacza, że od samego początku dostał składniki – był to test wizji sztucznej inteligencji, a nie umiejętności przepisu.
Więcej z przewodnika Toma
„Podróżujący ninja. Rozrabiaka. Badacz bekonów. Ekspert od ekstremalnych alkoholi. Obrońca zombie.”