Zeszłego lata opisałem historię Franceski Gino z Harvard Business School, którą rażąco oskarżono o fałszowanie danych w co najmniej czterech opublikowanych przez nią badaniach. Została złapana, gdy niektórzy detektywi zajmujący się danymi internetowymi – którzy w wolnym czasie badają niewłaściwe postępowanie badawcze – Znalazłem niespójności W swoich danych papierowych i zbadano je dalej.
W końcu zgłosili swoje wątpliwości na Uniwersytecie Harvarda, który ostatecznie zbadał tę sprawę Wniosek o wycofanie odpowiednich dokumentów. (Gino stopa Harvard pozwał blogerów, oskarżając ich o zmowę mającą na celu zszarganie jego reputacji.)
Czytając, myślałem o sprawie Gino Dziwnie podobna historia Ze skandalu w Dana-Farber Cancer Institute na Harvardzie, wiodącym szpitalu zajmującym się badaniami nad rakiem w Bostonie.
Dana Farber była zszokowana w styczniu tego roku A Post na blogu Napisane przez Sholto Davida, biologa molekularnego i detektywa danych internetowych, w którym przedstawia dowody powszechnej manipulacji danymi dotyczącymi badań nad rakiem, opublikowane przez czołowych badaczy, w tym dyrektora generalnego i dyrektora operacyjnego instytutu. Dawid Powiedziało Skontaktowała się z instytutem w związku z obawami dotyczącymi 57 artykułów naukowych, z których 38 instytut ponosił „główną odpowiedzialność za potencjalne błędy w danych”. Instytut wnioskował o wycofanie 6 z nich, a w przypadku 31 rozpoczął poprawianie.
Żeby było jasne, te manipulacje danymi nie były subtelne. (Nieco kwiecisty post na blogu Davida ogłaszający dowody opisuje je jako „żałośnie amatorskie i przesadne”). Wiele ze zidentyfikowanych przez niego przypadków dotyczyło wielokrotnego wykorzystywania tych samych obrazów w różnych kształtach, z różnymi etykietami oraz z kształtami obróconymi lub obróconymi w sposób niezdarny . Rozszerzone w Photoshopie lub podobnym edytorze obrazów. Wykresy gromadzenia danych w różnych dniach są w pewnym stopniu identyczne. Wyniki testu są wyraźnie kopiowane i wklejane.
Nasuwa się pytanie: zakładając, że za skopiowanymi i wklejonymi obrazami kryje się jakieś niewłaściwe postępowanie, jak ludzie śmią dopuszczać się tak rażącego oszustwa, tak otwarcie, przez tak długi czas? Ile pieniędzy z grantów zabezpieczono na podstawie sfabrykowanych danych i jak bardzo kluczowa walka z rakiem została podważona przez opublikowane nieścisłości w tych badaniach?
A może, co ważniejsze, czy to dopiero wierzchołek góry lodowej?
Anatomia skandalu związanego z danymi dotyczącymi raka
Od wielu lat badacze biomedycyny mają świadomość, że w tej dziedzinie istnieje problem fałszywych obrazów w dokumentach. W artykule z 2016 roku napisała holenderska mikrobiolog Elisabeth Beck Zeskanowano W ponad 20 000 artykułów biomedycznych szukano dowodów na taką manipulację i stwierdzono, że 3,8% artykułów miało takie oznaki, „przy czym co najmniej połowa wykazywała cechy sugerujące zamierzoną manipulację”. Co gorsza, problem wydaje się narastać. „W ciągu ostatniej dekady liczba artykułów naukowych zawierających problematyczne obrazy znacznie wzrosła” – stwierdził Beck.
Ha Skala opisująca manipulację Bada trzy rodzaje fałszywych zdjęć – przypadki, w których to samo zdjęcie zostało użyte dwukrotnie, z różnymi podpisami (co może być niewinną pomyłką) oraz przypadki, w których to samo zdjęcie zostało użyte dwukrotnie, ale w jednym przypadku zostało celowo przycięte (co wydaje się mniejsze prawdopodobieństwo, że będzie to fałszywe zdjęcie). Jest to niewinna pomyłka (niewinna pomyłka) i przypadki, w których do obrazu wklejono coś innego (co wydaje się mało prawdopodobne, aby był to niewinny błąd).
Zatem naukowcy zajmujący się biomedycyną doskonale zdawali sobie sprawę, że w tej dziedzinie występuje problem. Niektóre konkretne manipulacje podkreślone w poście na blogu Davida były dobrze znane wśród naukowców Gorący temat dyskusji na forum dyskusyjnym PubPeer. Ale choć obawy były dobrze znane, wydaje się, że przyjęła stanowisko Davida Szybkie wycofanie i wewnętrzne dochodzenie.
Błędy mają konsekwencje
Niepokojące jest to, że na jaw wychodzą przypadki takie jak Gino i Dana Farber, które wymagały zewnętrznej kontroli danych. Bycie detektywem danych jest niezwykle niewdzięczne, a nawet ryzykowne. Dawid Obecnie bezrobotny i zajmujący się raportowaniem przetwarzania danych W wolnym czasie między koncertami powiedział The Guardian.
Wielu badaczom danych grożono procesami sądowymi w celu ujawnienia oszustw związanych z danymi. „Wiele ważnych badań naukowych nie jest tworzonych przez duże instytucje, które kwestionują pewne rzeczy, ale przez takich niezależnych ludzi” – powiedział mi latem zeszłego roku prawnik specjalizujący się w sprawach o zniesławienie, Ken White. Problem polega na tym, że nie ma instytucjonalnego procesu przeglądu badań, chyba że ktoś inny naświetli problemy, a większość naukowców nie chce narażać swojej kariery na rzecz wykonywania tej frustrującej i niezbyt pięknej pracy.
Niepokojący jest także fakt, że podrabianie było tak rażące. Nie mówimy tutaj o skomplikowanym przetwarzaniu danych, ale raczej o przypadkach, w których naukowcy źle zredagowali obrazy wyników swoich eksperymentów. „Widzimy tylko mały wierzchołek oszukańczej góry lodowej – duplikację danych obrazu, ostateczność w przypadku nieudanego świata, gdy wszystkie inne sztuczki nie przyniosły pożądanego rezultatu” – napisał David w swoim oryginalnym poście na blogu. W kulturze, w której powtarzane są eksperymentalne wyniki Photoshopa, jest mało prawdopodobne, aby była to jedyna forma manipulacji.
Istnieje jeszcze jeden wspólny wątek między porażką Gino a porażką Dany-Farbera: Harvard. Pomiędzy sprawą Gino, rezygnacją prezydent Harvardu Claudine Guy, a obecnie rzekomo fałszywymi badaniami nad rakiem, reputacja Harvardu w zakresie doskonałości akademickiej niewątpliwie mocno ucierpiała.
Jednak odkrycie tych wyzwań na najbardziej prestiżowym uniwersytecie w Ameryce pomogło również zwrócić uwagę opinii publicznej na kwestię, która rozpaczliwie potrzebuje uwagi. Może żenujący Harvard przyniesie zmiany.
Wersja tej historii pierwotnie ukazała się na Przyszłość jest idealna wiadomości. Rejestracja tutaj!