Heim
AI-generiertes Papier passt Peer Review, Sakana behauptet, jedoch sind Details nuanciert
Die japanische KI-Startup Sakana hat kürzlich für Aufsehen gesorgt, indem sie behauptete, dass ihr KI-System, The AI Scientist-v2, eine der ersten peer-reviewed wissenschaftlichen Publikationen erstellt hat. Es gibt jedoch einige wichtige Details zu beachten, bevor wir uns zu sehr begeistern.
Die Debatte über die Rolle von KI in der Wissenschaft wird immer heißer. Einige Forscher glauben, dass KI noch nicht bereit ist, ein „Mitwissenschaftler“ zu sein, während andere Potenzial sehen, aber erkennen, dass wir uns noch in den Anfängen befinden. Sakana gehört zur letzteren Gruppe.
Das Unternehmen nutzte The AI Scientist-v2, um einen Artikel zu erstellen, der bei einem Workshop auf der ICLR, einer angesehenen KI-Konferenz, eingereicht wurde. Sakana arbeitete mit der University of British Columbia und der University of Oxford zusammen, um drei KI-generierte Artikel für diesen Workshop einzureichen. Die KI übernahm alles, von Hypothesen über Experimente, Code, Datenanalyse, Visualisierungen bis hin zu den Titeln.
„Wir haben Forschungsideen generiert, indem wir der KI den Workshop-Abstract und die Beschreibung zur Verfügung gestellt haben“, sagte Robert Lange, Forschungsmitarbeiter und Gründungsmitglied bei Sakana, per E-Mail gegenüber TechCrunch. „Dies stellte sicher, dass die generierten Artikel thematisch passend und geeignete Einreichungen waren.“
Einer der drei Artikel wurde vom ICLR-Workshop angenommen. Er konzentrierte sich auf die Kritik an Trainingstechniken für KI-Modelle. Sakana zog den Artikel jedoch zurück, bevor er veröffentlicht werden konnte, unter Berufung auf Transparenz und Respekt vor den ICLR-Konventionen.

Ein Auszug aus Sakanas KI-generiertem ArtikelBildnachweis: Sakana „Der akzeptierte Artikel führt eine neue, vielversprechende Methode zum Training neuronaler Netze ein und zeigt, dass es noch empirische Herausforderungen gibt“, sagte Lange. „Er liefert einen interessanten Datenpunkt, um weitere wissenschaftliche Untersuchungen anzuregen.“Aber lassen wir uns noch nicht zu sehr mitreißen. Sakana gab in ihrem Blogbeitrag zu, dass ihre KI einige „peinliche“ Zitierfehler machte, wie etwa eine Methode einem Artikel von 2016 zuzuschreiben statt dem ursprünglichen Werk von 1997.
Außerdem wurde der Artikel nicht so gründlich geprüft wie andere peer-reviewed Publikationen. Er wurde nach der ersten Begutachtung zurückgezogen, sodass er keine „Meta-Begutachtung“ von den Workshop-Organisatoren erhielt, die ihn möglicherweise abgelehnt hätten.
Ein weiterer Punkt, den man im Auge behalten sollte, ist, dass Konferenz-Workshops oft höhere Akzeptanzraten haben als der Hauptkonferenztrack. Sakana erwähnte dies in ihrem Blogbeitrag und stellte fest, dass keiner ihrer KI-generierten Studien ihren internen Standards für den ICLR-Konferenztrack entsprach.
Matthew Guzdial, ein KI-Forscher und Assistenzprofessor an der University of Alberta, nannte die Ergebnisse von Sakana „etwas irreführend“.
„Die Leute bei Sakana haben die Artikel aus einer Anzahl generierter ausgewählt, was bedeutet, dass sie menschliches Urteilsvermögen nutzten, um Ausgaben auszuwählen, von denen sie dachten, dass sie angenommen werden könnten“, sagte er per E-Mail. „Das zeigt meiner Meinung nach, dass Menschen plus KI effektiv sein können, nicht dass KI allein wissenschaftlichen Fortschritt erzeugen kann.“
Mike Cook, ein Forschungsstipendiat am King's College London, spezialisiert auf KI, stellte die Strenge der Gutachter und des Workshops infrage.
„Neue Workshops wie dieser werden oft von jüngeren Forschern begutachtet“, sagte er gegenüber TechCrunch. „Es ist auch erwähnenswert, dass dieser Workshop sich mit negativen Ergebnissen und Schwierigkeiten befasst – was großartig ist, ich habe schon einmal einen ähnlichen Workshop geleitet – aber es ist wohl einfacher, eine KI dazu zu bringen, über einen Misserfolg überzeugend zu schreiben.“
Cook war nicht überrascht, dass eine KI die Peer-Review bestehen konnte, da KI gut darin ist, menschenähnliche Texte zu schreiben. Er wies darauf hin, dass teilweise KI-generierte Artikel, die die Begutachtung von Fachzeitschriften bestehen, nicht neu sind und ethische Fragen für die wissenschaftliche Gemeinschaft aufwerfen.
Die technischen Probleme von KI, wie ihre Neigung zu „Halluzinationen“, machen viele Wissenschaftler vorsichtig, sie für ernsthafte Arbeiten zu nutzen. Es gibt auch die Befürchtung, dass KI nur Rauschen in die wissenschaftliche Literatur einbringen könnte, anstatt Wissen voranzutreiben.
„Wir müssen uns fragen, ob [Sakanas] Ergebnis darauf hinweist, wie gut KI Experimente entwirft und durchführt, oder ob es darum geht, wie gut sie Ideen an Menschen verkauft – wovon wir wissen, dass KI bereits hervorragend darin ist“, sagte Cook. „Es gibt einen Unterschied zwischen dem Bestehen der Peer-Review und dem Beitrag von Wissen zu einem Fachgebiet.“
Zum Verdienst von Sakana sei gesagt, dass sie nicht behaupten, ihre KI könne bahnbrechende oder besonders neuartige wissenschaftliche Arbeiten produzieren. Ihr Ziel war es, „die Qualität KI-generierter Forschung zu untersuchen“ und die Notwendigkeit von „Normen für KI-generierte Wissenschaft“ hervorzuheben.
„Es gibt schwierige Fragen, ob [KI-generierte] Wissenschaft zunächst nach ihren eigenen Meriten beurteilt werden sollte, um Vorurteile dagegen zu vermeiden“, schrieb das Unternehmen. „In Zukunft werden wir weiterhin Meinungen mit der Forschungsgemeinschaft über den Stand dieser Technologie austauschen, um sicherzustellen, dass sie sich in Zukunft nicht zu einer Situation entwickelt, in der ihr einziger Zweck darin besteht, die Peer-Review zu bestehen, wodurch die Bedeutung des wissenschaftlichen Peer-Review-Prozesses erheblich untergraben wird.“
Verwandter Artikel
Google Fotos erweckt den legendären Kleiderschrank aus „Clueless“ mithilfe von KI zum Leben
Google Fotos hat am Mittwoch eine neue KI-gestützte Funktion angekündigt, die Fotos Ihrer Kleidung bald in einen digitalen Kleiderschrank verwandeln wird, sodass Sie neue Outfit-Kombinationen zusammen
Notion verwandelt seinen Arbeitsbereich in eine Drehscheibe für KI-Agenten
Notion, der Anbieter von Produktivitätssoftware, tritt in das Zeitalter der agentenbasierten Lösungen ein.Während einer live gestreamten Produktankündigung am Mittwoch stellte Notion – bekannt für sei
ElevenLabs gibt BlackRock, Jamie Foxx und Eva Longoria als neue Investoren bekannt
Das Sprach-KI-Unternehmen ElevenLabs hat weitere Investoren für seine im Februar angekündigte Serie-D-Finanzierungsrunde in Höhe von 500 Millionen US-Dollar bekannt gegeben. Dazu gehören institutionel
Empfehlungen zu verwandten Spezialthemen
Kommentare (44)
この記事を読んで、AIが科学論文を書けるようになるって本当にすごいけど、ちょっと怖くない?🤔 査読をパスしたって言うけど、人間の研究者が書いたものとどう見分けるんだろう。AIが科学の世界を変えるのは時間の問題かもね。でも倫理的な問題はどうするの?
Esse relato sobre publicação científica gerada por IA é fascinante! Fico imaginando como isso pode mudar o processo de pesquisa em países com menos investimento em ciência. Será que sistemas como o 'AI Scientist' vão democratizar a produção acadêmica ou só criar mais barulho? 🤔 E aquela revisão por pares, será que já dá pra confiar? Fica a reflexão.
Honestly, first human artists' jobs got debated, now it's scientists? 😅 This feels like a big step, but reading that 'details are nuanced' makes me pause. Is it the AI's idea, or just really advanced data re-packaging? The ethics here are a minefield.
Also ein AI-generierter wissenschaftlicher Artikel, der peer-reviewed wurde? 🤔 Das ist schon heftig, aber ich hab auch Bedenken. Was bedeutet das für die Zukunft der Forschung? Verlieren echte Wissenschaftler jetzt ihre Jobs? Die Ethik-Debatte wird bestimmt heiß werden.
While the idea of AI-generated papers is cool, I'm a bit worried about where we draw the line for originality in research. If this becomes common, how do we trust what's published? 😅 Still, fascinating to see how fast things are moving!
Die japanische KI-Startup Sakana hat kürzlich für Aufsehen gesorgt, indem sie behauptete, dass ihr KI-System, The AI Scientist-v2, eine der ersten peer-reviewed wissenschaftlichen Publikationen erstellt hat. Es gibt jedoch einige wichtige Details zu beachten, bevor wir uns zu sehr begeistern.
Die Debatte über die Rolle von KI in der Wissenschaft wird immer heißer. Einige Forscher glauben, dass KI noch nicht bereit ist, ein „Mitwissenschaftler“ zu sein, während andere Potenzial sehen, aber erkennen, dass wir uns noch in den Anfängen befinden. Sakana gehört zur letzteren Gruppe.
Das Unternehmen nutzte The AI Scientist-v2, um einen Artikel zu erstellen, der bei einem Workshop auf der ICLR, einer angesehenen KI-Konferenz, eingereicht wurde. Sakana arbeitete mit der University of British Columbia und der University of Oxford zusammen, um drei KI-generierte Artikel für diesen Workshop einzureichen. Die KI übernahm alles, von Hypothesen über Experimente, Code, Datenanalyse, Visualisierungen bis hin zu den Titeln.
„Wir haben Forschungsideen generiert, indem wir der KI den Workshop-Abstract und die Beschreibung zur Verfügung gestellt haben“, sagte Robert Lange, Forschungsmitarbeiter und Gründungsmitglied bei Sakana, per E-Mail gegenüber TechCrunch. „Dies stellte sicher, dass die generierten Artikel thematisch passend und geeignete Einreichungen waren.“
Einer der drei Artikel wurde vom ICLR-Workshop angenommen. Er konzentrierte sich auf die Kritik an Trainingstechniken für KI-Modelle. Sakana zog den Artikel jedoch zurück, bevor er veröffentlicht werden konnte, unter Berufung auf Transparenz und Respekt vor den ICLR-Konventionen.

Aber lassen wir uns noch nicht zu sehr mitreißen. Sakana gab in ihrem Blogbeitrag zu, dass ihre KI einige „peinliche“ Zitierfehler machte, wie etwa eine Methode einem Artikel von 2016 zuzuschreiben statt dem ursprünglichen Werk von 1997.
Außerdem wurde der Artikel nicht so gründlich geprüft wie andere peer-reviewed Publikationen. Er wurde nach der ersten Begutachtung zurückgezogen, sodass er keine „Meta-Begutachtung“ von den Workshop-Organisatoren erhielt, die ihn möglicherweise abgelehnt hätten.
Ein weiterer Punkt, den man im Auge behalten sollte, ist, dass Konferenz-Workshops oft höhere Akzeptanzraten haben als der Hauptkonferenztrack. Sakana erwähnte dies in ihrem Blogbeitrag und stellte fest, dass keiner ihrer KI-generierten Studien ihren internen Standards für den ICLR-Konferenztrack entsprach.
Matthew Guzdial, ein KI-Forscher und Assistenzprofessor an der University of Alberta, nannte die Ergebnisse von Sakana „etwas irreführend“.
„Die Leute bei Sakana haben die Artikel aus einer Anzahl generierter ausgewählt, was bedeutet, dass sie menschliches Urteilsvermögen nutzten, um Ausgaben auszuwählen, von denen sie dachten, dass sie angenommen werden könnten“, sagte er per E-Mail. „Das zeigt meiner Meinung nach, dass Menschen plus KI effektiv sein können, nicht dass KI allein wissenschaftlichen Fortschritt erzeugen kann.“
Mike Cook, ein Forschungsstipendiat am King's College London, spezialisiert auf KI, stellte die Strenge der Gutachter und des Workshops infrage.
„Neue Workshops wie dieser werden oft von jüngeren Forschern begutachtet“, sagte er gegenüber TechCrunch. „Es ist auch erwähnenswert, dass dieser Workshop sich mit negativen Ergebnissen und Schwierigkeiten befasst – was großartig ist, ich habe schon einmal einen ähnlichen Workshop geleitet – aber es ist wohl einfacher, eine KI dazu zu bringen, über einen Misserfolg überzeugend zu schreiben.“
Cook war nicht überrascht, dass eine KI die Peer-Review bestehen konnte, da KI gut darin ist, menschenähnliche Texte zu schreiben. Er wies darauf hin, dass teilweise KI-generierte Artikel, die die Begutachtung von Fachzeitschriften bestehen, nicht neu sind und ethische Fragen für die wissenschaftliche Gemeinschaft aufwerfen.
Die technischen Probleme von KI, wie ihre Neigung zu „Halluzinationen“, machen viele Wissenschaftler vorsichtig, sie für ernsthafte Arbeiten zu nutzen. Es gibt auch die Befürchtung, dass KI nur Rauschen in die wissenschaftliche Literatur einbringen könnte, anstatt Wissen voranzutreiben.
„Wir müssen uns fragen, ob [Sakanas] Ergebnis darauf hinweist, wie gut KI Experimente entwirft und durchführt, oder ob es darum geht, wie gut sie Ideen an Menschen verkauft – wovon wir wissen, dass KI bereits hervorragend darin ist“, sagte Cook. „Es gibt einen Unterschied zwischen dem Bestehen der Peer-Review und dem Beitrag von Wissen zu einem Fachgebiet.“
Zum Verdienst von Sakana sei gesagt, dass sie nicht behaupten, ihre KI könne bahnbrechende oder besonders neuartige wissenschaftliche Arbeiten produzieren. Ihr Ziel war es, „die Qualität KI-generierter Forschung zu untersuchen“ und die Notwendigkeit von „Normen für KI-generierte Wissenschaft“ hervorzuheben.
„Es gibt schwierige Fragen, ob [KI-generierte] Wissenschaft zunächst nach ihren eigenen Meriten beurteilt werden sollte, um Vorurteile dagegen zu vermeiden“, schrieb das Unternehmen. „In Zukunft werden wir weiterhin Meinungen mit der Forschungsgemeinschaft über den Stand dieser Technologie austauschen, um sicherzustellen, dass sie sich in Zukunft nicht zu einer Situation entwickelt, in der ihr einziger Zweck darin besteht, die Peer-Review zu bestehen, wodurch die Bedeutung des wissenschaftlichen Peer-Review-Prozesses erheblich untergraben wird.“
Google Fotos erweckt den legendären Kleiderschrank aus „Clueless“ mithilfe von KI zum Leben
Google Fotos hat am Mittwoch eine neue KI-gestützte Funktion angekündigt, die Fotos Ihrer Kleidung bald in einen digitalen Kleiderschrank verwandeln wird, sodass Sie neue Outfit-Kombinationen zusammen
Notion verwandelt seinen Arbeitsbereich in eine Drehscheibe für KI-Agenten
Notion, der Anbieter von Produktivitätssoftware, tritt in das Zeitalter der agentenbasierten Lösungen ein.Während einer live gestreamten Produktankündigung am Mittwoch stellte Notion – bekannt für sei
ElevenLabs gibt BlackRock, Jamie Foxx und Eva Longoria als neue Investoren bekannt
Das Sprach-KI-Unternehmen ElevenLabs hat weitere Investoren für seine im Februar angekündigte Serie-D-Finanzierungsrunde in Höhe von 500 Millionen US-Dollar bekannt gegeben. Dazu gehören institutionel
この記事を読んで、AIが科学論文を書けるようになるって本当にすごいけど、ちょっと怖くない?🤔 査読をパスしたって言うけど、人間の研究者が書いたものとどう見分けるんだろう。AIが科学の世界を変えるのは時間の問題かもね。でも倫理的な問題はどうするの?
Esse relato sobre publicação científica gerada por IA é fascinante! Fico imaginando como isso pode mudar o processo de pesquisa em países com menos investimento em ciência. Será que sistemas como o 'AI Scientist' vão democratizar a produção acadêmica ou só criar mais barulho? 🤔 E aquela revisão por pares, será que já dá pra confiar? Fica a reflexão.
Honestly, first human artists' jobs got debated, now it's scientists? 😅 This feels like a big step, but reading that 'details are nuanced' makes me pause. Is it the AI's idea, or just really advanced data re-packaging? The ethics here are a minefield.
Also ein AI-generierter wissenschaftlicher Artikel, der peer-reviewed wurde? 🤔 Das ist schon heftig, aber ich hab auch Bedenken. Was bedeutet das für die Zukunft der Forschung? Verlieren echte Wissenschaftler jetzt ihre Jobs? Die Ethik-Debatte wird bestimmt heiß werden.
While the idea of AI-generated papers is cool, I'm a bit worried about where we draw the line for originality in research. If this becomes common, how do we trust what's published? 😅 Still, fascinating to see how fast things are moving!











