„Impotente Epigonen“: Köhlmeier und Helfer mit scharfer Kritik an KI

Werke aus Vorarlberg sind Teil eines Datensatzes, der für das Training von KI-Systemen genutzt wurde. Die Reaktionen darauf fallen gegensätzlich aus, von Zustimmung bis zu klarer Kritik.
Künstliche Intelligenz wird mit gewaltigen Textmengen trainiert. Eine zentrale Rolle spielt dabei der sogenannte LibGen-Datensatz, eine Sammlung aus Millionen Büchern und wissenschaftlichen Arbeiten, die großteils ohne Zustimmung der Urheber verbreitet wurden.
Öffentlich ins Zentrum der Debatte rückte LibGen durch Recherchen und Gerichtsverfahren in den USA. Im Zuge von Klagen gegen den Facebook-Konzern Meta wurde bekannt, dass das Unternehmen unter anderem auf solche Datensammlungen zurückgegriffen hat, um seine KI-Systeme zu trainieren. Interne Dokumente und offengelegte Trainingsdaten führten dazu, dass LibGen als Quelle genannt wurde.
KI-Trainer aus Vorarlberg
Recherchen der NEUE zeigen: Auch zahlreiche Autorinnen und Autoren aus Vorarlberg sind darin vertreten, von international bekannten Schriftstellern bis hin zu spezialisierten Wissenschaftlern.
Besonders präsent ist die literarische Szene. Der Vorarlberger Autor Michael Köhlmeier scheint mit zahlreichen Werken auf, viele davon in mehreren Sprachen. Ähnliches gilt für Arno Geiger, dessen Romane international verbreitet sind. Auch Monika Helfer, Alex Beer und Robert Schneider finden sich im Datensatz wieder. Die Vielzahl an Übersetzungen zeigt, wie stark Vorarlberger Literatur global rezipiert wird und damit auch in internationalen KI-Systemen landet.
Doch der Datensatz umfasst weit mehr als Belletristik. Psychiater Reinhard Haller ist mit mehreren Fachpublikationen vertreten, ebenso Historiker Alois Niederstätter. Kommunikationswissenschaftler Markus Rhomberg scheint mit Arbeiten zu Medien und Öffentlichkeit auf. Besonders häufig vertreten ist der aus Vorarlberg stammende Wirtschaftsinformatiker Hubert Österle mit dutzenden Publikationen zu Digitalisierung und Informationssystemen.

Nutzen oder „Diebstahl“?
Wie unterschiedlich die Einschätzungen ausfallen, zeigen drei prominente Stimmen aus Vorarlberg.
Der Wirtschaftsinformatiker Hubert Österle bewertet die Nutzung wissenschaftlicher Arbeiten durch KI grundsätzlich positiv. „KI ist die derzeit höchste Form der Verwertung von öffentlich zugänglicher Information.“ Für ihn steht im Vordergrund: „Das Ziel der Publikation von Forschungsergebnissen ist, dass andere Forscher darauf aufbauen und Praktiker sie umsetzen können.“ Gerade öffentlich finanzierte Forschung soll Nutzen erzeugen und nicht „in einem Bücherregal verstauben“. Kritik an der Nutzung durch KI-Plattformen bezeichnet er als „klassisches Neidargument.“

Der Psychiater Reinhard Haller sieht die Entwicklung differenziert. „Es war mir nicht bekannt und es hat mich niemand informiert und gefragt. Grundsätzlich sehe ich das ambivalent: Einerseits werden möglicherweise Urheberrechte verletzt. Andererseits ist es erfreulich, wenn meine Arbeiten gut genug und geeignet für ein solches Training sind.“ Gleichzeitig verweist Haller auf die wachsende Bedeutung von Künstlicher Intelligenz in der Medizin: „Ansonsten knüpfe ich in der medizinischen Forschung und therapeutischen Arbeit grosse Hoffnungen an die KI, etwa in der Diagnostik, in der Entwicklung neuer Medikamente, sogar in der psychotherapeutischen Beratung.“
KI werde den Menschen nicht ersetzen, aber eine zentrale Rolle einnehmen: „KI wird zwar die Ärzte nicht ersetzen, aber die Ärzte werden auf KI nicht mehr verzichten können“, ist Haller überzeugt.
Ganz anders äußern sich die Schriftsteller Michael Köhlmeier und Monika Helfer: „Alle Autoren, die wir kennen, sind empört über diesen Diebstahl.“ Und dass ihre Werke ohne Zustimmung in solchen Datensätzen auftauchen, sei „nichts anderes als Diebstahl.“
„Wir denken, das in Gesetzesform gegossene Urheberrecht sollte immer und überall und in jedem Zusammenhang gelten.“ Den Einsatz von KI in der Literatur lehnen sie ab: „Schreiben ist eine so schöne Tätigkeit, dass es uns nicht einfallen würde, sie einer Maschine zu übertragen. Ein Autor, der das möchte, der hat seinen Beruf verfehlt.“
„Impotente Epigonen“
Besonders scharf fällt ihre Kritik an jenen aus, die KI zur Texterstellung nutzen: „Impotente Epigonen, die ihren Mangel an Einbildungskraft mithilfe einer Maschine kaschieren wollen, verachten wir“, stellen Helfer und Köhlmeier unimssverständlich klar. Für Leser fordern sie eine klare Kennzeichnung: „Die Buchhändler sollten ein eigenes Regal in ihrem Laden aufstellen, in dem solche Bücher stehen.“
Zur Rolle von Künstlicher Intelligenz in der Kunst halten sie fest: „KI kann auf vielen Gebieten Gutes leisten, in der Kunst, in der Musik, in der Literatur ist sie eine Absurdität, weil sie den Sinn derselben auslöscht.“
Umstrittene Datengrundlage
Der LibGen-Datensatz steht seit Jahren in der Kritik. Er basiert großteils auf urheberrechtlich geschützten Inhalten, die ohne Zustimmung verbreitet wurden. Gleichzeitig gilt er als eine der wichtigsten Textquellen für das Training moderner KI-Systeme.
Neben rechtlichen Fragen gibt es auch Probleme bei der Datenqualität: Werke erscheinen teils mehrfach, in unterschiedlichen Sprachversionen oder mit uneinheitlichen Angaben zu Autor, Erscheinungsjahr oder Verlag, was eine eindeutige Zuordnung erschwert.
Gleichzeitig zeigt sich an der Zusammensetzung des Datensatzes, wie breit die Grundlage für KI-Systeme ist. Literarische Werke stehen neben wissenschaftlichen Fachartikeln, populäre Bücher neben hochspezialisierten Studien. Diese Mischung beeinflusst auch, wie KI Inhalte verarbeitet, gewichtet und später wieder ausgibt.
Die Beispiele aus Vorarlberg zeigen, wie breit die Basis solcher Systeme ist: von literarischen Werken über historische Forschung bis hin zu wissenschaftlichen Analysen. Gleichzeitig machen sie deutlich, wie unterschiedlich die Bewertung ausfällt. Zwischen dem Anspruch, Wissen möglichst frei verfügbar zu machen, und dem Schutz geistigen Eigentums verläuft eine Konfliktlinie, die durch den Einsatz von Künstlicher Intelligenz weiter an Schärfe gewinnt.