Maschinelles Lesen

Kann der Computer einen Bestseller vorhersagen?

Gründerin Gesa Schöning.

Gründerin Gesa Schöning.

Foto: Euroforum

Ein Hamburger Start-up hat ein Programm entwickelt, das Literatur-Hits erkennt. Trefferquote soll bei 78 Prozent liegen.

Hamburg.  Die unaufgefordert eingesandten Manuskripte türmen sich in den Regalen der Verlage. Nun gibt es eine Software, die den professionellen Prüfern und Lektoren die Arbeit abnehmen könnte. Ein Hamburger Unternehmen hat einen Algorithmus entwickelt, der die Verkaufschancen von Büchern beziffert. Die Software könne einen Bestseller mit einer Trefferquote von 78 Prozent prognostizieren, sagt Gesa Schöning, die gemeinsam mit dem Mathematiker Ralf Winkler „Qualifiction“ gegründet hat. Mit ihrem Start-up wollen sie künftig Verlage bei der Manuskriptauswahl unterstützen.

Sie haben, sagen Sie, mit einem Computerprogramm die Bestseller-DNA entschlüsselt. Wie das?

Gesa Schöning: Wir haben eine Software entwickelt, die sich der Methoden des maschinellen Lernens und des Deep Learnings bedient. Das bedeutet, dass die Software zunächst einmal lernen muss, was ein erfolgreicher Text ist – und welcher weniger erfolgreich wurde. Dafür haben wir viele Tausend Texte in die Software gegeben und unsere Erkenntnisse darüber, wie diese Texte beim Leser ankamen. Die Software erkennt dann Muster.

Und kann dieses Muster anschließend auf andere Texte übertragen?

Schöning: Genau. Aber „Schema F“, im Sinne von „A plus B ist gleich C“, ist das nicht. Mit der Software werden viele Hundert Datenpunkte miteinander verrechnet, um Textmerkmale freizulegen. Zum Beispiel die Stimmungskurve: Wie düster oder heiter ist das Werk, gibt es ein Happy End? Oder die Thematik: Worum geht es in dem Werk, wie innovativ ist das Thema, welchem Genre lässt es sich zuordnen? Den Stil: Wie anspruchsvoll ist die Sprache, wie die Lesbarkeit des Textes? Und die Figurenkonstellationen: Gibt es etwa starke weibliche Hauptfiguren, Dreiecksbeziehungen, einen Fokus auf wenige, ausgearbeitete Figuren oder eine große Masse an Einzelfiguren?

Woher stammen die Daten, mit denen das Programm gefüttert wurde?

Schöning: Die Verlage, mit denen wir zusammenarbeiten, haben uns schon zu Beginn viele Texte übermittelt, mit denen wir die Software trainieren konnten. Die Software ist nie „fertig“, da sich Leseverhalten und Trends in der Buchbranche verändern. Daher ist es wichtig, immer die neuesten Entwicklungen mitaufzunehmen, stets die aktuellen literarischen Beiträge miteinfließen zu lassen und die Software immer wieder neu zu trainieren.

Man darf seine Zweifel haben, ob der Computer literarische Qualität erkennt, oder?

Schöning: Ist das eine rhetorische Frage? (lacht) Die Software erkennt das, was man ihr beibringt. Wir hätten sie auch auf die Texte der Nobelpreisträger hin trainieren können, aber Tatsache ist doch, dass wir damit kein Problem lösen würden. Bestseller müssen nicht immer einer Qualität im Sinne des literarischen Feuilletons entsprechen, aber sie müssen zumindest der Kombination aus handwerklichem Geschick und, auch das, einem Funken künstlerischen Regelbruchs entspringen. Ein jeweils eigener Zugang schadet einem Text und seinen Erfolgschancen mitunter gar nicht, eher im Gegenteil. Welche Schwerpunkte die Verlage setzen, wenn sie die Software als Filter für eingereichte Texte nutzen, ist übrigens ihnen überlassen und kann auch ganz anderen Kriterien entsprechen als dem des reinen Erfolgspotenzials.

Hätte das Programm etwa das Potenzial der aktuellen Bestseller von Dörte Hansen und Michel Houellebecq tatsächlich erkannt?

Schöning: Dörte Hansen hat sehr gut abgeschnitten und ist von der Software klar als Bestseller identifiziert worden. Den neuen Houellebecq haben wir bisher nicht getestet; ich denke, dafür benötigt es auch keine Software, um dessen Erfolg vorherzusehen. Unsere Bestseller-Trefferquote liegt derzeit bei 78 Prozent. 100 Prozent wird es wohl nie geben, dafür hängen Bucherfolge und -misserfolge auch noch zu sehr von anderen Faktoren ab, die jenseits einer rein literarischen Betrachtung liegen. Aber die Quote ist sehr gut, wenn man bedenkt, dass derzeit 99 Prozent der verlegten Bücher keine Bestseller werden, die Trefferquote also aktuell ein Prozent entspricht.

Als Literaturliebhaberin dürfte Sie die Berechenbarkeit von Literatur doch zumindest ein bisschen schmerzen, oder nicht?

Schöning: Noch eine rhetorische Frage! Als Literaturliebhaberin freue ich mich, viel schöne Literatur um mich zu haben und dazu beitragen zu dürfen, unbekannte Autoren und unerkanntes Potenzial zu entdecken.

Das heißt, Ihre Software soll nicht nur Manuskripte aussortieren, sondern Autoren überhaupt erst den Weg ebnen?

Schöning: Warum nicht? Ich bin überzeugt davon, dass die Software eine Bereicherung für die Leser und den Buchmarkt sein wird, sonst würde ich dieses Unternehmen gar nicht betreiben. Literatur – und damit meine ich gute Literatur – liegt mir am Herzen. Ich bin aber auch geprägt von Yuval Noah Harari und der Ansicht, dass menschliche Emotionen biochemische Prozesse sind. Mit anderen Worten: berechenbar. Das ändert dennoch nicht die Realität unserer Empfindungen, weder beim Lesen noch im sonstigen Leben. Literatur kann sehr wohl berechenbar und zauberhaft zugleich sein. Berechenbar für die Maschine. Und zauberhaft für den empfindenden Leser.

Verlage dürften an Ihrer Software grundsätzlich interessiert sein – wie ist bisher die Resonanz?

Schöning: Grundsätzlich gut. Wir arbeiten mit einigen namhaften deutschen Publikumsverlagen zusammen und sind in der Buchbranche mittlerweile sehr bekannt. Aber es ist wie mit einer Pferdekutsche auf der Autobahn zu fahren. Die Prozesse dauern oft sehr lange, und das ist nicht nur der Neuartigkeit unseres Unterfangens geschuldet.

Sondern?

Schöning: Es herrscht teilweise eine abwartende Haltung, ob der Knall, der bereits die klassische Film- und Musikbranche erschüttert hat, an der Buchbranche nicht doch vorüberzieht. Aber Veränderung muss ja nichts Schlechtes sein. Neue Formate können sich besser dem Wandel der Zeit anpassen und neue Lesergruppen ansprechen. Es gibt Gründe, warum innovative Unternehmen sich nicht als Erstes auf die deutsche Buchbranche stürzen.

Eine andere Zielgruppe könnten Autoren sein. Stehen diesen Ihre Dienste auch zur Verfügung?

Schöning: Wir starten gerade eine Version für Autoren, weil die Nachfrage wirklich groß zu sein scheint. Autoren befinden sich ja sozusagen auf der anderen Seite des Problems, wie ein erfolgreicher Text aussehen sollte. Die Texte, die Verlage derzeit nicht schaffen zu lesen, weil die Masse zu groß ist, stammen von Autoren, die teilweise Jahre damit verbracht haben, ihre Geschichten aufzuschreiben.

Die könnten nun die Software als „Lektor“ verwenden ...

Schöning: ... diese Autoren möchten zumindest gerne wissen, ob die Texte dennoch Erfolgspotenzial haben, auch wenn sie nie ein Feedback von Verlagen erhalten haben oder immer nur abgelehnt wurden. Oder ob sie in anderen Bereichen, wie zum Beispiel im Selfpublishing, ihre Zielgruppen vielleicht viel besser adressieren könnten. Ab der Leipziger Buchmesse starten wir eine Beta-Version für Autoren und arbeiten zudem mit einer Lektorin zusammen, die den Autoren auch Tipps und Unterstützung anbietet.