Wie verändert Künstliche Intelligenz (KI) die Medien?

27. Oktober 2017, mit Joel KaczmarekKatja Nettesheim

Dieses Transkript wurde maschinell erstellt. Wenn dir ein Fehler auffällt, schreib uns gerne zu diesem unter redaktion@digitalkompakt.de.

Joel Kaczmarek: Hallo und herzlich willkommen zu einem neuen Mediendigital-Podcast von Digitalkompakt. Mein Name ist Joel Kaczmarek und ich darf hier wieder mit den Großen spielen. Also es ging hier schon fleißiges Pingpong hin und her vor unserem Gespräch. Wir machen nämlich einen Crossover. Schon das zweite Mal mit dem guten Johannes. Der ist irgendwie der Crossover-Man. Der kann die Klappe nicht halten. Der muss auch über Tech sozusagen mal hinausgehen, was ich sehr gut finde. Spaß beiseite. Also auf der Rechten von mir sitzt wieder die gute Katja. Guten Morgen.

Katja Nettesheim: Guten Morgen.

Joel Kaczmarek: Und auf der Linken, wie gesagt, Johannes Schaback aus unserem Tech-Podcast. Hallo Johannes. Hi.

Johannes Schaback: Hallo ihr beiden.

Joel Kaczmarek: Ich sage nochmal ganz kurz einen Satz zu dir, falls jemand unseren Tech-Podcast noch nicht gehört hat, was du machst, weil das ja auch ein bisschen ein Qualifikationsmerkmal für unser Thema heute ist.

Johannes Schaback: Ja, ich bin Vollblut-Techie. Ich bin ein sehr begeisterter Verfolger der AI-Branche, also insbesondere der künstlichen Intelligenz, sagt man ja auf Deutsch. Ich bin selber Gründer und Geschäftsführer von Visual Meta. Das ist die Firma, die hinter ladenzeile.de steht. Ich habe das Unternehmen vor neun Jahren gegründet, kümmere mich dort insbesondere um alle technischen Belange. Wir setzen dort sehr, sehr viel künstliche Intelligenz ein, sodass ich an der Stelle auch einen gewissen Praxisbezug habe zu dem Thema und bin nebenbei in der Gruppe SB21, Saarbrücker 21 Business Angel. Und wir versuchen, junge Unternehmen zu unterstützen, insbesondere aus Berlin, ihren Weg zu finden, ihren Erfolg zu finden. Zum Teil mit Geld, aber insbesondere auch eben mit ganz konkretem Know-how. Und ja, ich glaube, das bin so ich in 16 Sätzen.

Joel Kaczmarek: Ich würde ja behaupten, du bist der Hidden Champion der deutschen Tech-Szene. Also man kriegt ja mit in der Presse, dein Name wird langsam doch mal auch in Kreisen. Weißt du, bei den Großmedien kommst du immer ganz als letztes an und ich finde, da gehörst du eigentlich hin. Weil, was ich so mitgeschnitten habe, früher bei Rocket hast du ja auch irgendwie ganz viele Tech-Themen evaluiert. Jetzt bei Saarbrücker 21 siehst du super viel. Bei Ladenzeile denkt man jetzt auch gar nicht, was da manchmal als Antec hinterstehen kann. Also ich kenne dich ja sehr, sehr gut. Du musst jetzt mal eine Lanze für dich brechen. Nichtsdestotrotz bist du ja auch auf Kongressen. Und einer davon war ja dieser schöne BDZV-Zeitungskongress. Da muss Katja gleich mal ein, zwei Sätze zu sagen. Wo ja ein Thema begonnen hat, was wir heute mal fortsetzen wollen. Man sieht, auch Kongresse ziehen sich bis in die reale Welt fort. Und wir freuen uns natürlich, dass man so ein modernes Medium wie uns dafür auch ausgewählt hat. Also unser Thema heute soll sein KI in den Medien. Künstliche Intelligenz oder AI wird sicherlich auch mal so ein Stichwort sein. Also Artificial Intelligence, gleicher Begriff. So, und du hast ja so ein bisschen als Claim gehabt, das ist so wie Digitalisierung und Steroids. Ja, da wollen wir heute drüber reden. Und trotzdem sagst du auch so, ja, man muss die Kirche aber auch ein Stück weit im Dorf lassen. Das heißt, wir wollen so versuchen zu verorten. Wir machen mal einen kleinen Exkurs, was ist KI eigentlich genau? Und dann gehen wir mal auf Anwendungsfälle im Journalismus und du sagst mal, was da eigentlich so geht und wie man das einordnen muss. So, und wie schon angedroht, muss Katja jetzt mal einen Satz zu diesem glorreichen Event sagen, wo du ja auch mit ihm auf der Bühne warst. Also ihr zwei habt das Gespräch schon mal offline begonnen und wir legen jetzt online fort.

Katja Nettesheim: So ist es, genau. Also Johannes und ich, wir haben ein paar Gemeinsamkeiten. Die eine ist zum Beispiel, dass ich drei Jahre in der Saarbrücke 21 mein Büro hatte. Aber die zweite, und das ist die, auf die es jetzt heute ankommt, ist, dass wir vor drei Wochen in Stuttgart beim Zeitungskongress der deutschen Zeitungsverleger eine ganz spannende Diskussion angefangen haben. Der Johannes hat da eine super Präsentation gehalten, wo er sehr verständlich erläutert hat, was KI eigentlich ist. Und das hat er so gut und so leidenschaftlich gemacht, dass wir nicht mehr so viel Zeit hatten, darüber zu diskutieren, was das jetzt eigentlich für die Medienbranche bedeutet. Und dann habe ich gesagt, das ist so spannend, das ist so ein bisschen unterbrochen jetzt hier und das würden wir gerne fortsetzen. Und insbesondere, weil der Johannes ja tatsächlich schon die Bedeutung von KI deutlich macht, eben in diesem Zitat Digitalisierung auf Steroiden, aber gleichzeitig nicht dazu neigt, da einen großen Hype draus zu machen.

Joel Kaczmarek: Kleiner Gossip-Anteil übrigens, dritte Gemeinsamkeit für euch, eure Kinder gehen in den gleichen Kindergarten, darf man auch mal sagen.

Katja Nettesheim: Das ist richtig, wir sehen uns auch beim Hausschuhe anziehen.

Joel Kaczmarek: Ich bin hier für die wertvollen Einflechtungen, man merkt es.

Katja Nettesheim: Genau, und wenn wir jetzt an dem Punkt sind, du hast es ja gerade schon angedeutet, Ihr macht auch sonst gemeinsam Podcasts zum Thema KI, wo ihr wirklich tief in die technischen Details geht. Aber jetzt nochmal ganz kurz, damit man diesen Podcast auch isoliert hören kann. Johannes, in jeweils einem Satz. Was ist KI? Was ist Machine Learning? Was sind neuronale Netzwerke?

Joel Kaczmarek: Kannst du auch zwei nehmen? Das ist schon ein hartes Brett.

Katja Nettesheim: Nein, wir haben eine Herausforderung.

Johannes Schaback: Ich mache ja immer so ein bisschen lange Pausen, die dann nachher rausgeschnitten werden, weil ich erstmal lange überlegen muss. Also zehn Minuten. Nee, das können wir natürlich rausspannen. Aber der Punkt bei KI ist, dass es letztendlich Algorithmen sind. Und es geht um Algorithmen, die selbst lernen und sich selbst verbessern. Und deswegen auf Ereignisse oder auf Signale aus der Umwelt reagieren können, die sie so vorher noch nicht gesehen haben. Ein Beispiel ist Bildverarbeitung. Also wenn man an selbstfahrende Autos denkt, dann ist natürlich jedes Bild, was so eine Kamera in einem selbstfahrenden Auto aufnimmt, weil andere Augen in Anführungsstrichen hat natürlich ein selbstfahrendes Auto nicht, immer anders. Und ein künstlicher Intelligenz Algorithmus kann diese ganzen Bilder verarbeiten und daraus Entscheidungen treffen und sich zum Teil auch selbst verbessern. Also ganz konkret ist letztendlich künstliche Intelligenz Software. Das sind Algorithmen und diese Algorithmen können sich selbst verbessern auf Basis von Daten. Und wenn man jetzt erstmal nur diese große, große, große Gruppe von Algorithmen sich anschaut, die in irgendeiner Weise künstliche Intelligenz genannt werden, dann sind das teilweise Algorithmen, die aus den 90ern kommen, also sogenannte Expertensysteme, das heißt irgendwelche Datenbanken, wo Regeln drin sind, beispielsweise Diagnosen von Ärzten, die über Jahrzehnte hinweg gesammelt wurden und und die man dann einfach wieder abrufen kann. Das ist auch schon ein Stück weit künstliche Intelligenz, Expertensysteme, obwohl man das ja als relativ blöden Algorithmus bezeichnen würde. Der guckt ja nur vorher gespeichertes Wissen wieder an. Gibt es eben auch eine Untergruppe unter diesen KI-Algorithmen, die nennen sich Algorithmen des maschinellen Lernens oder Machine Learning. Das sind Algorithmen, die auf Basis von Daten sich verbessern. Konkret muss man sich das so vorstellen, dass der Algorithmus letztendlich große Tabellen von Daten durchliest und dann schaut, was kann ich daraus lernen? Kann ich hinsichtlich eines bestimmten Zieles, also beispielsweise, wenn ich jetzt wieder das Beispiel von selbstfahrenden Autos bemühen darf, dann wäre ein maschinelles Lernverfahren für selbstfahrende Autos so konstruiert, dass es die ganzen Bilddaten bekommt in Form einer großen Tabelle. Man kann sich das so vorstellen, dass jeder Pixel wäre ein Wert in so einer großen Tabelle. Und der Algorithmus hätte die Aufgabe, nicht von der Straße abzuweichen. Und dann würde man das Auto losfahren lassen oder eben in einer simulierten Umgebung losfahren lassen und letztendlich die ganze Zeit messen und Bilder erfassen lassen und dann dem Algorithmus immer sagen, Achtung, jetzt bist du von der Straße abgekommen oder nein, du bist noch auf der Straße. Ganz binär. Und auf Basis dieser Daten, also Bilder plus das Feedback, bist auf Straße, bist nicht auf Straße, lernt der Algorithmus, das maschinelle Lernverfahren, die Bilder, Daten richtig zu interpretieren und zu wissen, okay, ich bin noch auf der Straße, ich bin nicht auf der Straße. Das heißt noch nicht, dass es lenkt übrigens, sondern das heißt erstmal nur, es weiß, ich bin auf der Straße, ich bin nicht auf der Straße oder ich bin von der Straße abgekommen. Das ist im ersten Schritt erstmal maschinelles Lernen.

Katja Nettesheim: Und an der Stelle, das Feedback kriegt er von einer anderen Maschine oder von einem Menschen?

Johannes Schaback: Im ersten Schritt, der Einfachheit halber, bekommt er dieses Feedback von Menschen. Man könnte sich auch vorstellen, um es jetzt etwas einfacher zu konstruieren, man nimmt alle Bilder des deutschen Internets oder des gesamten Internets, das ist eigentlich nicht entscheidend, und sagt, ich möchte jetzt einen pornografischen Detektor bauen. Also handelt es sich bei dem Bild um pornografische Inhalte? Ja, nein. Und um das zu entscheiden, bedarf es menschlichen Inputs. Oder handelt es sich um ein Tier auf diesem Bild? Ja, nein. Oder handelt es sich um ein Tier, Menschen auf dem Bild oder handelt es sich vielleicht sogar um Joel auf dem Bild, also diese Binärentscheidung. insbesondere, grundsätzlich bedarf es Feedback des Menschen, um diesen Algorithmus des maschinellen Lernens zu verbessern.

Katja Nettesheim: Okay, das heißt also, der Mensch hat in dem Moment noch die Rolle, den Algorithmus zu trainieren.

Johannes Schaback: Das ist in der Tat aktuell der Fall. Es gibt auch Weiterentwicklungen, das würde jetzt, glaube ich, aber den Rahmen springen, die so beispielsweise sogenannte Adversarial Generative Networks, da wird ein bestimmtes Machine Learning Verfahren trainiert, um ein anderes zu trainieren. Das gibt es mittlerweile auch. Das beschleunigt natürlich diesen selbstverstärkenden Effekt des maschinellen Lernens. Das würde jetzt an der Stelle, glaube ich, zum Verständnis nicht beitragen. Deswegen lassen wir das erstmal beiseite. Aber grundsätzlich kann man sich das so vorstellen, ein Mensch muss zu den Daten, die ein maschinelles Lernverfahren sieht, seinen Input geben, sein Feedback geben, damit das maschinelle Lernverfahren eigentlich das Entscheidungsverhalten von den Menschen kopieren kann.

Katja Nettesheim: Okay, super. Und dann hatten wir noch den dritten Begriff, der wichtig ist, wenn wir darüber nachdenken, was können Medienunternehmen mit KI anfangen, nämlich neuronale Netze.

Johannes Schaback: Neuronale Netze sind eine spezielle Form von Machine Learning Algorithmen. Also wenn man sich jetzt überlegt, wie werden denn diese selbstlernenden Algorithmen, die ja auf Basis von Daten besser werden, gebaut, dann gibt es unterschiedliche Herangehensweisen. Eine Beispielsweise ist sich zu überlegen, okay, was ist in der Statistik heutzutage schon möglich? Insofern Regressionen, gibt es unterschiedliche Methoden, least squares und so weiter. Eine andere, die im Übrigen eigentlicherweise auch sehr weit statistische Methoden enthält, ist das biologische Vorbild von neuronalen Netzen zu simulieren. Weil wenn man sich überlegt, okay, der Mensch ist relativ schlau und vielleicht will man auch erstmal nur so schlau werden wie der Mensch. Vielleicht können wir den simulieren. Wir haben als Menschheit noch das gesamte Gehirn nicht verstanden, aber wir können zumindest kleine Teile verstehen und kleine neuronale Netze simulieren. Und letztendlich sind sogenannte künstliche neuronale Netze eine Simulation nach dem biologischen Vorbild. Stark vereinfacht, viele Effekte, die eben in dieser organischen Chemie vorkommen, sie werden vernachlässigt, aber die entscheidenden Elemente sind drin. Und sie sind auch heutzutage state of the art, was die Fähigkeiten und die Mächtigkeit von Machine Learning Algorithmen angeht. Und das sind letztendlich die sogenannten neuronalen Netze.

Katja Nettesheim: Das heißt aber jetzt nochmal ganz einfach, neuronalen Netze heißt, wir schalten 10.000 Computer zusammen in einer Struktur von verschiedenen Ebenen.

Johannes Schaback: Wir schalten nicht 10.000 Computer zusammen. Es ist in der Regel reicht ein Computer im ersten Schritt. Aber letztendlich erfordert es sehr, sehr viel Rechenleistung. Das wird häufig auf Computer-Grafikkarten gemacht, weil die Prozessoren auf diesen Grafikkarten sich für die Berechnung dieser Informationspropagierung durch diese Schichten eignet. Vom Aufbau her, weil du es gerade ansprichst, kann man sich das wirklich vorstellen, man hat einzelne Neuronen, Die haben letztendlich kleine Dendriten oder so kleine Zellkörper, mit denen sie sich wieder an weitere nachfolgende Neuronen verknüpfen. Und wenn man jetzt ganz, ganz viele Neuronen hat, dann entstehen so Schichten. Man kann sagen, so die erste Schicht, die sogenannte Input-Schicht, da gibt es kein Neuron davor. Da beginnt sozusagen das neuronale Netz und dann beginnen unterschiedlich viele Neuronen. Verknüpfungen von Neuronen und die auch übrigens untereinander wieder verknüpft sind. Das heißt also, ein Neuron in der ersten Schicht ist häufig mit allen Neuronen der zweiten Schicht verknüpft. Und das ist dann genau der interessante Teil, wie so ein neuronales Netz aufgebaut ist. Es kommt sehr darauf an, was für ein Problem man lösen möchte. Sind vielleicht die Neuronen der ersten Schicht nicht mit allen Neuronen der zweiten Schicht verknüpft? Das hat bestimmte Eigenschaften. Entropie kommt da jetzt ins Spiel, also dass man bestimmte Informationsdichten beim Trainieren dieses neuronalen Netzes nicht überschreiten möchte, damit Information nicht verloren geht. Aber das ist vielleicht erstmal genau. Entscheidend ist, dass diese Information letztendlich, wenn so ein Neuron aktiviert wird, das heißt also einen elektrischen Impuls bekommt, einen simulierten Impuls, Dann wird diese Information weitergegeben oder eben nicht weitergegeben. Und man kann sich das vorstellen wie so Ant-Gutter oder so, wie man das in der Elektronik kennt. Wenn bestimmte Signale anliegen, dann wird sozusagen eine kleine, ganz einfache binäre Funktion ausgeführt in diesem Neuron. Und dann entscheidet sich dieses Neuron, gebe ich diesen Impuls weiter in die nächste Schicht, ja oder nein.

Katja Nettesheim: Das heißt aber letztendlich, jetzt auch wieder laienhaft paraphrasiert, das ermöglicht das arbeitsteilige Arbeiten zwischen Grafikkarten.

Johannes Schaback: Genau. Erstmal ist die mathematische Repräsentation des neuronalen Netzes unabhängig von der Realisation auf der Hardware. Jetzt ist es in der Tatsache, da hast du recht, mit den 10.000 Rechnern, dieses Trainieren und insbesondere der Aufbau und das Trainieren von solchen neuronalen Netzen ist möglich. Durch verteiltes Rechnen. Das heißt also, man kann den Algorithmus so schreiben, dass Teile dieses neuronalen Netzes simuliert werden auf anderen Rechnern oder auf anderen Grafikkarten. Beispielsweise baut Google gerade ein Stück Hardware, einen neuen Prozessor, einen Tensor Processing Unit, nennt sich die, die letztendlich wie eine CPU, eine Central Processing Unit, die man eben aus PCs kennt oder aus herkömmlichen Computern kennt, nicht notwendigerweise PCs, die aber wirklich genau dafür gemacht ist, dass sie eben diese neuronalen Verschaltungen simuliert und auch trainieren kann. Und wenn man davon eben möglichst viele hat und möglichst gut angebunden hat, dann kann man diesen Algorithmus auf diesen ganzen Prozessoren oder Grafikkarten verteilt rechnen lassen. Und übrigens, das ist ein ganz entscheidender Punkt, den du da ansprichst, das war früher und insbesondere in den 90er Jahren nicht möglich. Also zwei Dinge sind zusammengekommen, warum AI groß geworden ist. Insbesondere vor, ich schätze mal, fünf, acht Jahren. Das Erste ist, es gibt einfach sehr, sehr, sehr viel mehr Daten. Das ganze Big-Data-Thema hat es ermöglicht, dass überhaupt die nötigen Datenmengen vorhanden sind, um diese neuronalen Netze zu trainieren. Das zweite ist, dass die Hardware-Power, also die schiere Rechenleistung nach dem Moerschen Law massiv angestiegen ist, sodass die Simulation von neuronalen Netzen möglich ist. Ehrlicherweise ist die Simulation eines solchen organischen Systems höchst ineffizient, also energetisch. Deswegen bedarf es sehr, sehr viel Energie, ehrlicherweise. Ein Prozessor, ein Computer ist eigentlich nicht so effizient wie ein organisches System an der Stelle. Aber es ist möglich, das mittlerweile zu simulieren. Und weil eben diese zwei, also Daten plus Rechenleistung zusammengekommen sind, konnte man größere Netzwerke bauen. Mehr Neuronen, mehr Schichten. Und die haben eine deutlich höhere Mächtigkeit als die, die man in den 60er Jahren kannte.

Katja Nettesheim: Super. Extrem spannend. Aber jetzt müssen wir nochmal so aufs Geschäft zurückkommen, ehrlich gesagt. Du hast mir gerade eine goldene Brücke gebaut durch Google. Wenn man sich so künstliche Intelligenz anschaut und auch sieht, wer da investiert, hat man manchmal den Eindruck, es ist nur was für die Großen. Also die Investments gehen brutal hoch in KI, vor allem aber durch die Tech-Giganten, weniger durch Startups. Wenn man in der Industrie mal fragt, ich glaube, es gibt eine Studie von McKinsey dazu, sind sich 41% der Unternehmen unsicher über die Vorzüge von KI. Es sind 40%, die sogenannte Contemplators sind, die so auf dem Zaun sitzen und noch nicht so genau wissen, was sie damit anfangen sollen. Und von denjenigen, die es anwenden, also von den 20%, die KI schon anwenden, sagen 13%, sie wenden sogar mehr als eine AI-Technologie an. Deswegen die Frage, als mittelgroßes Unternehmen, gerne auch speziell als Medienunternehmen. Und ich glaube, im Vergleich zu Google zählt alles, was wir hier in Deutschland haben, als maximal mittelgroß. Wo findet man da einen Ansatzpunkt?

Johannes Schaback: KI kann immer dort eingesetzt werden, wo ich natürliche Daten verarbeite. Also wo ich insbesondere Sensorikdaten verarbeite, Logistikdaten, Messungen, Bildverarbeitung, Tonverarbeitung. Da sind moderne KI-Algorithmen extrem gut. Wenn ich Software ausschließlich dafür einsetze, um Accounting zu machen, um meine BWAs zu erstellen oder um letztendlich Regeln oder Prozesse abzubilden, dann hilft mir KI gar nicht so sehr. Denn KI ist insbesondere, also die neuen modernen KI-Methoden, mächtig, um natürliche Daten zu analysieren und Dinge zu erkennen, also Gesichtserkennung, Tonerkennung, Spracherkennung, Sentiment, also Um was geht es in einem Text? Ist es da positiv, ist es da negativ? Solche Sachen gehen sehr, sehr gut. Klassisches maschinelles Lernen, also insbesondere Statistik, ist davon unbenommen. Das funktioniert natürlich immer noch. Also wenn ich das Gefühl habe, ich kann statistische Methoden anwenden, auch häufig wird das in einen Topf geschmissen mit maschinellem Lernen oder eben mit künstlicher Intelligenz. Das kann ich wahrscheinlich auch anwenden. Das heißt, wenn ich in meiner Finance-Abteilung das Pricing berechnen möchte oder einen besseren Preispunkt ausrechnen möchte, dann ist das ein Optimierungsproblem, was natürlich genau so nach wie vor funktioniert. Wenn ich mir aber die Frage stelle, okay, der heutige Fortschritt in der künstlichen Intelligenz, was könnte mir das bringen? Dann muss ich mich fragen, was ist das Problem, was ich lösen will? Das sind eigentlich nur Probleme, die auf Basis von natürlichen Daten bestehen. Und das ist immer die Frage, weil es ist ein Riesenwerkzeug, es ist ein Riesenhammer oder man kann sich das vorstellen, wie so eine riesige Maschine, die total smart ist, wie so ein simuliertes Gehirn, aber ich kann sie gar nicht für alles sinnvoll einsetzen und ich brauche ein sinnvolles Problem. Also nur um KI, der KI will einzusetzen, macht überhaupt keinen Sinn. Ich brauche ein massives Problem auf massiven Daten, Mengen, die idealerweise hohen sogenannten Noise, also Rauschanteil haben, dann machen die modernen KI-Methoden Sinn.

Katja Nettesheim: Das heißt, um das nochmal den Leuten wirklich ins Vorderhirn zu bringen. Jedes Mal, wenn du auf eine Situation guckst und sagst, oh, ich würde gerne wissen, und dann schaust du auf die Daten und sagst, ach du Scheiße, das ist ein Anwendungsfall für KI.

Johannes Schaback: Genau, wenn du als Mensch diese Daten, weil es einfach die schiere Menge ist, nicht vernünftig verarbeitet bekommst, dann ist es in der Regel was für KI. Wenn ich auf eine Excel-Tabelle gucke, dann ist per Definition von Excel das Pfeil schon maximal 20.000 Zeilen lang. Das kann ich als Mensch ohne weiteres verarbeiten. Wir müssen hier über Millionen, wenn nicht Milliarden Datenpunkte sprechen. Dann macht KI Sinn. Vielleicht lässt es mal nur 10.000 sein. Aber der entscheidende Punkt ist, wenn ich hochstrukturierte Daten habe in einer Tabelle, wo die Tabellennamen wunderbar benannt sind, wo die Tabellenzellen in dieser Spalte genau perfekt formatiert sind und ich weiß, es ist alles Euro und es ist alles richtig und der Wert ist nie größer als 10 und nie kleiner als minus 5. Also in dem Moment, wo die Daten hochstrukturiert sind, hilft mir Machine Learning, also die modernen Machine Learning-Methoden erstmal so sehr nicht. Der Value-Add ist nicht so groß. Normale Statistik reicht da völlig aus.

Joel Kaczmarek: Kannst du mal so ein bisschen eigentlich generell die Macht von KI nochmal ein bisschen einnorden? Weil wir hatten ja so einen nuklearen Winter in Sachen KI. Danach kamen diese zwei Sachen, die du genannt hast, Daten plus irgendwie Hardware. Und dann ging ja so ein Hype los. Dann merkt man irgendwie, Google kauft DeepMind für irgendwie einen sehr signifikanten Bereich. Facebook macht ganz viel DeepMind. Muss man da, wenn wir jetzt mal an so klassische Medienhäuser denken, muss man da erst mal vor Angst haben? Stellt das mein ganzes Unternehmen auf den Kopf? Du bist ja eigentlich eher so ein bisschen, um mal die Antwort halb vorweg zu nehmen, so in der Kirche im Dorflasten-Fraktion, so wie ich dich immer wahrgenommen habe. Aber da gehen auch ganz schnell Ängste an.

Johannes Schaback: Das ist eine Riesenfrage, die du da stellst. Vielleicht schlagen wir die Brücke. Eine Ursprungsfrage von Katja. Warum investieren insbesondere die großen Gafas, also Google, Amazon, Facebook, Apple, in diese Technologie? Übrigens, Gafa ist ein Kurzbegriff. Klar. Da fehlen eine ganze Reihe. Da fehlen SAP, da fehlen Chinesen. Warum investieren insbesondere die Großen rein? Das beantwortet einen Teil deiner Frage. Also, wenn ich ein großes Unternehmen bin und ich sitze auf einem Berg Daten, insbesondere von Nutzern generierten Daten, also insbesondere Daten, die natürlichen Ursprungs sind. Texte, Bilder, Fotos, Ton, alles Mögliche, dann habe ich durch moderne KI-Methoden die Möglichkeit, die sehr viel effizienter und sehr viel akkurater zu verarbeiten und daraus Entscheidungen oder Prozesse abzuleiten, die letztendlich wieder wertstiftend sind für das Unternehmen. Man muss sich vorstellen, die GAFA-Ökonomie sitzt auf riesigen Datensilos. Wenn man einfach an Facebook denkt, was da für wunderbare Inhalte herumschwirren, dann hatten sie bisher, also bis zu dem Moment, wo AI wirklich groß geworden ist, nicht die Möglichkeit, systematisch diese Inhalte, diese ganzen Bilder insbesondere und Daten natürlichen Ursprungs zu verarbeiten. Und jetzt ist möglich, diese riesigen Datensilos durchzuackern mit automatischen Methoden und daraus Wert zu extrahieren. Und das ist ganz, ganz, ganz entscheidend, warum die GAFA-Ökonomie da drauf sitzt. Letztendlich ist es ein sogenannter Enabling Layer. Also man kann sagen, er ersetzt Software. Wenn ich Software schreibe, die Daten verarbeitet, insbesondere natürliche Daten, dann musste ich bisher sehr, sehr komplexe Software schreiben. Jetzt kann ich Methoden des maschinellen Lernens anwenden, also Algorithmen trainieren, die diese Software, die vorher sehr komplex war, ersetzt. Und wir alle wissen, dass die schiere Menge der Daten im Internet, die sozusagen das Internet hält, die das Internet ausmacht, exponentiell wächst. Das heißt, es bedarf auch anderer Algorithmen, einer anderen Mächtigkeit, die diese ganzen Daten verarbeiten können. Und dafür ist maschinelles Lernen da, weil niemand, also kein Entwickler dieser Welt oder keine Gruppe von Entwicklern dieser Welt, die Möglichkeit noch hat, Algorithmen von Hand zu schreiben, die diese ganzen Daten verarbeiten können. Und dafür ist maschinelles Lernen eben gut. vorstellbar große Datenmenge verarbeiten.

Katja Nettesheim: Um auf die Frage von Joel daraus zurückzukommen, muss man Angst haben als Unternehmen. Das ist ja dann letztendlich eine Chance von KI. Weil ich kenne ganz viele Unternehmen, die sagen, oh Mann, uns mangelt es an Programmierern, die in der Lage sind, so komplexe Sachen zu machen. Wenn du jetzt gerade sagst, Es gibt Algorithmen, die komplexe Softwareprogrammierung ersetzt, weil sie librarymäßig schon mal da sind. Ist dann ja wiederum das auch eine Chance für die digitale Transformation von Unternehmen, oder? Und keinen Grund Angst zu haben.

Joel Kaczmarek: Fragst du mich nicht, da musst du ihn fragen eigentlich.

Katja Nettesheim: Nee, ich wollte deine Frage nochmal aufgreifen.

Johannes Schaback: Also ich sehe das ganz genau so.

Joel Kaczmarek: Nee, aber er hat insofern recht, finde ich, valider Punkt. Der Steroid-Gedanken, den du geäußert hast, der wird ja dadurch ganz gut klar eigentlich. Es gibt ja auch diese Bilder. Bei Facebook habe ich das übrigens in einem Vortrag mal gehört. Von 1920 bis 1990 die Anzahl an Fotos, die geschossen wurde. Das hat sozusagen 70 Jahre gedauert. Was glaubst du, wie schnell das irgendwie jetzt passiert im Internet, wie die hochgeladen werden? Und du bist, glaube ich, bei unter einer Minute.

Johannes Schaback: Oder wenn du überlegst, wie viel Videomaterial, also Sekunden oder Minuten in Video pro Minute bei YouTube hochgeladen wird oder Podcasts erstellt werden, die transkribiert werden müssen etc. Genau, das sind alles wunderbare Anwendungsfälle. Auch Google hat ja sich selber gerade auffällig, oder ehrlicherweise schon vor zwei Jahren, angefangen zu sagen, wir gehen von einer Mobile-First, also Mobiltelefon-First, also als allererstes wird fürs Mobiltelefon entwickelt, weil das der größte Wachstumsmarkt ist, hinüber in eine AI-First-Welt. Das heißt also, sie glauben nicht mehr so stark an das Wachstum oder sie glauben schon noch an das Wachstum, aber das Wachstum wird nicht mehr so stark sein von Mobiltelefonen. Die Kurve wird sich abflachen. Sie sehen vielmehr ihr Heil in AI-Algorithmen.

Joel Kaczmarek: Können sie eigentlich auch gar nicht anders, wenn man ehrlich ist.

Johannes Schaback: Naja, und da ist natürlich auch noch ein Riesenpotenzial, weil böse Zungen behaupten, Google war bisher ein riesiges Regelwerk. Das ist natürlich nur in kleinen Bereichen. Also das muss man mit einer riesigen Prise Salz genießen. Aber wenn man sich vorstellt, der Ranking-Algorithmus beispielsweise von Google, also dem eigentlichen Kerngeschäft von Google, das, was letztendlich AdWords ermöglicht, das war bislang sehr, sehr stark nach Regeln programmiert. Da haben sich Entwickler gesagt, es gibt Rankingsignale, diese Rankingsignale werden ausgewertet und dann werden die irgendwie vermischt und dann werden die Auf Basis deines Keywords kommt dann sozusagen so eine Suchergebnisseite zustande. Mit Methoden des maschinellen Lernens kann ich viel individuellere Rankings bauen für den Nutzer. Ich kann viel besser diese ganzen Websites analysieren. Ich kann nicht nur gucken, was ist auf den Bildern drauf. Bisher konnten sie ja nur Text analysieren, sondern sie können auch in die Podcasts reinhören. Und sie können viel, viel, viel mehr machen. Sie können viel individueller auf dein Nutzerverhalten bei Google eingehen. Sie können viel besser disambiguieren, das ist ein großes Problem für Suchmaschinen, was du meinst. Beispielsweise, es gibt eine Programmiersprache, das ist jetzt sehr aus meiner Welt, aber es gibt eine Programmiersprache, die heißt Rust. Und Rust heißt aber auch eben Rost. Und wenn ich jetzt nach Rust suche, oder einer Library, die heißt Nail, und ich suche nach Rust Nail, dann kommen als allererstes rostige Nägel. Google weiß aber, dass ich Rust die Programmiersprache meine und Nail dann wahrscheinlich die Library gemeint ist.

Katja Nettesheim: Wer weiß, was du am Wochenende daheim gemacht hast, ja.

Johannes Schaback: Aber der Punkt ist Individualisierung und Disambiguierung. Das sind einfach nur wenige Beispiele, die illustrieren, wie stark AI-Algorithmen solche riesigen datengetriebenen Unternehmen enablen. Zurück zur Angst. Wir müssen ja eigentlich zurück zur Angst. Ich war gerade bei den Chancen schon wieder. Also Angst vor AI zu haben, ist völliger Quatsch. Es ist völlig unnötig, sich darüber Gedanken zu machen, ob in 15, 15, 25, völlig egal, Jahren, Terminator die Welt beherrschen oder dieses Skynet-Problem auftritt, um das sozusagen mal in dem Film zu halten. Das halte ich für völlig überzogen. Da gibt es ja zwischen Elon Musk und Mark Zuckerberg auch immer eine interessante Diskussion. Mark Zuckerberg sieht es eher so wie ich. Ich sehe es so wie Mark Zuckerberg, vielleicht soll ich es so formulieren. Nein, das war schon richtig. Es gibt die Optimisten, es gibt die Pessimisten. Ich habe bei Elon Musk ehrlicherweise ein Stück weit das Gefühl, es ist Marketing. Glaube ich auch.

Katja Nettesheim: Der inszeniert sich.

Johannes Schaback: Genau, der hat Einblicke da rein. Der weiß es besser. Der weiß, dass auch mit seinem Autopilot von Tesla, der ja wirklich extrem gut ist und ist ja sicherlich von allem, was ich weiß, marktführend in diesem Bereich das Software für autonomes Fahren. Insbesondere übrigens auch, weil sie mehr Daten haben. Das ist auch ein ganz interessanter Punkt, über den wir mal eingehen sollten. Das muss auch für die Gafferindustrie entscheiden. Das ist überzogen, weil wir ganz am Anfang stehen der künstlichen Intelligenz. Es ist völlig unvorstellbar, dass wir den Turing-Test, also dass eine Maschine, einem Menschen glaubhaft vermitteln kann, sie wäre auch ein Mensch, dass das jetzt in nächster Zeit gut gelöst wird. Das ist in Computerspielen, also in kleinen simulierten Welten vielleicht möglich, so eine Art abgewandelten Turing-Test zu machen. Dass ich nicht weiß, ist mir da gegenüber ein echter Mensch oder ein Computerspieler. Aber das ist ehrlicherweise in der realen Welt mit seiner kompletten Komplexität sehr, sehr lange nicht möglich. Und deswegen ist auch Es ist völlig unwahrscheinlich, dass da jetzt irgendwie Roboter plötzlich autonom werden und die Welt überherrschen und eigentlich wie jetzt alle schon die Aktienmärkte kontrolliert werden von AI-Algorithmen, die uns nur Böses wollen und sowas. Das ist alles Quatsch. Es gibt eine Riesenphilosophie, einen Bereich, den auch ehrlicherweise einen seriösen AI-Forscher überhaupt nicht interessiert.

Katja Nettesheim: Weil er in der Technik ist.

Johannes Schaback: Genau, weil er in der Technik ist und weil er weiß, wo die Grenzen sind.

Katja Nettesheim: Ja, und wahrscheinlich auch ein bisschen beseelt ist von den Chancen. Und auf die würde ich jetzt gerne nochmal kommen und zwar ganz konkrete Anwendungsfälle. Du hast jetzt gerade eben schon das eine oder andere erwähnt, was Google an konkreten Anwendungsfällen macht, aber jetzt nochmal ein bisschen mehr down-to-earth Medien.

Joel Kaczmarek: BDZV näher.

Katja Nettesheim: Na, Medien. Es gibt ja schon einige Anwendungsfälle, die man konkret sieht von KI-Lösungen im Mediengeschäft.

Johannes Schaback: Genau. Also ein großes Thema ist der sogenannte Robo-Journalismus oder Roboter-Journalismus. Da handelt es sich letztendlich um das Erstellen von Inhalten, insbesondere Text, auf Basis von Daten. Also beispielsweise Fußballergebnisse, das habe ich bei der Welt erst mal mitbekommen. Kannst jetzt irgendwie so Drittliga-Ergebnisse, kannst du die als Tabelle besorgen. Die werden zusammengestellt von den Ligen und auf Basis dieser Tabellen kannst du Texte erstellen. Das sind in dem Fall einfache Texte. Das heißt, das Vokabular ist sehr beschränkt. Die Grammatik, der Style, wie das geschrieben wird, ist relativ einfach. Deswegen funktioniert das sehr, sehr gut. Und die Floskeln und das, was da verwendet wird, das wird immer wieder neu verwendet. Das heißt, man kann letztendlich ein Regelwerk bauen. Und das ist übrigens interessant. Das ist nämlich, könnte man argumentieren, gar nicht Machine Learning, sondern erst mal nur KI. Das ist Die funktionieren auch in der Regel so, dass es eine übergeordnete Repräsentation gibt, eben besagte Tabellen, und dann wird über eine Grammatik dieser Text ausformuliert. Und das ist ein Beispiel von vielen.

Katja Nettesheim: Ja, weil wir gerade an dem Punkt sind, vielleicht haben wir da eine gute Gelegenheit, nochmal KI und Machine Learning auseinander zu differenzieren. Wäre es dann Machine Learning, wenn man den Algorithmus befähigt, da auch Varianten reinzubringen, wenn er also jetzt dreimal das gleich geschrieben hat, dass er dann das nächste Mal es irgendwie anders macht?

Johannes Schaback: Nee, weil das könnte ich mit dem Zufallsgenerator auch machen. Dann habe ich irgendwie drei Regeln für, ging unentschieden aus, habe ich irgendwie drei Sätze.

Katja Nettesheim: Aber Machine Learning wäre besser, wenn er reagieren würde auf die Likes, die er drauf kriegt?

Johannes Schaback: Also ich gebe ihm alle Drittliga-Berichterstattungen der letzten 20 Jahre. Und gebe ihm dazu, zu dem Text, eine tabellarische Repräsentation des Ergebnisses. Also beispielsweise den Spielstand. Erste Mannschaft, zweite Mannschaft. Und zu jedem Text gebe ich ihm diesen Spielstand. Und dann fängt die Maschine an zu trainieren, zu verstehen, zu welchem Spielstand welcher Text gut passt. Und das Pattern zu erkennen. Und wenn ich ihm jetzt dann einen neuen Spielstand gebe, dann könnte die Maschine daraus einen Text kreieren, ohne dass wir ihr irgendwie Regeln, Subjekt, Prädikat, Objekt etc., also syntaktische Regeln mitgegeben hätten, um ihr zu erklären, wie eigentlich Sprache funktioniert. Sondern das hat sie dann ausschließlich gelernt aus Beispielen.

Katja Nettesheim: Das heißt, sie hat sich selbst abgeleitet.

Johannes Schaback: Exakt.

Katja Nettesheim: Sie hat sich die Regeln selber abgeleitet, anstatt dass sie ihr vorgegeben wurde.

Johannes Schaback: So kann man es sehen, genau.

Katja Nettesheim: Wunderbar.

Joel Kaczmarek: Hast du mal so einen Einblick, wie viel Robo-Journalismus es de facto schon gibt? Also so Wetterbericht würde mir noch einfallen.

Johannes Schaback: Genau, Wetterbericht ist ein sehr gutes Beispiel. Börsenberichte. Börsenberichte, exakt, genau, Börsenprospekte. Das ist übrigens auch interessant, weil du gerade im Finanzsektor hast du bestimmte Regeln, hast du bestimmte missverständliche Formulierungen, auch in der technischen Dokumentation musst du die Sätze einfach Und da funktioniert das schon ganz gut, weil diese Sprache in der Regel sehr einfach ist oder weil du auch eben sie in dutzende Sprachen übersetzen musst und dann sozusagen von einem übergeordneten Konzept ohne weiteres in andere Sprachen übersetzen kannst. Ehrlicherweise jetzt der Robo-Journalismus ist gar nicht so groß nach meinem Dafürhalten. Ich habe das Gefühl, das ist noch sehr in den Kinderschuhen. Das liegt eben insbesondere daran, dass die Textqualität noch nicht da ist, wo wir sie gerne hätten.

Katja Nettesheim: Ja, das ist das eine aus meiner Sicht. und das zweite ist auch, dass es da gerade im Bereich Robo-Journalismus natürlich auch noch gewisse Berührungsängste gibt und eine Diskrepanz mit dem verlegerischen und vor allem dem journalistischen Selbstverständnis.

Johannes Schaback: Das finde ich total interessant, weil die Leute benutzen sicherlich Microsoft Word oder irgendeinen anderen Textprozessor, also Programm. Ich bin der festen Überzeugung, dass sie sicherlich auch das Spellchecking, also die Rechtschreibprüfung und auch die Stilüberprüfung verwenden. Wo ist da jetzt genau die Grenze eigentlich? Wenn ich jetzt einen Word-Prozessor benutze, der mir einen Text verändert, auf Basis, weil er Fehler behebt, oder weil ich einen Roboter habe, der mir den Text ein bisschen weiter noch formuliert, sicherlich habe ich da, also ich verstehe, dass da noch ein Schritt dazwischen ist, aber so groß ist dieser Schritt auf jeden Fall nicht. Ich bediene mich jetzt schon technischen Hilfsmitteln, die ziemlich automatisiert sind.

Katja Nettesheim: Absolut, aber ich glaube, der Unterschied ist psychologischer. Der eine ist World Spellchecker und so weiter, der nimmt mir Arbeit ab, die ich nicht gern mache. Der Robo-Journalismus nimmt mir Arbeit ab, nämlich meine, die ich gerne mache.

Joel Kaczmarek: Wo du aber übrigens eben auch über Übersetzungen geredet hast. Ich habe gerade so im Kopf hier der Geryon Fraling, der baut ja in Köln auch so einen ganz spannenden Übersetzer namens Deep Air. Hast du den mal ausprobiert? Unfassbar gut. Nein, nein, nein. Funktioniert wirklich, wirklich gut. Ist das auch zum Beispiel so ein Anwendungsfall, dass man Maschinen beibringen könnte, wie sehen gute Übersetzungen aus, dass ein Magazin zum Beispiel hingeht und sagt, die Welt bringe ich jetzt auch irgendwie als Le Monde in Frankreich raus und als, was weiß ich, in Portugal. Weil die machen das meines Wissens auch so, dass die sich Übersetzungen angucken und abgleichen. Genau wie du es gesagt hast mit den Drittliga-Ergebnissen, machen die das eigentlich mit Sprache.

Johannes Schaback: Genau, in dem Fall ist der Unterschied, dass die Texte vorher schon existieren und dann sozusagen der bestehende Text übersetzt wird. Das funktioniert so, dass man, insbesondere aus der Europäischen Union gibt es ja Gesetzestexte, die inhaltlich exakt dasselbe wiedergeben semantisch, syntaktisch aber anders funktionieren, weil es ja eine andere Sprache ist. Und auf Basis dieser Beispiele trainieren dann diese Algorithmen. Das heißt aber, ich gebe ihm einen fertigen Text, der wird dann übersetzt.

Katja Nettesheim: Zweiter Use Case, den man sich vorstellen könnte unter Einsatz von KI und wir arbeiten uns vor, von den einfachen zu den schwierigeren, Personalisierung von Webseiten oder so. Kannst du dafür praktische Beispiele nennen?

Johannes Schaback: Genau, Personalisierung von Webseiten ist natürlich etwas, was nicht nur den Medienhäusern vorenthalten wird. Letztendlich ist das etwas, was im E-Commerce insbesondere betrieben wird.

Katja Nettesheim: Ja, da kennst du dich aus.

Johannes Schaback: Amazon beispielsweise schickt sehr intensiv sogenannte Customer-Relation-Management-E-Mails raus, die hoch personalisiert sind, weil sie wissen, dass ich ein Nerd bin und dann schicken sie mir immer die neuesten Nerd-Gadgets etc.

Joel Kaczmarek: Ich finde, dass Amazon unglaublich schlecht ist, muss ich dir sagen. Ich finde, das ist mit einer der schlechtesten Datenverwender, die ich kenne. Oder? Geht dir das anders?

Johannes Schaback: Ich glaube

Joel Kaczmarek: Ich kriege immer Produktempfehlungen von Produkten, die ich schon gekauft habe, wo ich so denke, was ist das für ein Scheiß.

Johannes Schaback: Ich vertraue, so machen wir es ja bei Ladenzeiler auch, wir testen alles AB. Und nur weil wir davon überzeugt sind, dass ein Algorithmus cool ist, geht er noch lange nicht live, sondern er muss in der realen Welt zeigen, dass er gut funktioniert. Ich bin der 120-prozentigen Überzeugung, dass Amazon das genauso macht. Absolut. Und deswegen ist es irrelevant, ob ich das jetzt gerade gut oder schlecht finde. Ich glaube, im Schnitt funktioniert das sehr, sehr gut. Und der eine Datenpunkt, bei dem ich dann enttäuscht bin, der möglicherweise alles überschattet, die 10 Male, bei denen es gepasst hat, das verzerrt das Bild ein bisschen. Ich glaube, in einem datengetriebenen Entwickeln wäre das ein Fehler, den sie sich nicht leisten würden.

Joel Kaczmarek: Okay, aber Personalisierung in den Medien, wie könnte sowas dann aussehen mit KI?

Johannes Schaback: Genau, also letztendlich die Zusammenstellung Wenn ich beispielsweise bekannt bin als Autofanatiker und ich gehe jetzt auf eine Website XYZ, dann kann diese Information verwendet werden, um Inhalte in den Vordergrund zu stellen, die für mich besonders relevant sind. Also beispielsweise Auto-Inhalte oder eben Nerd-Inhalte. Tech-Inhalte. Das ist immer eine interessante Diskussion, weil ich eigentlich, so ein bisschen wie bei der GEZ früher, ja eigentlich über etwas informiert werden soll, was mich möglicherweise nicht interessiert, aber was ich wissen sollte. Das ist eine ganz interessante Diskussion. Letztendlich ist das etwas, was möglich ist. Oder beispielsweise die Paywall. Das finde ich sehr interessant, wie aktuell, das ist ganz interessant, wie da experimentiert wird, wenn man sich immer auf den Springer-Medien, aber auch auf Spiegel sich das anschaut oder auch auf Zeit, wie aktuell die Paywall eingesetzt wird, bei welchen Artikeln. Und man merkt, dass es teilweise, und jetzt lehne ich mich ein bisschen aus dem Fenster, aber dass man das Gefühl hat, es gibt sogenannte Teaser-Artikel, Inhalte, die klar sind, dass sie gut funktionieren werden. die möglicherweise nicht unbedingt politisch sind, die nicht langweilig sind, die nicht so starken informativen Charakter haben, aber die sicherlich von Konsumenten von hohem Kaufinteresse sind, dann liegt dahinter die Paywall. Und das finde ich immer sehr interessant. Und ich glaube, dass man da eine Riesenchance hat, dass man den richtigen Nutzer zur richtigen Zeit mit dem richtigen Inhalt die Paywall präsentiert und sagt, pass auf, für diesen Inhalt, der ist dir wichtig, dafür musst du jetzt zahlen. Und dann übrigens auch ein Dynamic Pricing dahinter hätte.

Katja Nettesheim: Ah ja, genau, jetzt kommen wir auf spannendes Thema.

Johannes Schaback: du kannst jetzt hier ein Abo abschließen, One Size Fits All, irgendwie 20 Cent pro Artikel oder eben 3 Euro pro Monat oder was auch immer, ich weiß es nicht. Ich glaube, dass dann auch die Möglichkeit besteht, zu verstehen, okay, eine Vorstellung wäre, ich interessiere mich jetzt nur für High-End-Autos, also innerhalb des Autosegment für High-End-Autos und vielleicht für Reisen, jetzt nicht unbedingt Backpacker, sondern irgendwie Spa in der Dominikanischen Republik und irgendwie alles nur 1.000 Euro die Nacht, dann könnte die Paywall dynamisch sagen, pass auf, du bezahlst halt einfach den Vierfach.

Joel Kaczmarek: Das gibt es doch im E-Commerce-Bereich auch.

Johannes Schaback: Das ist nicht mal besonders innovativ. Deswegen kommt ja auch auf diese Idee.

Katja Nettesheim: Einen halben Schritt zurück nochmal. Momentan werden ja gerade bei Paywalls, die jetzt nicht mietert sind, sondern so klassisches Freemium-Modell sind, Da wird mehr oder minder manuell in der Redaktion entschieden, was geht hinter die Paywall, was bleibt vor der Paywall. Das ist in der Regel, soweit ich das zumindest weiß, in der Praxis noch nicht personalisiert. Maximal gibt es dazu eine verabschiedete Strategie, die auch wiederum ein menschengemachtes Regelwerk ist. Kennst du schon Fälle, wo es ein maschinengemachtes Regelwerk ist, also wo tatsächlich die KI entscheidet, dem muss jetzt das und das hinter der Paywall und das und das vor der Paywall serviert werden. und das ist das richtige Pricing für den?

Johannes Schaback: Ich kenne das aus dem Flugbereich. Yield Management. Genau, Yield Management, exakt.

Joel Kaczmarek: Was ist das für jemand, der den Begriff nicht kennt? Wie geht es verspätlich?

Johannes Schaback: Ganz einfache Anwendungsverhältnisse. Wenn du das zweite Mal über eine Preisvergleicher-Seite auf, jetzt Air Berlin ist ein blödes Beispiel, aber weil dann auch Niki kommst und weißt, in dem Fall an die Lufthansa, okay, diese Person, Joelle, die ist jetzt zum zweiten Mal da, hat ein erhöhtes Kaufinteresse für diesen Flug und dann, bumms, wird der Flug 20 Prozent teurer. Das wäre so ein Beispiel.

Katja Nettesheim: Deswegen mache ich das immer mit verschiedenen Devices ohne synchronischen Blocking.

Johannes Schaback: Ja, Devices oder Cookie löschen oder die IP rotieren. Also es gibt eine Menge Möglichkeiten. Erstmal durch die neue Cookie-Regulierung wird das schwieriger, also massiv schwieriger. Zweitens glaube ich auch, dass das irgendwann problematisch wird, weil es eine gewisse Wettbewerbsverzerrung wird. Sowas können die Großen machen, die insbesondere viele Daten haben. Und wenn jetzt Google anfangen würde, sein Gmail-Pricing zu ändern auf Basis deiner E-Mails, dann würden die Leute schreien. Das ist aber bei Weitem noch nicht so groß und da ist noch nicht so eine monopolistische Marktmacht hinter. Irgendwann wird das schwieriger werden.

Katja Nettesheim: Wir kommen ja hier dann auch, jetzt kommt wieder die Juristin, in grundgesetzlich relevante Bereiche. Das ist ein Verstoß gegen Artikel 3.

Johannes Schaback: Also zumindest in einem gewissen Rahmen. Und genau, das muss man natürlich auffassen, weil auf der einen Seite haben wir gesagt, ich glaube, dass das die Zukunft der Paywall ist. In abgeschwächter Form ist es auch immer die Frage, für welche Inhalte muss ich bezahlen? Also ohne jetzt Dynamic Pricing zu machen, wäre das eine Möglichkeit.

Joel Kaczmarek: Du bist ja aber auch an einen Konzern angedockt, der ein sehr breites Portfolio hat. Wir sind ja eigentlich über das Thema Personalisierung eher mal beim Content reingekommen. Hast du da irgendwie Beispiele, die du schon gesehen hast, wo jemand zum Beispiel hingeht und sagt, okay, du hast jetzt irgendwie auf Motor Talk geguckt und auf Kicker, dann könnte dir auch dieser Artikel aus unserem Heimwerkmagazin gefallen. Gibt es da irgendwie Cases, die du gesehen hast?

Johannes Schaback: Innerhalb von Axios Spring ist das Thema sehr, sehr, sehr virulent. Es ist eine große Gruppe, die sich um solche Themen kümmert, technisch, aber auch betriebswirtschaftlich. Also da wird sehr stark darauf geachtet, wie kriegen wir eine technische Möglichkeit hin, die letztendlich allen Units oder allen Bereichen innerhalb des Konzerns, des Spring-Konzerns profitiert und wie wir das hinzugänglich machen, weil die Systeme sehr unterschiedlich sind, die Integrationen sind sehr schwierig. Es gibt auch Shipstead in Norwegen, was häufig so als das Leuchtbeispiel vorangetragen wird. Ich weiß immer nicht so richtig, ob die wirklich so weit sind, aber die auch ein norwegischer Verlag ist, die sehr, sehr stark durchdigitalisiert sind und solche Systeme auch im Ansatz haben.

Katja Nettesheim: Absolut.

Joel Kaczmarek: Ich wäre ja noch so ein Kandidat übrigens, wo wir schon jetzt wirklich auch mal einen coolen Anwendungsfall haben, weil ich den bei mir selber kenne. Mich hat neulich gerade jemand angesprochen, dass ich gefühlt der einzige Journalist sei, der mal auf die Idee kam, das Handelsregister zu durchblättern. Ich glaube, das war ein bisschen ein nettes Kompliment. Das war zu viel des Guten, aber der Punkt, den er hatte, der hat schon bei mir so ein bisschen ins Herz getroffen. Ich bin ja immer ein Fan davon, sich so Daten anzugucken. Datenjournalismus und vielleicht auch Recherche boostet bei KI und Analysen könnte ich mir noch als so einen Anwendungsbereich vorstellen, der auch Sinn machen würde. Trifft das zu?

Johannes Schaback: Absolut. Also wir haben jetzt sehr stark über die Content-Erstellung gesprochen. Ich glaube, da können wir uns auch noch mal ein, zwei Jahrzehnte noch weiter in die Zukunft gucken. Vielleicht kann man da später noch mal drauf. Aber wenn wir jetzt erst mal gucken, was ist heutzutage möglich in der Datenanalyse, also beispielsweise das Verifizieren von Quellen oder um nachzuschauen, Wer hat jetzt etwas gesagt? Also diese ganzen Plagiatsrecherchen, das wird auch sehr stark mit Datenbanken und sozusagen mit Technologie unterstützt. Ich stelle mir vor, es gibt ja zig Handyvideos, die ausgewertet werden müssen. Also man muss sozusagen das richtige Handyvideo, dem richtigen Ort, der richtigen Person, dem richtigen Ereignis zuordnen können. Das sind riesige Datenmengen. Diese Art von Analyse ist mit Methoden des maschinellen Lernens möglich. sehr gut möglich. Natürlich nie mit abschließender hundertprozentiger Sicherheit, da wird es noch sehr lange den Menschen erfordern. Es ist sehr viel einfacher, die schiere Masse, sagen wir mal, von Handyvideos auf drei Kandidatenvideos zu reduzieren und dann von Hand zu überprüfen, sagen, okay, diese drei geben wirklich dieses Ereignis wieder, sei es eine Exekution oder sei es whatever, was man da eben sieht, um dann zu sagen, okay, jetzt kann ich als Mensch, als Journalist nochmal die Wahrheit und die Integrität dieses Videos, dieser Quelle überprüfen.

Katja Nettesheim: Ja.

Johannes Schaback: Und da gibt es sehr viel. Also beispielsweise Zusammenfassen von Inhalten. Was haben andere darüber gesagt? Was sind die unterschiedlichen Meinungsströmungen? Also auch für die Meinungsbildung ist das entscheidend. Das Zusammenfassen von Inhalten.

Katja Nettesheim: Clustern auch von Meinungsbildern. Also sind die mehr dafür, sind die mehr dagegen? Sind die mehr rechts, sind die mehr links? Genau.

Johannes Schaback: Panama Papers ist ein riesen Beispiel. Das ist ein riesen Datensatz aus sehr unstrukturierten Daten. PowerPoint Slides, PDFs etc. Das wurde zum Teil oder überwiegend sogar von Hand erstmal vorstrukturiert und dann mit Tools, aber wiederum sehr, sehr manuell digitalisiert. Also OCR, Optical Character Recognition, weil das ja Bilder sind, die mussten dann sozusagen abgelesen werden. Das ist häufig auch bei Wikileaks das Problem. Du bekommst irgendwelche Folien und das sind teilweise Fotos, das sind einfach Screenshots. Das muss abgedigitalisiert werden, damit diese Inhalte durchsucht werden. Suchbar werden. Absolut. Da gehen wir schon in diese Richtung, dass in dem Moment, wo die Digitalisierung, die Recherche und die Analyse noch stärker automatisiert wird, auf Steroiden kommt, da glaube ich, ist noch sehr, sehr viel Möglichkeit.

Katja Nettesheim: Ja, und gerade wo du sagst Panama Papers, das ist doch auch wieder eine Erleichterung oder eine Verbesserung von Qualitätsjournalismus und ehrlich auch wiederum eine Chance, jetzt Dinge herauszufinden, die man vorher nur mit einem Rechercheteam von 30 Leuten, was heutzutage niemand mehr hat, wieder machen kann.

Johannes Schaback: Richtig.

Katja Nettesheim: Das heißt also auch die Renaissance des Qualitätsjournalismus durch Einsatz von KI.

Johannes Schaback: Absolut. Das ist nicht nur im Journalismus so, aber der einzelne Mitarbeiter wird viel, viel mächtiger. Der wird viel, viel enabler. Der hat viel mehr Möglichkeiten, viel mehr Daten in viel kürzerer Zeit zu durchforsten. Und das gilt insbesondere für Journalisten.

Katja Nettesheim: Du hast gerade gesagt, wir gucken vielleicht jetzt auch nochmal zehn Jahre voraus. Wie könnte die Medienbranche, Journalismus oder Content-Erstellung im Allgemeinen aussehen? unter Einsatz von KI, unter Einsatz von neuronalen Netzen?

Johannes Schaback: Ich glaube, dass in einer weiteren Zukunft, also sagen wir mal in fünf bis zehn Jahren, die Inhaltserstellung komplett automatisiert wird. Ich glaube, dass ich als Journalist, der wahrscheinlich auch sehr viel Werterin sieht, dass bestimmte Texte in einer bestimmten Art und Weise nach meinem Stil formuliert sind, werde ich nicht die Texte mehr selber schreiben. Das würde mir Spaß machen, das mache ich am Wochenende dann vielleicht. Aber ich werde insbesondere eine Maschine trainieren, die in meinem Stil formulieren kann. Das ist eine Möglichkeit. Das ist übrigens jetzt schon möglich. Also Beethovens Unvollendete wurde vollendet durch ein KI-Algorithmus. Ja, es gibt auch KI, die barock gemeldet werden. Genau, und das ist wirklich scary, die Stimmen perfekt impersonaten kann. Oder auch ganze Videos erstellen kann, weil der AI-Algorithmus gelernt hat, wie sieht Barack Obama im Video aus.

Katja Nettesheim: Das heißt aber, der Journalist schafft sich seinen eigenen Klon. Für die tägliche Arbeit.

Johannes Schaback: Und da kann er natürlich unendlich viele Feuilleton-Artikel schreiben, wie er will, lustig ist. Das ist ganz entscheidend. Das ist jetzt erstmal nur auf so einer semantisch-syntaktisch-stilistischen Ebene. Das wird aber auch auf einer inhaltlichen Ebene weitergehen. Das heißt, wenn wir jetzt erstmal nur in der Content-Erstellung bleiben, dann gehe ich davon aus, dass ich in Zukunft ein Abonnement haben werde, weil Journalismus ist extrem wichtig. Die Wahrheit ist extrem wichtig. Da fühle ich mich total bereit, Geld auszugeben. Mich ärgert die GEZ, weil ich irgendwie da das Gefühl habe, ich gebe was aus, aber lange anderes Thema. Aber auf jeden Fall bin ich bereit dafür auszugeben und Geld auszugeben und zwar relativ viel. Ich würde mich dann an ein Portal wenden, an eine Plattform, die unterschiedliche Inhalte zu unterschiedlichen Themen auf mich zugeschnitten hat. Also in der Textlänge, in der stilistischen Form, ist es komplex, ist es Englisch, ist es Deutsch, ist es sozusagen im Sinne von Frank Gosen geschrieben oder Helge Schneider, um sozusagen mal drastische Beispiele zu nehmen, oder eben jemand, der wirklich andere literarische Ansprüche hat als die beiden Herren. Ich will jetzt gar nicht sagen, dass sie schlechter sind, aber der entscheidende Punkt ist, dass sie stilistisch anders sind. Die Texte sind unterschiedlich, die Länge, es kann auch ein Bewegbild sein, also beispielsweise ein generierter Film. Es kann auch ein vorgelesener Text sein von einer sonoren Stimme, die mir gut gefällt. Ich glaube, die Inhaltserstellung wird stark angepasst werden auf die Länge, auf die Befindlichkeiten, auf die Umgebung des Menschen. Auf den Zeitpunkt. Auf den Zeitpunkt natürlich.

Katja Nettesheim: Die Plattform wird wissen, ob du gerade unterwegs bist oder nicht. Richtig.

Johannes Schaback: Und dahinter wird ein Modell liegen, vielleicht ein neuronales Netz, aber es wird irgendeine Art von Datenmodell sein, was ständig in Echtzeit geupdatet wird. Das heißt, es wird auch davon abhängen, ob ich heute nachfrage, was ist die Meinung von Herrn Macron zu Europa? Dann kann ein Text generiert werden, der genau auf mich zugeschnitten ist. Aber wenn ich morgen diese Frage nochmal stelle, dann wird es eine andere Antwort sein, ein anderer Inhalt, der erstellt wird. Und das wird einfach laufend geupdatet werden. Dieses Modell, das wird letztendlich das sein, wofür ich Geld ausgebe. Die Inhaltserstellung ist Commodity. Das Entscheidende ist, dass alles, was in diesem Datenmodell ist, vielleicht kann man sich das ein bisschen vorstellen wie ein neuronales Netz. Ich glaube, ich stelle mir das eher vor wie so ein Graph, so ein Knowledge Graph. Gibt es übrigens auch, Google baut sehr stark einen Knowledge Graph, der einfach nur Fakten enthält, auf die sie sich verlassen können. Das ist nämlich ganz entscheidend. Aus Basis dessen wird dann alles rausgeneriert. Das ist beispielsweise für IMDB, wenn man das kennt, also für Workflow. WUWI ist das jetzt schon sehr populär. Dieses Modell, das ist letztendlich das, was den Wert enthält. Und da wird es dann bestimmte Spezialisierungen geben, Finanzsektor, Politik etc.

Katja Nettesheim: Das heißt, ich stelle mir das jetzt gerade so vor wie mein unsichtbarer Journalismusassistent, der ab dem Moment, wo ich ihn anspreche oder aktiviere, vielleicht ist das auch voreingestellt, mir genau die Informationen gibt, die ich haben will, in der Darreichungsform und in dem Format, so wie es gerade passt. Das heißt, er läuft die ganze Zeit unsichtbar mit. Ich meine, wenn wir über Earphone-Wearables sprechen, dann haben wir den sowieso immer im Ohr oder bei Glas vor den Augen. Also letztendlich so ein Paralleluniversum.

Johannes Schaback: Genau, man könnte sich auch vorstellen, dass dieses Datenmodell am Ende in so einer Art Blockchain liegt, das heißt für alle öffentlich zugänglich, man kann aber verifizieren, woher die Informationen kommen. Das heißt, in dem Moment, wo unsere Fantasie aktiviert wird, kann man noch sehr weit denken.

Katja Nettesheim: Ja, wenn man das mit der Blockchain zusammendenkt und gerade den Punkt Verifizieren von Fakten, da kommt da ja nochmal eine Potenz drauf.

Johannes Schaback: Welche Information kommt von wem, ist signiert von wem und das ist nachführbar.

Katja Nettesheim: Und dann kannst du, während du das hörst oder liest, kannst du sagen, Metadaten bitte. Und dann kriegst du genau die Information dazu. Auf der nächsten Ebene.

Johannes Schaback: Hyperlink, der groß besungene in den 90er Jahren, ist de facto Quatsch, weil heutzutage google ich etwas. Das ist sozusagen mein neuer Link und bekomme neue Inhalte aus dem Internet. Dann werde ich einfach fragen, ich will mehr Informationen zu Macron oder zu seiner Frau, wenn mich das dann interessiert. Whatever. Also ich denke jetzt einfach an etwas, was ein bisschen obskur ist. So würde ich dann sozusagen diesen Hyperlink haben. Und so trete ich in eine Konversation ein mit diesem Agenten, wie du ihn genannt hast, und bekomme letztendlich die Information ab, dargeboten in einer real-time, persönlich auf mich abgestimmten, formatunabhängigen Art und Weise. Oh, der persönliche Journalismusagent, der uns unmittelbar immer begleitet. Das Entscheidende ist, was trägt der Journalist bei? Das ist extrem wichtig.

Katja Nettesheim: Absolut.

Johannes Schaback: Dieses Modell zu bauen. Weil erstens wird der Journalist immer dafür da sein, um zu entscheiden, was geht in das Modell rein? Was ist jetzt wirklich Wahrheit? Und was ist vielleicht sogar meine als solche gekennzeichnete Meinung? Das ist übrigens auch entscheidend. Weil Meinungsbildung wird noch wichtiger werden, weil je stärker, je größer, je mehr Menschen ich kennzeichne. Facebook, 1000 Freunde, etc., desto mehr möchte ich mich auf einzelne Menschen, denen ich total vertraue, verlassen können. Und von denen übernehme ich Meinungen. Es gibt ja jetzt schon interessante Studien auf Twitter, wer man erfolgt, etc. Der Faktor Mensch wird entscheidender, insbesondere bei der Meinungsbildung. Und dann ist die Möglichkeit, in einem Modell Meinung als solche auszuweisen und auch mitzugenerieren und damit in ein Streitgespräch mit so einem virtuellen Journalisten zu treten, auch möglich. Und das ist total entscheidend, weil ich dann sehe, okay, das ist der Joel oder die Katja, mit der ich sozusagen grundsätzlich in ein Sparing eingehe, vielleicht bin ich nicht 100 Prozent ihrer Meinung, aber ich kann auf jeden Fall mich daran reiben und ich bilde mich. Das ist total entscheidend, weil Meinung ist letztendlich etwas, was in Machine Learning nicht, und da rüftet man sehr schnell in die Philosophie ab, in dem Moment, wo ich der Maschine eine Meinung antrainiere, dann entflickte ich ja eigentlich meine eigene Meinung auf die Maschine. Ja. Das wird ganz interessant, wie das da funktioniert. Das heißt also, der Journalist als solcher in der Meinungsbildung, aber auch eben der Wahrheitserfindung und der Zusammenstellung der relevanten Informationen, der Nachrichten, das wird ganz essentiell wichtig sein. Und ich habe auch das Gefühl, aktuell in Zeiten der Lügenpresse erlebt das eine Wahnsinns-Renaissance.

Katja Nettesheim: Also vielleicht nochmal zusammenfassend jetzt in Bezug auf Medienunternehmen. KI ist jetzt schon tatsächlich da, vor allem im Bereich der Prozessverbesserung, Prozesserleichterung und der Zugänglichmachung von Feldern für die Analyse, die bisher eigentlich noch nicht der Analyse zugänglich waren.

Johannes Schaback: Ein tolles Beispiel ist übrigens, wenn du messen möchtest als Werbetreibender, wie häufig bei Fußballspielen deine Marke an dem Banner auf dem Fußballfeld eingeblendet wurde. Kannst du natürlich einen Menschen davor setzen, der einfach die Sekunden zählt. Kannst du aber auch eine Maschine trainieren.

Katja Nettesheim: Genau. Also das heißt, jetzt schon da in Erweiterung von Analysefeldern, in Verbesserung von Prozessen. Aber wir haben eine ganz andere Vision noch gemeinsam hier in den Raum gestellt, nämlich des persönlichen Journalismusagenten, der uns den ganzen Tag über begleitet und uns genau das ins Ohr flüstert oder vor Augen führt, was wir an Informationen bestellt haben oder auch gerade brauchen, so wie es passt in dem Moment. Und der wiederum ist sehr stark KI und Technologie getrieben, aber kann nichts sein ohne den Journalisten, der tatsächlich die Glaubwürdigkeit, die Autorität und auch die Meinung da in dieses System einspielt. Das heißt, man kann ja dann schon sagen, dass die KI das Megafon ist für den Journalisten, der es ermöglicht, dass er sich auf die echt wertschöpfenden Tätigkeiten konzentriert und das Produkt seiner Tätigkeit einfach auf viel unmittelbarerem, seamless Weg zum Menschen bringt.

Johannes Schaback: Genau, glaube ich auch.

Joel Kaczmarek: Was könnte es für ein besseres Schlusswort geben als von der guten Katja?

Katja Nettesheim: Ja, lange, lange gearbeitet.

Joel Kaczmarek: Hat auch nur einen Vortrag und einen Podcast gedauert.

Katja Nettesheim: Nee, aber wir haben das ja jetzt auch so verdichtet und man muss es am Schluss ja auch nochmal wirklich so hinstellen, damit es jeder im Kopf hat. Und jetzt können wir daran arbeiten, gemeinsam das in die Tat umzusetzen. In 20 Jahren treffen wir uns wieder und gucken, was draus geworden ist.

Joel Kaczmarek: Ja, genau. Ganz herzlichen Dank natürlich für deine viele Zeit und deine Passion und dein ganzes Wissen. Und wir sehen uns ja eh bald wieder bei Blackbox Tech.

Johannes Schaback: Das will ich hoffen.

Joel Kaczmarek: In diesem Sinne, over and out.

Katja Nettesheim: Hey! Hey!

Mehr zum Thema

Transformation

Diese Episode dreht sich schwerpunktmäßig um Medien: Denn Modelle, die in der Vergangenheit viel Geld in die Kassen der großen Medien und Verlage gespült haben, tun heute mitunter gähnende Leere auf. Was also tun? Dazu haben wir regelmäßig mit Medienexpertin Katja Nettesheim gesprochen, um die Geschäftsmodelle der Verlagswelt in der digitalen Zukunft sowie die Herausforderungen auf dem Weg dorthin zu verstehen.