Prompt Engineering: So bedienst du deine KI-Tools besser

Joel Kaczmarek: Hallo Leute, herzlich willkommen zu einer neuen Folge digital kompakt. und weißt du was, heute geht's mal richtig zur Sache, weil KI haben wir ja glaube ich schon alle mal drüber geredet, auch viel gemacht, aber wenn wir ganz ehrlich sind, der Teufel steckt ja bekanntlich im Detail. Also wenn ich die Sachen richtig machen möchte, dann braucht es ja ein paar Dinge mehr, deswegen reden wir heute mal über Prompt Engineering oder anders gesagt, wie kriege ich die KI dazu, dass sie das macht, was ich möchte, aber next level. Also nicht nur so dieses oberflächliche Zeugs, was jeder irgendwie kann, sondern dass wir mal eine Ebene drunter gehen und verstehen, okay, was sind denn so? ein paar wichtige Marker, paar wichtige Bausteine, die ich beachten sollte. So, und wie machen wir das heute? Mit einem meiner Lieblingsgäste, nämlich dem lieben Ruppert Bodmeier. Ihr kennt ja Ruppert vielleicht, der ist ja auf Innovationsentwicklung spezialisiert und hat mit Disruptive ein Tool geschaffen, wo man genau sowas machen kann. Und ich kann dir sagen, Ruppert hat genau diese Höhenfahrt, dieses Anstrengende, was man da so an Lerneffekten hat, schon durch mit seinem Tool. Weil er war irgendwann an dem Punkt, dass er gesagt hat, okay, krass, ich habe jetzt verstanden, wie Innovationsentwicklung funktioniert, also ich brauche erstmal eine Problemstellung, daraus leite ich Pain-Points ab, dann suche ich mir Benchmarks in anderen Industrien, also ich gucke, welche Beispiele gibt es um mich herum, die das erfolgreich machen, was ich lernen kann oder wovon ich lernen kann. Und dann geht es in die Lösungsfindung rein. Und dann hat er einen draufgesetzt, hat gesagt, alles klar, wie sieht denn das aus, wenn jetzt ab sofort die KI für mich macht? Und vielleicht kannst du dir vorstellen, wenn man so etwas hochindividualisiertes macht, dass man der KI regelmäßig unterschiedliche Inputs gibt und wir ein relativ ähnliches Ergebnis haben, dass das gar nicht so einfach ist. Von daher hat der liebe Ruppert sich bereit erklärt, heute mal seinen Erfahrungsstations aufzumachen und zu sagen, alles klar, Prompt Engineering, this is how it works. Und lieber Ruppert, freue ich mich total drauf. Schön, dass du da bist. Hello.

Ruppert Bodmeier: Ja, vielen Dank, lieber Joel. Das hast du so schön aufgezählt. Also ich hätte es nicht schöner erklären können.

Joel Kaczmarek: Aber wenn du jetzt mal sozusagen einen anderen Teil übernimmst, kannst du uns ja vielleicht mal verraten, so die Schmerzreise, war die groß bei dir?

Ruppert Bodmeier: Das war der letzte Scheiß, ehrlich. Manchmal hätte ich am liebsten meinen Rechner gegen die Wand geschleudert und konnte teilweise einfach echt nicht richtig schlafen, weil wir natürlich auch eine Menge Geld da rein investieren. Und du denkst dir die ganze Zeit, hey, warum kommt denn da jetzt nicht ums Verrecken dieses Ergebnis raus, was ich gerne haben möchte? Und wie soll ich es denn bitte schön noch formulieren? Und das ist jetzt hier schon die 20. Variante gewesen. Und der Scheiß läuft immer noch nicht. Also dieses Tal der Hölle ist aber normal, da muss ich irgendwo durch, weil die hohe Kunst beim Prompt Engineering ist letzten Endes echt Beharrlichkeit, Frusttoleranz, Resilienz, dranbleiben. weil am Ende des Abends die Zeit spielt für dich, weil diese Modelle, die werden alle drei Monate besser und besser und besser. Manches liegt nicht nur bei dir, manches merkt man einfach, das braucht dann halt Zeit und das funktioniert dann erst zu einem späteren Zeitpunkt, aber umso besser, wenn du davor schon eine Basis gelegt hast, viele Learnings mitgenommen hast und dann einfach die späteren Modelle, die einfach deutlich besser sind, dann dieses Vorwissen, was du dir mit Blutschweiß und Tränen aufgebaut hast, Wenn du das dann halt dann aber leichter ausgerollt bekommst, weil dann halt auch die Modelle soweit sind.

Joel Kaczmarek: Ja, vor allem, ich finde, der frustrierendste Zeitpunkt ist ja, wenn du irgendwie so ein Prompt gebaut hast oder ein GPT oder wie auch immer, bis Windows treibst und dann funktioniert was und dann kommt ein Update und es funktioniert auf einmal nicht mehr. Also manchmal macht es ja auch rückstürmter. Also als jetzt zum Beispiel bei ChatGPT diese ganze Bildgeschichte aufkam, habe ich mir sofort meinem Experten sagen lassen, ja du, das war der Moment, wo die ganze Textqualität rapide runtergegangen ist, weil auch die Computing-Power weggeht oder wenn das Wissen zu groß wird. Von daher, lass uns aber mal basic anfangen. Also was ist so? das erste Element, auf das du guckst, wenn du dir über Prompt Engineering Gedanken machst? Also womit sollte ich anfangen? Was ist sozusagen der Ausgangspunkt?

Ruppert Bodmeier: Also grundsätzlich ist es so, wir sind ja in einem exponentiellen Markt. Das heißt also, jenseits der Vorstellungskraft, die Dinge werden so rasant besser. Es ist einfach wirklich galaktisch. Man kann es gar nicht anders sagen. Wenn man sich guckt, was vor zwei Jahren ging und was heute geht, es ist wie eine andere Welt. umso wichtiger ist ja zu gucken, worauf setze ich eigentlich? Und du musst eigentlich auf Dinge setzen, wo du weißt, oder die Frage, die man sich strategisch stellt, was meine ich wird sich denn nicht ändern, wenn sich hier alles Mögliche ändert? Ich kann plötzlich irgendwie hier Bilder generieren ohne Photoshop, auch nur ein Fünkchen zu können. Ich kann plötzlich hier Filme machen ohne dass ich ein riesiges Team mit Budgetgröße von 50.000 Euro und ich mache das hier alleine zu Hause in meinem Kämmerchen ohne dass ich einen Pile-Up für 500 Dollar, ne? Wenn sich die Dinge so radikal ändern, musst du auf Dinge setzen, die sich eben nicht ändern. Bei uns war es ja zu sagen, weil es die Denksportaufgabe, ein Problem muss immer in kleinere Probleme zerlegt werden. Wenn du auf neue Gedanken kommst, musst du immer in andere Industrien schauen und du willst ja am Markt Erfolg, also willst du ja nur Prinzipien aufgreifen, wo du weißt, die funktionieren und die adaptiere ich auf meine Bonn. Das ist eine Grundidee. Die wird sich nicht ändern, weil ob am Ende des Abends ich Leute da Post-its an die Wand zu kleben, wie wir ursprünglich mal gestartet haben, oder ob ich es dann remote über ein eigenes Tool mache, was wir danach dann gemacht haben, während der Corona-Phase, oder ob das dann am Ende des Abends ich das über einen Prompt mache oder vielleicht zukünftig über einen Agent, ist egal. Das ändert sich nicht. Wenn ich gute Ergebnisse will, das ist einfach so eine Vorgehensweise, die wird immer spannende Ergebnisse produzieren. Darauf muss ich setzen. Und deswegen musst du halt immer gucken, in deiner Branche ist natürlich in anderen Branchen anders. Also was ist der eigentliche Sinn? Also wenn du jetzt zum Beispiel ein klassischer Fehler, nämlich die Buchbranche, dann darfst du auf gar keinen Fall immer auf Formate setzen. Du darfst nicht aufs Buch setzen, sondern musst meinetwegen auf das Prinzip von Lesen sein. Neugier wecken. Neues erfahren, unterhalten werden, einfach mal die Welt um mich herum vergessen. Also das sind so Dinge, auf so kann man setzen und die muss ich halt ausfindig machen, weil wenn sich die Welt um mich herum geht, dann muss ja die Basis, also das Fundament, auf das ich ja all das aufbaue, das muss langlebig sein. Das ist sozusagen die erste Krux.

Joel Kaczmarek: Aber jetzt mal wirklich Hand aufs Herz. Das ist ja so ein bisschen genau das Problem. In einer KI-Welt hast du ja das Gefühl, es gibt keine Konstanten mehr. Also das, was gestern noch so, hey, Agenturgeschäft, völlig erodiert, weil ich kann jetzt Kampagnen mit KI bauen und Bilder und Videos und pipapo. Gibt es denn wirklich bei so vielen Unternehmen so diesen Nukleus, also diese feste Basis, die sich egal was um dich rum an Technologie entsteht, nicht verändert?

Ruppert Bodmeier: Ja, immer das Kundenproblem. Das Problem bleibt ja. Leute haben irgendwie eine Herausforderung, das sie gelöst haben wollen. Und früher sind sie in den Laden gegangen, dann haben sie sich irgendwann mal online gemacht, dann haben die sich in Netzwerken zusammengeschlossen. Also die Form, die ändert sich immer. Aber solange du auf ein Thema setzt, wo du sagst, das hat immer einen Wert für Menschen, Kannst du drumherum Angebote stricken und ob du das dann halt über, indem du den Leuten einen Agent zur Verfügung stellst oder eine Dienstleistung, das ist dann eine Ausprägungsfrage. Aber das Problem ist, du darfst dich nicht so sehr über die Ausprägung definieren, sondern du musst dich halt über die Herausforderung, über das, was du bei den Leuten auslösen möchtest, den Wert, den du stiften musst, darauf musst du dich definieren, weil wenn du darüber dich orientierst, Bei uns ist es zum Beispiel, wir möchten halt Menschen in radikal kurzer Zeit neue Lösungswege aufzeigen und wir möchten, dass sie nicht bestehenden Trampelpfaden rumtouren. Das bleibt ja bestehen. Und früher haben wir das halt nur im Workshop gemacht, dann haben wir es über unser Tool gemacht, heute machen wir es über einen AI-Assistant, der das in zwei Minuten macht. Das Thema bleibt das gleiche. Die kommen trotzdem mit den gleichen Herausforderungen auf. Und da hat sich nichts dran geändert. Und die Ausprägung, also das Ergebnis, was wir abliefern, ist immer noch das gleiche. Aber die Art und Weise, wie wir machen, das ist eine völlig andere. Das ist wie schwarz auf weiß. Und deswegen ist immer zu sagen, was möchtest du am Ende abliefern, als Ergebnis haben, als emotionalen oder als Mehrwert? Und was möchtest du initial lösen? Startpunkt, Endpunkt, das muss sitzen. Das dazwischen musst du total offen sein, wie du es ja richtigerweise sagst. Heute mag ich es mit dem Agent, in der Zukunft mag ich es mit XY. Keine Sau weiß, was da kommt, aber das Problem wird es noch in zehn Jahren geben. Dass die Lösung relevant für die Menschen bleiben, wird auch noch in zehn Jahren der Fall sein. Und wenn du das sichergestellt hast, dann bist du eigentlich auf einem guten Trichter zu sagen, okay, da ist etwas, worauf wir setzen können.

Joel Kaczmarek: Hm, wir sind jetzt noch auf der Metaebene, also wir sind ja noch nicht tief unter die Haube gekrochen, aber was mich da nochmal ein Stück weit interessieren würde, ist ja, hast du noch Tipps für Unternehmen, weil das, was du beschrieben hast, ist ja so ein bisschen wie, ich bin Autobauer und jetzt kommt Elektro um die Welt oder um die Ecke. Also eigentlich ist das Thema nach wie vor, ich stelle Menschen Fahrzeuge zur Verfügung, die sie in hoher Geschwindigkeit mit Convenience von A nach B bringt. Aber vielleicht nicht mehr mit Benzin oder Diesel, sondern mit Elektro oder Wasserstoff oder whatever. Aber ich habe ja dann in der Regel, für diese Problemlösung, von der du gerade geredet hast, habe ich ja schon was gebaut. Also es gibt ja schon eine Legacy, es gibt ja schon etwas. Das heißt, ich glaube, viele Unternehmen tun sich damit sehr schwer, zu sagen, okay, was ist denn die Basis? und das mache ich jetzt mal mediums agnostisch. Also ich denke über die Basis nach und ignoriere dabei, aber ich könnte ja zum Beispiel auch sagen, gestern habe ich Podcast gemacht, morgen mache ich Video und übermorgen mache ich vielleicht Virtual Reality oder so. Hast du da einen Tipp, wie man Leuten quasi diesen Druck nehmen kann, wenn ich eine Legacy habe?

Ruppert Bodmeier: Kulturelle Themen sind natürlich ein schweres Ding, die ja schon so einige Unternehmen aus der Bahn irgendwo geschmissen hat. Letzten Endes, ich kann ja nur in die Welt gehen und eigentlich meine Fühler rausführen. Wenn der Wind sich dreht, muss ich mich halt auch drehen, weil eine Sache ist ja klar. Ich kann in solche Märkte nicht einsteigen, wenn sie schon laufen. Dann ist es ja oftmals zu spät. Die Geschichten, die da existieren, sind ja zahllos. IBM wäre prädestiniert gewesen, auch das Cloud Computing zu bestimmen. Die hatten ja alles da. Die hatten die Ingenieure, die hatten die Kunden, die hatten die Kompetenzen, aber haben sich halt nur sehr, sehr schwer von ihrem Server-Business trennen können und haben da zu lange draufgesetzt. Ich kann nur mal sagen, diese neuen Disziplinen, es wirkt so total ähnlich, es ist ja immer noch ein Auto. Ich komme ja immer noch von A nach B. Aber die Idee, ein Elektroauto zu bauen, ist halt eine völlig andere Idee, als ein Benziner zu bauen. Du brauchst andere Kompetenzen, du brauchst andere Fertigkeiten, du verkaufst es auch anders. Auch der Wert des Autos endet sich ja letzten Endes. Wenn du nur noch ein Drittel der Teile hast, dann ist der Preis höher als ein Benziner zu verlangen. Das ist halt nicht zu rechtfertigen. Ein Porsche, da war es oftmals so, wenn du einen Porsche gekauft hast, der hat einen Wert über die Dauer zugenommen. Im Elektrozeitalter ist das halt nicht mehr der Fall. Deswegen kann ich da einfach nur raten, nicht das Neue so herabtun, sondern sich früh genug damit auseinanderzusetzen und Experimente zu starten. Weil, das werden wir ja auch gleich herausfinden, KI hin oder her, ich kann ja sagen, wow, ich mache hier einen Prompt, tue da ein, zwei Sätzchen formulieren, ist aber halt ein völlig anderes Tier, wenn ich einen Befehl formuliere, der für mich funktioniert, als wenn ich einen Befehl funktioniere, der für eine dritte Person funktionieren muss. Also wenn ich einen Befehl für mich schreibe, ist das eine, aber wenn ich einen Befehl schreibe, der für dich funktionieren muss völlig anderes Tier, völlig andere Disziplin, völlig andere Erwartungshaltung und da muss ich mich auch ganz anders reinknien. Und wenn ich dann zum Beispiel einen Befehl schreiben muss, der dann nicht nur für eine andere Person, sondern für tausend unterschiedliche Personen funktionieren muss, wie mit allen unterschiedlichen Problemen auf mich zu kommen, dann reden wir wieder über ein völlig anderes Tier und über eine völlig andere Disziplin. Ich kann nur raten, Ins Experimentieren zu kommen, nicht eben zu sagen, ja KI, das ist nur ein Hype oder ich habe hier mal einen Satz reingehackt und irgendwie funktioniert das alles nicht. Du musst dich einfach mit dem Thema auseinandersetzen und in die Tiefe vorkommen, weil wenn du in die Tiefe vorkommst, merkst du, puh, ist eine völlig andere Welt. Aber da gibt es einfach keine pauschale Regel. Es hängt an einem selber, bin ich in der Lage offen zu sein, nicht direkt schon mal einen Stempel draufzuhören, schon vorzuverurteilen, ohne dass es schon einen Fall gibt. Das ist eigentlich die eigentliche Krux und die kulturelle Aufgabe, die du da eben hast.

Joel Kaczmarek: Gut, so dann lass uns doch mal sukzessive weiter eintauchen. Also Meta-Ebene, was ist meine permanente Basis? quasi, was ändert sich nicht, egal was draußen stürmt. Dann ist ja so der nächste Schritt, sich mal zu überlegen, welchen Output will ich eigentlich erzielen. So, hast du da schon mal so erste Tipps, wie ich da rangehe?

Ruppert Bodmeier: Also du musst rückwärts arbeiten. Du musst eigentlich eine klare Vorstellung davon haben, was hätte ich ganz gerne, wirklich ganz konkret als Ergebnis. Also lass sagen, ich bin Online-Händler, ich habe Modeprodukte und ich möchte, dass Menschen aus fünf, sechs unterschiedlichen Produkten, aus so einem Sortiment, dass wir daraus für die irgendeine persönliche Fashion-Show mit eben Laufsteg und so weiter machen und dann laufen da Models entlang und tragen so unsere Klamotten. Nur als Beispiel. Das heißt, ich muss einfach wirklich exakt definieren, was möchte ich eigentlich als Ergebnis dann eben haben? und dann muss ich rückwärts arbeiten, damit ich eine coole Video-Fashion-Show habe, da brauche ich ja irgendwie erstens, der Laufsteg muss ja cool aussehen. Das Setting muss irgendwie glaubwürdig und gut sein, das Publikum, das da drin sitzt, muss gut sein. Ich brauche ja irgendwie Musik, ich brauche Audio und so weiter und so fort. Also ich muss es dann zerlegen, was für einzelne Disziplinen setzt sich eigentlich dieses Ergebnis zusammen? und dann gehe ich rückwärts und gucke in den Markt, okay, und wer kann mir den besten Baustein dafür liefern? Also wer liefert mir hier heute welches KI-Modell mit weitem Abstand das beste Audio-Ergebnis. Wer schafft es heute, so etwas mit weitem Abstand das beste Video-Ergebnis zu generieren? Wer kriegt es heute, ohne dass das irgendwie verzerrt ist, Produkte irgendwie auf Models angezogen und Models so glaubwürdig langgehend zu lassen, dass die Leute sagen, wow, ich bin hier wirklich in meiner persönlichen eigenen Fashion-Show. Also ich gehe praktisch, zerlege das und Gucke, wer ist das beste Modell? und diese Modelle, die muss ich dann im Grunde eigentlich in Zusammenarbeit kriegen. Das heißt also, das Setting schicke ich an Modell A. Den Text als Intro, der gesprochen werden soll, schicke ich aber an Modell B. Das Video, das dafür generell wird, schenke ich wiederum an Modell C. Und diese einzelnen Befehle müssen auch total hochspezifisch dann eben ausformuliert werden. Und dann kriege ich hier Ergebnisse und die baue ich dann wieder zusammen. So funktioniert das. Das kann man sich im Grunde wie ein Orchester vorstellen. Also ich baue mir hier ein Orchester aus verschiedenen KI-Services und hier in meinem Orchester, zum Beispiel bei uns, spielt halt zum Beispiel die Chat-GPT-Geige zusammen mit dem Mid-Journey-Kontrabass und im Einklang mit Notebook-LM. Und ich bringe diese Modelle in Zusammenarbeit. Das ist eigentlich die hohe Kunst. Aber ich kann die Dinge nur in Zusammenarbeit bringen, wenn ich weiß, was muss jede einzelne Disziplin am Ende das machen. Wie wenn ich ein Haus baue. Ich brauche einen Schweiner, Tischler, was auch immer. Ich brauche einen Maurer. Ich brauche jemanden, der den Putz macht. Ich brauche jemanden, der die Innenverkleidung macht. Aber ich weiß am Ende, wie der Raum oder das Haus am Ende aussehen muss. Und dann tue ich das an die einzelnen Disziplinen raus. Eigentlich ist es exakt so, wird aber heute noch massiv unterschätzt, was da eigentlich dranhängt, KI-Modelle in Zusammenarbeit zu bringen, jedes Modell perfekt anzusprechen und dann einen Output abzuliefern, der eigentlich am Ende im Hintergrund 4, 5, 6 Services gearbeitet haben, hin zum Endkonsumenten muss es aber aus einem Guss wirken. Du hast ja richtigerweise gesagt, wir machen ja ein Benchmarking, aber dieses Benchmarking, da arbeiten fünf unterschiedliche Modelle zusammen und jedes Modell liefert uns einen eigenen kleinen Baustein und wir fügen diese dann in unseren Templates zusammen und spucken das dann eben raus und die Leute sind dann geflasht, was natürlich einen ganz anderen Effekt hat. als wenn die das in dem Chatfenster bei den einzelnen Modellen einzeln reinhacken und dann über eine PowerPoint dann vielleicht irgendwann mal mühsam zusammenkleistern.

Joel Kaczmarek: Okay, also ich verstehe ein Multi-Gewerke-Produkt sozusagen. Wie macht ihr das denn? Also wenn wir uns mal jetzt ranhangeln, so wie ich da mehr rauskitzle, was war denn bei euch so der Ort, an dem ihr das alles zusammenbringen musstet? Hattet ihr das neu aufsetzen? Konntet ihr Dinge schon nutzen, die es gab? Wie war das bei euch?

Ruppert Bodmeier: Also wir haben tatsächlich ein komplett neues Backend bauen müssen, weil heute gibt es eigentlich keine Software, wo du hochmodulare Promptbefehle zusammenbauen kannst und diese individuell dann eben rausschicken kannst, weil du musst dir überlegen Wir haben ja zum Beispiel verschiedenste Firmen bei uns irgendwie auf der Plattform und die einen, die verkaufen als B2B-Händler irgendwelche Schrauben an Großbetriebe und andere, die verkaufen wieder Rennradräder an irgendwelche Rennradfreaks. Also völlig andere Branchen, völlig andere Disziplinen schlagen sich auch mit völlig anderen Problemen um und trotzdem wollen ja alle irgendein gutes Benchmarking haben. Das heißt, es ist immer so eine Mix aus allgemeingültigen Befehlen plus eben individuelles Signaling. Also wir haben gelernt, der Kontext ist das A und O. Also lieber ein schlechter Befehl mit dem richtigen Kontext als ein top durchdefinierter Befehl ohne Kontext. Kontext ist das A und O. Qualität läuft heute nur über den Kontext. Bei uns war es so, erst als wir eben herausgefunden haben, okay, wir müssen die Zielgruppe definieren, die wir damit ansprechen und die müssen wir in den Befehl mitschicken. Wir müssen das Angebot, was dieses Unternehmen hat, das müssen wir definieren und das müssen wir mitschicken. Wir müssen auch überlegen, was ist das Businessziel und was ist das Format, in dem wir den Output haben wollen. Erst als wir diese Kontexte individuell, die einzelnen Unternehmen abgefragt haben, in unsere Befehle mit eingebaut und rausgeschickt haben, dann kam erst Qualität zurück. Weil sonst kriegst du einfach nur generischen Mist. Und wir haben halt gelernt, es gibt so eine Art Signaling-Wörter oder Signaling-Elemente, die einer KI sagen, okay, ich soll jetzt hier nicht allgemein spezifischen Output abliefern, sondern hier scheint was Spezifisches gefragt zu sein. Okay, dann tue ich vielleicht nochmal andere Parameter aktivieren, als ich es vielleicht sonst gemacht habe und lasse dann einen anderen Prozess laufen, als wenn du mit deinem allgemeinen Befehl darüber kommst. Also der Was in der Zukunft enorm wichtig wird und das ist der Deal schlechthin, du wirst Kontext gegen Mehrwert tauschen müssen. Du wirst den Kontext von den Nutzern abfragen müssen und den werden sie dir aber nur geben, wenn du dir dafür etwas abliefern kannst, dir so einen hohen Wert für die Stifte, dass sie bereit sind, den dir mitzuteilen.

Joel Kaczmarek: Was heißt bei dir alles Kontext? Also was würdest du darunter zusammenfassen?

Ruppert Bodmeier: Also zum Beispiel, Kontext heißt für mich zum Beispiel, spreche ich jetzt hier Rentner an. Oder spreche ich jetzt hier junge Flipper, die gerade in den Beruf eingestellt sind? Völlig anderes Tier, völlig andere Ansprache, auch völlig anderes Ergebnis rein. Das ist für mich so eine klassische Kontextanfrage. Wir sind erst damals drüber gestolpert, als mal ein Unternehmen zu uns kam. Das war eine Versicherung. Die wollten im Bereich Corporate Social Responsibility was machen und die wollten eine Kampagne machen. Und haben gesagt, okay, wir möchten jetzt hier eine zweiseitige Kampagne. Wir möchten im Grunde förderungswürdige Vereine suchen. Das heißt, Teil der Kampagne ist, nenn mir einen Verein, wo du sagst, der ist so toll und schafft so viel Wert für die Gesellschaft. Das ist ein Verein, der ist förderungswürdig. Und dann wollen sie im zweiten Schritt die Community darüber abstimmen lassen und welchen von diesen förderungswürdigen Vereinen suchen. Sollen wir denn jeden Tag unterstützen? Und dann haben wir natürlich irgendwie ein Kampagnenprojekt aufgesetzt, haben das rausgeschickt und die KI hat ständig als Output Versicherungen abgeliefert, die man für einen verchecken kann. Aber das war nicht die Frage. Es ist zwar ein Versicherungsunternehmen, aber Die Idee war nicht, jetzt diesen Verein Versicherungen zu verchecken, sondern das war ein ganz anderes Tier. Und da war uns klar, okay, verstanden, wir müssen der KI schon auch mitgeben, dass es jetzt hier nicht darum geht, dass hier als Output eben Versicherungen vercheckt wird, was man ja die KI automatisch annimmt, wenn du sagst, hier ist ein Versicherungsunternehmen, das dies und das machen möchte. Und darüber sind wir dann gestolpert. und dann haben wir uns eben einfallen lassen, okay, wie kommen wir an den richtigen Kontext ran, dass du auch für solche spezifischen Fragen guten Output liefern kannst.

Joel Kaczmarek: Ich glaube, ich weiß auch echt, was du meinst. Meine Frau und ich, wir haben jeder eine KI programmiert bekommen oder trainiert bekommen, die Fotos von uns erstellt. Also auf Prompt-Hinweis hin. Das heißt, ich kann dann irgendwie sagen, hier, ich sitze am Schreibtisch und halte einen Luftballon in der Hand. So, und dann kriegst du halt ein Bild von dir gebaut. So, und dann hatte meine Frau einen Podcast. Da ging es um, ich glaube, Bauchgefühl. Ich meine, es war sowas wie, warum trauen wir dem Verstand mehr als dem Bauch? Oder vielleicht ging es auch um Ernährung. Auf jeden Fall wünschte sie sich als Bild, ich sitze draußen auf einer schönen Wiese, auf einem Berg, habe eine Hand auf meinem Bauch und lächle in die Kamera. Weil es ging halt darum, Bauchgefühl zu fühlen. Und wirklich fast jedes Foto von ihr wurde schwanger generiert. Das heißt, die KI ging davon aus, dass wenn eine Frau ihre Hand auf ihren Bauch legt, dann wird der Anlass sein, dass sie schwanger ist. War es aber gar nicht. Sondern der Kontext war, ich will meinem Bauchgefühl vertrauen. Das ist, glaube ich, was du so meinst, ne?

Ruppert Bodmeier: Ja, vor allem jetzt überleg mal, ich könnte ja zum Beispiel hingehen, ich nehme irgendwie ein Produktfoto und sage so, ich hätte jetzt hier gerne, mach mir daraus bitte ein Modelshoot wie von Zalando. Und dann wird aus diesem Produktleger plötzlich ein Model reingepacet. Im ersten Moment natürlich erstmal Wahnsinn, dass sowas geht und dann kommt wirklich ein Foto und das hat auch echt eine ansehnliche Qualität. Aber da geht es schon los. Du lässt total viel offen. Weil da ist ja nicht definiert, möchte ich ein männliches Model oder möchte ich ein Frauenmodel? Möchte ich, dass die Person lange Haare oder kurze Haare hat? Blond oder schwarz? Soll die eine Uhr tragen oder nicht? Was soll denn unter dieser Jacke getragen werden? Das muss ja irgendwie auch dazu passen. Und passt es dann in der Ansprache auch wieder zu unserer Zielgruppe? Und dann merkt man eigentlich, wo eigentlich der Hund begraben liegt. Alles, was ich nicht definiere, wird über Annahmen für mich getroffen und da kann halt alles Mögliche rauskommen. Und je klarer ich weiß, was ich will und ich bin nicht fähig, das zu artikulieren, umso bessere Ergebnisse kann ich halt machen. Ich kann dann halt sagen, ich hätte ein Setting, gerne in den Highlands, ich hätte irgendwie eine Person, 50 plus. Soll so ein bisschen Top Gun Typ sein, hier drei Tage Bart, der soll schon grau sein, der soll so einen leichten Scheitel haben, der soll eine Breitling Uhr tragen. Weißt du, kannst du alles definieren, kannst du alles mitgeben und dann kriegst du halt exakt das, was du möchtest, was deiner Marke oder sonst irgendwas entspricht. Aber ich muss mir halt die Mühe machen, das einmal für mich zu definieren. Sonst definiert es für mich die KI und dann passiert es halt wie bei deiner Frau. Da wird halt angenommen, dass die schwanger ist, die Person, ist aber eigentlich gar nicht gefragt, habe ich vergessen, habe ich nicht mitgegeben, Kontext halt.

Joel Kaczmarek: Und jetzt mal so aus technischer Neugierde raus, wie macht ihr das bei euch? Jetzt, ich weiß ja auch, ihr definiert so ein Projekt, dann sagst du hier, was ist dein Ziel, beschreib mal das Business-Problem, dann fragst du, was ist denn die Zielgruppe, du fragst nämlich noch irgendwas weiteres ab, aber ich sag mal so eine Reihe von Dingen, wo man ja, glaube ich, versteht, was der Aufbau ist und dann flanscht er dir sozusagen Pain-Points runter und aus Pain-Points dann Lösungsideen und so weiter und so fort. Wie habt ihr das gemacht? Also ihr habt euer Backend, wo quasi diese ganzen Dinger gezogen werden, bap, bap, bap, bap, Und baut ihr dann quasi einen durchgehenden Prompt daraus zusammen, den ihr dann rüberreicht an einer der verschiedenen KIs, die ihr nutzt? Oder wie macht ihr das?

Ruppert Bodmeier: Wir sind genau so vorgegangen, wie ich es vorhin meinte. Wir haben gesagt, am Ende soll ein Prototyp rauskommen. Das ist unser Endergebnis. Damit wir aber einen guten Prototypen haben, brauchen wir erst eine Teaser. Aber wir können ja nur dann eine gute Teaser haben, wenn wir ein gutes Benchmarking haben. Und das heißt also, wir haben sozusagen das Endergebnis. in kleinere Bestandteile zerlegt. Was brauchen wir? Wir brauchen ein detailliertes Briefing, mit der eine KI super arbeiten kann. Wie sollen wir dann die große Herausforderung, die ich hier definiert habe, in kleinere Teilherausforderungen zerlegen und pro Teilherausforderung nochmal konzeptionelle Fragen stellen? Und das sind schon hinten im Backend zwei verschiedene Tiere. Das heißt also, wir haben erstmal hinten im Backend einen Reiter, der nichts anderes dafür sorgt, ein perfektes Projektbriefing zu generieren. Denn egal, was du mir da reinhackst, das reicht nicht, sondern du musst auch bestimmte Formulierungen rüberschicken, weil KIs damit besser arbeiten können. Aber im Grunde unsere Nutzer wissen das gar nicht. Also haben wir erstmal den Input immer von den Nutzern genommen und haben das in ein KI-taugliches Briefing umformulieren lassen, umgemünzt und erarbeiten lassen und haben diese einzelnen Felder halt spezifiziert. Also letzten Endes haben wir eigentlich den Input der Leute veredelt, weil wir wussten, wenn das zu oberflächlich ist, wenn das nicht detailliert genug, wie wir gerade ja drüber gesprochen haben, dann kommt keine gute Qualität drüber an. Das heißt, klingt dumm, aber wenn du einen tollen Prototypen haben möchtest, dann ist es total entscheidend, was du am Anfang machst. Weil das im Grunde die Qualität bis hinten festlegst. Und wenn du am Anfang die Qualität, die du reinkippst, das holst du hinten nicht mehr raus. Sondern du musst am Anfang sicherstellen, dass es die Qualität ist. Und dafür haben wir zum Beispiel hinten nur fürs Briefing Über acht unterschiedliche Felder, wo wir dann sagen, okay, in Briefings setze ich das und das zusammen. Da haben wir dann definiert, das sind Beispielformulierungen für ein gutes Briefing. Diese Befehle sind mit Variablen besetzt, weil je nachdem, was du da ja reinkippst, muss ja da sozusagen was anderes mitgeschickt werden. Und auch dieser Promptbefehl nur fürs Briefing, das ist ein JSON-Format. Für die, die es nicht wissen, das ist im Grunde, du tauschst Informationen formatlos aus, ohne dass du sagst, das ist jetzt ein Video oder ein Bild, sondern nur reiner Text. Und auch die Hierarchie ist total entscheidend, wie dieses JSON-Format aufgebaut ist. Also wie baust du das JSON-Format auf? Welche Variablen sind in welchem Baustein vom JSON? Wie ist der einzelne Befehl für dieses Briefing? Nur damit mal die Leute verstehen, was da ist. Wir haben bei uns ein Briefing, wir haben eine Aufgabenstellung, wir haben eine Beschreibung der Herausforderungen, eine Spezifizierung der Zielgruppe und das ist jeweils im JSON-Format ein einzelnes kleines Segment. Und für jede dieser kleinen Disziplinen gibt es einen eigenen Promptbefehl, der modular sich zusammensetzt und flexibel Variablen besetzt wird. Und da spätestens merkt man jetzt eigentlich, worüber reden wir denn hier eigentlich? Weil das ist nicht einfach etwas, was ich mal so schnell über Nacht mache oder so, jetzt geht hier die Fahrt ab. Das ist eine eigene Disziplin, da muss ich mega viel rumexperimentieren, wie muss das aufgebaut sein, wo müssen welche Variablen rein, wie kitzle ich da mehr Qualität raus. Ich muss Beispiele mitschicken, damit die KI weiß, was hätte ich ganz gerne als Output und wo soll das qualitativ landen, damit die mich versteht, was ich da haben möchte, weil sonst macht die irgendwas. Und da reden wir ja nur über das Segment Briefing und das haben wir für alle. Alle einzelnen Segmente gemacht, das haben wir dann dasselbe für die richtigen Fragenstellen gemacht, eigener Reiter mit eigenen modularen Befehlen, wo Variablen automatisch besetzt werden, dann fürs Benchmarking ebenso, das ist eine Aneinanderkettung und das haben wir uns Schritt für Schritt aufgebaut.

Joel Kaczmarek: Und sag mal, ich weiß ja von dir, dass die neueste Ausbaustufe deines Produktes sein wird, dass du nur noch ein Textfeld hast und ich brauche wirklich nur ganz, du sagst immer so schön, einen dummen Satz eingeben. Das nennt ihr Fire, das kann ich verstehen, wenn man da on Fire ist. Wie machst du das denn dann, wenn du eigentlich mir sagst, du hast reverse-engineert vom Produkt her, dir überlegt, was ich haben will und dann, was ich brauche, damit er das gut bauen kann. Und dann verschlankst du es aber sozusagen nach vorne hin so massiv, dass jemand dir nur noch so einen dusseligen Satz hinbaut. Wie funktioniert das dann, dass du da trotzdem dem noch gerecht wirst?

Ruppert Bodmeier: Das funktioniert dann, also wir kamen ja ursprünglich mal daher, dass wir ja immer erst gesagt haben, du gibst deinen Input rein und dann machen wir das perfekte Projektbriefing für dich. und dann wurde dir das ausgesprochen, dann konntest du dran arbeiten, konntest es nochmal überarbeiten, dran fallen, so dass es für dich passt. und dann haben wir gesagt, okay und jetzt passt das Briefing für dich. Und nun generieren wir für dich die Fragen. Aber wir haben da irgendwie gelernt, obwohl das im Grunde von der Arbeitszeit, nur damit du mal so ein Gefühl kriegst, früher haben wir Workshops gemacht, zwei Tage, zehn Leute eingesperrt und diese Arbeiter haben wir mit diesen einzelnen Befehlsketten innerhalb von einer halben Stunde alleine gemacht. Also zehn Leute, zwei Tage, also reden wir da über 160 Stunden, reduziert auf eine halbe Stunde und trotzdem war es den Leuten immer noch zu aufwendig. Das ist verrückt, aber dann muss ich das immer wieder neu eingeben und so weiter und so fort. Hat nicht funktioniert, sondern du musst eigentlich wirklich davon ausgehen, die Leute sind exakt bereit, einen Satz reinzuhacken. Das ist exakt die Bereitschaft der Leute. Das habe ich rausgefunden einfach in diesem ganzen KI. Die Leute sind bereit, einen Satz zu formulieren und dann erwarten die Magie. Und du musst es abliefern können. Und du kannst mit einem Satz ja nicht automatisch eine unfassbare Qualität erwarten. Wenn du jetzt zum Beispiel, du nutzt das Videomodell Sora, dann ist es natürlich genial, du machst nur einen Satz und dann kriegst du hier so ein kinotaugliches Video. Aber man muss den Prozess dahinter verstehen. Nämlich dein simpler Befehl wird im Backend bei Google und bei OpenAI, wie sie alle heißen, in tausend kleine Promptbefehle zerlegt, die dann alles von diesem Video definieren. Pro Befehl werden 259 Bilder generiert, die dann in einer kurzen Abfolge gemacht werden, zusammengesetzt werden und dann für dich als Video ausgespuckt werden. Du denkst, wow, ich bin so ein kreatives Genie. Und letzten Endes ist es auch das, was wir gemacht haben. Wir haben ja diese einzelnen Segmente definiert. Wir haben die Befehle ja definiert und so weiter und so fort und die einzelnen Dinge haben wir immer aufeinander aufgebaut. Also die Fragen, die gestellt wurden, haben wir auf das Briefing, das wir im Vorfeld generiert haben, aufgebaut. Die Benchmarks, die generiert werden, dafür war ja die Basis immer die richtigen Fragen. Erst muss ich ja die Fragen wissen, um zu gucken, was brauche ich denn für Lösungsbeispiele, die mir da weiterhelfen können. Dadurch, dass wir das von Anfang an aufeinander aufgebaut hatten, waren wir dann in der Lage, das halt komplett durchzuautomatisieren. Das heißt also, du hackst durch deinen Satz aus und dann geht erstmal der Befehl fürs Briefing raus. Wird das zu Ende generiert, als das Briefing dann komplett generiert und aus ist, dann schicken wir direkt die nächste Automatisierungskette raus und sagen so, und jetzt bitte Cluster aufbauen, Fragen stellen. Dann ist das abgearbeitet und dann schicken wir automatisiert die nächsten Befehle fürs Benchmarking raus. Also wir haben im Grunde eigentlich eine Kette aufgebaut, die, wenn das eine Gliederkette abgearbeitet wird, das nächste aktiviert wird. Und in der Summe, du gibst einen Sachs, ein und kriegst eigentlich das perfekte Projektbriefing. Du kriegst das Briefing, die Fragen gestellt, das Benchmarking und du kriegst sechs geniale Lösungen, wofür du vorher eine Woche brauchst. Aber die Befehle, die da abgeschickt werden, wenn ich die alle ausdrucke, die wir da losschicken, dann komme ich auf 25 DIN A4 Seiten. 25 DIN A4 Seiten. hochmodular und individuell mit Variablen besetzt, sodass am Ende des Abends kein Befehl mit dem anderen zu vergleichen ist. Und das ist der Wettbewerbsvorteil der Zukunft. Damit generierst du in der Zukunft einzigartige USPs, wenn du es schaffst, ein Thema auszuwenden und zu sagen, ich bin die Person, die mit weitem Abstand in dem Feld der die beste Person oder das beste Unternehmen bin, dann kannst du einzigartige Dinge machen, die nur schwer zu kopieren ist. Weil ich kriege ja immer wieder witzigerweise von Leuten, die sagen so, ja, ich kann ja auch bei Chet Chibitin Benchmarking machen. Aber die Person weiß nicht, wovon sie da spricht. Sie denkt, weil sie da ein, zwei Sätze formulieren können, dass das dann funktioniert. Aber das ist ein ganz anderes Tier und ich bin der Auffassung, dass das so komplex ist und das ist auch aus guten Gründen, deswegen Prompt Engineering heißt, Dass du damit Wettbewerbsvorteile bauen kannst, so wie halt Google oder TikTok mit ihren Algorithmen auch Wettbewerbsvorteile. Das kannst du da im Grunde eigentlich für dich auch bauen, wenn du dich auf den Weg machst.

Joel Kaczmarek: Sag mal, das ist ja ein interessantes Thema, die Länge. Also du hast jetzt gerade eben so einen Nebensatz erzählt, dass was für dich Interface ein Satz in einem Textfeld ist. Und hinterher kommt ein geiles Ergebnis raus, ist hinter den Kulissen 25 Seiten Dokument. Was ist denn so deine Erfahrung, was die Menge an Input für so eine KI angeht? Weil ich habe die Erfahrung gemacht, es gibt ja verschiedene Wege daran zu gehen. Also entweder schreibst du es in den Prompt oder du legst sozusagen Anhänger an und gibst ihnen den mit. Zum Beispiel Referenzobjekte. Also in meinem Beispiel jetzt war es zum Beispiel so, ich will jetzt, weiß ich nicht, einen Teaser für einen Podcast haben. Also ich möchte in meinen Shownotes irgendwie schreiben können, worum geht es in dieser Folge? und es soll so Bock machen von dem, was du da liest, dass du sofort einschaltest. So, peng. Da kann ich dir jetzt natürlich 20 Beispiele mitgeben, aber ich habe einfach so die Beobachtung gemacht. Manchmal ist es so, je mehr Input ich gebe, desto schwieriger wird das Ergebnis, weil ja auch ein Input immer gleich ein Token ist. Also der hat dann sozusagen immer Informationsstücke. Was ist denn so deine Erfahrung damit?

Ruppert Bodmeier: Also den größten Fehler, den du machen kannst, ist, das hatten wir auch oft gesehen, die Leute haben zum Beispiel einfach alles, was sie zum Projekt wussten, irgendwie ins Briefing reingehackt. Aber das ist so ein Kardinalfehler, weil alles, was du mitschickst, wird verarbeitet. Also du musst schon das Wichtige vom Unwichtigen trennen. Das ist ja die eigentliche Krux. Ich muss entscheiden können, ist das jetzt wichtig zu wissen oder ist das unwichtig? Und wenn es unwichtig ist, warum sollte ich es dann mitschicken? Weil wenn ich es mitschicke, wird es auf jeden Fall verarbeitet und mit eingeflossen. Also das sozusagen auseinander zu dividieren und eigentlich mein Problem auf den Kern zu reduzieren. Also was ist jetzt wirklich essentiell und was ist jetzt wichtig? Das ist sozusagen die eine Krux. das zu artikulieren zu können. Und das Zweite ist halt, dass du halt weißt, was sind die Elemente, die ich brauche, um spezifische Ergebnisse zu kriegen. Weil bei deinem Beispiel zu bleiben, du hast ja zig unterschiedliche Gäste mit zig unterschiedlichen Fachdisziplinen und Wissen. Das sind dann sozusagen wichtige Bausteine, die du auf jeden Fall mitschicken musst, weil es jedes Mal anders ist. Also die Elemente auch rauszuarbeiten und zu definieren, welche muss ich auf jeden Fall mitschicken, wenn ich ein spezifisches Ergebnis habe, ist dann die zweite Krux. Und wenn du nicht dann immer irgendwie auch ein Beispiel mitgibst, was für dich eigentlich gut ist, also ein Qualitätsindex. dann kannst du das auch vergessen, weil dann macht das Ding ja, was du möchtest. Also wenn du jetzt nicht beispielhafte Intro-Texte mal mitschickst, damit die KI nur so einen Hauch von Gefühl kriegt, worüber wir reden und im Idealfall schickst du sehr unterschiedliche Formulierungen mit, weil das eine Intro könnte man so lauten, das andere mal so, dass da eine gewisse Varianz drin sind, dann bist du schon auf einem relativ guten Trichter und dann muss man nochmal wissen, dass es echt auf Modelle ankommt. Zum Beispiel, wir haben verschiedene Projektarten, Du kannst zum Beispiel bei uns strategische Fragestellungen reinhacken, aber auch zum Beispiel User Experience. Und zum Beispiel strategische Fragestellungen schicken wir an OpenAI, weil die einfach in der analytischen Fragestellung sehr, sehr gut sind. Aber wenn du zum Beispiel eher kreativere Themen hast, dann schicken wir das eher an Anthropic. weil die mit kreativeren Fragen besser umgehen können. Also du musst auch die Disziplin der Modelle kennen, also wer ist jetzt hier geeigneter? und dann musst du auch noch verrückterweise auch noch die Modellvarianten differenzieren können. Also wenn du zum Beispiel möchtest, dass es super akkurat dein Befehl abgehandelt werden muss, dann ist zum Beispiel 4.1 von OpenAI dein Modell. Aber wenn du zum Beispiel sagst, ist mir eigentlich relativ egal, Hauptsache da ist geil formuliert, da Scheiß kommt raus, dann nimmst du eher Gemini zum Beispiel. Und da musst du halt experimentieren und gucken, welches Modell auch welche Ergebnisse zum Beispiel abliefert. Wir haben zum Beispiel bei uns im Backend 20 OpenAI-Varianten, die ich auswählen kann. Und für jede Projektart will ich eine andere. Und selbst auch für das Briefing. Das Briefing erstellt bei uns ein anderes Modell als das Modell, das für uns ein Benchmarking generiert. Also ich bleibe beim gleichen Projektart. Ich will eine User Experience Lösung. Das Briefing erstellt aber ein Tropic. Das Benchmarking macht aber OpenAI. Und den Prototypen baut mir aber Gemini zum Beispiel. Bleibt aber die gleiche Kette. Es bleibt die gleiche Projektart. Der User merkt nichts. Wir wissen aber, für die einzelnen Teildisziplinen müssen wir da verschiedene Modelle anpicken.

Joel Kaczmarek: Hast du dich da wirklich durch alle in mühevoller Kleinarbeit durchgetestet? Und vor allem, wenn Neues rauskommt oder sich ein Bestehendes ändert, passt du dann auch nachträglich an?

Ruppert Bodmeier: Muss ich. Muss ich. Aber es war jetzt nicht so, dass es bei mir Schmerzen ausgelöst hat, weil die Modelle werden ja immer besser. Die werden ja nicht schlechter. Die werden ja immer nur besser. Das heißt, eigentlich war immer, wenn ein neues Modell da war, dann war das gute Nachricht. Weil Sehr wahrscheinlich haben sie ein Teilproblem, was uns heute echt fuchsig macht, haben die irgendwie gelöst und mit jedem Modell wurde es auch immer besser. Deswegen habe ich jedes Mal gejubelt, wenn ein neues Modell kam und die können wir mit, weil wir über eine API laufen, in fünf Minuten andocken. Also wenn ChatGBT 4.2 rausbringt, theoretisch, dann sind wir in 30 Minuten angedockt. solange sie es über eine API bereitstellen. Das ist ja die Grundvoraussetzung. Und dann teste ich durch und gucke, funktionieren dann alle Befehle noch? Kriegen wir noch die Ergebnisse korrekt zurück? Also mit jedem Modell, das du ergänzt, machst du ein Testing durch und guckst, was kommt raus. Und das ist auch so, dass wir mal neuere Modelle nicht aufgegriffen haben, weil in dem Bezug jetzt die Ergebnisse nicht besser wurden. Wir merken das zum Beispiel bei der Bildgenerierung. Wir laufen immer noch über das Vorgängermodell von Flux, weil wir wollen User Interfaces herstellen, Und komischerweise kann das Vorgängermodell bessere Interfaces generieren als das neueste Modell. Dann gehen wir halt da nicht mit.

Joel Kaczmarek: Weißt du, ich habe aber auch einfach festgestellt, also ich kann ja, wenn ich jetzt zum Beispiel mal in der OpenAI-Welt bin, kann ich ja hingehen, kann Chat aufmachen, kann da kommunizieren. Dann wäre der nächste Ausbaustufe wäre, ich baue einen GPT. Also ich schaffe quasi eine Anleitung, die immer über dann ein Fenster replizierbar ist. Also ich habe quasi eine Wiederkehr. Und dann kann ich ja einen Assistant bauen. Das heißt, wenn ich jetzt hingehe und sage, ich mache Automatisierung mit Mac.com, dann will ich das vielleicht immer anpingen, so wie du es gerade beschrieben hast. Und das Asoziale daran ist ja, dass sie alle unterschiedlich funktionieren. Also ich kann den exakt selben Prompt nehmen. Er funktioniert als Chat anders als als GPT, anders als Assistant. Also Assistants brauchen zum Beispiel viel mehr Input und brauchst viel mehr Details und so weiter und so fort. Hast du da für dich einen guten Weg gefunden? oder ist das gar nicht so dein Problem, weil du eh alles über API löst?

Ruppert Bodmeier: Also wir lösen alles über API und wenn du echte Wettbewerbsvorteile generieren willst, dann kannst du es eigentlich nur über APIs machen, weil ein Tool-User ist. ein Tool-User ist ein Tool-User. Weil am Ende haben ja alle die gleichen Tools und dann kitzle ich halt da 5% mehr raus. Aber mit einer API kann ich machen, was ich möchte. Ich kann auch Dinge bauen, die keiner anderer baut. weil sich da irgendwie keiner da jetzt bemüßigt fühlt, dafür eine Lösung zu finden. Eigentlich der Wettbewerbsvorteil liegt immer echt in der API und in diesem Kettenbauen. Also du kannst jetzt natürlich OpenAI und super Befehle reinformulieren, aber am Ende des Abends wirst du nicht diesen riesen Unterschied ausmachen. Aber wenn du jetzt zum Beispiel sagst, du baust bei Make hochindividuelle Agents, die jetzt auf deinem Workflow das perfekte Ergebnis haben, da fängt halt Differenzierung an. Da würde ich schon eher darauf setzen, damit lassen sich einzigartige Dinge machen. Und wie gesagt, USPs der Zukunft sind Die laufen nicht über Tools, da braucht man sich gar nichts vormachen. Wenn ich jetzt sage, wir sind für KI gut aufgerüstet, weil alle Mitarbeiter haben bei uns hier eine Chat-GPT-Lizenz, dann ist es so, wie ich sage, wir sind für die Digitalisierung super aufgestellt, weil alle haben hier bei uns Word und Excel. Also so auf dem Level reden wir dann. Natürlich gibt es da ein paar Typen, die Excel-Götter drin sind, brauchen wir gar nicht diskutieren. Aber die haben andere Firmen halt auch und alle nutzen halt Excel. Und die Differenzierung funktioniert über die API.

Joel Kaczmarek: Ja, mega spannend. Und hast du vielleicht noch einen guten Tipp, wie man ChatGPT und Co. gut an den Start kriegt, wenn ich es über API ansteuere? Also gibt es da für dich so eine Art kleines Einmaleins, was ich beachten sollte? Also wir haben ja jetzt schon ganz viel gesagt, klar. Aber weißt du vielleicht, was ich meine? Wenn ich es über API ansteuere, reagiert es halt anders, als wenn ich es direkt anspreche.

Ruppert Bodmeier: Ja, also der Vorteil ist einfach über die API, ich kann ja die Dinge viel, viel, viel präziser machen, weil ich ja über dieses JSON-Format ja auch immer ganz viele Definitionen mitgeben kann. Also ich sage, an welchem Format hätte ich das Bild gerne, an welche Breite, welche Höhe, ich kann exakt definieren, soll das Model eine Uhr tragen oder nicht? und wenn eine Uhr, welche Uhr sollte das sein. Der große Vorteil Ich kann den Befehlen eine klare Struktur geben, einen Aufbau. Ich kann mit Hierarchie arbeiten. Ich kann auch mehrere Dinge ineinander reinsetzen oder ich kann auch Folgebefehle definieren. Also zum Beispiel beim Benchmarking ist es so, wir kriegen eine Beschreibung von einem Benchmarkbeispiel zurück und Aber diese Beschreibung nehmen wir und schicken danach direkt noch einen zweiten Befehl los, um eine Adaption hinzukriegen, damit du nicht alles in einem Befehl unterkriegen musst, was du es eigentlich heute machen würdest oder iterierst, wie du es in einem Chatfenster machen würdest, sondern du kannst halt solche Befehlsketten automatisieren. Das geht aber nur über eine API. Das kriegst du eigentlich so über, wenn du es im Chatfenster halt nicht machst, kriegst du es eigentlich praktisch nicht hin. Und diese klare Hierarchisierung von Befehlen und eben Kettenbefehle loszufeuern, sowas geht nur mit der API. Und das ist halt der Traum, weil du dann halt sehr komplexe Dinge machen kannst und weil du natürlich viel mehr Qualität rauskitzeln kannst, ohne dass es dich auch nur eine Sekunde mehr kostet. Du musst es halt einmal aufbauen, einmal definieren, schickst deinen einen Satz los und dann arbeitet diese Kette für dich die Dinge ab und zwar auf einem qualitativ viel, viel höheren Niveau, als wenn du da in dem Chatfenster immer ellenlange, seitenlange Befehle reinhörst. Der Kunst ist oder das Zauberwort, das dahinter steckt, ist diese Automatisierung. die dadurch möglich ist. Und die Kunst ist es, schlaue Ketten zu bauen, die zu einem einzigartigen Ergebnis führen und gleichzeitig die Qualität hochzuhalten. Und dieses Kettenbauen ist halt aber auch anstrengend. Ich habe jetzt mal ein bisschen versucht, so ein Gefühl dafür zu kriegen, was ist dafür eben notwendig. Aber ein USP, der nicht wehtut, ist kein USP. Das ist nur ein Feature. Weil dann kann es ja jeder. Es muss ja wehtun, nur dann ist es was einzigartiges letzten Endes.

Joel Kaczmarek: Geil, der Satz hat ja Qualität für so einen Zitatszettel. Ein USP, der nicht wehtut, ist kein USP. Und sag mal, laufe ich Gefahr, dass wenn ich solche Verkettungen baue, dass meine Fehlerwahrscheinlichkeit auch steigt? Also hast du gemerkt, dass es irgendwie schwieriger ist, zu dem Ergebnis zu kommen, was ich möchte, weil es ja mehrere Zwischenschritte gibt? Oder ist gerade noch das Gegenteil der Fall, weil du ja jedes einzelne Element quasi rückverfolgen kannst, dass es sogar eigentlich besser geht?

Ruppert Bodmeier: Also prinzipiell ist es so, dass ja die Qualität steigt, weil du ja immer wieder dafür Sorge trägst, dass der Input hochqualitativ ist. Das ist ja im Grunde die Chance, die ja drin schlummert. Man darf nur nicht den Fehler machen, also woran wir zum Beispiel lange laboriert haben, wir fanden immer, dass die Thesen nicht so gut waren und wir dachten immer, das liegt daran, weil die Benchmarks nichts taugen und haben halt ewig lang an den Benchmarks rumgefeilt, Wie muss denn jetzt ein Befehl sein, damit ein gutes Benchmarking zustande kommt? Bis wir irgendwann auf den richtigen kommen, ist es eigentlich nicht der Benchmarking-Befehl, der entscheidend ist und für die Qualität sorgt, sondern die Frage, die wir vorher generiert haben. Ist diese Frage individuell formuliert? Und wenn nein, dann tut sie mir halt nur generische Beispiele generieren. Also früher haben wir einen Befehl gesorgt und haben gesagt, zeig mir bitte coole Beispiele, die es geschafft haben, Nutzer auf eine emotionale Art zu berühren. Und dann kamen immer die gleichen Beispiele. Und wir haben dann gemerkt, nicht der Benchmarkbefehl das Problem, sondern die Frage, weil Nutzer ist, was soll Nutzer sein? Kann ja alles möglich sein. Reden wir über alte Leute, junge Leute, reden wir über Schwanger? reden wir über männlich, weiblich, keine Ahnung, nutze es alles. Und dadurch kommen dann halt auch allgemeingültige Beispiele. Aber die einen wollen halt Rentner ansprechen, die anderen vielleicht junge Familien. Es ist eine völlig andere Bitte, zeig mir Beispiele, die junge Familien, die gerade ein Kind bekommen haben. emotional berührt und begeistert und ein ganz anderes Tier, kriegst du auch ganz andere Beispiele. Und was hat emotional berührt? Also Dinge, die halt nicht klar definiert sind, die offen sind und die allgemeingültig sein können, werden immer schlechte Qualität produzieren. Deswegen haben wir gemerkt, wenn wir ein gutes Benchmarking wollen, muss der Schritt davor super sein. Und dann haben wir extrem viel Know-how reingelegt, dass wir individuelle Fragen generieren. Zum Beispiel sagen wir, bitte vermeide allgemeine Begriffe wie Menschen, Kunden, Nutzer. Weil das kann alles sein. Bitte formuliere diese Fragen so spezifisch wie möglich und es muss wirklich die Nerv der Zielgruppe sein. Und übrigens hier eine exakte Beschreibung der Zielgruppe, die wir erreichen möchten. Und hier übrigens mal eine Definition, mit was die sich so rumschlagen. Und hier mal beispielhafte, einzigartige formulierte Fragen, die total individuell formuliert sind, damit du so ein Gefühl dafür kriegst, was wir da meinen. Und als das gesetzt hat, dann wurden erst die Benchmarks besser, weil die KI gemerkt hat, oh, ich brauche Beispiele, die für junge Familien funktionieren. Ah, okay, und die haben seit fünf Tagen nicht mehr schlafen können, weil das Kind die ganze Nacht schreit. Ah, ich verstehe, die brauchen jetzt dringend eine Lösung, die sind aber auch echt arme Schweine, da finde ich doch was. Das ist ein ganz anderes Signaling an die KI, Dinge zu suchen und zu finden, als wenn ich sage, Nutzer schlafen nicht so gut. Was soll das sein? Wegen der Arbeit, wegen, keine Ahnung, Partnerin oder Partner, es ist total offen. Und das zu spezifizieren, das ist eigentlich prompt Engineering. Und wie komme ich da ran? Trage ich Sorge dafür, dass das individuell ist, um eben Qualität zu bekommen?

Joel Kaczmarek: Und sag mal so abschließende Frage, wir haben ja jetzt über so eine Tool-Welt geredet, die viel so über Automatisierung und API geht. Der, sag ich mal, bewegteste Teil ist ja ansonsten Agents, also wo man vielleicht auch mit sowas wie N8n irgendwie arbeiten würde. Wie bullisch bist du da so? Hast du auch vielleicht schon erste gute Erfahrungen gemacht? Was ist denn so dein Feeling, wo wir da stehen?

Ruppert Bodmeier: Also ich glaube, bei den Agents stehen wir da, wo vor drei, vier Jahren ChatGPT 3 stand. So in etwa, glaube ich, kann man das einordnen. Das ist total ausgeflippt, dass es jetzt sowas gibt. Das ist auch total ausgeflippt, dass es auch schon für so einzelne Disziplinen das gibt, zum Beispiel Coden. Das ist allein schon wirklich ein Quantensprung. und trotzdem muss man das einordnen, das ist alles in den Anfängen, da darf man auch noch nicht akkurate Ergebnisse erwarten und man muss echt eine sehr, sehr hohe Fehlertoleranz und Leidensfähigkeit noch mitbringen. Und trotzdem muss man ja davon ausgehen, wenn ich mir Bilder anschaue, die vor sechs Jahren über Dolly generiert haben, wie die aussahen und was heute geht, dann ist das gigantisch. Und so ist es eigentlich mit den Agents auch. Heute würde ich sagen, nicht werbsfähig. zu Workflows, Ketten, Assistenten. In drei bis vier Jahren werden die aber ausgeflippte Dinge machen. Und dann reden wir hier über ein ganz, ganz anderes Tier. Deswegen finde ich, ist es enorm wichtig, sich damit auseinanderzusetzen, auch wenn es jetzt in dieser Woche noch nicht die Welt verändern wird. Aber in drei, vier Jahren ist es was ganz anderes. Und trotzdem finde ich, bei Agents ein großer Nachteil bleibt für Leute wie zum Beispiel jetzt mich, die etwas klar im Kopf haben, wie ich es gerne hätte und wie das abgearbeitet werden soll. Damit muss ich erleben können, dass ein Agent macht, was er will. Weil das ist die Idee eines Agents. Ich gebe ja nur meine Aufgabe rein und ich definiere, was ich haben möchte. Aber wie es der Agent macht, ist total offen. Muss ich dem Agent überlassen. Das ist wie ein Mitarbeiter, den ich brief, die geht los, die Person und macht, was sie will erstmal. Und so funktioniert halt auch ein Agent und damit muss ich leben können. Und wenn ich damit nicht leben kann, dann wird Agent nie etwas, mit dem ich glücklich werde, sondern ich muss mich ja darauf verlassen, dass dieser Agent einen perfekten Prozess jetzt hier erarbeitet und ihn abarbeitet und iteriert und so lange, bis dann eine Qualität rauskommt, mit der ich auch glücklich und zufrieden bin. Und da bin ich mir relativ sicher. dass da auch wieder immer Ernüchterungen bei den Leuten kommen werden, dass der Agent ja doch nicht genau hier die perfekte Urlaubslocation auf Mallorca für mich findet, so wie das mir eigentlich versprochen wurde. Vielleicht, weil du es nicht richtig gebrieft hast. Also wir werden, glaube ich, dieselben Fehlerquellen, die wir heute haben, Beim Prompt Engineering und zum Bauen von Assistenten und Workflows haben. diese Fehlerquellen, die werden bei den Agents höchstwahrscheinlich wieder auftauchen, in der Ausprägung anders, aber auch da wird man wieder sehr genau iterieren müssen und definieren müssen und klarstellen müssen, dass dieser Agent wirklich in meinem Sinne arbeitet. Und vor allem, man darf ja immer nicht vergessen, diese Agents, die gehören nicht mir. Die arbeiten auch nicht für mich. Die suggerieren mir, dass sie für mich arbeiten, aber eigentlich arbeiten die für Google, die arbeiten für Facebook, die arbeiten für OpenAI und sie werden immer im Interesse von OpenAI und Google halten. Also ich würde nach Agents Ausschau halten, die so konzipiert sind, dass die in meinem Interesse agieren. Also zum Beispiel, wenn mir ein Instagram diese drei Leute vorschlägt zum Followen, ist das wirklich in meinem Interesse? Oder schlägt mir Instagram die vor, weil sie getrackt haben, Leute, die den vorlaufen, gehen häufiger zu Instagram. Also handelt hier diese Empfehlung in meinem Interesse? Oder würde mir nicht eine neutrale Person vielleicht andere Leute, die für mein Wohlbefinden vielleicht gesünder wären, empfehlen? Das sind die Fragen, die man sich in dem Zuge schon mitstellen sollte, bevor man da jetzt hier voll bullisch auf diese Agents geht. Also für wen arbeiten die? Arbeiten die in meinem Sinne? Und wenn sie es nicht tun, wie kann ich zumindest dann das so sicherstellen, dass da kein Humbug betrieben wird? Das sind die konzeptionellen Fragen, die da auf einen zukommen werden.

Joel Kaczmarek: Ja, spannend, Ruppert. Also, vielen, vielen Dank, dass du uns da mal mit unter die Haube genommen hast. Gerne, gerne. Und viel gelernt. und ja, bestimmt to be continued. Also ich freue mich aufs nächste Mal mit dir.

Ruppert Bodmeier: Danke dir.

Prompt Engineering: So bedienst du deine KI-Tools besser

Mehr zum Thema

KI-Experte: Was sind die wichtigsten KI-Tools dieses Jahr?

KI-Agenten im Marketing: Von Content bis Performance vollautomatisiert

KI-Agenten im Vertrieb: Wie Assistenten dein Sales-Game verbessern

digital kompakt

Für Werber

Für Werber