Dieses Transkript wurde maschinell erstellt. Wenn dir ein Fehler auffällt, schreib uns gerne zu diesem unter redaktion@digitalkompakt.de.
Joel Kaczmarek (00:00.078) ...
Joel Kaczmarek (00:03.712) Hallo Leute, herzlich willkommen zu einer neuen Folge Digital Kompakt. Und weißt du was, heute geht's mal richtig zur Sache. Weil KI haben wir ja glaube ich schon alle mal drüber geredet, auch viel gemacht. wenn wir ganz ehrlich sind, der Teufel steckt ja bekanntlich im Detail.
Wenn ich die Sachen richtig machen möchte, braucht es ein paar Dinge mehr. Deswegen reden wir heute über Prompt Engineering. Oder anders gesagt, wie kriege ich die KI dazu, dass sie das macht, was ich möchte? Aber next level. Also nicht nur dieses oberflächliche Zeugs, was jeder kann, sondern dass wir mal eine Ebene druntergehen und verstehen, was sind ein paar wichtige Marker, Bausteine, ich beachten sollte. So. Und mit wie machen wir das heute? Mit einem meiner Lieblingsgäste, dem lieben Rupert Botmayer. Ihr kennt Rupert vielleicht, der ist auf Innovationsentwicklung spezialisiert und hat mit Disruptive ein Tool geschaffen.
wo man genau so was machen kann. ich kann dir sagen, Rupert hat genau diese Höllenfahrt, dieses Anstrengende, was man da so an Lerneffekten hat, schon durch mit seinem Tool, weil er war irgendwann an dem Punkt, dass er gesagt hat, okay krass, ich hab jetzt verstanden, wie Innovationsentwicklung funktioniert, also ich brauch erst mal eine Problemstellung, daraus leite ich Pain Points ab, dann suche ich mir Benchmarks in anderen Industrien, also ich gucke, welche Beispiele gibt's mich rum, die das erfolgreich machen, was ich lernen kann, oder wovon ich lernen kann, und dann geht's in die Lösungsfindung rein.
Dann hat er einen draufgesetzt, gesagt, alles klar, wie sieht das aus, es ab sofort die KI für mich macht? Und vielleicht kannst du dir vorstellen, wenn man so etwas hoch Individualisiertes macht, dass man der KI regelmäßig unterschiedliche Inputs gibt und will ein relativ ähnliches Ergebnis haben, dass das gar nicht so einfach ist. Von daher hat der liebe Rupert sich bereit erklärt, mal seinen Erfahrungsstationsauf zu machen und zu sagen, klar, prompt engineering, this is how it works. Und lieber Rupert, freu ich mich total drauf, schön, du da bist.
Ruppert Bodmeier (01:35.234) Ja, vielen Dank, lieber Joel, jetzt hast du so schön aufgezählt, ne? Also ich hätte es nicht schöner erklären können.
Joel Kaczmarek (01:41.322) Aber wenn du jetzt mal einen anderen Teil übernimmst, kannst du uns vielleicht mal verraten, die Schmerzreise, war die groß bei dir, sich mit dem Thema auseinanderzusetzen?
Ruppert Bodmeier (01:47.602) Das war der letzte Scheiß, ehrlich. Manchmal hätte ich am liebsten meinen Rechner gegen die Wand geschleudert und konnte teilweise einfach echt nicht richtig schlafen, weil wir natürlich auch eine Menge Geld da rein investieren und du denkst dir die ganze Zeit, warum kommt denn da jetzt nicht ums Verrecken dieses Ergebnis raus, was ich gerne haben möchte und wie soll ich es denn bitteschön noch formulieren und das ist jetzt hier schon die 20. Variante und der Scheiß läuft immer noch nicht. Also dieses Tal der Hölle.
ist aber normal, da muss ich irgendwo durch, weil die hohe Kunst beim Prompt Engineering ist letzten Endes Echtbeharrlichkeit, Frusttoleranz, Resilienz dranbleiben, weil am Ende des Abends die Zeit spielt für dich, weil diese Modelle, die werden alle drei Monate besser und besser und besser. Manches liegt nicht nur bei dir, manches merkt man einfach, das braucht dann halt Zeit und das funktioniert dann erst zu einem späteren Zeitpunkt. Aber umso besser, wenn du davor schon eine Basis gelegt hast, viele Learnings mitgenommen hast.
und dann einfach die spätere Modelle, die einfach deutlich besser sind, dann dieses Vorwissen, was du dir mit Blutschweiß und Drehen aufgebaut hast, wenn du das dann halt dann aber leichter ausgerollt bekommen, weil dann halt auch die Modelle so weit sind.
Joel Kaczmarek (03:00.082) Ja, vor allem, ich finde, der frustrierendste Zeitpunkt ist ja, wenn du irgendwie so einen Prompt gebaut hast oder einen GPT oder wie auch immer, bis wenn du es treibst. Und dann funktioniert was und dann kommt ein Update und es funktioniert auf einmal nicht mehr. Also manchmal macht es ja auch Rückschritte. Also als jetzt zum Beispiel bei ChatGPT diese ganze Bildgeschichte aufkam, habe ich mir sofort meinem Experten sagen lassen, ja du, das war der Moment, wo die ganze Textqualität rapide runtergegangen ist, weil auch die Computingpower weggeht oder wenn das Wissen zu groß wird. Von daher, lass uns aber mal basic anfangen.
Ruppert Bodmeier (03:12.434) Ja, das ist der letzte Scheiß.
Joel Kaczmarek (03:29.406) Also was ist so das erste Element, das du guckst, wenn du dir über Prompt Engineering Gedanken machst? Also womit sollte ich anfangen? Was ist sozusagen der Ausgangspunkt?
Ruppert Bodmeier (03:38.05) Also grundsätzlich ist es so, wir sind ja da in einem exponentiellen Markt. heißt also, jenseits der Vorstellungskraft, die Dinge werden so rasant verbessert. Es ist wirklich einfach galaktisch. Man kann es gar nicht anders sagen. Wenn man sich guckt, was vor zwei Jahren ging und was heute geht, es ist wie eine andere Welt. Umso wichtiger ist ja zu gucken, worauf setze ich eigentlich. Und du musst eigentlich auf Dinge setzen, du weißt, oder die Frage, man sich strategisch stellt, was meine ich, wird sich denn nicht ändern, wenn sich hier ...
alles mögliche ändern. Ich kann plötzlich irgendwie hier Bilder generieren ohne Photoshop. Auch nur ein Fünkchen zu können. Ich kann plötzlich hier Filme machen ohne dass ich ein riesiges Team mit Budgetgröße von 50.000 Euro. Ich mache das hier alleine zu Hause, mein Kämmerchen ohne dass ich einen Pile habe für 500 Dollar. Damit sich die Dinge so radikal ändern, musst du auf Dinge setzen, die sich eben nicht ändern. Bei uns war es ja zu sagen, weil das die Denksportaufgabe
Ein Problem muss immer in kleinere Probleme zerlegt werden. Wenn du auf neue Gedanken kommst, musst du immer in andere Industrien schauen. du willst ja am Markt erfolgreich sein. Also willst du dir nur Prinzipien aufgreifen, wo du weißt, die funktionieren und die adaptiere ich auf meine Rolle. Das ist, wo wir sagen, das ist eine Grundidee. Die wird sich nicht ändern, weil ob am Ende des Abends ich Leute da postet, an die Wand zu kleben, wie wir ursprünglich mal gestattet haben, oder ob ich es dann remote über ein eigenes Tool mache, was wir dann nach dann gemacht haben.
während der Corona-Phase oder ob das dann am Ende des Abends ich das über einen Prompt mache oder vielleicht zukünftig über einen Agent ist egal, das ändert sich nicht. Wenn ich gute Ergebnisse will, das ist einfach so eine Vorgehensweise, die wird immer spannende Ergebnisse produzieren. Darauf muss ich setzen und deswegen musst du halt immer gucken in deiner Branche, ist natürlich in anderen Branchen anders, also was ist der eigentliche Sinn? Also wenn du jetzt zum Beispiel ein klassischer Fehler, wenn nehme ich die Buchbranche,
Dann darfst du auf gar keinen Fall immer auf Formate setzen. Du darfst nicht aufs Buch setzen, sondern du musst auf das Prinzip von Lesen sein. Neugewecken, neues erfahren, unterhalten werden, einfach mal die Welt mich herum vergessen. Das sind so Dinge, auf so kann man setzen. Und die muss ich ausfindig machen. Weil wenn sich die Welt mich rumgeht, dann muss die Basis, das Fundament, auf das ich all das aufbaue, das muss langlebig sein. Das ist sozusagen die erste Krux.
Joel Kaczmarek (05:54.763) Aber jetzt mal wirklich Hand aufs Herz. Das ist ja so bisschen genau das Problem in einer KI-Welt. Da hast du ja das Gefühl, es gibt keine Konstanten mehr. Also das, was gestern noch so, hey, Agenturgeschäft, völlig erodiert, weil ich kann jetzt Kampagnen mit KI bauen und Bilder und Videos und Pipapo. Gibt's denn wirklich bei so vielen Unternehmen so diesen Nukleus, also diese feste Basis, die sich, egal was dich rum an Technologie entsteht, verändert?
Ruppert Bodmeier (06:20.078) Immer das Kundenproblem, das Problem bleibt ja. Leute haben irgendwie eine Herausforderung, das sie gelöst haben wollen und früher sind sie in den Laden gegangen, dann haben sie sich irgendwann mal online gemacht, dann haben die sich in Netzwerken zusammengeschlossen. Also die Form, die ändert sich immer. Aber solange du auf ein Thema setzt, wo du sagst, das hat immer einen Wert für Menschen, kannst du drum herum Angebote stricken. Und ob du das dann halt über, indem du den Leuten einen Agent zur Verfügung stellst oder eine Dienstleistung, das ist dann eine Ausprägungsfrage.
Aber das Problem ist, du darfst dich nicht so sehr über die Ausprägung definieren, sondern du musst dich halt über die Herausforderungen, über das, was du bei den Leuten auslösen möchtest, den Wert, du stiften, darauf musst du dich definieren. Weil wenn du darüber dich orientierst, bei uns ist zum Beispiel, wir möchten halt Menschen in radikal kurzer Zeit neue Lösungswege aufzeigen und wir möchten, dass sie nicht in bestehenden Trampelpfaden rumturnen. Das bleibt ja bestehen.
Früher haben wir das mit einem Workshop gemacht, dann über unser Tool, heute über einen AI-Assistent, der das in zwei Minuten macht. Das Thema bleibt das Gleiche. Die kommen trotzdem mit den gleichen Herausforderungen auf. Da hat sich nichts dran geändert. Und die Ausprägung, also das Ergebnis, was wir abliefern, ist immer noch das Gleiche. Aber die Art Weise, wie wir machen, das ist eine völlig andere. Das ist wie schwarz auf weiß. Deswegen ist immer zu sagen, was möchtest du am Ende abliefern als Ergebnis haben, als emotionalen oder als Mehrwert?
Und was möchtest du initial lösen? Startpunkt, Endpunkt, das muss sitzen. Das dazwischen musst du total offen sein, wie du es ja richtigerweise sagst. Heute mach ich es mit dem Agent, in der Zukunft mach ich es X, Y. Keine Sau weiß, was da kommt. Aber das Problem wird es noch in 10 Jahren geben. Dass die Lösungen relevant für die Menschen bleiben, wird auch noch 10 Jahren der Fall sein. Und wenn du das sichergestellt hast, dann bist du eigentlich auf einem guten Trichter zu sagen, da ist etwas, worauf wir setzen können.
Joel Kaczmarek (08:15.212) Wir sind jetzt noch auf der Metaebene. Wir sind ja noch nicht tief unter die Haube gekrochen. Aber was mich da noch mal ein Stück weit interessieren würde, ja, hast du noch Tipps für Unternehmen? das, was du beschrieben hast, ist ja so ein bisschen wie, ich bin Autobauer und jetzt kommt Elektro die Welt oder die Ecke. Also eigentlich ist das Thema nach wie vor, ich stelle Menschen Fahrzeuge zur Verfügung, die sie in hoher Geschwindigkeit mit Convenience von A nach B bringen. Aber vielleicht nicht mehr mit Benzin oder Diesel, sondern mit Elektro oder Wasserstoff oder whatever.
Aber ich hab ja dann in der Regel für diese Problemlösungen, von der du gerade geredet hast, ich ja schon was gebaut. Also es gibt ja schon eine Legacy, es gibt ja schon etwas. Das heißt, glaub, viele Unternehmen tun sich damit sehr schwer zu sagen, okay, was ist denn die Basis? Und das mach ich jetzt mal mediums agnostisch. Also ich denk über die Basis nach und ignorier dabei aber ich könnte ja zum Beispiel auch sagen, gestern hab ich Podcast gemacht, morgen mach ich Video und übermorgen mach ich vielleicht Virtual Reality oder so. Hast du da einen Tipp, wie man Leuten quasi diesen Druck nehmen kann, wenn ich eine Legacy hab?
Ruppert Bodmeier (09:14.578) Also, kulturelle Themen sind natürlich ein schweres Ding, das schon einige Unternehmen aus der Bahn geschmissen hat. Letzten Endes, ich kann ja nur in die Welt gehen und eigentlich meine Fühler rausstellen. Wenn der Wind sich dreht, muss ich mich halt auch drehen. Eine Sache ist ja klar, ich kann in solche Märkte nicht einsteigen.
wenn sie schon laufen, dann ist es ja oftmals zu spät. Die Geschichten, die da existieren, ja zahllos. IBM wäre prädestiniert gewesen, auch das Cloud Computing zu bestimmen. Die hatten ja alles da. Die hatten die Ingenieure, hatten die Kunden, die hatten die Kompetenzen, aber haben sich halt nur sehr, sehr schwer von ihrem Server-Business sich halt trennen können und haben da zu lange draufgesetzt. Ich kann nur mal sagen, diese neuen Disziplinen, es wirkt so total ähnlich. Es ist ja immer noch ein Auto. Ich komme ja immer noch von A nach B.
Aber die Idee, ein Elektroauto zu bauen, eine völlig andere Idee als einen Benziner zu bauen. brauchst andere Kompetenzen, andere Fertigkeiten. Du verkaufst es auch anders. Auch der Wert des Autos endet sicher letzten Endes. Wenn du nur noch ein Drittel der Teile hast, dann ist der Preis höher als ein Benziner zu verlangen. Das ist nicht zu rechtfertigen. Nehm Porsche. Da war es oft mal so, wenn du einen Porsche gekauft hast, der hat einen Wert über die Dauer zugenommen.
Im Elektrozeit ist das halt nicht mehr der Fall. Deswegen kann ich da einfach nur raten, nicht das neu so herab tun, sondern sich früh genug damit auseinanderzusetzen und Experimente zu starten, weil das werden wir ja auch gleich rausfinden. KI hin oder her, ich kann ja sagen so wow, ich mach hier einen Prompt, tu da ein, zwei Sätzchen formulieren. Ist aber halt ein völlig anderes Tier, wenn ich einen Befehl formuliere, der für mich funktioniert, als wenn ich einen Befehl funktioniere, der für eine dritte Person funktionieren muss. Also wenn ich ein Befehl für mich schreibe,
ist das eine, aber wenn ich einen Befehl schreibe, für dich funktionieren muss, völlig anderes Tier, völlig andere Disziplin, völlig andere Erwartungshaltung, dann muss mich auch ganz anders reinknien. Und wenn ich dann zum Beispiel einen Befehl schreiben muss, der dann nicht nur für eine andere Person, sondern für tausend unterschiedliche Personen funktionieren muss, wie mit allen unterschiedlichen Problemen auf mich zu kommen, dann reden wir wieder über ein völlig anderes Tier und über eine völlig andere Disziplin. Und ich kann nur raten,
Ruppert Bodmeier (11:33.72) ins Experimentieren zu kommen, nicht zu sagen, ja, KI, das ist nur ein Hype, oder ich hab hier mal einen Satz reingehackt und irgendwie funktioniert das alles nicht. Du musst dich einfach mit dem Thema auseinandersetzen und in die Tiefe vorkommen, weil wenn du in die Tiefe vorkommst, merkst du, Pu ist eine völlig andere Welt. Aber da gibt's einfach keine pauschale Regel. Es hängt an einem selber, bin ich in der Lage, offen zu sein, nicht direkt schon meinen Stempel draufzuhören, schon vorzuverurteilen, ohne dass es schon einen Fall gibt.
Joel Kaczmarek (11:50.22) Hmm.
Ruppert Bodmeier (12:03.746) Das ist eigentlich eigentliche Krux und die kulturelle Aufgabe, die du da eben hast.
Joel Kaczmarek (12:09.213) Gut, dann lassen wir uns doch mal sukzessive weiter eintauchen. Also Metaebene, was ist meine permanente Basis quasi, was ändert sich nicht, egal was draußen stürmt. Dann ist der nächste Schritt sich mal zu überlegen, welchen Output ich eigentlich erzielen. Hast du da schon mal erste Tipps, wie ich da rangehe?
Ruppert Bodmeier (12:24.696) Also du musst rückwärts arbeiten. musst eigentlich eine klare Vorstellung davon haben, was hätte ich ganz gerne wirklich ganz konkret als Ergebnis. Also lass sagen, ich bin Online-Händler, ich Mode-Produkte und ich möchte, dass Menschen aus 5, 6 unterschiedlichen Produkten, aus so einem Sortiment, dass wir daraus für die irgendeine persönliche Fashion-Show mit eben Laufsteg und so weiter machen und dann laufen da Models entlang und tragen so unsere Klamotten. Nur als Beispiel.
Das heißt, ich muss wirklich exakt definieren, was möchte ich eigentlich als Ergebnis dann eben haben. Und dann muss ich rückwärts arbeiten. Damit ich eine coole Video-Fashion-Show habe, da brauche ich ja irgendwie, erstens der Laufsteg muss ja cool aus sein. Das Setting muss irgendwie glaubwürdig und gut sein. Das Publikum, das da drin setzt, muss gut sein. Ich brauche ja irgendwie Musik, brauche Audio und so weiter und so fort. Also ich muss es dann zerlegen. Was für einzelne Disziplinen setzt sich eigentlich dieses Ergebnis zusammen?
Und dann gehe ich rückwärts und gucke in den Markt, okay, und wer kann mir den besten Baustein dafür liefern? Also wer liefert mir hier heute welches KI-Modell mit weiten Abstand das beste Audioergebnis? Wer schafft es heute so etwas mit weitem Abstand das beste Videoergebnis zu generieren? Wer kriegt es heute, ohne dass das irgendwie verzerrt ist, Produkte irgendwie auf Models angezogen und Models so glaubwürdig langgehen zu lassen?
dass die Leute sagen, wow, ich bin hier wirklich in meiner persönlichen eigenen Fashion Show. Also ich gehe praktisch, zerlege das, gucke, wer ist das beste Modell und diese Modelle, die muss ich dann im Grunde eigentlich in Zusammenarbeit kriegen. Das heißt also, das Setting schicke ich an Modell A. Den Text als Intro, der gesprochen werden soll, schicke ich aber an Modell B. Das Video, das dafür generiert wird, schenke ich wiederum an Modell C und diese einzelnen Befehle müssen auch total hochspezifisch dann eben ausformen. Und dann
kriege ich die Ergebnisse und die baue ich dann wieder zusammen. So funktioniert das. Das kann man sich im Grunde wie ein Orchester vorstellen. Also ich baue mir hier ein Orchester aus verschiedenen KI-Services und hier in meinem Orchester, zum Beispiel bei uns, spielt halt zum Beispiel die Chatchie PT-Geige zusammen mit dem Midcherny Kontrabass und im Einglagen mit Notebook LM. Und ich bringe diese Modelle in Zusammenarbeit. Das ist eigentlich die hohe Kunst, aber das
Ruppert Bodmeier (14:45.018) Aber ich kann die Dinge nur in Zusammenarbeit bringen, wenn ich weiß, was muss jede einzelne Disziplin am Ende machen. Wie wir nicht ein Haus bauen. Ich brauche Schreiner, Tischler, auch immer. brauche einen Maurer, brauche jemanden, der den Putz macht. brauche jemanden, die Infallkleidung macht. Aber ich weiß am Ende, wie der Raum oder das Haus am Ende aussehen muss. Und dann tue ich das an die einzelnen Disziplinen raus. Eigentlich ist es exakt so, wird aber heute noch massiv unterschätzt.
Was da eigentlich dranhängt, KI-Modelle in Zusammenarbeit zu bringen, jedes Modell perfekt anzusprechen und dann ein Output abzuliefern, der eigentlich am Ende im Hintergrund 4, 5, 6 Services gearbeitet haben, hin zum Endkonsumenten muss es aber aus einem Guss wirken. Du hast ja richtigerweise gesagt, wir machen ja ein Benchmarking, aber dieses Benchmarking, arbeiten fünf unterschiedliche Modelle zusammen und jedes Modell liefert uns einen eigenen kleinen Baustand und wir
fügen diese dann in unseren Templates zusammen und spucken das dann eben raus und die Leute sind dann geflasht, was natürlich einen ganz anderen Effekt hat, als wenn die das in einem Chatfenster bei den einzelnen Modellen einzeln rein hacken und dann über eine PowerPoint dann vielleicht irgendwann mal mühsam zusammenkleistern.
Joel Kaczmarek (15:57.227) Okay, also ich verstehe ein Multi-Gewerke-Produkt sozusagen. Wie macht ihr das denn? Also wenn wir uns mal jetzt ran hangeln, so wie ich da mehr rauskitzle, was war denn bei euch so der Ort, an dem ihr das alles zusammenbringt? Musstet ihr das neu aufsetzen? Konntet ihr Dinge irgendwie schon nutzen, die es gab? Wie war das bei euch?
Ruppert Bodmeier (16:14.326) Also wir haben tatsächlich ein komplett neues Backend bauen müssen, weil heute gibt es eigentlich keine Software, wo du hochmodulare Promptbefehle zusammenbauen kannst und diese individuell dann eben rausschicken kannst. Weil du musst dir überlegen, wir haben ja zum Beispiel verschiedenste Firmen bei uns irgendwie auf der Plattform und die einen, verkaufen als B2B-Händler irgendwelche Schrauben an Großbetriebe und andere
Die verkaufen wieder Rennräder an irgendwelche Rennradfreaks. Also völlig andere Branchen, völlig andere Disziplinen schlagen sich auch mit völlig anderen ein Problem rum. Und trotzdem wollen ja alle irgendwie ein gutes Benchmarking haben. Das heißt, es ist immer so eine Mix aus allgemeingültigen Befehlen plus eben individuelles Signaling. Also wir haben gelernt, der Kontext ist das A und O.
Also lieber ein schlechter Befehl mit dem richtigen Kontext als ein top durch definierter Befehl ohne Kontext. Kontext ist das A und O. Qualität läuft heute nur über den Kontext. Bei uns war es erst als wir eben herausgefunden haben, okay, wir müssen die Zielgruppe definieren, die wir damit ansprechen und die müssen wir in dem Befehl mit schicken. Wir müssen das Angebot, was dieses Unternehmen hat, das müssen wir definieren und das müssen wir mit schicken. Wir müssen auch überlegen, was ist das Business Ziel und den
was ist das Format, in dem wir den Output haben wollen. Erst als wir diese Kontexte individuell die einzelnen Unternehmen abgefragt haben, in unsere Befehle mit eingebaut und rausgeschickt haben, dann kam erst Qualität zurück. Weil sonst kriegst du einfach nur generischen Mist. wir haben halt gelernt, es gibt so eine Art Signaling-Wörter oder Signaling-Elemente, die einer KI sagen, okay, ich soll jetzt hier nicht allgemein spezifischen Output abliefern, sondern hier scheint was kreatives.
gefragt zu sein, okay, dann tu ich vielleicht nochmal andere Parameter aktivieren, als ich vielleicht sonst gemacht hab und lass da einen anderen Prozess laufen, als wenn du mit deinem allgemeinen Befehl darüber kommst. das, was in der Zukunft enorm wichtig wird, und das ist der Deal schlechthin, du wirst Kontext gegen Mehrwert tauschen messen und wirst den Kontext von den Nutzern abfragen müssen und den werden sie dir aber nur geben, wenn du dir dafür etwas abliefern kannst, der so einen hohen Wert für die Stifte, dass sie bereit sind, den dir mitzuteilen.
Joel Kaczmarek (18:36.56) Was heißt bei dir alles Kontext? Also was würdest du darunter zusammenfassen?
Ruppert Bodmeier (18:40.654) Also zum Beispiel, Kontext heißt für mich zum Beispiel, spreche ich jetzt hier Rentner an oder spreche ich jetzt hier junge Flipper, die gerade in den Beruf eingestimmt, völlig anderes Tier, völlig andere Ansprache, auch völlig anderes Ergebnis rein. Das ist für mich so eine klassische Kontext Anfrage. Wir sind erst damals darüber gestolpert, als mal ein Unternehmen zu uns kam. Das war eine Versicherung.
Die wollten im Bereich Corporate Social Responsibility was machen und die wollten eine Kampagne machen und haben gesagt, okay, wir möchten jetzt hier eine zweiseitige Kampagne. Wir möchten im Grunde förderungsmüdige Vereine suchen. Das heißt Teil der Kampagne ist, nenn mir einen Verein, wo du sagst, ist so toll und schafft so viel Wert für die Gesellschaft. Das ist ein Verein, ist
förderungswürdig und dann wollen im zweiten Schritt die Community darüber abstimmen lassen und welche von diesen förderungswürdig vereinen sollen wir denn jeden Tag unterstützen und dann haben wir natürlich irgendwie eine Kampagnenprojekt aufgesetzt, haben das rausgeschickt und die KI hat ständig als Output Versicherungen abgeliefert, die man vereinen verchecken kann. Aber das war nicht die Frage. Es ist zwar ein Versicherungsunternehmen, aber
Die Idee war nicht, diesen Verein Versicherungen zu verchecken, sondern das war ein ganz anderes Tier. Und da war uns klar, okay, verstanden, wir müssen der KI schon auch mitgeben, dass es jetzt hier nicht darum geht, dass hier als Output eben Versicherungen vercheckt wird, was man ja die KI automatisch annimmt, wenn du sagst, hier ist ein Versicherungsunternehmen, das, diese und das machen möchte. Und darüber sind wir dann gestolpert und dann haben wir uns eben einfallen lassen, okay, wie kommen wir an den richtigen Kontext ran?
dass du auch für solche Fragen guten Output liefern kannst.
Joel Kaczmarek (20:28.209) Ich glaube, ich weiß auch echt, was du meinst. Meine Frau und ich, haben jeder eine KI programmiert bekommen oder trainiert bekommen, die Fotos von uns erstellt, also auf Prompt-Invice hin. Das heißt, ich kann dann irgendwie sagen, hier, sitze am Schreibtisch und halte einen Luftballon in der Hand. So, und dann kriegst du halt ein Bild von dir gebaut. So, und dann hatte meine Frau einen Podcast, da ging es ich glaube, Bauchgefühl. Ich meine, es war so was wie, warum trauen wir dem Verstand mehr als dem Bauch? Oder vielleicht ging es auch Ernährung. Auf jeden Fall wünschen sie sich als Bild, ich sitze draußen auf einer schönen Wiese auf einem Berg.
habe eine Hand auf meinem Bauch und lächelte in die Kamera, weil es ging halt darum, Bauchgefühl zu fühlen. Und wirklich fast jedes Foto von ihr wurde schwanger generiert. Das heißt, die KI ging davon aus, dass wenn eine Frau ihre Hand auf ihren Bauch legt, dann wird der Anlass sein, dass sie schwanger ist. War es aber gar nicht, sondern der Kontext war, ich will meinem Bauchgefühl vertrauen. Von daher, das ist glaube was du so meinst, ne?
Ruppert Bodmeier (21:16.033) Ne?
Ja, vor allem jetzt überleg mal, ich könnte jetzt zum Beispiel hingehen, ich nehme irgendwie ein Produktfoto und sag so, ich hätte jetzt hier gerne, ähm, mach mir daraus bitte ein Modelshoot wie von Zalando. Und dann wird aus diesem Produktleger plötzlich ein Model reingepastet. Im ersten Moment, natürlich erstmal Wahnsinn, dass sowas geht und dann kommt wirklich ein Foto und das hat auch echt eine ansehnliche Qualität. Aber da geht schon los, du lässt total viel offen. Weil da ist ja nicht definiert, möchte ich ein männliches Model oder möchte ich ein Frauenmodel.
Joel Kaczmarek (21:47.371) Bye,
Ruppert Bodmeier (21:48.012) Möchte ich, dass die Person lange Haare oder kurze Haare hat? Blond oder schwarz? Soll die eine Uhr tragen oder nicht? Was soll denn unter dieser Jacke getragen werden? Das muss ja irgendwie auch dazu passen. Und passt es dann in der Ansprache auch wieder zu unserer Zielgruppe. Und dann merkt man eigentlich, wo eigentlich der Hund begraben liegt. Alles, was ich nicht definiere, wird über Annahmen für mich getroffen. Und da kann halt alles Mögliche rauskommen. Und je klarer ich weiß, was ich will und ich bin nicht fähig, das zu artikulieren,
Umso bessere Ergebnisse kann ich halt machen. Ich kann dann halt sagen, ich hätte ein Setting, in den Highlands, ich hätte irgendwie eine Person, 50 plus, soll so bisschen Top Gun Typ sein, hier 3 Tage Bart, der soll schon grau sein, der soll so einen leichten Scheitel haben, der soll eine Breitling-Uhr tragen, weißt du, kannst du alles definieren, kannst du alles mitgeben und dann kriegst du halt exakt das, was du möchtest, was deiner Marke oder sonst irgendwas entspricht. Aber ich muss mir halt die Mühe machen, das einmal für mich zu definieren.
Sonst definiert es für mich die KI und dann passiert es halt wie bei deiner Frau. Da wird halt angenommen, dass die schwanger ist, die Person. Ist aber eigentlich gar nicht gefragt, hab ich vergessen, hab ich nicht mitgegeben, Kontext halt.
Joel Kaczmarek (22:56.138) Jetzt mal aus technischer Neugierde raus. Wie macht ihr das bei euch? Ich weiß ja auch, ihr definiert so ein Projekt. Dann sagst du hier, was ist dein Ziel? Beschreib mal das Businessproblem. Dann fragst du, was sind die Zielgruppe? Du fragst noch was weiteres ab. sag mal, eine Reihe von Dingen, wo man versteht, was der Aufbau ist. Dann flanscht er dir sozusagen Paint Points runter und aus Paint Points dann Lösungsideen und so weiter. Wie habt ihr das gemacht? Ihr habt euer Backend, wo diese ganzen Dinger gezogen werden.
baut ihr dann quasi einen durchgehenden Prompt daraus zusammen, den ihr dann rüber reicht, an einer der verschiedenen KIs, ihr nutzt? Oder wie macht ihr das?
Ruppert Bodmeier (23:30.962) Wir sind genau so vorgegangen, wie es vorhin meinte. Wir haben gesagt, am Ende soll ein Prototyp rauskommen. Das ist unser Endergebnis. Damit wir aber einen guten Prototyp haben, brauchen wir erst eine These. Aber wir können ja nur dann eine gute These haben, wenn wir ein gutes Benchmarking haben. Und das heißt, wir haben sozusagen das Endergebnis in kleinere Bestandteile zerlegt. Was brauchen wir? Wir brauchen ein detailliertes Briefing, mit der eine KI super arbeiten kann. Die sollen wir dann, die große Herausforderung, die ich hier definiert habe, kleinere Teilherausforderungen zerlegen.
und pro Teil der Herausforderung nochmal konzeptionelle Fragen stehen. Und das sind schon hinten im Backend zwei verschiedene Tiere. Das heißt also wir haben erstmal hinten im Backend einen Reiter, der dir nichts anderes dafür sorgt, perfektes Projektbriefing zu generieren. Denn egal was du mir da reinhackst, das reicht nicht. Sondern du musst auch bestimmte Formulierungen rüber schicken, weil KI's damit besser arbeiten können.
Aber im Grunde unsere Nutzer wissen das gar nicht. Also haben wir erstmal den Input immer von den Nutzer genommen und haben das in ein KI-taugliches Briefing umformulieren lassen, umgemünzt und erarbeiten lassen und haben diese einzelnen Felder halt spezifiziert. Also letzten Endes haben wir eigentlich den Input der Leute veredelt, weil wir wussten, wenn es zu oberflächlich ist, wenn es nicht detailliert genug, wie wir gerade ja drüber gesprochen haben, dann kommt gar eine gute Qualität drüber. Das heißt,
Klingt dumm, aber ich möchte, wenn du einen tollen Prototypen haben möchtest, dann ist es total entscheidend, was du am Anfang machst, weil das im Grunde die Qualität bis hinten festlegt. Und wenn du am Anfang die Qualität, die du reinkippst, das holst du hinten nicht mehr raus, sondern musst am Anfang sicherstellen, dass die Qualität ist. Und dafür haben wir zum Beispiel hinten nur fürs Briefing über acht unterschiedliche Felder, wo wir dann sagen, okay, in Briefing setze ich das und das zusammen.
Da haben wir dann definiert, sind Beispielformulierungen, führen gutes Briefing, diese Befehle sind mit Variablen besetzt, weil je nachdem was du da ja reinkippst, muss ja da sozusagen was anderes mitgeschickt werden und auch dieser Promptbefehl nur fürs Briefing, das ist ein JSON Format, für die die es nicht wissen, das ist im Grunde, du tauschst Information formatlos aus, ohne dass du sagst, das ist jetzt ein Video oder das ein Bild, sondern nur reiner Text.
Ruppert Bodmeier (25:43.446) Und auch die Hierarchie ist total entscheidend, wie dieses Chasen-Format aufgebaut ist. wie baust du das Chasen-Format auf? Welche Variablen sind in welchem Baustein vom Chasen? Wie ist der einzelne Befehl für dieses Briefing? Nur damit mal die Leute verstehen, was da ist. Wir haben bei uns ein Briefing, haben eine Aufgabenstellung, wir eine Beschreibung, eine Herausforderung, Spezifizierung der Zielgruppe und das ist jeweils im Chasen-Format ein einzelnes kleines Segment.
Und für jede dieser kleinen Disziplinen gibt es einen eigenen Promptbefehl, der modular sich zusammensetzt und Flexibelvariablen besetzt wird. Und da spätestens merkt man jetzt eigentlich, worüber reden wir denn hier eigentlich? Weil das ist nicht einfach etwas, was ich mal so schnell über Nacht mache oder so, jetzt geht hier die Fahrt ab. Das ist eine eigene Disziplin, da muss ich mega viel rum experimentieren, wie muss das aufgebaut sein, wo müssen welche Variablen rein, wie kitzle ich da mehr Qualität raus.
Ich muss Beispiele mit schicken, damit die KI weiß, was hätte ich ganz gerne als Output und wo soll es qualitativ landen, damit die mich versteht, was ich da haben möchte, aber sonst macht die irgendwas. So und da reden wir ja nur über das Segment Prefixing. Das haben wir für alle einzelnen Segmente gemacht, dass haben wir dann dasselbe für die richtigen Fragenstellen gemacht. Eigener Reiter mit eigenen modularen Befehlen, wo Variablen automatisch besetzt werden, dann fürs Benchmarking ebenso. Das ist eine Enanderkettung.
Joel Kaczmarek (27:09.801) Hm.
Ruppert Bodmeier (27:10.095) Und jetzt haben wir uns Schritt für Schritt aufgebaut.
Joel Kaczmarek (27:13.397) Und sag mal, ich weiß ja von dir, dass die neuste Ausbaustufe deines Produktes sein wird, dass du nur noch ein Textfeld hast und ich brauch wirklich nur ganz ... Du sagst immer so schön einen dummen Satz eingeben. Das nennt ihr Fire, kann ich verstehen, wenn man da on Fire ist. Wie machst du das denn dann, wenn du eigentlich mir sagst, du hast reverse-engineert vom Produkt her, überlegt, was ich haben will und dann, ich brauche, damit er das gut bauen kann. Und dann verschlankst du's aber sozusagen nach vorne hin so massiv, dass jemand dir nur noch so einen dusseligen Satz ...
Ruppert Bodmeier (27:25.426) Ich
Joel Kaczmarek (27:40.475) Wie funktioniert das dann, dass du da trotzdem dem noch gerecht wirst?
Ruppert Bodmeier (27:44.162) Das funktioniert dann, also wir kamen ja ursprünglich mal daher, dass wir ja immer erst gesagt haben, du gibst dein Input rein und dann machen wir das perfekte Projekt-Priefing für dich und dann wurde dir das ausgespuckt, dann konntest du dran arbeiten, kannst du es nochmal überarbeiten, fallen, so dass es für dich passt und dann haben wir gesagt, okay und jetzt passt das Briefing für dich und nun generieren wir für dich die Fragen. Aber wir haben da irgendwie gelernt, obwohl das im Grunde
von der Arbeitszeit, nur damit du mal so Gefühl kriegst. Früher haben wir Workshops gemacht, zwei Tage, zehn Leute eingesperrt und diese Arbeiter haben ja mit diesen einzelnen Befehlsketten innerhalb von einer halben Stunde alleine gemacht. Also zehn Leute, zwei Tage. Also reden wir da über 160 Stunden, reduziert auf eine halbe Stunde und trotzdem es den Leuten immer noch zu aufwendig. Das ist verrückt. Aber die haben ja, aber da muss ich das immer wieder neu eingeben und so weiter und so fort.
hat nicht funktioniert, sondern du musst eigentlich wirklich davon ausgehen, die Leute sind exakt bereit, einen Satz reinzuwecken. Das ist exakt die Bereitschaft der Leute. Das hab ich rausgefunden einfach in diesem ganzen KI. Die Leute sind bereit, einen Satz zu formulieren und dann erwarten die Magie. Und du musst es abliefern können. Und du kannst mit einem Satz ja nicht automatisch eine unfassbare Qualität erwarten. Wenn du jetzt zum Beispiel, du nutzt das Videomodell Sora.
dann ist es natürlich genial, du machst nur einen Satz und dann kriegst du hier so ein kinotaugliches Video, aber man muss den Prozess dahinter verstehen. Nämlich dein simpler Befehl wird im Backend bei Google und bei OpenAI, und wie sie alle heißen, in tausend kleine Promptbefehle zerlegt, die dann alles von diesem Video definieren. Pro Befehl werden 259 Bilder generiert, die dann in einer kurzen Abfolge gemacht werden, zusammengesetzt werden und dann für dich als Video ausgespuckt werden. Du denkst, wow, ich bin so ein kreatives Chini.
Und letzten Endes ist es auch das, was wir gemacht haben. Wir haben ja diese einzelnen Segmente definiert. Wir haben die Befehle definiert und so weiter und so fort. die einzelnen Dinge haben wir immer aufeinander aufgebaut. Also die Fragen, die gestellt wurden, haben wir auf das Briefing, das wir im Vorfeld generiert haben, aufgebaut. Die Benchmarks, die generiert werden, dafür war ja die Basis immer die richtigen Fragen. Erst muss ja die Frage wissen, zu gucken, was brauche ich denn für Lösungsbeispiele, die mir da weiterhelfen können.
Ruppert Bodmeier (29:57.966) Dadurch, dass wir das von Anfang an aufeinander aufgebaut hatten, waren wir dann in der Lage, das halt komplett durch zu automatisieren. Das heißt also, du hackst noch deinen Satz aus und dann geht erstmal der Befehl fürs Briefing raus. Wird das zu Ende generiert, als das Briefing dann komplett generiert und aus ist, dann schickt mir direkt die nächste Automatisierungskette raus und sagen sie, und jetzt bitte Cluster aufbauen, Fragen stellen. Dann ist das abgearbeitet und dann schickt mir automatisiert die nächsten Befehle fürs Benchmarking raus. Also wir haben im Grunde eigentlich eine Kette,
aufgebaut, die, wenn die eine, das eine Gliederkette abgearbeitet wird, das nächste aktiviert wird. Und in der Summe, du gibst einen Saks ein und kriegst eigentlich das perfekte Projekt Briefing. Du kriegst das Briefing, die Fragen gestellt, das Benchmarken und du kriegst sechs geniale Lösungen, wofür du vorher eine Woche brauchst. Aber die Befehle, da abgeschickt werden, wenn ich die alle ausdrücke, die wir da los schicken, dann komme ich auf 25 DIN A4 Seiten. 25 DIN A4 Seiten. Hochmodular.
Joel Kaczmarek (30:54.505) Krass.
Ruppert Bodmeier (30:58.05) und individuell mit Variablen besetzt, sodass am Ende des Abends kein Befehl mit dem anderen zu vergleichen Und das ist der Wettbewerbsvorteil der Zukunft. Damit generierst du in der Zukunft einzigartige USPs, wenn du es schaffst, ein Thema auszuwenden und zu sagen, ich bin die Person, die mit weitem Abstand in dem Fall die beste Person oder das beste Unternehmen bin, dann kannst du einzigartige Dinge machen, die nur schwer zu kopieren sind. Weil ich kriege ja mal wieder witzigerweise von Leuten sagen, so,
Ja, ich kann ja auch bei Chat-GPT'n Benchmarking machen. Aber die Person weiß nicht, wovon sie da spricht. Sie denkt, weil sie da ein, zwei Sätze formulieren können, dass das dann funktioniert. Aber das ist ein ganz anderes Tier und ich bin der Auffassung, dass das so komplex ist und das ist auch aus guten Gründen. Deswegen Prompt-Ingenierung heißt, dass du damit Wettbewerb-Vorteile bauen kannst. Du wie halt Google oder TikTok mit ihren Algorithmen auch Wettbewerb-Vorteile. Das kannst du da im Grunde eigentlich für dich auch bauen.
wenn du dich auf den Weg machst.
Joel Kaczmarek (31:58.345) sag mal, ist ja ein interessantes Thema die Länge. Du hast jetzt gerade eben so in einem Nebensatz erzählt, dass was für dich, Interface, ein Satz in einem Textfeld ist. Und hinterher kommt ein geiles Ergebnis raus, ist hinter den Kulissen 25 Seiten Dokument. Was ist denn so deine Erfahrung, was die Menge an Input für so eine KI angeht? Weil ich hab die Erfahrung gemacht, es gibt ja verschiedene Wege, daran zu gehen. Entweder schreibst du es in den Prompt oder du legst sozusagen Anhänger an und gibst ihm den mit.
Zum Beispiel Referenzobjekte. In meinem Beispiel war es so, ich will einen Teaser für einen Podcast haben. Ich möchte in meinen Show Notes schreiben, worum geht's in dieser Folge. Es soll so Bock machen, dass du sofort einschaltest. So, peng. Da kann ich dir 20 Beispiele mitgeben, aber hab die Beobachtung gemacht. Manchmal ist es je mehr Input ich gebe, desto schwieriger wird das Ergebnis. Weil ein Input immer gleich ein Token ist. Der hat dann immer Informationsstücke. Was ist deine Erfahrung damit?
Ruppert Bodmeier (32:53.11) Also, den größten Fehler, den du machen kannst, ist, das hatten wir auch oft gesehen, die Leute haben zum Beispiel einfach alles, was sie zum Projekt wussten, irgendwie ins Briefing reingehackt. Aber das ist so ein Kardinalfehler, weil alles, was du mitschickst, wird verarbeitet. Also du musst schon das Wichtige vom Unwichtigen trennen. Das ist ja die eigentliche Krux. Ich muss entscheiden können, ist das jetzt wichtig?
zu wissen oder ist das unwichtig und wenn es unwichtig ist, sollte ich es dann mitschicken, weil wenn ich es mitschicken, wird es auf jeden Fall verarbeitet und mit eingeflossen. Also das sozusagen auseinander zu dividieren und eigentlich mein Problem auf den Kern zu reduzieren, also was ist jetzt wirklich essentiell und was ist jetzt wichtig, dass sozusagen die eine Trucks das zu artikulieren zu können und das zweite ist halt, dass du halt weißt, was sind die Elemente, die ich brauche, spezifische Ergebnisse zu kriegen, weil bei deinem
Beispiel zu bleiben, du hast ja zig unterschiedliche Gäste mit zig unterschiedlichen Fachdisziplinen und Wissen. Das sind dann sozusagen wichtige Bausteine, die du auf jeden Fall mitschicken musst, weil das jedes Mal anders ist. Also die Elemente auch rauszuarbeiten und zu definieren, welche muss ich auf jeden Fall mitschicken, wenn ich ein spezifisches Ergebnis habe, ist dann die zweite Crooks. Und wenn du nicht dann immer irgendwie auch ein Beispiel mitgibst...
was für dich eigentlich gut ist, also ein Qualitätsindex, dann kannst du das auch vergessen, dann macht das Ding ja, was du möchtest. Also wenn du jetzt nicht beispielhafte Intro-Text mal mitschickst, damit die KIN nur so einen Hauch von Gefühl kriegt, worüber wir reden, und im Idealfall schickst du sehr unterschiedliche Formulierungen mit, weil das eine Intro könnte mal so lauten, das andere mal so, dass da eine gewisse Varianz drin sind.
dann bist du schon auf einem relativ guten Trichter. Und dann muss man noch mal wissen, dass es echt aufs Modell ankommt. Zum Beispiel, wir haben verschiedene Projektarten. Du kannst bei uns strategische Fragestellungen reinhacken, aber auch Beispiel User Experience. Und zum Beispiel strategische Fragestellungen schicken wir an OpenAI. Weil die einfach in der analytischen Fragestellung sehr gut sind. Aber wenn du zum Beispiel eher kreativere Themen hast, dann schicken wir das eher an Anthropic.
Ruppert Bodmeier (35:04.624) weil die mit kreativeren Fragen besser umgehen können. du musst auch die Disziplin der Modelle kennen, also wer ist jetzt hier geeigneter und dann musst du auch noch verrückterweise auch noch die Modellvarianten differenzieren können. Also wenn du zum Beispiel möchtest, dass es super akkurat, dein Befehl abgehandelt werden muss, dann ist zum Beispiel 4.1 von OpenAI dein Modell. Aber wenn du zum Beispiel sagst, ist mir eigentlich relativ egal, Hauptsache da ist geil formulierter Scheiß kommt raus, dann nimmst du eher Gemini zum Beispiel.
Und da musst du halt experimentieren und gucken, welches Modell auch welche Ergebnisse zum Beispiel abliefert. Wir haben zum Beispiel bei uns im Backend 20 OpenAI Varianten, die ich auswählen kann. Und für jede Projektart will ich eine andere. Und selbst auch fürs Briefing. Briefing erstellt bei uns ein anderes Modell, als das Modell, das für uns ein Benchmarking generiert. Also ich bleib beim gleichen Projektart. Ich will eine User Experience Lösung.
Das Briefing erstellt aber ein Tropic, das Benchmarking macht aber OpenAI und den Prototypen baut mir aber Gemini zum Beispiel. Bleibt aber die gleiche Kette, es bleibt die gleiche Projektart, der User merkt nichts. Wir wissen aber, für die einzelnen Teildisziplinen müssen wir da verschiedene Modelle anpingen.
Joel Kaczmarek (36:22.734) Hast du dich wirklich durch alle in mühevoller Kleinarbeit durchgetestet und vor allem, wenn Neues rauskommt oder sich ein Bestehendes ändert, passt du dann auch nachträglich an?
Ruppert Bodmeier (36:25.97) Ja.
Ruppert Bodmeier (36:31.274) muss ich muss ich aber es war jetzt nicht so dass es bei mir schmerzen ausgelöst hat weil die modelle werden ja immer besser die werden ja nicht schlechter die werden ja immer nur besser das heißt eigentlich war immer wenn ein neues modell da war dann war das gute nachricht sehr wahrscheinlich haben sie ein teil problem was uns heute echt fuchsig macht haben die irgendwie gelöst und mit jedem modell wird es auch immer besser deswegen habe ich jedes mal gejubelt wenn neues modell kam
Joel Kaczmarek (36:47.688) Nö.
Ruppert Bodmeier (36:58.21) Die können wir, weil wir über eine API laufen, in fünf Minuten andocken. Wenn chat.gbt 4.2 rausbringt, sind wir in 30 Minuten angedockt, solange sie es über eine API bereitstellen. Das ist die Grundvoraussetzung. Dann teste ich durch und gucke, funktionieren alle Befehle noch. Kriegen wir noch die Ergebnisse korrekt zurück. Mit jedem Modell, das du ergänzt, machst du ein Testing durch und guckst, was kommt raus. Es ist auch so, dass wir mal neuere Modelle nicht aufgegriffen haben, weil in dem Bezug die Ergebnisse nicht besser wurden.
Wir merken das zum Beispiel bei der Bildgenerierung. Wir laufen immer noch über das Vorgängermodell von Flux, weil wir wollen User Interfaces und komischerweise kann das Vorgängermodell bessere Interfaces generieren als das neueste Modell. Dann gehen wir halt da nicht mit.
Joel Kaczmarek (37:43.281) Weißt du, ich hab aber auch einfach festgestellt, also ich kann ja, wenn ich jetzt zum Beispiel mal in der OpenAI-Welt bin, kann ich ja hingehen, kann Chat aufmachen, kann da kommunizieren. Dann wäre der nächste Ausbaustufe, ich bau einen GPT, also ich schaffe quasi eine Anleitung, die immer über dann ein Fenster replizierbar ist. Also ich hab quasi eine Wiederkehr. Und dann kann ich ja ein Assistant bauen, das heißt, ich jetzt hingehe und sage, ich mach Automatisierung mit Mac.com, dann will ich das vielleicht immer anpingen, so wie du's gerade beschrieben hast. Und das Asoziale daran ist ja ...
dass die alle unterschiedlich funktionieren. kann den exakt selben Prompt nehmen. Er funktioniert als Chat, anders als als GPT, anders als Assistant. Also Assistants brauchen viel mehr Input und brauchst viel mehr Details und weiter und so fort. Hast du da für dich einen guten Weg gefunden oder ist das gar nicht dein Problem, weil du alles über API löst?
Ruppert Bodmeier (38:27.8) Also wir lösen alles über API und wenn du echte Wettbewerbsvorteile generieren willst, dann kannst du es eigentlich nur über APIs machen, weil ein Tool User ist ein Tool User ist ein Tool User. Weil am Ende haben ja alle die gleichen Tools und dann kitzle ich halt da 5 % mehr raus. Aber mit einer API kann ich machen, was ich möchte. Ich kann auch Dinge bauen, die keiner andere baut, weil sich da irgendwie keiner da jetzt bemüßigt wird, dafür eine Lösung zu finden. Eigentlich der Wettbewerbsvorteil liegt immer echt in der API und in ...
Joel Kaczmarek (38:38.057) Hm.
Ruppert Bodmeier (38:56.694) diesen ketten bauen also du kannst jetzt natürlich open eye und da super befiele rein formulieren aber am ende des abends wirst du nicht diesen riesen unterschied ausmachen aber wenn du jetzt zum beispiel sagst du baust bei make hochindividuelle agents die jetzt auf deinen workflow perfekt das perfekte ergebnis an da fängt halt differenzierung an da würde ich sagen da würde ich schon eher darauf setzen damit lassen sich einzigartige dinge machen und wie gesagt usb ist der zukunft
Die laufen nicht über Tools, da braucht man sich gar nichts vormachen. Wenn ich jetzt sage, wir sind für KI gut aufgerüstet, weil alle Mitarbeiter haben bei uns hier eine Chatchip-BT-Lizenz, dann ist das so, wie ich sage, wir sind für die Digitalisierung super aufgestellt, weil alle haben hier bei uns Word und Excel. Also so auf dem Level reden wir dann. Natürlich gibt es da ein paar Typen, die Excel-Götter drin sind, brauchen wir gar nicht diskutieren. Aber die haben andere Firmen halt auch und alle nutzen halt Excel.
Die Differenzierung funktioniert über die API.
Joel Kaczmarek (39:58.616) Wenn du mir nicht böse bist, ich eine kurze Pinky-Pause machen, wenn das okay ist. Megaspannend. Hast du vielleicht noch einen guten Tipp, wie man ChatGPT und Co. gut an Start kriegt, wenn ich es über API ansteuere? Gibt es da für dich eine Art kleines Ein-mal-eins, was ich beachten sollte? Wir haben schon viel gesagt, Aber wenn ich es über API ansteuere, reagiert es anders, als wenn ich es direkt anspreche.
Ruppert Bodmeier (40:20.466) Also der Vorteil ist einfach über die API, ich kann ja die Dinge viel viel viel präziser machen. Weil ich ja über dieses Chasing Format ja auch immer ganz viele Definitionen mitgeben kann. Also ich sage, in welchem Format hätte ich das Bild gerne, welche Breite, welche Höhe. Ich kann exakt definieren, soll das Model eine Uhr tragen oder nicht und wenn eine Uhr, Uhr sollte das sein.
Also der große Vorteil, ich kann den Befehl eine klare Struktur geben. Einen Aufbau, ich kann mit Therapie arbeiten, kann auch mehrere Dinge ineinander reinsetzen oder ich kann auch Folgebefehle definieren. zum Beispiel beim Benchmarking ist es so, wir kriegen eine Beschreibung von einem Benchmark Beispiel zurück.
Aber diese Beschreibung nehmen wir und schicken danach direkt noch einen zweiten Befehl los, eine Adaption hinzukriegen. Damit du nicht alles in ein Befehl unterkriegen musst, was du es eigentlich heute machen würdest oder iterierst, wie du es in einem Chatfenster machen würdest, sondern du kannst halt solche Befehlsketten automatisieren. Das geht aber nur bei einer API. Das kriegst du eigentlich so über, wenn du so ein Chatfenster halt nicht machst, kriegst du es eigentlich praktisch nicht hin. Und diese klare Hierarchisierung...
von Befehlen und Kettenbefehle loszufeuern. Sowas geht nur mit der API. Und das ist halt der Traum, weil du dann halt sehr komplexe Dinge machen kannst und weil du natürlich viel mehr Qualität rauskitzeln kannst, ohne dass es dich auch nur eine Sekunde mehr kostet. Du musst es halt einmal aufbauen, einmal definieren.
Schickst deinen Einsatz los und dann arbeite diese Kette für dich die Dinge ab und zwar auf einem qualitativ viel viel höheren Niveau als wenn du da in dem Chatfenster immer ellenlange, seitenlange Befehle eben rein. Der Kunst ist oder das Zauberwort das dahintersteckt ist diese Automatisierung die dadurch möglich ist und die Kunst ist es schlaue
Ruppert Bodmeier (42:31.298) Ketten zu bauen, die zu einem einzigartigen Ergebnis führen und gleichzeitig die Qualität hoch zu halten. Und dieses Kettenbauen ist halt auch anstrengend. Ich habe jetzt ja mal bisschen versucht, so ein Gefühl dafür zu kriegen, was ist da für eben notwendig. Aber ein USB, der nicht wehtut, ist kein USB. Sondern es ist nur ein Feature. Aber dann kann es ja jeder. Na, es muss ja wehtun, nur dann ist es was einzigartiges letzten Endes.
Joel Kaczmarek (42:48.744) Geil.
Joel Kaczmarek (42:56.808) Geil, der Satz hat ja Qualität für so einen Zitatzettel. Ein USP, der nicht wehtut, ist kein USP. Und sag mal, lauf ich Gefahr, dass wenn ich solche Verkettungen baue, dass meine Fehlerwahrscheinlichkeit auch steigt? Also hast du gemerkt, dass es schwieriger ist, sag ich mal, dem Ergebnis zu kommen, was ich möchte, weil es mehrere Zwischenschritte gibt? Oder ist gerade das Gegenteil der Fall, weil du jedes einzelne Element rückverfolgen kannst, dass es sogar besser geht?
Ruppert Bodmeier (43:22.446) Also prinzipiell ist es so, dass ja die Qualität steigt, weil du ja immer wieder dafür Sorge tragst, dass der Input hochqualitativ ist. Das ist ja im Grunde die Chance, die ja drin schlummert. Man darf nur nicht den Fehler machen. Also woran wir zum Beispiel lang gelaboriert haben, wir fanden immer, dass die Thesen nicht so gut waren und wir dachten immer, das liegt daran, weil die Benchmarks nichts taugen und haben halt ewig lang an den Benchmarks rumgefallen.
Wie muss denn jetzt ein Befehl sein, damit ein gutes Benchmarking zustande kommt? Bis wir irgendwann auf den richtigen kommen. Das ist eigentlich nicht der Benchmarking-Befehl, der entscheidend ist und für die Qualität sorgt, sondern die Frage, die wir vorher generiert haben. Ist diese Frage individuell formuliert? Und wenn nein, dann tut sie mir halt nur generische Beispiele generieren. Also früher haben wir ein Befehl gesöckt und haben gesagt, zeig mir bitte coole Beispiele.
die es geschafft haben, Nutzer auf eine emotionale Art zu berühren. Dann kamen immer die gleichen Beispiele. Wir haben dann gemerkt, nicht der Benchmark-Befehl ist Problem, sondern die Frage, was soll Nutzer sein? Kann ja alles möglich sein. Reden wir über alte Leute, junge Leute, wir über Schwanger, reden wir über männlich, weiblich, keine Ahnung, Nutzer ist alles. Dadurch kommen dann auch allgemein güttige Beispiele. Aber die einen wollen Renten ansprechen, die anderen vielleicht junge Familien. Es ist eine völlig andere ...
Bitte zeig mir Beispiele, die junge Familien, die gerade ein Kind bekommen haben, emotional berührt und begeistert wurden. Ganz anderes Tier kriegst du auch ganz andere Beispiele. Und was hat emotional berührt? Dinge, die halt nicht klar definiert sind, die offen sind und die allgemeingültig sein können, werden immer schlechte Qualität produzieren. Deswegen haben wir gemerkt, wenn wir ein gutes Benchmarking wollen, muss der Schritt davor super sein. Und dann haben wir extrem viel
Know-how reingelegt, dass wir individuelle Fragen generieren. Zum Beispiel sagen wir bitte vermeide allgemeine Begriffe wie Menschen, Kunden, Nutzer. Weil das kann alles sein. Bitte formuliere diese Fragen so spezifisch wie möglich und es muss wirklich die Nerven der Zielgruppe sein und übrigens hier eine exakte Beschreibung der Zielgruppe, die wir erreichen möchten. Und hier übrigens meine Definition mit was die sich so rumschlagen. Und hier mal beispielhafte einzigartige formulierte Fragen, die total individuell formuliert sind.
Ruppert Bodmeier (45:45.49) damit du so Gefühl dafür kriegst, was wir da meinen. Als das gesetzt hat, dann wurden erst die Benchmarks besser. Weil die KI gemerkt hat, ich brauch Beispiele, für junge Familien funktionieren. Die haben seit fünf Tagen nicht mehr schlafen können, weil das Kind die ganze Nacht schreit. Ich verstehe, die brauchen dringend eine Lösung, sind aber auch arme Schweine, da find ich doch was. Weißt es ist ein ganz anderes Signaling an die KI, Dinge zu suchen und zu finden, als wenn ich sag, Nutzer schlafen nicht so gut.
Joel Kaczmarek (46:15.493) Mhm.
Ruppert Bodmeier (46:15.57) Was soll das sein? Wegen der Arbeit, wegen Partnerinnen oder Partner? Es ist total offen. Das zu spezifizieren, das ist eigentlich Prompt Engineering. Und wie komme ich da ran? Und wie trage ich Sorge dafür, dass das individuell ist, eben Qualität zu bekommen?
Joel Kaczmarek (46:38.45) Und es hat mal so abschließende Frage, wir haben ja jetzt über so eine Toolwelt geredet, die viel so über Automatisierung API geht. Der, sag ich mal, bewegte Teil ist ja ansonsten Agents, also wo man vielleicht auch mit so was wie N8N irgendwie arbeiten würde. Wie bullish bist du da so? Hast du auch vielleicht schon erste gute Erfahrungen gemacht? Was ist denn so dein Feeling, wo wir da stehen?
Ruppert Bodmeier (46:57.86) Also ich glaube bei den Agents stehen wir da wo vor 3-4 Jahren Chachy Pt. 3 stand. So in etwa kann man das einordnen. Das ist total ausgeflippt, dass es jetzt sowas gibt. Das auch total ausgeflippt, dass es auch schon für einzelne Disziplinen das gibt, z.B. Coden. Das ist alleine schon wirklich ein Quantensprung und trotzdem muss man das einordnen, das ist alles in den Anfängen, da darf man auch noch nicht akkurate Ergebnisse...
erwarten und man muss echt eine sehr, sehr hohe Fehler-Toleranz und Leidensfähigkeit noch mitbringen. Und trotzdem muss man ja davon ausgehen, wenn ich mir Bilder anschaue, die ich vor sechs Jahren über Dolly generiert habe, wie die aussahen und was heute geht, dann ist das gigantisch. Und so ist es eigentlich mit den Agents auch. Heute würde ich sagen, nicht wettbewerbsfähig zu Workflows, Ketten, Assistenten. In drei bis vier Jahren werden die aber ausgeflippte Dinge machen.
Und dann reden wir hier über ein ganz, ganz anderes Tier. Deswegen finde ich, es ist enorm wichtig, sich damit auseinanderzusetzen, auch wenn es jetzt in dieser Woche nur nicht die Welt verändern wird. Aber in drei, vier Jahren ist es was ganz anderes. Und trotzdem finde ich, bei Agents ein großer Nachteil bleibt für Leute wie zum Beispiel jetzt mich, die etwas klar im Kopf haben, wie ich es gerne hätte und wie das abgearbeitet werden sollen.
Damit muss ich erleben können, dass ein Agent macht, er will. Weil das ist die Idee eines Agents. Ich gebe ja nur meine Aufgabe rein und ich definiere, was ich haben möchte, aber wie es der Agent macht, ist total offen. Muss ich dem Agent überlassen. Das ist wie ein Mitarbeiter, ich briefed, der geht los, die Person und macht, was sie will erstmal. Und so funktioniert halt auch ein Agent und damit muss ich leben können. Und wenn ich damit nicht leben kann, dann wird Agent nie etwas, mit dem ich glücklich werde.
sondern ich muss mich ja darauf verlassen, dass dieser Agent einen perfekten Prozess jetzt hier erarbeitet und ihn abarbeitet und iteriert und so lange bis da eine Qualität rauskommt, mit der ich auch glücklich und zufrieden bin. Und da bin ich mir relativ sicher, dass da auch wieder immer Ernüchterung bei den Leuten kommen wird, dass der Agent ja doch nicht genau hier die perfekte Urlaubslocation auf Mallorca für mich findet, so wie ich mir eigentlich versprochen wurde. Vielleicht, weil du es nicht richtig...
Ruppert Bodmeier (49:17.362) Also wir werden glaube ich dieselben Fehlerquellen, wir heute beim Prompt-Ingenierungen und zum Bauen von Assistenten und Workflows haben, diese Fehlerquellen, die werden bei den Agents höchstwahrscheinlich wieder auftauchen, in der Ausbringung anders, aber auch da wird man wieder sehr genau iterieren müssen und definieren müssen und klarstellen müssen, dass dieser Agent wirklich in meinem Sinne arbeitet. Und vor allem, man darf hier immer nicht vergessen, diese Agents, die gehören nicht mir. Die arbeiten auch nicht für mich.
Die suggerieren mir, dass sie für mich arbeiten, aber eigentlich arbeiten die für Google, die arbeiten für Facebook, die arbeiten für OpenAI und sie werden immer im Interesse von OpenAI und Google halten. Also ich würde nach Agents Ausschau halten, die so konzipiert sind, dass die in meinem Interesse agieren. Also zum Beispiel wenn mir Instagram diese drei Leute vorschlägt zum Followen, ist das wirklich in meinem Interesse? Oder schlägt mir Instagram die vor, weil sie getrackt haben Leute die den followen
gehen häufiger zu Instagram. Also handelt hier diese Empfehlung in meinem Interesse? Oder würde mir nicht eine neutrale Person vielleicht andere Leute, die für mein Wohlbefinden vielleicht gesünder wären, empfehlen? Das sind die Fragen, man sich in dem Zuge schon mitstellen sollte, bevor man da jetzt hier voll bullisch auf diese Agents geht. Also für wen arbeiten die? Arbeiten die in meinem Sinne? Und wenn sie es nicht tun, wie kann ich zumindest dann das so sicherstellen, dass da kein Humbug betrieben wird? Das sind
die konzeptionellen Fragen, da auf einen zukommen werden.
Joel Kaczmarek (50:50.363) Ja, spannend, Rupert. vielen, vielen Dank, dass du uns da mal mit unter die Haube genommen hast und viel gelernt und ja, bestimmt to be continued. Also, ich freue mich aufs nächste Mal mit dir.
Ruppert Bodmeier (50:53.714) Gern wieder!
Ruppert Bodmeier (50:59.79) Danke dir!