Bilderstellung mit Grok 2 von X
Mit Grok hat nun auch die Social Media Plattform X (ehemals Twitter) die Möglichkeit eingebunden, Informationen über eine generative-KI gestützte Chatbot-Funktion ausgeben zu lassen. Das Design und die Darstellung der Funktionen ist sehr stark an ChatGPT angelehnt. Neben Text lassen sich auch Bilder generieren.
Bilder-Generierung mit Grok 2
Über die Funktion Grok lassen sich in X Bilder generieren. Aktuell werden standardmäßig 4 Ergebnisse gleichzeitig erstellt, sodass die Wahrscheinlichkeit steigt, darunter ein Bild zu finden, was für die eigenen Zwecke verwendet werden kann. In dem folgenden Screenshot sind die Funktionen des Tools für den schnellen Überblick beschriftet. Das ist vielleicht auch für die jenigen interessant, die X den Rücken gekehrt haben, so können sie es auch einmal kurz zur Kenntnis sehen.
Was liegt bei der Erstellung von Bildmaterial näher, als ein Bild zu „SEO“ zu erstellen?! Das funktionierte auf Anhieb gut, aber der Kontext fehlte, so entstand u. a. das Ergebnis mit den Buchstaben aus Pflanzen.
Bei Wörtern, die länger sind, haben Bildererstellungs-KI-Tools allgemein größere Probleme, diese Wörter korrekt zu erstellen. Nach Einfügen des Worts „Suchmaschinenoptimierung“ fing für mich das muntere Generieren von Bildern an.
Text in Bildern ist auch für Grok 2 ein Problem
In 80% der Ergebnis-Bilder war das Wort „Suchmaschinenoptimierung“ entweder falsch geschrieben oder einige Buchstaben wiesen seltsame Formen auf. Wenn dann die Wörter korrekt generiert wurden, wiesen dafür andere Darstellungen (die im Prompt nach und nach hinzukamen) Fehler in Aussehen und Logik auf, wie zum Beispiel eine seltsam wabbelige Tastatur am Laptop oder ein wederwillen schmelzendes Kettenmuster, was Links repräsentieren sollte. Dazu habe ich kaum Bilder in diesen Beitrag hinzugenommen, weil ich lieber Bilder zeige, in welchen die Darstellung korrekt ist. Viele generierte Bilder wimmeln nur von Fehlern und Ungenauigkeiten in den KI-Chat-Bots, verbunden mit der Wartezeit beim Laden und dann der Enttäuschung erinnert mich das etwas an die öffentlichen modernen Vitrinen-Schränke, wo man gegen 10 euro besitzerlose Pakete aus dem Automaten bekommt: Man ist gespannt, freut sich und hofft…und packt am Ende etwas aus, was man nie gebrauchen wird (in meinem Fall eine Hülle für ein Tablet, was ich nicht habe). So ähnlich ist es mit den Bildern. Man gibt den Prompt ein und ist gespannt und wird oft enttäuscht, hat quasi diese bilder und kann nichts mit ihnen anfangen.
Bilderstellung mit Unterhaltungsfaktor für User
Diese Generierungsprogramme haben aus meiner Sicht auch ein gewisses Suchtpotenzial, ähnlich wie Social Media oder ein Spiel für das Smartphone. Denn es ist spannend immer weiter Varianten auszuprobieren und sich etwas Neues auszudenken und zu schauen, was durch die eigenen Eingaben erstellt wird, sehr vieles ist möglich in der Darstellung. Außerdem hat es einen Touch von Gamification, Grok 2 zu nutzen, da unter den erstellten Bildern weitere Vorschläge zur Generierung weiterer Bilder gegeben werden. In meinem Fall gab es u. a. den Vorschlag, Kristalle einzufügen. Diese Aktion habe ich dann ausgewählt und bekam interessante Darstellungen in den Ergebnissen, die sich zwar von meinem eigentlichen Thema entfernten, aber trotzdem etwas an sich haben. Das folgende Bild zeigt das Wort „SEO“ auf Kristallen im Wald, das könnte auch ein Cover für einen dunklen Fantasyroman (zu einem anderen Thema als SEO) werden. Inspirationen gibt es also genug.
So kann man sich von Grok 2 durch die Vorschläge immer weiter leiten lassen und Elemente aus dem Weltraum, Sterne und Silberschein hinzufügen.
Der Tipp zu Neon-Lichtern kam ebenfalls von Grok 2.
Praktischerweise wird die Quelle direkt unten rechts angegeben, sodass bei der Einbindung der Bilder für den Nutzer nachvollziehbar ist, wie diese entstanden sind.
Bei den Bildern mit dem Wort Suchmaschinenoptimierung fällt mir beim Korrekturlesen mal wieder auf, wie lang das Wort doch eigentlich ist. Die Darstellung war mir in fast allen Ausführungen nicht gerade genug (siehe dazu auch unteres Bild, was eines der besten Ergebnisse war) und am Ende habe ich kein Ergenbis bekommen, was mir wirklich gut gefallen hat. Das nachfolgende Bild sollte einen steigenden Graphen zeigen. In der Umsetzung ist dabei der halbe Monitor quasi zersägt. Das ist zwar künstlerisch interessant, aber für einen normalen Post würde ich es nicht nutzen.
Die besten Ergebnisse bekommt man, wenn man wenige „Wünsche“ hat, aber dafür auch die langweiligsten. Je mehr Auflagen es gibt, desto mehr Fehler schleichen sich ein. Eine partielle Bildkorrektur war nicht ersichtlich, das macht ChatGPT besser.
Nach 30 Versuchen, das Bild zu optimieren hatte ich dann mein Limit zur kostenlosen Nutzung verbraucht und es kam die folgende Meldung:
Am Folgetag war es möglich, wieder neue Bilder auf X zu generieren.
Es hat schon einen WOW-Effekt, welches Bildmaterial in Sekundenschnelle generiert werden kann. Viel Spaß beim Ausprobieren, es kommen spannende und zum Nachdenken anregende Bildgenerierungs-Zeiten auf uns zu.
Anzeige