Nicht von Menschenhand geschaffen

Der Begriff „Acheiropoieton“ ist kaum bekannt. Das griechische Wort bezeichnet wörtlich „nicht-hand-gemachte“ Bilder. Gemeint damit war deren vermuteter übernatürlicher Ursprung vor allem bei Bildern von Jesus. Doch bleibt man beim reinen Wortsinn, so ergibt sich eine überraschende Analogie des spätantiken Phänomens zu ganz aktuellen Bildern, die mit künstlicher Intelligenz zustande kommen. Das erklärt Hans D. Baumann, Fachautor für digitale Bildbearbeitung.
Aufgrund des jüdischen Verbots von Kultbildern gab es in den ersten Jahrhunderten des Christentums nur wenige Darstellungen von Jesus. Die Heiden-Christen mit römisch-hellenistischen Traditionen kannten dieses Verbot nicht und verwendeten ab dem 3. Jahrhundert bildliche Darstellungen Jesu – etwa als Heros, guter Hirte oder jugendlicher Philosoph.
Die theologische Diskussion, ob solche Bilder erlaubt seien, zog sich jedoch jahrhundertelang hin – von den Auseinandersetzungen zwischen Bildergegnern und Bilderfreunden in Byzanz bis hin zu den Bilderstürmen der Reformation. Während die einen das Bilderverbot vertraten, argumentierten die anderen, dass Jesu Doppelnatur die Darstellung seiner menschlichen Seite durchaus erlaube.
Im 6. Jahrhundert erschienen plötzlich so genannte Acheiropoieta – legitime (Vor-)Bilder, die angeblich nicht von Menschenhand gemacht waren. Der bilderfreundliche Autor Johannes Damaszenus verwendete für sie um 700 den Begriff Acheiropoieta. Dazu gehörten etwa das Veronika-Schweißtuch oder das Mandylion. Die theologischen Debatten um Bilder setzten sich in den folgenden Jahrhunderten fort und prägten die weitere Entwicklung der Christus-Bildnisse.
Überraschende Parallele
Nimmt man den Begriff „Acheiropoieton“ wörtlich, unter Ausklammerung seiner übernatürlichen Aspekte, so bezieht er sich zunächst nur negativ auf den Herstellungsprozess eines Bildes und sagt etwas darüber aus, was dabei nicht geschehen sein soll: Keine menschliche Hand – allgemeiner: kein menschliches Subjekt – habe beim Entstehen des Bildes mitgewirkt. Damit stellt sich sofort die Frage, wie eng oder wie weit man diese Voraussetzung interpretiert. Denn weitgefasst wären Acheiropoieta heute keine außergewöhnliche, sondern eine ganz alltägliche Erscheinung; man könnte sogar sagen: Von Menschenhand geschaffene Bilder sind heute die Ausnahme.
Ob sich das so zu Recht behaupten lässt, hängt auch davon ab, wie eng man den Begriff „Werkzeug“ fasst. Ein werkzeuglos entstandenes Bild wäre ein mit dem Finger in den Sand gezeichnetes. Stift oder Pinsel werden von einer Hand geführt. Aber reicht der Druck eines Zeigefingers auf den Auslöser einer Fotokamera (oder auf einen kleinen Kreis auf dem Handy-Display) noch aus, um das Ergebnis als menschengemacht zu bezeichnen?
Ich möchte mich hier mit Bildern befassen, die es erst seit wenigen Jahren gibt und deren Qualität sich von Monat zu Monat verbessert, so dass heute oft nur noch Fachleute feststellen können, ob es sich bei ihnen um Fotos und Gemälde handelt oder ob sie rein digital zustande gekommen sind: Bilder, die von künstlicher Intelligenz erzeugt werden.
Gespeicherte Bedeutung
Künstliche neuronale Netze werden mithilfe von Deep-Learning-Methoden und Milliarden Bildern trainiert, um dann eigene zu erzeugen, wobei am Anfang eine Zuordnung von Bildinhalt und sprachlicher Beschreibung und Klassifikation steht; später erkennen die Systeme von allein, ob das auf einem Foto Dargestellte eine Katze, ein Blumentopf oder ein Auto ist. KI-Systeme speichern keine Bilder, sondern Bedeutungen als Vektoren in mehrdimensionalen Räumen.
Anwender können die KI auf verschiedenen Wegen zum Bildgenerieren einsetzen – die häufigste ist das Formulieren eines Textes, eines so genannten Prompts, der beschreibt, was auf einem Bild zu sehen soll sein, aber auch über hochgeladene Referenzbilder oder Stilanforderungen. Ja, die KI kann sogar ein Bild detailliert beschreiben und auf dieser Basis neue generieren.
Wird KI auf solche Weise genutzt, lässt sie sich noch immer als Werkzeug verstehen, wenn auch als ein sehr weit entwickeltes und eigenwilliges (denn es bedarf mitunter hunderter Versuche, Durchgänge und Prompt-Verfeinerungen, bis ein gewünschtes Ergebnis entsteht. Auf die dargestellten Details hat der Anwender keinerlei Einfluss).
Lachender Jesus
Was aber geschieht, wenn man der KI sozusagen die Zügel loslässt? Gebe ich als Prompt nur ein einziges Wort vor, kann sie das tun, was man bei Menschen „freies Assoziieren“ nennen würde, mit völlig unabsehbaren Ergebnissen; bei KI nennt man das „Halluzinieren“. Doch die Herstellung eines Bildes ist nur die eine Seite – die andere ist seine Betrachtung und Interpretation. Während die meisten Kunstwissenschaftler der Meinung sind, KI könne keine Kunstwerke erschaffen, weil sie kein Subjekt mit Intentionen sei, frage ich mich, ob das ästhetische Erlebnis einer Bildbetrachtung und -interpretation wirklich davon abhängen kann und sollte, dass Betrachter ein Vorwissen über den Entstehungsprozess eines Bildes mitbringen?

Das „Foto“ der Büste eines lachenden Jesus entstand mit der KI Midjourney nach der Vorgabe des knappen Prompts „acheiropoieton, christ, face“. Gehen wir einmal davon aus, wir wüssten nichts über seine Entstehungsgeschichte, würden wir gewiss versuchen, die ungewöhnliche Darstellung zu deuten. Ein lachender Jesus wäre in der Kunstgeschichte nahezu einzigartig, und an Ikonographie und Vorläufern würden wir uns ja orientieren.
Eine stilistische Zuordnung verwiese auf den Barock. Die weit geöffneten Augen und vor allem der zweigeteilte Kinnbart ließen sich auf Ikonen der Ostkirche zurückführen. War die Büste ursprünglich Teil einer Ganzkörperskulptur? Was hätte diese dargestellt? Kaum eine Kreuzigung, eher einen triumphierenden Christus. Dieses Lachen Jesu war ja zentraler Gegenstand von Umberto Ecos Roman „Der Name der Rose“ mit heftigen Disputen zwischen William von Baskerville und Jorge von Burgos.
Ohne Intention
Besonders auffällig ist der Riss, der die Büste in zwei gleiche Hälften teilt. Eine altersbedingte Spaltung des Holzes? Oder Absicht des Bildhauers beziehungsweise seines Auftraggebers? Greift der Riss die spätantike Diskussion über die zwei Naturen Christi auf, eine göttliche und eine menschliche; homoousios versus homoiousios, die Wesensähnlichkeit/Wesensgleichheit des Sohns mit dem Vater? Wollte der Künstler andeuten, dass Jesus über diese spitzfindigen Dispute lacht? Ist es Zufall, dass der Schatten des Kinnbarts dem Profil eines Menschen gleicht? Steht der Spalt für den zerrissenen Vorhang im Tempel? Oder ist er nur das Ergebnis eines späteren Zerstörungsversuchs durch jemanden, der einen lachenden Jesus unerträglich fand, ähnlich den Beschädigungen von Jesus-Köpfen beim Amsterdamer Bildersturm 1566?
All das würde man als legitime Interpretationsversuche an die Büste herantragen, wüsste man nicht um ihren intentionslosen Ursprung. Offenbar lässt sich also auch etwas interpretieren, dem keine Absicht zugrunde liegt. (Die einfachste Lösung: Es ist gar nicht Jesus.)

Das zweite Bild , mit demselben Prompt und ebenfalls in Midjourney generiert, erlaubt Deutungen in vergleichbarer Weise. KI, hier Deep Dream Generator, kann es sogar mit eigenen Worten beschreiben: „Bild einer stilisierten Skulptur, die einem Kopf mit schmerzerfülltem Ausdruck ähnelt. Sie besteht aus strukturierten, verwitterten Materialien, die das Aussehen von Holz und getrockneten Ranken imitieren. Die Skulptur zeigt ein trauriges Gesicht mit geschlossenen Augen, einem leicht geöffneten Mund und einem markanten, kunstvoll geschnitzten Bart. Der Kopf ist mit einer Krone aus gedrehten Zweigen geschmückt, die sich wie ein Heiligenschein nach außen erstreckt und die Verbindung zur Natur betont. Die Gesamtkomposition sollte ein Gefühl der Kontemplation und Ehrfurcht hervorrufen und die raue Schönheit und Emotion dieses expressionistischen Stücks hervorheben.“
Verrauschte Bilder
(Hinein)interpretieren ließen sich hier etwa die Analogie des Materials Holz zum Kreuzesholz, die eigenmächtig ausufernde Dornenkrone, die keine verletzenden Dornen mehr aufweist, sondern als Symbol der Auferstehung neu austreibt und sich seitlich wie eine Aureole erstreckt. Zugleich erinnern die Ranken an Johannes 15,1: „Ich bin der wahre Weinstock“, aber auch an: „Jede Rebe an mir, die keine Frucht bringt, schneidet [der Vater] ab“. Und so weiter.
KI lernt die Generierung von Bildern, indem sie Trainingsmaterial immer undeutlicher „verrauscht“ und später diesen Prozess zu erkennbaren Bildern umkehrt. Sie kann daher auch aus unklaren Strukturen klare Bilder „re“-konstruieren.

Oben habe ich das mit dem kontrastverstärkten Negativ des Gesichts auf dem Turiner Grabtuch versucht; „störende“ Blutflecken, die zu unerwünschten Artefakten geführt hätten, hatte ich zuvor retuschiert. Die KI Deep Dream Generator machte daraus das Gesicht in der rechten Hälfte, wobei betont werden muss, dass das nur eine von vielen möglichen Rekonstruktionen ist und erheblich davon abhängt, wie zuvor die unterschiedlichen Parameter eingestellt werden.
KI eigenmächtig „halluzinieren“ zu lassen, entspricht nicht ihrer üblichen Nutzung als Werkzeug, um Bilder zu erzeugen, die eigenen Vorgaben möglichst genau entsprechen. Dass sie zu unreglementierten Resultaten in der Lage ist, wirft jedoch die Frage auf, wie wir künftig mit Bildern umgehen, die sich ohne weiteres wie von Menschen gemachte interpretieren lassen, obwohl kein Subjekt mit einer Absicht dahintersteht.
Hans D. Baumann
Dr. Hans D. Baumann ist Kulturwissenschaftler in Kassel.