5 KIs. Ein Bild. Und erstaunlich unterschiedliche Antworten.
Kaum ein Thema wird derzeit so enthusiastisch diskutiert wie Künstliche Intelligenz.
Sie schreibt E‑Mails, programmiert Webseiten, erstellt Bilder und beantwortet Fragen, die früher eine Suchmaschine beantworten musste.
Natürlich liegt da eine Frage nahe:
Kann KI auch Alternativtexte schreiben?
Die kurze Antwort lautet:
Ja.
Die etwas längere Antwort lautet:
Ja, aber nicht immer gut.
Und manchmal erstaunlich schlecht.
Also habe ich 5 bekannte KI-Systeme dieselbe Aufgabe erledigen lassen.
Ein Bild. 5 Alternativtexte.
Ein erstaunliches Ergebnis.
Zunächst die wichtigste Frage: Was ist überhaupt ein guter Alternativtext?
Viele Menschen glauben, ein Alternativtext müsse einfach beschreiben, was auf einem Bild zu sehen ist.
Das stimmt ungefähr so weit, wie die Aussage stimmt, ein Roman bestehe aus Buchstaben.
Ein guter Alternativtext beschreibt nicht einfach das Bild.
Er beschreibt die Information, die das Bild vermittelt.
Das ist ein erheblicher Unterschied.
Ein Firmenlogo benötigt einen anderen Alternativtext als ein Diagramm.
Ein Produktfoto einen anderen als ein dekoratives Hintergrundbild.
Ein Screenshot einen anderen als ein Portrait.
Und genau hier beginnt die Schwierigkeit für jede KI.
Der Praxistest
Als Testbild habe ich bewusst kein modernes Stockfoto gewählt, sondern ein bekanntes Gemälde: „Der Distelfink“ (Het Puttertje) von Carel Fabritius aus dem Jahr 1654.
Warum dieses Bild?
Weil es auf den ersten Blick einfach wirkt. Ein kleiner Vogel sitzt auf einem Holzkasten und ist mit einer feinen Kette befestigt. Doch je nach Kontext erzählt das Bild eine völlig andere Geschichte. Geht es um Kunstgeschichte? Um den Maler? Um den Vogel? Oder dient das Bild lediglich als dekoratives Element?
Genau das macht es zu einem idealen Test für Künstliche Intelligenz.

5 KI-Systeme. Ein Bild.
Ich habe also 5 Systeme mit einem einzigen Bild konfrontiert: Carel Fabritius, Der Distelfink, 1654. Öl auf Holz. Mauritshuis, Den Haag. Dreizehn mal neun Zentimeter im Original, eines der berühmtesten Gemälde der Welt, und zugleich ein Bild, das jede KI auf eine harte Probe stellt, weil es einfach aussieht und nicht einfach ist.
Die Aufgabe lautete bei allen 5 Systemen:
„Schreibe einen Alternativtext für dieses Bild nach den WCAG-Empfehlungen.“
Mehr nicht.
Keine weiteren Hinweise.
Kein Kontext.
Denn genau so arbeiten viele Menschen inzwischen.
ChatGPT: Der Romancier
“Ein kleiner Vogel mit rötlichem Gesicht und schwarz-gelben Flügeln sitzt auf dem oberen Rand eines grauen Futterkastens. Eine feine Kette ist an seinem Bein befestigt und hängt am Kasten herab. Der helle, nahezu einfarbige Hintergrund lässt Vogel und Kasten deutlich hervortreten.”
Mit 280 Zeichen ist der Alternativtext über der selbst empfohlenen Textlänge von bis zu 150 Zeichen. Trotzdem fehlen wichtige Informationen.
Nirgendwo erfährt der Leser, dass es sich um ein Gemälde handelt.
Nirgendwo wird der Künstler genannt.
Und nirgendwo wird deutlich, warum dieses Bild im Artikel auftaucht.
Stattdessen entsteht eine Beschreibung, die ebenso gut zu einem Naturfoto passen könnte.
Das zeigt sehr schön die Stärke und gleichzeitig die Schwäche heutiger KI.
Sie erkennt Objekte erstaunlich zuverlässig.
Sie erkennt den Kontext nur dann, wenn wir ihn ihr verraten.
Kriterien für Alternativtext laut ChatGPT
Die WCAG selbst schreiben nicht vor, wie ein Alternativtext formuliert werden muss. Sie definieren vielmehr das Ziel: Bilder müssen für Menschen, die sie nicht sehen können, inhaltlich zugänglich sein. Die konkreten Empfehlungen stammen aus den WCAG Understanding-Dokumenten, den W3C WAI Tutorials und dem Accessible Name and Description Computation.
Die wichtigsten Empfehlungen lassen sich so zusammenfassen:
Ein Alternativtext soll vermitteln, welche Information das Bild transportiert.
Nicht:
“Ein Vogel sitzt auf einem Kasten, der grau ist und zwei Beine hat.“
Sondern:
“Kleiner Vogel sitzt auf einem Futterkasten und ist mit einer feinen Kette befestigt.“
Je nach Kontext kann sogar reichen:
Distelfink auf einem Futterkasten.
Dasselbe Bild kann unterschiedliche Alternativtexte benötigen.
In einem Vogellexikon
“Distelfink sitzt auf einem Futterkasten.“
In einem Kunstmuseum
“Gemälde eines Distelfinks auf einem Futterkasten.“
In einem Blog über Tierhaltung
“Distelfink sitzt angekettet auf einem Futterkasten.“
Der Kontext entscheidet, welche Informationen relevant sind.
Screenreader kündigen Bilder bereits an.
Nicht: “Bild eines Vogels.“
Besser: “Kleiner Vogel sitzt auf einem Futterkasten.”
Es gibt keine Zeichenbegrenzung in den WCAG.
Als Faustregel:
- einfache Fotos: 20 – 80 Zeichen
- komplexere Motive: bis etwa 150 Zeichen
- Diagramme oder Infografiken: kurze Zusammenfassung im Alt-Text, ausführliche Beschreibung im Fließtext.
Keine Informationen ergänzen, die nicht sichtbar sind.
Nicht: “Der Distelfink symbolisiert Freiheit.“
Nicht: “Das berühmte Gemälde von Carel Fabritius.“
Wenn diese Informationen wichtig sind, gehören sie in den Text der Seite, nicht in den Alt-Text.
Enthält das Bild lesbaren Text, muss dieser im Alt-Text vorkommen.
Beispiel: Button mit Jetzt anmelden
Alt-Text: “Jetzt anmelden”
Ist ein Bild gleichzeitig ein Link oder Button, beschreibt der Alt-Text die Funktion.
Nicht: “Lupe” Sondern: “Suche“
Nicht: “Druckersymbol” Sondern: “Seite drucken”
Der Alt-Text fasst zusammen.
Beispiel: “Balkendiagramm zeigt steigende Besucherzahlen von 2020 bis 2025.“
Die detaillierten Werte gehören in den Fließtext oder eine Langbeschreibung.
Der Alt-Text ist kein SEO-Feld.
Nicht: “Vogel Distelfink Vogelhaus Natur Tier Goldfink Vogelbild”
Perplexitiy: Der Sachliche
“Ein kleiner Stieglitz sitzt auf einem grauen Futterhäuschen vor hellem Hintergrund.”
In 79 Zeichen beschreibt Perplexity knapp das Bild. Auf den ersten Blick ist daran wenig auszusetzen.
Der Vogel wurde korrekt erkannt. Der Hintergrund ebenfalls. Der Satz ist kurz und verständlich.
Und genau darin liegt das Problem.
Der Alternativtext könnte genauso gut unter einem Vogelführer, einem Online-Shop für Vogelhäuser oder einem Naturblog stehen.
Er verschweigt, dass es sich um ein Gemälde handelt.
Er verschweigt, dass dieses Gemälde über 370 Jahre alt ist.
Er verschweigt, dass der Vogel angekettet ist – ein Detail, das viele Betrachter als wesentlich empfinden.
Und er verschweigt vor allem, warum dieses Bild überhaupt gezeigt wird.
Mit anderen Worten:
Perplexity beschreibt das Motiv.
Nicht das Bild.
Und schon gar nicht dessen Bedeutung im Kontext des Artikels.
Das ist kein schlechter Alternativtext.
Er ist nur ungefähr so aussagekräftig wie die Beschreibung „Ein Mensch sitzt auf einem Stuhl.“
Technisch richtig.
Praktisch wenig hilfreich.
Kriterien für Alternativtext laut Perplexitiy
Die WCAG empfehlen für Alternativtexte vor allem: Sie sollen den gleichen Zweck wie das Bild erfüllen, kurz und prägnant sein und sich am Kontext orientieren. Bilder, die nur dekorativ sind, brauchen keinen inhaltlichen Alt-Text; sie sollten stattdessen als dekorativ behandelt bzw. mit leerem ‘alt‘ ausgezeichnet werden. [bundesfachstelle-barrierefreiheit]
- Beschreibe, was das Bild im Zusammenhang der Seite vermittelt, nicht jede sichtbare Einzelheit. [info.cms.fu-berlin]
- Halte den Text knapp, aber vollständig genug, damit Screenreader-Nutzende den Inhalt verstehen. Als Faustregel wird oft „so ausführlich wie nötig, so wenig wie möglich“ genannt. [barrierefreies-webdesign]
- Beginne nicht mit „Bild von“ oder „Foto von“, wenn das keine zusätzliche Information liefert. [techsmith]
- Wiederhole Informationen nicht doppelt, wenn sie schon im umgebenden Text oder in einer Bildunterschrift stehen. [bundesfachstelle-barrierefreiheit]
- Bei informierenden Bildern: Inhalt oder Funktion des Bildes beschreiben. [barrierefreies-webdesign]
- Bei verlinkten Bildern: Das Linkziel oder die Aktion nennen. [lf-barrierefreiheit-st]
- Bei Bildern mit Text: Relevanten Textinhalt im Alt-Text wiedergeben. [barrierefreiheit.dh]
- Bei komplexen Grafiken: Eine kurze Textalternative plus eventuell eine längere Beschreibung im direkten Umfeld. [info.cms.fu-berlin]
Ein guter Alt-Text ist neutral, kontextbezogen und vermeidet unnötige Wertungen. Er sollte die für den Seitenzweck relevanten Informationen liefern, nicht die komplette Bildästhetik erklären. [barrierefreies-webdesign]
Für dein Bild aus der vorherigen Anfrage wäre beispielsweise der kurze, sachliche Alt-Text passend, den wir schon formuliert haben.
Claude: Der Gewissenhafte
“Ölgemälde eines Stieglitzes, der auf einem an der Wand befestigten Futterkasten sitzt. Der kleine Vogel hat ein rotes Gesicht, schwarz-weißen Kopf und braun-goldenes Gefieder mit gelben Flügelstreifen. An seinem Bein ist eine dünne Kette befestigt, die mit dem Kasten verbunden ist. Der Hintergrund ist in hellem Grau-Beige gehalten, der Vogel wirft einen deutlichen Schatten an die Wand. Unten die Signatur ‘C. Fabritius 1654’.”
Mit 428 Zeichen liefert Claude den längsten Alternativtext, fast dreimal so lang wie Claude selbst empfiehlt. Immerhin werden Signatur, Jahreszahl und Bildart erwähnt.
Dieser Alternativtext liest sich fast wie eine kunsthistorische Bildanalyse. Die KI erkennt das Ölgemälde, beschreibt den Stieglitz, den Futterkasten, die Kette am Bein, den Hintergrund und entdeckt sogar die Signatur des Malers. Beeindruckend? Ja. Hilfreich? Nicht unbedingt.
Genau hier liegt ein häufiger Irrtum: Ein guter Alternativtext ist nicht derjenige, der am meisten erkennt, sondern derjenige, der am besten unterstützt. Screenreader-Nutzende möchten schließlich keine Inventarliste hören. Sie möchten verstehen, was auf dem Bild zu sehen ist – und vor allem, warum das Bild an dieser Stelle überhaupt eingebunden wurde.
Die Signatur von Carolus Fabritius, der Schatten an der Wand oder die genaue Farbnuance des Hintergrunds mögen für Kunsthistoriker spannend sein. Für die meisten Menschen, die sich durch einen Blogartikel bewegen, sind sie eher akustisches Kleingedrucktes.
Das Beispiel zeigt sehr schön, dass eine KI Bilder inzwischen erstaunlich präzise analysieren kann. Die eigentliche Herausforderung liegt aber woanders: zu entscheiden, welche Informationen für den jeweiligen Kontext wirklich relevant sind. Und genau diese Entscheidung kann uns heute noch keine KI zuverlässig abnehmen.
Kriterien für Alternativtext laut Claude
Die WCAG behandeln Alternativtexte primär unter Erfolgskriterium 1.1.1 – Nicht-Text-Inhalt (Level A, also die unterste Konformitätsstufe – Pflicht, nicht Kür).
Jeder Nicht-Text-Inhalt braucht eine Textalternative, die denselben Zweck erfüllt. Was das konkret bedeutet, hängt von der Funktion des Bildes ab:
- Informative Bilder bekommen einen Alternativtext, der den wesentlichen Inhalt beschreibt – nicht mehr, nicht weniger.
- Funktionale Bilder (Icons, Buttons, Links) beschreiben nicht, was zu sehen ist, sondern was das Element tut. Ein Lupe-Icon in einem Suchfeld bekommt alt=“Suchen”, nicht alt=“Lupe”.
- Komplexe Bilder wie Diagramme oder Infografiken brauchen eine Kurzbeschreibung im alt-Attribut und eine Langbeschreibung im Fließtext oder per aria-describedby.
- Bilder von Text – also Text, der als Bild eingebettet ist – bekommen den identischen Wortlaut als Alternativtext. Wobei die WCAG das Einbetten von Text als Bild grundsätzlich vermeiden will (1.4.5, Level AA).
- „Bild von …” oder „Foto zeigt …” als Einleitung ist redundant – Screenreader kündigen Bilder bereits an. Die Beschreibung fängt direkt mit dem Inhalt an.
- Die empfohlene Länge liegt bei etwa 100 – 150 Zeichen, nicht weil es eine Regel ist, sondern weil längere Texte die Nutzbarkeit senken. Und der Alternativtext muss zur Funktion des Bildes auf dieser Seite passen – nicht zum Bild in abstracto.
Gemini: Der Techniker
“Das Ölgemälde ‘Der Distelfink’ von Carel Fabritius aus dem Jahr 1654. Ein kleiner Stieglitz sitzt auf einer graublauen Futterbox, die an einer hellen, verputzten Wand befestigt ist. Der Vogel hat eine rote Gesichtsmaske, einen gelben Streifen auf dem Flügel und ist mit einer feinen Kette am Fuß an der Stange gesichert.”
Mit 320 Zeichen ist auch diese Bildbeschreibung ist zu lang.
Aber dieser Alternativtext macht vieles richtig. Er erkennt nicht nur das Motiv, sondern ordnet das Bild als Gemälde ein und nennt Titel, Künstler und Entstehungsjahr. Für einen kunsthistorischen Beitrag kann genau diese Information sinnvoll sein, weil sie den Kontext des Bildes unmittelbar vermittelt.
Trotzdem zeigt sich auch hier ein typisches KI-Muster: Es wird beschrieben, was erkannt wurde aber nicht unbedingt, was für den Alternativtext erforderlich ist. Die detaillierte Beschreibung der roten Gesichtsmaske, des gelben Flügelstreifens oder der Kette am Fuß ist zwar korrekt, trägt aber nur dann zum Verständnis bei, wenn diese Merkmale für den Inhalt des Beitrags tatsächlich relevant sind.
Die KI beschreibt das Bild ein wenig so, als würde jemand den Inhalt eines Kühlschranks aufzählen, obwohl Sie nur wissen wollten, ob noch Milch da ist. Beeindruckend genau – aber nicht unbedingt hilfreich.
Ein guter Alternativtext beantwortet eine einfache Frage: Welche Informationen braucht jemand, der das Bild nicht sehen kann, um den Inhalt des Beitrags zu verstehen?
Gerade deshalb gefällt mir dieser Vorschlag trotzdem besser als die vorherigen. Er beginnt mit dem Wesentlichen (Titel, Künstler und Gemälde) und liefert anschließend eine knappe Bildbeschreibung. Mit einer kleinen Kürzung bei den Details wäre er für viele Webseiten bereits eine sehr gute Grundlage.
Kriterien für Alternativtext laut Gemini
Die (WCAG) regeln die Anforderungen für Alternativtexte primär im Erfolgskriterium 1.1.1 (Nicht-Text-Inhalt) auf Stufe A. Die zentrale WCAG-Empfehlung besagt, dass jede Grafik eine Textalternative benötigt, die denselben Zweck erfüllt wie das Bild selbst. Der Inhalt des Alt-Textes hängt demnach stark vom Kontext ab.
- Informativ: Bilder, die Informationen vermitteln (ein Foto in einem Artikel). Der Alt-Text muss die Kernbotschaft oder das Motiv kurz beschreiben.
- Funktional: Bilder, die als Link oder Button dienen (eine Lupe für die Suche). Der Alt-Text darf hier nicht das Bild beschreiben, sondern muss die Funktion benennen (alt=“Suche starten”).
- Komplex: Diagramme, Karten oder Infografiken. Hier fordert die WCAG einen kurzen Alt-Text als Identifikation gekoppelt mit einer ausführlichen Langbeschreibung im umliegenden Text oder via Verlinkung.
- Prägnanz: Alt-Texte sollten kurz und auf den Punkt sein (Richtwert: maximal 80 bis 120 Zeichen).
- Keine Redundanz: Formulierungen wie „Bild von…“ oder „Grafik zeigt…“ sind zu vermeiden, da Screenreader den Elementtyp ohnehin als Grafik ankündigen.
- Keine Wiederholung: Informationen, die bereits in der direkten Bildunterschrift oder im Fließtext stehen, gehören nicht noch einmal in den Alt-Text.
- Sprachkonsistenz: Die Sprache des Alternativtextes muss mit der voreingestellten Hauptsprache der jeweiligen Webseite übereinstimmen.
WordPress AI: Das Werkzeug ohne Meinung
“Ein Vogel sitzt auf einem Kasten.”
33 Zeichen. WordPress AI wird in verschiedenen Plugins und dem Block-Editor angeboten und hat das Erwartbare geliefert.
6 Wörter. Ich respektiere die Ökonomie. Wirklich. Aber 6 Wörter sind hier zu wenig.,
Nicht falsch. Aber auch nicht besonders hilfreich.
Wer das Bild nicht sehen kann, erfährt weder, dass es sich um ein Gemälde handelt, noch dass der Vogel angekettet ist oder weshalb dieses Bild überhaupt gezeigt wird.
Das ist kein Alternativtext. Das ist ein Platzhalter für einen Alternativtext. Es erfüllt die technische Anforderung im selben Sinne, wie ein leerer Kühlschrank die technische Anforderung eines Kühlschranks erfüllt: Er existiert, aber er nützt niemandem.
Und jetzt kommt der eigentliche Test
Alle 5 Antworten könnten korrekt sein.
Und trotzdem könnten alle 5 falsch sein.
Warum?
Weil keine KI weiß, warum ich dieses Bild ausgewählt habe.
In diesem Artikel geht es nicht um Kunstgeschichte.
Nicht um Vögel.
Nicht um Carel Fabritius.
Ich verwende das Bild als Beispiel dafür, dass der Kontext über einen guten Alternativtext entscheidet.
Ein passender Alternativtext für diesen Blogartikel könnte deshalb lauten:
“Ölgemälde „Der Distelfink“ von Carel Fabritius, 1654, dient im Artikel als Beispiel für gute Alternativtexte”
Dieser Alternativtext beschreibt nicht nur das Motiv. Er erklärt, warum das Bild an dieser Stelle erscheint.
Und genau das unterscheidet einen guten Alternativtext von einer reinen Bildbeschreibung. Bietet die Veröffentlichung eine Langbeschreibung, würde ich das Gemälde dort genauer beschreiben.
Ökonimisch schwierig wird es, wenn dasselbe Motiv an mehreren Stellen in der Veröffentlichung oder im Projekt verwendet wird. Gut gepflegte Metadaten sind dann manchmal nicht hilfreich und jede Verwendung benötigt eventuell einen individuellen Alternativtext.
Ein guter Alternativtext für ein informatives Bild sollte kompakt, objektiv und kontextspezifisch den Inhalt des Bildes beschreiben. Er sollte verständlich und möglichst kurz sein, sachlich, ohne Interpretationen und Meinungen.
KI-Systeme erkennen Details ganz wunderbar aber nicht den Kontext der Bildwahl. Dem KI-System sollte in der Aufgabe Kontext, Sprachstil und Länge des Textes als Parameter mitgegebene werden.
Mein Fazit
Alle getesteten KI-Systeme liefern brauchbare Ergebnisse.
Manche sogar überraschend gute.
Keine der KIs schreibt jedoch zuverlässig perfekte Alternativtexte.
Nicht, weil die Modelle schlecht wären.
Sondern weil ihnen die wichtigste Information fehlt:
Der kommunikative Zweck des Bildes.
Deshalb sehe ich KI heute nicht als Ersatz.
Sondern als hervorragenden ersten Entwurf.
Sie spart Zeit.
Sie liefert Ideen.
Sie verhindert das gefürchtete: „Bild123_final.jpg“
Als fertigen Alternativtext würde ich ihre Vorschläge jedoch nur selten übernehmen.
Ein guter Alternativtext entsteht nicht allein durch Bilderkennung.
Er entsteht durch Verständnis.
Und dafür ist der Mensch noch immer erstaunlich nützlich.
Mein Tipp für die Praxis
Nutzen Sie KI.
Aber geben Sie ihr mehr Informationen.
Statt:
„Schreibe einen Alternativtext.“
Lieber:
„Schreibe einen Alternativtext nach WCAG für dieses Bild. Das Bild befindet sich auf einer Website für eine Weiterbildung im Bereich WordPress und soll die Zusammenarbeit im Team zeigen. Der Alternativtext soll maximal 125 Zeichen lang sein.“
Die Qualität der Ergebnisse steigt dadurch deutlich.
Nicht weil die KI intelligenter wird.
Sondern weil der Mensch bessere Fragen stellt.
Und das war eigentlich schon immer eine gute Idee.
Digitale Barrierefreiheit mit amselrehhase
Bei amselrehhase beschäftigen wir uns mit:
- barrierefreiem Webdesign
- WCAG-konformer Gestaltung
- Accessibility-Checks
- barrierefreien PDFs
- Typografie & Lesbarkeit
- Schulungen rund um digitale Barrierefreiheit
Denn gutes Design sollte nicht nur schön aussehen.
Es sollte funktionieren.
amselrehhase | 02.07.2026
Wir entwickeln und prüfen barrierefreie Projekte. Buchen Sie uns für barrierefreie Kommunikationsmittel! Schreiben Sie uns eine E‑Mail!
Vereinfachte Zusammenfassung
Künstliche Intelligenz kann beim Schreiben von Alternativtexten helfen. Die Ergebnisse sind oft gut, aber nicht immer passend. Eine KI erkennt, was auf einem Bild zu sehen ist. Sie weiß jedoch nicht, warum das Bild auf einer Website verwendet wird. Deshalb sollten Menschen die vorgeschlagenen Alternativtexte immer prüfen und anpassen. Gute Alternativtexte machen Websites für viele Menschen besser nutzbar.



