Berlin. Microsofts „CaptionBot“ erklärt, was auf Fotos zu sehen ist – meistens. Auf Twitter werden die skurrilsten Bildbeschreibungen geteilt.

Ein Programm, das die Welt erklären kann – oder es zumindest versucht. Das ist „CaptionBot“, Microsofts neuer Suchbot. Die künstliche Intelligenz soll in wenigen Worten beschreiben, was auf einem Foto zu sehen ist. Das funktioniert aber nicht immer und so entstehen verrückte und lustige Bildbeschreibungen.

Der Begriff „Bot“ leitet sich vom englischen Wort „robot“ für Roboter ab. Ein Bot ist ein Computerprogramm, das bestimmte Aufgaben selbstständig und automatisiert ausführen kann. Das Wissen dazu holt sich die Software aus einer Datenbank.

Microsoft bietet mehrere Bilderkennungsprogramme an

„CaptionBot“ wurde von Microsofts Cognitive Service Team entwickelt. Die Software basiert auf den drei Microsoft-Technologien Microsoft Emotion Recognition, Microsoft Computer Vision API und der Bing Bildersuche. Das Programm soll laut Microsoft „den Inhalt jedes Bildes verstehen“ und versuchen, das Foto so gut wie es ein Mensch tun würde, zu beschreiben. Das Prinzip dabei ist ganz einfach: Der Nutzer lädt bei dem Programm ein Foto hoch oder gibt die URL zu einem Bild an. „CaptionBot“ analysiert dann das Foto und gibt eine Bildunterschrift an. Das Ergebnis kann der Nutzer dann bewerten. Die Bewertungen fließen in die Weiterentwicklung und Verfeinerung des Bots ein.

Neben „CaptionBot“ hat Microsoft noch weitere Bilderkennungsprogramme auf den Weg gebracht. „How-Old“ schätzt anhand eines Fotos das Alter der Person ein. „MyMoustache“ verrät dem Nutzer, wie gut sein Bart aussieht. Und wer schon immer seinen Promi-Doppelgänger finden wollte, kann „CelebsLike.Me“ testen.

Bei „CaptionBot“ ist Michelle Obama ein Handy

Tatsächlich erkennt „CaptionBot“ einige Fotos und gibt passende Bildunterschriften. Allerdings entsteht in den meisten Fällen eine lustige und unpassende Bildbeschreibung. In den sozialen Netzwerken machen sich die Nutzer inzwischen einen Spaß daraus und freuen sich, wenn das Programm Michelle Obama als Handy bezeichnet oder einen Ellenbogen als Frau, die ihre Zähne putzt.

In einem eigenen Versuch hat das Programm eine Minions-Figur mit einem Teddy im Arm so betitelt: „Ich bin mir nicht wirklich sicher, aber ich denke, es ist ein Kuchen, der wie eine Tasse aussehen soll.“

Und bei dem Bild einer Frau im Taucheranzug erkannte der Bot „eine Person, die ein gelbes Motorrad hält.

Das sind die lustigsten Bildbeschreibungen von „CaptionBot“.