Neues Facebook-Tool beschreibt Blinden den Inhalt von Fotos

Berlin. Blinde können sich von einem neuen Tool vorlesen lassen, was Facebook-Fotos zeigen. Manuelle Bildbeschreibungen sind dafür nicht nötig.

Facebook hat ein Tool entwickelt, um blinden und sehbehinderten Menschen den Zugang zu Fotos zu erleichtern. Es beschreibt, was auf Bildern in der Chronik eines Nutzers zu sehen ist. Als künstliche Intelligenz ist die neue Funktion namens Automatic Alternative Text (AAT) nicht darauf angewiesen, dass Nutzer ihre hochgeladenen Bilder manuell verschlagworten. Stattdessen beruhen die Beschreibungen auf einem automatischen Algorithmus. Facebook beschreibt das Programm als „neuronales Netzwerk mit Millionen von lernbaren Parametern“.

Wenn Blinde und Sehbehinderte Facebook und andere soziale Netzwerken nutzen, lassen sie sich die Inhalte von sogenannten Screenreadern vorlesen. Bildschirminhalte werden von diesen speziellen Programmen oder Apps in synthetische Sprache übersetzt. Allerdings sind Screenreader nicht in der Lage, zu beschreiben, was auf Fotos zu sehen ist, solange nicht ein passender Beschreibungstext hinterlegt ist.

Mit dem neuen Facebook-Tool soll sich das nun ändern. „Das ist ein wichtiger Schritt, um sicherzustellen, dass jeder gleichberechtigten Zugang zu Informationen hat und in Unterhaltungen eingebunden wird“, schreibt Facebook-Gründer Mark Zuckerberg in einem Facebook-Post zum Launch von ATT.

Screenreader liest vor, was auf dem Bild zu sehen sein könnte

Ein Facebook-Video zeigt, wie das neue Tool funktioniert. Betitelt mit den Worten „Sonntag-Nacht-Kauforgie“ ist etwa auf einem Foto eine riesige Pizza mit Salami, Oliven und Peperoni zu sehen. „Manoher Paluri, 6. März, 19.48 Uhr. Foto. Bild könnte beinhalten: Pizza, Lebensmittel“, liest der Screenreader Nutzernamen, Veröffentlichungsdatum, Überschrift und Bildbeschreibung vor. Dazu müssen Nutzer die VoiceOver-Funktion einschalten, die integrierte Sprachausgabe bei Apple.

Die neue Funktion hat Facebook am Dienstag veröffentlicht; verfügbar ist sie bisher allerdings nur für das Apple-Betriebssystem iOS, in englischer Sprache und in den USA, Großbritannien, Kanada, Australien und Neuseeland. Geplant sei aber die Ausweitung auf andere Betriebssysteme, Sprachen und Länder, hieß es in einer Mitteilung von Facebook.

Facebook-Funktion erkennt Brillen und Bärte

Die Funktion kennt bisher rund 100 in Fotos häufig wiederkehrende Objekte und Szenarien. Dazu gehören:

Menschen (Babys, Brillen, Bärte, Lächeln, Schmuck)
Naturszenerien (Outdoor, Berge, Schnee, Himmel)
Transport/Mobilität (Autos, Boote, Flugzeuge, Fahrräder)
Sport (Tennis, Schwimmen, Sportstadien, Baseball)
Lebensmittel (Eis, Pizza, Dessert, Kaffee)

Zudem kann die künstliche Intelligenz bestimmte zusätzliche Informationen erkennen und übermittelt beispielsweise die Anzahl der abgebildeten Personen, beschreibt, ob eine Person lächelt, ob das Foto in einem Restaurant aufgenommen wurde, als Nahaufnahme oder als Selfie. Tiere erkennt das neue Facebook-Tool offenbar nicht. Eine Vorsichtsmaßnahme, schreibt „Zeit Online“, und verweist auf einen peinlichen Fall aus dem vergangenen Sommer. Damals hatte die Bilderkennung von Google versagt und ein Foto, auf dem zwei Afro-Amerikaner zu sehen sind, mit dem Schlagwort „Gorillas“ versehen, wie unter anderem das amerikanische Technikportal „The Verge“ berichtete.

Eine 100-prozentige Treffsicherheit könne eine künstliche Intelligenz eben nicht liefern, schreibt Facebook in seiner Mitteilung, deshalb beginnen die Beschreibungen immer mit den vorsichtigen Worten: „Bild könnte beinhalten ...“ Aber: Die Veröffentlichung von AAT sei eben nur der Anfang.