2023
11/22

Algorithmen von Cordelia Schmid schaffen die Grundlagen für schnelle Bildsuche im Internet

Als Cordelia Schmid 1996 ihre bahnbrechende Doktorarbeit schrieb, steckte die Bildklassifizierung mittels Computern allerdings noch in den Kinderschuhen: „Die damals gebräuchlichen Systeme konnten nur einfache geometrische Formen wie Kreise, Dreiecke oder Quadrate erkennen, und dies auch nur bei gleichförmigem Hintergrund.“ Schmid verbesserte die Erkennung erheblich, indem sie die Systeme markante Bildpunkte finden ließ. Diese „lokalen Bilddeskriptoren“ repräsentieren die räumlichen Dimensionen der gezeigten Objekte. Damit waren die Systeme in der Lage, Objekte auch dann wiederzuerkennen, wenn diese aus einer anderen Perspektive oder teilweise verdeckt gezeigt werden. Den Eiffelturm beispielsweise erkennt ein mit Bilddeskriptoren arbeitendes System auch dann, wenn er perspektivisch verzerrt von unten aus geringem Abstand fotografiert wurde – oder schräg von der Seite oder aus großem Abstand, wenn ein Baum im Vordergrund einen Teil des Turms verdeckt. Schmid schuf so die Grundlagen dafür, dass wir heute durch Suchmaschinen aus Millionen Bildern im Internet in Sekundenschnelle die gewünschten finden. 

Nach der Jahrtausendwende machte die automatische Bilderkennung große Fortschritte und brachte viele neuartige Ansätze hervor. In dieser Zeit konzipierte Cordelia Schmid „Benchmark“-Tests, mit denen aus der Vielzahl der neuen Methoden die effektivsten ermittelt werden konnten. Zu den Testkriterien zählte neben einer hohen Trefferquote beim Auffinden gesuchter Bilder ein möglichst hohes Arbeitstempo.

2006 entwickelte Schmid ein weiteres Standardverfahren zur Bilderkennung: „Spatial Pyramid Matching“ unterteilt die zu untersuchenden Bilder sukzessive in immer kleinere Abschnitte. Damit wurde das inhaltliche Erfassen räumlicher Anordnungen noch flexibler. „Wir konnten nun bei der Bilderkennung beispielsweise die Kategorien Schlafzimmer und Wohnzimmer klar voneinander trennen, und eine Strandszene wurde sozusagen gleich auf den ersten Blick erkannt“, sagt Schmid.

Schmid schuf so die Grundlagen dafür, dass wir heute durch Such­maschinen aus Millionen Bildern im Internet in Sekundenschnelle die gewünschten finden.

Bilderkennung beruht auf komplexen Berechnungen. Dabei müssen verschiedene Ansätze gegeneinander abgewogen werden.