Wie Computer Videos erkennen

25. November 2014, Nr. 86

Ausgezeichnetes Verfahren zur Bewegungsanalyse

Fahrerassistenzsysteme, die Hindernisse im Straßenverkehr erkennen, visuelle Effekte in Filmen wie Matrix, computeranimierte Charaktere und kombinierte Bildgebungsprozesse in der Medizin: Hinter all diesen Technologien steckt ein Verfahren, an deren stetiger Verbesserung die Informationsforschung seit Jahren arbeitet, der sogenannte optische Fluss. Prof. Andrés Bruhn vom Institut für Visualisierung und Interaktive Systeme der Universität Stuttgart ist Spezialist auf diesem Gebiet. Auf der „European Conference on Computer Vision“ in Zürich wurde er jüngst gemeinsam mit Fachkollegen für eine vor zehn Jahren entwickelte Methode mit dem „Jan Koenderink Prize for Fundamental Contributions in Computer Vision“ ausgezeichnet. Dies ist einer der renommiertesten Preise auf dem Gebiet des maschinellen Sehens und würdigt Arbeiten, die sich nach einem Jahrzehnt als besonders wertvoll erwiesen haben.

Wie kann man Computer in die Lage versetzen, Bewegungen in einem Video möglichst genau zu erkennen? Diese Frage beschäftigt seit rund 30 Jahren die Informatikforschung. Prof. Andrés Bruhn befasst sich seit seiner Promotion mit dem optischen Fluss, um das maschinelle Verstehen von Videobildern zu beschleunigen und qualitativ zu verbessern. Doch was genau ist ein optischer Fluss? Ganz allgemein verbirgt sich hinter der Methode ein Algorithmus, der jeden Pixel eines einzelnen Videobildes betrachtet und dessen Verschiebung in Bezug auf sein Referenzbild schätzt.

Mit diesem Prinzip lassen sich zahlreiche Technologien realisieren. Beispielsweise können real nicht existente Zwischenbilder erstellt werden, um in der Filmindustrie Slow-Motion-Effekte ohne Qualitätsverlust zu generieren oder aus Videoaufnahmen computergenerierte Filmsequenzen zu erstellen. Das Gesicht eines Schauspielers kann auf diese Weise mit realistischer Mimik und Gestik rekonstruiert werden und dann durch einen virtuellen Charakter ersetzt werden. Auch Anwendungen im Automotive-Bereich basieren auf der Berechnung von Flussfeldern. So gibt es Fahrerassistenzsysteme, die aufgrund von Kameraaufnahmen Abstände zu Hindernissen erkennen, sich bewegende Objekte identifizieren, Kollisionen vorhersagen oder andere Aussagen über die Verkehrssituation treffen. Ein weiterer Wirtschaftszweig, in dem der optische Fluss zum Einsatz kommt, ist die medizinische Bildverarbeitung. Dort werden beispielsweise Aufnahmen verschiedener Bildgebungsverfahren überlagert, etwa um das Wachstum eines Tumors konkreter untersuchen zu können.

„Die verfügbaren Methoden des optischen Flusses haben sich in vielen Anwendungen bewährt“, sagt Prof. Andrés Bruhn, „aber dennoch unterliegen sie einer Vielzahl von Beschränkungen. Diese weiter zu minimieren und weitere Anwendungsfelder zu erschließen ist das Ziel unserer Arbeit.“ Insbesondere beschäftigt sich sein Forscherteam mit der Verwertung von Aufnahmen mit schlechter Beleuchtungen oder raschen Bewegungs- oder Farbänderungen, aber auch die korrekte Schätzung von Objektanordnungen im Raum und die grundsätzliche Verbesserung der rekonstruierten Computermodelle stehen im Fokus ihrer Arbeiten.

Andrés Bruhn wurde in diesem Jahr mit dem Koenderink-Preis für eine Methode ausgezeichnet, die er 2004 noch während seiner Promotionszeit an der Universität des Saarlandes mit seinen Kollegen Thomas Brox, Nils Papenberg und Joachim Weickert entwickelte. Damals gelang dem Forscherteam eine enorme Genauigkeitssteigerung gegenüber den bereits verfügbaren Methoden. Die Auszeichnung ist einer der renommiertesten Preise auf dem Gebiet des maschinellen Sehens und würdigt Arbeiten, die sich nach einem Jahrzehnt als besonders wertvoll erwiesen haben. Ihre Arbeit wurde seit seiner Veröffentlichung mehr als 1.200 mal zitiert, was den besonderen Wert der Arbeit für die Wissenschaft deutlich macht.

Den Fachartikel finden Sie unter
http://link.springer.com/chapter/10.1007%2F978-3-540-24673-2_3
.

Weitere Informationen:

Tina Barthelmes, Universität Stuttgart, Visualisierungsinstitut (VISUS), Tel. 0711/685-88604,
E-Mail: tina.barthelmes (at) visus.uni-stuttgart.de

Prof. Andrés Bruhn, Institut für Visualisierung und Interaktive Systeme, Tel.: 0711/685-88439,
E-Mail: andres.bruhn (at) vis.uni-stuttgart.de

Birgit Vennemann, Universität Stuttgart, Abt. Hochschulkommunikation, Tel. 0711/685-82122,
E-Mail: birgit.vennemann (at) hkom.uni-stuttgart.de

Computergestützte Rekonstruktion von Gesichtszügen auf der Basis von Videoaufnahmen. Gemeinsame Arbeit mit Forschern des Max-Plack-Instituts für Informatik, Saarbrücken.
Zum Seitenanfang