Nachrichten, Gerüchte, Meldungen und Berichte aus der IT-Szene

Redaktion: Heinz Schmitz

Mehr Möglichkeiten in 3D

27.04.2022 00:00

Selbst mit professionellen Akquise-Geräten lässt sich nicht komplett verhindern, dass 3D-Rekonstruktionen sogenanntes „Rauschen“ enthalten: Hier zum Beispiel Löcher, fehlende Details oder Unebenheiten auf der Oberfläche. (Quelle: Universität Siegen)

Fotos lassen sich über Smartphone-Apps mit Künstlicher Intelligenz (KI) beliebig bearbeiten: Ohne Probleme können wir auf Selfies das eigene Gesicht jünger oder älter machen, unsere Frisur verändern und vieles mehr. Bei dreidimensionalen Darstellungen sind die Möglichkeiten dagegen viel begrenzter - häufig funktioniert die Bearbeitung auch weniger gut und führt zu fehlerhaften Ergebnissen. Das zu verbessern, hat sich Dr. Zorah Lähner von der Universität Siegen in ihrem Projekt „Robust Geometric Deep Learning“ vorgenommen. „Es handelt sich um mein erstes eigenes Forschungsprojekt. Ich freue mich riesig über die Aufnahme in ‚KI-Starter‘ und die damit verbundenen Möglichkeiten“, sagt die 31jährige Zorah Lähner, die seit 2021 als promovierte Informatikerin am Siegener Lehrstuhl für „Computer Vision“ arbeitet. „Unsere Welt ist dreidimensional, deshalb ist es nur natürlich, dass man die Dinge auch in 3D darstellt“, erklärt Lähner. Geometrische 3D-Daten seien zudem das Rückrat vieler Anwendungen in der Computergrafik und Vision – von selbstfahrenden Autos, über die Virtuelle Realität bis hin zu medizinischen Anwendungen. „Es wird in Zukunft immer mehr 3D-Aufnahmen geben, erste Geräte und Apps dafür sind ja schon auf dem Markt. Mein Ziel ist es, dass alles, was man heute schon mit Fotos machen kann, künftig auch mit 3D-Daten möglich ist.“

Der Ansatz der Informatikerin: Die der 3D-Bearbeitung zugrundeliegenden, geometrischen „Deep Learning-Methoden“ robuster und flexibler zu machen. „Deep Learning“ ist ein Teilbereich der Künstlichen Intelligenz. Die Algorithmen orientieren sich dabei an der Struktur des menschlichen Gehirns und werden als neuronale Netze bezeichnet. „Für 3D-Daten gibt es zwar schon sehr viele neuronale Netze – aber die funktionieren nur, wenn die Daten qualitativ sehr hochwertig sind“, erklärt Lähner. Gerade 3D- Aufnahmen von Laien enthalten jedoch oft kleine Störungen wie Rauschen oder Unschärfen, was in der Bearbeitung schnell zu Problemen führt. Eine weitere Hürde stellen die verschiedenen Formate bzw. Repräsentationsformen dar, in denen 3D-Objekte dargestellt werden können – von sogenannten „Punktwolken“, bis hin zu Flächen- und Volumenmodellen. Bisher müssen AnwenderInnen ihre Darstellungen häufig erst mühsam konvertieren, um sie zu bearbeiten. „Das liegt daran, dass die Bearbeitungsmethoden nur für bestimmte Repräsentationen funktionieren. Ich möchte die Methoden hinsichtlich der Formate flexibler machen“, sagt Lähner.

Im ersten Schritt plant die gebürtige Kölnerin, einen neuen Datensatz mit einem möglichst breiten Spektrum an 3D-Daten anzulegen: Daten, die mit unterschiedlicher Hardware aufgenommen wurden und in verschiedenen Repräsentationen und Qualitäten vorliegen. Auf dieser Grundlage möchte sie anschließend die dem Deep Learning zugrunde liegenden neuronalen Netze „trainieren“: „Idealerweise stelle ich mir am Ende ein neuronales Netz vor, in das man eine beliebige 3D-Darstellung eingeben kann – egal mit welchen Gerät oder in welcher Qualität sie aufgenommen wurde und in welcher Repräsentation sie vorliegt – und man bekommt bei der Bearbeitung auch als Laie und ohne großen Mehraufwand das gewünschte Ergebnis.“

Siehe auch:

https://www.mkw.nrw/hochschule-und-forschung/foerderungen/foerderlinie-kuenstliche-intelligenz-maschinelles-lernen

Zurück