„Maschinelles Lernen und Computer Vision gehört aktuell wohl mit zu den spannendsten Themengebieten und Technologiefeldern mit einem unglaublich großen Einsatz- und Innovationspotenzial in vielfältigsten Bereichen von Technik, Wirtschaft und Kultur."
A. Schreyer: Herzlichen Glückwunsch zu Ihrer Berufung als Professor für Computer Vision und Maschinelles Lernen an der Fakultät Ingenieurwissenschaften der HTWK Leipzig. Können Sie uns kurz erläutern, welche Aufgabenbereiche mit Ihrer Professur verbunden sind?
Prof. Fuchs: Zunächst vielen Dank für die Glückwünsche - auch wenn ich die Professur bereits seit einem Jahr vertreten habe und damit schon ein wenig in den Alltag eingetaucht bin, markiert die Berufung natürlich etwas ganz Besonderes für mich. Schon alleine deshalb, weil ich nun als Professor an genau der Stelle wirksam werden kann, an der ich vor ziemlich genau 20 Jahren selbst als Student in ingenieurtechnische und ingenieurwissenschaftliche Problemstellungen eingetaucht bin. Dabei verantworte ich nun Themenbereiche, die für damalige Absolventen wie mich fast keine Rolle gespielt haben, denen aber - da bin ich ziemlich sicher - sehr viele zukünftige Absolventinnen und Absolventen in ihrem Berufsleben auf die eine oder andere Weise begegnen werden.
Egal ob Nachrichten im Fernsehen, Podcasts, Soziale Medien, Radiobeiträge oder Zeitschriftenartikel - wann immer heute der oft viel zu sehr strapazierte Begriff der künstlichen Intelligenz auftaucht, also KI oder AI, ist in dessen Dunstkreis das Thema maschinelles Lernen in der Regel nicht weit. Im Prinzip ist es ganz einfach: Im Maschinellen Lernen geht es darum, einer Maschine bzw. einem Computer die Lösung eines Problems beizubringen, ohne die dafür notwendigen Regeln zur Lösung explizit zu formulieren, das heißt also ohne diese programmieren zu müssen. Stattdessen präsentiert man dem Computer möglichst viele Daten und gibt ihm eine Strategie an die Hand, wie er den Lösungsweg selbständig finden kann. Was so einfach klingt, ist in der Praxis natürlich nicht so leicht umzusetzen und kam deshalb lange nur in wenigen Anwendungsfeldern zum Einsatz. Aber gerade in den letzten Jahren haben ML-Verfahren völlig neue Möglichkeiten für die Datenanalyse eröffnet und zu beeindruckenden Anwendungen geführt.
Ein besonderes Potenzial moderner maschineller Lernverfahren besteht vor allem in Anwendungen mit sehr komplexen Lösungsräumen, in denen die klassische regelbasierte Programmierung schnell an ihre Grenzen stößt. Dies trifft beispielsweise auf die menschliche Sprache, aber vor allem eben auch auf die Verarbeitung und Analyse von Bilddaten zu. Und damit sind wir beim Thema Computer Vision. Hier geht es sozusagen darum, Computern durch Kameras Augen zu geben und aus den dabei aufgezeichneten Bildern Informationen zu gewinnen. Dabei können bestimmte Kameras Bilder extrem schnell im Vergleich zum menschlichen Auge erfassen. Andere wiederum wandeln nicht nur den Bereich des sichtbaren Lichts in digitale Signale um, sondern auch Bereiche des elektromagnetischen Spektrums, die dem menschlichen Auge überhaupt nicht zugänglich sind. Daraus ergibt sich ein vielfältiges Anwendungspotenzial von Computer-Vision-Systemen, aber zunächst einmal vor allem eine große Datenflut und folgerichtig auch ein sehr komplexer Entscheidungsraum, aus dem die gewünschten Informationen extrahiert werden müssen. In aller Regel ist es dann heutzutage das von Ingenieurinnen und Ingenieuren entwickelte Zusammenspiel klassischer Algorithmen und sogenannter Deep-Learning-Verfahren, das in der jeweiligen Anwendung zur Problemlösung führt.
Ich denke also es ist keine Übertreibung zu behaupten, dass sowohl Maschinelles Lernen als auch Computer Vision aktuell wohl mit zu den spannendsten Themengebieten und Technologiefeldern mit einem unglaublich großen Einsatz- und Innovationspotenzial in vielfältigsten Bereichen von Technik, Wirtschaft und Kultur gehören. Insofern empfinde ich große Freude, genau diese Gebiete nun sowohl in Lehre und Forschung an unserer Hochschule der angewandten Wissenschaften vertreten zu dürfen.
Für mich liegt die Herausforderung bzw. besser formuliert mein Anspruch vor allem darin, die vielfältigen komplexen und sich stellenweise noch sehr schnell wandelnden Themen zu systematisieren und in einer angemessenen Balance aus Theorie und praktischer Umsetzung mit modernen Tools zu vermitteln. Ich hoffe außerdem, dass es mir gelingt, die Studierenden zumindest auch ein klein wenig für meine eigenen Forschungsarbeiten zu begeistern, sodass die eine oder der andere zukünftig mein Forschungsteam verstärkt. Die entsprechenden Themen vermittle ich im Bachelorstudium in den Pflichtfächern Maschinelles Lernen I und Computer Vision I sowie im Wahlpflichtmodul Maschinelles Lernen II. Im Masterstudium sind es die Pflichtfächer Computer Vision II sowie CV/ML-Anwendungen in eingebetteten Systemen und die Wahlpflichtfächer CV/ML Advanced und Kamerabasierte Anwendungen.
A. Schreyer: Wie kommt es, dass Sie sich für diesen Forschungs- und Lehrbereich entschieden haben? Wussten Sie bereits vor dem Studium, welchen Weg Sie später einschlagen wollen?
Prof. Fuchs: In meiner Jugend habe ich ganz gern Computer gespielt. In der Praxis war es dann Mitte der 90er Jahre aber eher so, dass ich sicherlich mindestens 80% meines Zeitbudgets damit verbringen musste, den PC überhaupt in einen funktionsfähigen Zustand zu versetzen. Mal war die Hardware das Problem, mal das Betriebssystem. Ich denke entscheidend war dabei vor allem, dass dies noch in einer Zeit vor Google & Co. war und ich mich deshalb sehr intensiv mit den jeweiligen Problemen auseinandersetzen musste. Das war zwar oft langwierig, nicht aber langweilig, denn das intensive Beschäftigen mit der Technik und dem Zusammenspiel aus Hard- und Software hat natürlich Spaß gemacht. Dies war schließlich sicherlich ein Aspekt, der mich zum Studium der Elektrotechnik hier an der HTWK geführt hat. Gleichzeitig wusste ich da noch nicht, wo die Reise nach dem Studium hingehen könnte. Während meines Studiums waren es vor allem Themen rund um Mikrocontroller, Signalverarbeitung und Nachrichtentechnik, die mich begeistert haben. Denn hier war ich plötzlich wieder in meiner Welt des Zusammenspiels aus Hardware, Software und natürlich auch von Algorithmen.
Algorithmen waren es dann auch, die mich seitdem bis heute praktisch nicht mehr losgelassen haben, und zwar in den unterschiedlichsten Bereichen. Vor allem wollte und will ich in der Regel auch heute immer noch sehr genau verstehen, wie bestimmte Algorithmen funktionieren, wieso Algorithmen so sind, wie sie eben sind, und was genau hinter ihren Formeln steckt. Aus diesem Interesse heraus und einer entsprechenden Gelegenheit konnte ich als Gastwissenschaftler am Max-Planck-Institut für Kognitions- und Neurowissenschaften an meiner Dissertation arbeiten und schließlich an der TU Ilmenau promovieren. Dieses wissenschaftliche Arbeiten hat mir sehr viel Spaß gemacht - und spätestens hier wurde mir klar, dass ich mir gern ein eigenes Forschungsprofil aufbauen und interdisziplinäre Projekte mit der Industrie und anderen Wissenschaftlerinnen und Wissenschaftlern aktiv mitgestalten und verantworten möchte.
Neben der Mitbegründung der Arbeitsgruppe Laboratory for Biosignal Processing hier am Forschungszentrum der HTWK Leipzig als wichtiger Schritt in Richtung dieser Profilbildung gehörte dann vor allem das Identifizieren eines geeigneten Betätigungsfeldes dazu, gewissermaßen einer Nische mit der Chance, Alleinstellungsmerkmale im Hinblick auf Forschungs- und Entwicklungsvorhaben zu etablieren. Fündig geworden bin ich schließlich in der berührungslosen, meist kamerabasierten Erfassung von Signalen in unterschiedlichsten Anwendungsbereichen, z.B. in Medizin und Gesundheit, für Monitoringaufgaben in der Industrie, für Prozessanalysen bis hin zu Sporttechnologien. Dies alles geschah in einer Zeit, in der Themen rund um maschinelles Lernen nicht nur, aber vor allem in Bezug auf Bild- und Videodatenverarbeitung einen immensen technologischen Fortschritt zu verzeichnen hatten - sie spielten demnach auch für unsere Problemlösungen eine zunehmend wichtigere Rolle. Insofern hat mich diese Fokussierung in letzter Konsequenz dann zu maschinellen Lernverfahren geführt.
A. Schreyer: Was glauben Sie, sollten Studierende, die sich für ein Studium der Elektrotechnik und Informationstechnik entscheiden, an Fähigkeiten und Interessen mitbringen?
Prof. Fuchs: Für alle der im Verlauf dieses Studiums wählbaren Vertiefungen und Spezialisierungen ist sicherlich zunächst eine Affinität für das Verständnis physikalischer Zusammenhänge und deren Beschreibung mit mathematischen Methoden von großer Bedeutung. Auch grundlegende Programmierfähigkeiten werden schon ab dem ersten Tag des Studiums eine große Hilfe sein und sollten daher spätestens dann konsequent erlernt werden. Unbedingt sollten Studierende ein Interesse daran haben, den Funktionsprinzipien etablierter und selbstverständlich auch neuer Technologien auf den Zahn zu fühlen. Das hilft nicht nur während des Studiums, sondern auch mit Blick auf das spätere Berufsleben. Wer sich in einem ganz speziellen Problem vertieft, kann dabei sehr viel lernen und oft auch Rückschlüsse auf andere Bereiche ziehen. Gleichzeitig entwickelt man durch die Neugier an das Innenleben technischer Lösungen die notwendige Kreativität und ein umfangreiches Portfolio an Methoden und Werkzeugen, um später selbst komplexe Problemstellungen zielorientiert lösen zu können.
Nicht weniger wichtig sind aber auch Fähigkeiten, um technische Lösungen und Probleme adäquat und mit der notwendigen Sorgfalt sowohl qualitativ als auch quantitativ zu beschreiben - wenn dies am Anfang schwerfällt, ist das ganz natürlich. Aber man sollte selbst aktiv daran arbeiten, die eigenen Fähigkeiten in dieser Hinsicht stetig zu verbessern. Denn am Ende kommt es eben nicht nur darauf an, tolle neue Lösungen zu entwickeln, sondern diese auch in vielfältiger Weise zu kommunizieren.
A. Schreyer: Welche neuen Projekte würden Sie gerne in Zukunft realisieren?
Prof. Fuchs: Grundsätzlich macht es mir vor allem Freude, durch technische Lösungen neue Anwendungen zu ermöglichen. In dieser Hinsicht halte ich also immer die Augen offen, in welchen Anwendungsfeldern sich durch Technologien des maschinellen Lernens und von Computer Vision neue Möglichkeiten erschließen lassen. In den letzten Jahren ist dies beispielsweise im Bereich von Sporttechnologien, für Gesundheitsanwendungen und auch für spezielle Industriebereiche gelungen. All diese Anwendungsfelder werden in den kommenden Jahren verstetigt und vertieft, was natürlich auch mit entsprechenden Drittmittelvorhaben einhergeht. So freue ich mich zum Beispiel, dass wir bereits ab Januar 2023 ein neues zweijähriges Projekt starten können, um eine neue Technologie zur Wettkampfanalyse im Kanu-Rennsport zu entwickeln. Nennenswert ist in diesem Zusammenhang auch, dass sich aus solchen Vorhaben regelmäßig interessante Möglichkeiten zur Mitwirkung von Studentinnen und Studenten im Rahmen von Praktika, Bachelor- und Masterarbeiten ergeben.
Neben Themenbereichen, die ich bisher bereits unmittelbar adressiert habe, sehe ich vor allem auch innerhalb der HTWK interessante Anknüpfungspunkte für interdisziplinäre, anwendungsorientierte Forschungsvorhaben. Auch diesbezüglich finden bereits erste konkrete Vorarbeiten statt, um hoffentlich bald disziplin- und fakultätsübergreifend drittmittelfinanziert zu forschen.
Ein nicht minder wichtiges Projekt ist der bevorstehende Aufbau des Labors Computer Vision und Maschinelles Lernen. Im CVML-Lab werden Studierende nicht nur die Möglichkeit haben, mit gängigen Industriekameras Algorithmen und Anwendungen zu erproben, sondern auch mit sehr modernen Technologien wie zum Beispiel Event-Kameras und Hyperspektralkameras zu arbeiten. Selbstverständlich wird das Labor auch mit moderner Rechentechnik ausgestattet sein, sodass das Entwickeln und Trainieren äußerst komplexer künstlicher neuronaler Netze für Studierende möglich wird. Gerade in Bezug auf Kameratechnologien erhoffe ich mir darüber hinaus Synergien zu anderen Bereichen wie zum Beispiel dem Maschinenbau oder Bauwesen - denn mit diesen Technologien können wir bestimmte nicht-sichtbare Dinge sichtbar machen und vor allem automatisiert auswerten! Ich denke, dass hier noch ein großes Potenzial schlummert, um auch zukünftig eine Menge neuer Vorhaben anzugehen.