Das Holo-Deck und die Zukunft der Kommunikation aus Karlsruhe

IOSB-Alumnus Miro Taphanel im Interview

© Gixel
Die Menschheit aus der Videocall-Hölle befreien, das ist die Vision von Dr. Miro Taphanel. Dafür hat er das Start-up Gixel mitgegründet. Die Idee überzeugte auch die Bundesagentur für Sprunginnovationen, die sich der Förderung von disruptiven Technologien verschrieben hat. Und so ist das Start-up eines der wenigen, das SPRIN-D unterstützt.

Ein „echtes“ Treffen zweier Menschen, die an verschiedenen Orten stehen, das ist die Zukunftsvision des Fraunhofer-IOSB-Alumnus Miro Taphanel und seinen Mitstreitern. Sie wollen die Menschheit aus der Video-Telefonie-Hölle führen – denn bei herkömmlichen Technologien geht ein großer Teil nonverbaler Informationen verloren. Diese neue Form der Kommunikation ist bereits im Einsatz, die Gründer des Karlsruher Start-up treffen sich regelmäßig virtuell über verschiedene Standorte hinweg und stehen sich virtuell in voller Körpergröße gegenüber. Zumindest fühlt es sich dank Gixels Augmented Reality-Technologie, bestehend aus Kamera, spezieller Brille, Bildschirm, Künstlicher Intelligenz und komplexer Software so an.
Auch US-Tech-Giganten mit milliardenschweren Budgets drängen auf diesen Markt und wollen Menschen in andere Umgebungen versetzen – allerdings mit ganz unterschiedlichen Ansätzen. Gelingt Gixel der technische Durchbruch, scheint der finanzielle Erfolg gesichert. Bevor wir in die Zukunft der Kommunikation eintauchen können, gibt es allerdings für das Karlsruher Unternehmen noch technische Herausforderungen zu meistern.

Die Aussicht auf die Lösung eines grundlegenden Problems hat auch die Agentur für Sprunginnovationen SPRIND der Bundesregierung überzeugt. Und so investiert SPRIND in Gixel mehr als 20 Millionen Euro, ein Ritterschlag, der bislang nur wenigen Gründungen zu Teil wurde.

 

Miro Taphanel studiert am KIT Maschinenbau. Schon während seiner Promotion am KIT steht er im intensiven wissenschaftlichen Austausch mit dem Fraunhofer-Institut für Optronik, Systemtechnik und Bildauswertung IOSB. Anschließend arbeitet er als Wissenschaftler für die renommierte Universität und wechselt dann als Leiter der Gruppe »Variable Bildgewinnung« zum Fraunhofer IOSB. Mit dem IOSB-Wissenschaftler und Kollegen Ding Luo sowie dem erfahrenen Unternehmensgründer Felix Nienstädt gründet er Sommer 2019 Gixel.

 

 

Eure Lösung wird gerne mit dem Holo-Deck, einer fiktiven Errungenschaft aus einer Science-Fiction-Serie, verglichen. Wie kann man sich die Idee hinter der Gixel-Lösung vorstellen?

Unser Ziel ist ein Remote-Meeting im Gefühl eines echten Treffens. Daher steht die Kommunikationslösung als Ganzes im Mittelpunkt. Mit Hilfe von Augmented Reality erzeugen wir die Illusion, dass Gegenstände oder wie in unserem Fall Menschen in meinem Raum, meinem Sicherheitsbereich sind. Darin unterscheiden wir uns klar vom Virtual Reality-Ansatz und damit auch vom Holodeck. Bei unserer Lösung hat man keinen Mülleimer im Gesicht, verlässt nicht den eigenen Fähigkeitsbereich, um in eine andere Welt hineinzugehen. Wir reichern die eigene Realität mit Freund:innen, Bekannten und Kolleg:innen an, bleiben im Hier und Jetzt. So behalte ich auch alle Fähigkeiten, kann mein Handy, meinen Notizblock verwenden, ich könnte auch einen Nagel in die Wand hämmern. Hätte ich eine Mixed-Reality-Brille aufgesetzt, würde ich nicht auf so eine Idee kommen!

Diese Uneingeschränktheit macht neben dem Kommunizieren auch weitere Einsatzszenarien denkbar. Welchen Ansatz verfolgt Ihr dabei?

Das Sehen ist der wichtigste Sinn, dem wir nicht gerecht werden, wenn wir Informationen zunächst in Pixel und digitale Daten umrechnen, um diese wieder in etwas Optisches, Analoges umwandeln. Den Menschen muss man mit seinem peripheren Sehen belassen, so wie es von Natur aus ist. Wir wollen die Superkraft verleihen, Dinge in diesen Sinn mit aufzunehmen. Das Schönste sind gute Freundinnen und Freunde, mit denen man abends auf dem Sofa sitzt, Spiele spielt oder zusammen Sport macht.

Wir setzen zudem auf Spatial Audio. Man hört das Gegenüber, dort wo sie oder er im Raum erscheint. Unser Leitstern ist das reale Treffen mit einer Person. Daher gehen wir einen Schritt weiter und verzichten auf den Lautstärkeregler. Spricht in der realen Welt ein Gegenüber zu leise, gibt es keinen Regler, sondern die Bitte, lauter zu sprechen.

© Gixel
Die ersten Treffen über die Lösung von Gixel in den Labors des jungen Unternehmens sind bereits möglich. Der Ansatz von Gixel unterscheidet sich technisch deutlich von den Marktbegleitern.

Wenn ich mit Gixel ein Gespräch führen möchte, was benötige ich dafür?

Die einzige Hardware, die man für unsere Lösung braucht, ist eine spezielle Brille. Diese ist so gestaltet, dass beide nach wie vor Lust haben, sich miteinander zu unterhalten. Ich würde nicht von einem Anruf sprechen. Unser Leitstern ist das physikalische Treffen. Dabei rufe ich nicht irgendwo an, sondern betrete einen Raum. Natürlich muss man das initialisieren, aber es fühlt sich visuell und akustisch so an, als steht man sich real in einem Raum gegenüber. Ich kann mein Gegenüber anschauen, jeder sieht, wo die Aufmerksamkeit ist. Ich kann etwas behaupten und sehe, wie jemand auf das Gesprochene reagiert und ich kann diese Information aufnehmen. Es sind also all die Kommunikationsformen möglich, die wir mit all den gängigen Video-Tools, die es heute auf dem Markt gibt, nicht zur Verfügung haben.

Einen erheblichen Anteil hat auch Software. Man benötigt vom Gegenüber ein dreidimensionales Abbild, damit ich um die Person herumlaufen kann und sie auch so sehe, wie ich mich relativ zur Person aufhalte. Das bedeutet aber, dass ich nicht an der Stelle eine Kamera aufstellen kann. Dieses Bild, dieser Avatar muss von der Software generiert werden. Das setzen wir mit Deep Learning um. Uns steht eine große Bandbreite zur Verfügung, die von der Comic-Figur bis hin zum perfekten Fotorealismus reicht. Wir glauben nicht an Comics, sondern legen den Schwerpunkt auf den technisch deutlich anspruchsvolleren Fotorealismus.

Was sind die nächsten Schritte?

Erste Treffen sind auf diese Weise schon möglich, allerdings nur in unseren Niederlassungen. Mit diesen Prototypen, die wir mit geringen Mitteln in unserer Garage aufgebaut haben, überzeugten wir uns in erster Linie selbst, ob wir hinter dieser Kommunikationsform stehen und ob wir als Unternehmer die nächsten Jahre mit dieser Entwicklung verbringen wollen. Während Corona kommunizierten wir als Hologramme und haben gleichzeitig aus dieser User- Experience heraus das Produkt weiterentwickelt und die Avatarisierung getestet. Die mobile, finale Lösung ist jedoch noch nicht marktreif.

Auf der eigenen Web-Seite widmet Gixel einen großen Teil der Kultur des Unternehmens. Hat das auch mit der Lösung zu tun?

Wir haben Felix im Team, der einige Firmen gründete und sich intensiv mit dem Thema Unternehmenskultur auseinandersetzt. Wir wollen für unser Unternehmen den optimalen Umgang untereinander. Augmented Reality ist aktuell eines der kompliziertesten Produkte, die man bauen kann. Das resultiert aus der hohen Komplexität aber auch aus der großen Anzahl von Expertinnen und Experten, die dafür notwendig sind. Sollte Gixel Erfolg haben, wird es ein großes Unternehmen sein. Wenn man nicht von Beginn an ein solides Fundament legt, wird es im Nachgang schwierig, eine Kultur zu implementieren. Daher machten wir ums im Vorfeld viele Gedanken dazu. Wir haben diese Regeln aber auch nicht erfunden. Ich bin nicht zuletzt Fraunhofer-sozialisiert. Seit über einem Jahr leben wir diese Kultur und es funktioniert überraschend gut. Derzeit könnte ich mir keine Bessere vorstellen.

© Gixel
Mit Brillen wie dieser, wollen die Gründer von Gixel Kommunikation auf ein neues Level heben.

Könnten Sie Ihre Philosophie skizzieren?

Es gibt in unserem Unternehmen so gut wie kein Micromanagement und wir definieren keine Prozesse oder Regeln. Die Kurzformel lautet: Wir arbeiten mit Erwachsenen. Jede Mitarbeiterin, jeder Mitarbeiter weiß selbst, was jeder persönlich benötigt und jeder weiß auch, was für das Unternehmen notwendig ist. Wir fordern beides ein und jede Mitarbeiterin, jeder Mitarbeiter ist verantwortlich, beide Seiten in Einklang zu bringen. Wir wollen nicht, dass Zeit im Büro abgesessen wird, um auf die vereinbarten acht Stunden zu kommen. Zeit wird meist als messbare Größe herangezogen. Aber kein Arbeitgeber möchte für Zeit bezahlen, sondern für Leistung. Mit unserer Kultur wollen wir sehr gut dieses Dilemma in Einklang bringen. Dennoch bin ich mir nicht sicher, ob sich dieses Konzept auf jedes Unternehmen anwenden lässt.

Wir sind keinesfalls missionarisch unterwegs. Wir haben uns unsere Kultur nur aus dem einen Grund gegeben, weil wir glauben, damit maximale Effektivität zu erreichen. Das ist zeitlos, da wir auch schon vor Corona mit diesen Grundsätzen arbeiteten. Wir sehen einen deutlichen Digitalisierungsschub, höhere Akzeptanz für hybride Arbeitsmodelle oder Home-Office. Das sind technisch gesehen genau die Stellen, an der unser Produkt ansetzt. Dennoch: Corona war kein Enabler. Kommunikation ist DAS menschliche Grundbedürfnis und wir geben diesem Bedürfnis ein Produkt. Ich sehe das entkoppelt.

Hatten Sie bereits am IOSB Erfahrungen, die in diese Richtung gehen?

Fraunhofer wird von außen als eine sehr große Organisation wahrgenommen. In der Regel arbeitet man in kleineren Einheiten von 30 bis 40 Personen, so ist man stark von der eigenen Abteilung geprägt. Fraunhofer habe ich persönlich als sehr gute Ausbildung wahrgenommen. Als engagierter Mitarbeitender, oder auch im Rahmen einer Promotion steht man sehr intensiv im Austausch mit der Industrie und lernt schnell auf sehr hohem Niveau. Davon zehre ich sehr, man kann durchaus sagen, täglich. Wenn wir zum Beispiel Messsysteme aufbauen, sind wir sehr nahe an dem, was wir bei Fraunhofer gemacht haben. So gelingt die Umsetzung meist sehr schnell.

Fraunhofer ist für eine besondere Kultur bekannt, jedoch arbeitet ein Start-Up völlig anders. Ein Beispiel ist die Geschwindigkeit: An einem Freitagabend hatten wir die Idee, eine AR-Brille auszuprobieren. Am Samstagmorgen hatten wir das gewünschte Modell in den Händen. Man setzt in einem Start-up sehr schnell Ideen um. Bei Fraunhofer gibt es viele gute Gründe, die diese Geschwindigkeit zum Beispiel bei der Beschaffung einbremsen. Ein weiterer großer Unterschied ist die Fokussierung auf ein einziges Produkt. Als Unternehmer steht man viel stärker in der Selbstverantwortung und ist motiviert, Probleme zu lösen.

Gibt es noch regelmäßigen Austausch mit ehemaligen Kollegen oder Fraunhofer?

Natürlich stehe ich nach wie vor mit meiner alten Abteilung im Kontakt. Mit der Fraunhofer-Gesellschaft arbeiten wir als Auftraggeber mit unterschiedlichen Instituten zusammen. Ich nehme Fraunhofer als ein immer verfügbares Labor wahr und als Alumni habe ich keinerlei Berührungsängste. Wir planen fest mit Fraunhofer und müssen nicht jedes Labor selbst aufbauen. Auch wir kämpfen mit dem Fachkräftemangel und einen besseren Pool an Expertinnen und Experten, die mit dem richtigen Equipment ausgerüstet sind und sich über anspruchsvolle Projekte freuen, kann man in Deutschland vermutlich nicht finden.

© Gixel
Durch die Gixel-Brille fotografiert: Die Personen erscheinen als dreidimensionale Projektion, daher fühlt so ein Gespräch eher an wie ein Treffen mit realen Personen.

Vor welchen Herausforderungen steht Gixel?

Verschiedene Hersteller experimentieren aktuell mit Schnittstellen wie Hand-Controller, Steuerungen über einen Ring oder mit Gesten-Steuerung. Gleiches gilt für das virtuelle Treffen im Raum. Ein bekanntes Unternehmen hat dafür sogar den eigenen Namen geändert. Dennoch ist es in erster Linie ein technisches Problem. Einer der wesentlichen Aspekte ist »Field of View«. Die Sichtfeldgröße hängt stark mit dem Gefühl der Immersion zusammen. Verschwindet mein Gegenüber aus meinem Sichtfeld, wenn ich den Kopf bewege, findet keine immersive Kommunikation statt. Dieses Gefühl, jemand ist wirklich da, erreicht man nur mit einem großen Sichtfeld. Ansätze, die beispielsweise auf diffraktiven Wellenleitern oder Birdbath-Optiken aufsetzen, machen große Kompromisse nötig und stoßen auf physikalische Grenzen. Wir hatten das Glück, Versuche beobachten zu können und verfolgen jetzt einen völlig anderen technischen Ansatz.

Wie profitiert Ihre Gründung von der Sprind-Finanzierung?

Es ist eine komfortable und neue Art und Weise, wie man Start-ups in Deutschland finanzieren kann. Augmented Reality ist sehr komplex und kostenintensiv, da es ein komplexes Zusammenspiel aus Software, Prozessor und Optik ist und das nicht selten am Limit des technisch Machbaren. Entsprechend hoch sind die dafür notwenigen Gelder sowie der zeitliche Bedarf, um eine Entwicklung aus dem Labor ins Regal zu bringen. Die Bundesregierung hat SPRIND mit dem Anspruch gegründet, Projekte zu unterstützen, die das Potential besitzen, neue Industrien in Deutschland anzusiedeln. Wir haben uns für diese spezielle Form der Finanzierung beworben, - es ist keine Förderung – mit dem Anspruch, eine große Idee umzusetzen.

Mit dem sehr hohen finanziellen Risiko, mit dem wir gestartet sind, hätten wir auf dem normalen Markt keine Finanzierung in dieser Größenordnung bekommen, davon bin ich überzeugt. Inzwischen konnten wir das Risiko eindämmen und wir hoffen, dass wir mit unserer Idee zeigen können, dass sich diese Form der Finanzierung lohnt und wir für die Bundesrepublik Deutschland einen Mehrwert schaffen können.

Wir danken für das Gespräch, Herr Taphanel.