Eine KI entdeckt die Langsamkeit

Nvidia: KI macht aus alten Ruckelvideos butterweiche Zeitlupenaufnahmen

Geschätzte Lesezeit: ca. 2 Minuten

Foto von Sebastian Hardt

von Sebastian Hardt (@hardtboiled)-

Mit einem neuen Forschungsprojekt wollen Ingenieure von Nvidia Nutzern ermöglichen, alte Videos um ein Vielfaches zu verlangsamen, ohne dass Qualität verloren geht. Der Clou daran: Eine KI füllt das Video einfach mit computergenerierten Einzelbildern auf, so dass das neue Slo-Mo-Video genauso flüssig bleibt, wie das Original.

Superzeitlupe ist spätestens mit der neuesten Smartphone-Generation einer der Trends bei Videoaufnahmen. Modelle wie das iPhone X nehmen mühelos Sequenzen mit 240 Einzelbildern pro Sekunde auf - das bedeutet, dass Videos selbst bei vierfacher Verlangsamung noch ruckelfrei über den Bildschirm flimmern. Das Problem: Vor der Aufnahme weiß man in der Regel nicht, ob es sich lohnt, ein Video im Zeitlupenmodus zu starten. Schon allein, weil nur eine Minute dieser Hightech-Aufnahmen gut und gerne ein halbes Gigabyte an Speicherplatz belegen kann.

Nvidia-KI weiß, was zwischen den Frames passiert ist

Doch was wäre, wenn sich aus Standard-Videos (zum Beispiel mit nur 30 Bildern pro Sekunde) nachträglich ein ruckelfreies Zeitlupenvideo machen lässt? Das haben sich kürzlich offenbar auch Ingenieure des Grafikkarten-Herstellers Nvidia gedacht: "Es ist hochinteressant, aus existierenden Videos qualitativ hochwertige Zeitlupenvideos zu machen", schreiben sie in einem Forschungspapier. "Hochwertig" ist hier das Zauberwort: Ein Video einfach langsamer abzuspielen würde lediglich bewirken, dass sämtliche Bewegungen abgehackt und alles andere als flüssig dargestellt werden. Also müssen zusätzliche Einzelbilder die Lücke füllen. Und hier kommt die KI ins Spiel.

Da besagte Einzelbilder nie aufgenommen wurden, muss die Nvidia-KI die Übergänge zwischen den einzelnen Frames analysieren und sozusagen vorhersagen, was im Laufe der entstandenen Lücke geschehen ist. Damit das Verfahren realistisch wirkende Ergebnisse liefert, ist die KI mit über 11.000 Superzeitlupen-Videos von YouTube gefüttert worden - und das Ergebnis kann sich sehen lassen:

Superzeitlupe: 2 Bilder sind echt, 7 computergeneriert

Besonders bemerkenswert daran ist, dass weite Teile der Superzeitlupen-Videos streng genommen gar nicht existieren. Um aus einem Standard-Video mit 30 Bildern pro Sekunde eines mit 240 zu machen, muss die KI zwischen 2 Einzelbildern 7 Frames dazudichten.

Leider äußert sich Nvidia derzeit noch nicht dazu, ob und wann die spannende Technik beim Endanwender ankommt. Denkbar wäre eine App, die eure Videos zwecks Bearbeitung an die Nvidia-Rechenzentren schickt, so wie es beispielsweise Prisma oder Artisto handhaben. Vielleicht erfahren wir aber schon morgen mehr, wenn die Autoren der Studie ihre Ergebnisse auf der Konferenz 'Computer Vision and Pattern Recognition' in Salt Lake City vorstellen.

Hier erfährst du mehr über: Künstliche Intelligenz

Sag uns deine Meinung!