OpenAI Five übt 180 Jahre pro Tag

Dota 2: Wie eine KI Menschen im 5-gegen-5 schlägt und warum das cool ist

Geschätzte Lesezeit: ca. 3 Minuten

Foto von Sebastian Hardt

von Sebastian Hardt (@hardtboiled)-

Die KI 'OpenAI Five' hat erstmals menschliche Gegenspieler im 5-gegen-5-Modus des Computerspiels 'Dota 2' besiegt. Wer jetzt denkt: "Na und? Ich werde ständig von computergesteuerten Gegnern auf die Matte geschickt", befindet sich auf dem Holzweg. Damit eine KI ein komplexes Game wie Dota 2 von der Pike auf lernen kann, sind 128.000 Prozessorkerne nötig. Und 180 Jahre Training - am Tag.

Noch vor zwei Jahren war es eine Sensation: Die künstliche Intelligenz 'AlphaGo' besiegt einen der weltbesten Go-Spieler in seiner Paradedisziplin. Heute würde das wohl kaum mehr jemanden wirklich überraschen - künstliche Intelligenzen bekämpfen mittlerweile Moskitoplagen oder gucken durch Wände. Und sie schlagen inzwischen sogar halbwegs professionelle Spieler in komplexen Computer-Spielen: Der 'OpenAI Five' ist es jetzt gelungen, Halbprofis in dem höchst anspruchsvollen 'Dota 2' zu besiegen, wie die Forscher von 'OpenAI' in ihrem Blogeintrag stolz verkünden. Und zwar nicht etwa in der Variante 1-gegen-1 (das hat die KI bereits letztes Jahr geschafft), sondern im weitaus komplexeren 5-gegen-5-Modus.

Ihr fragt euch jetzt womöglich: Warum ist das eine Meldung wert? In 'Dark Souls' machen mich die Computergegner doch auch regelmäßig lang. Und gegen die KI in 'Starcraft 2' hab ich auch schon mehrfach verloren. Der Knackpunkt ist: Das Verhalten der Gegner in genannten Games ist im Vorfeld ziemlich genau festgelegt worden. Und zwar von Leuten, die das Spiel sehr gut kennen: Den Entwicklern. Der Handlungs-Spielraum eurer virtuellen Widersacher ist viel geringer, als es für euch vielleicht den Anschein hat - strenggenommen existiert ein solcher Spielraum gar nicht.

OpenAI Five: Viel mehr als ein schlauer Computergegner

Gegner in Computerspielen sind vielmehr komplexe "Wenn-Dann-Maschinen": Wenn der Spieler hinter einem Vorsprung hervorkommt, dann schießt du. So oder ähnlich könnte eines der vorher festgelegten Muster heißen, nach denen Computerspiel-KIs in einem Shooter handeln. Wirkt ein Computergegner auf den Spieler intelligent oder lernfähig, dann nur, weil er auf Grundlage von sehr vielen oder sehr komplexen (wenn dies UND dies, dann das UND jenes und so weiter) dieser Wenn-Dann-Beziehungen handelt. Gleichzeitig genießt die Computerintelligenz jede Menge Vorteile. In 'Starcraft 2' zum Beispiel kennt sie Informationen, die menschlichen Spielern verborgen bleibt. Oder sie bewegt alle Einheiten gleichzeitig.

Die KI spielt unter erschwerten Bedingungen, aber zu den selben Regeln.

Eine künstliche Intelligenz wie die von Open AI aber kennt das Spiel zunächst nicht, ihr sind die Regeln nicht geläufig und sie muss sich alles selbst erarbeiten. Die Maschine startet gewissermaßen bei null. Dafür muss sie mit den Informationen, die sie erhält, flexibel umgehen, sie richtig einordnen und in hoffentlich erfolgreiche Aktionen überführen können. Ganz wie ihr also, wenn ihr ein Spiel zum ersten Mal spielt.

Nur kann die KI nicht auf die Vorzüge eines menschlichen Gehirns zurückgreifen. Empathie, Intuition, Instinkt, Bauchgefühl und das Gespür für eure Teamkameraden - auf all das muss die Maschine verzichten. Sie spielt sozusagen unter erschwerten Bedingungen (es ist durchaus ein Nachteil, kein Gehirn zu haben), aber zu denselben Regeln.

180 Jahre Training am Tag - eine KI übt wie besessen

Um aber dennoch ein Spiel zu "lernen", um schließlich erfahrene menschliche Gegner zu besiegen, muss eine Maschine wie OpenAI Five, gelinde gesagt, ziemlich viel üben - besonders, um in einem Game wie Dota 2 die Oberhand zu behalten, in dem sich neben fünf eigenständig handelnden menschlichen Spielern auch noch 4 weitere KI-Kopien befinden. Genauer gesagt simulierte die KI unglaubliche 180 Jahre Spielzeit an nur einem einzigen Tag, über den Zeitraum von etwa einem Jahr.

Die KI hat gelernt, fast menschlich wirkende strategische Entscheidungen zu treffen.

128.000 Prozessorkerne und 256 sehr leistungsstarke 'Nvidia P100' Grafikprozessoren waren nötig, damit der Bot seine menschlichen Gegner schließlich in die Schranken weisen konnte.

Open AI hat im Zuge der Trainings offenbar gelernt, fast menschlich wirkende strategische Entscheidungen zu treffen - zum Beispiel das Opfern kurzfristiger Erfolge für ein langfristiges Ziel oder das Vorhersagen der Aktionen des Gegners, auch wenn er sich außerhalb des Sichtfeldes befindet. Gegenüber 'The Register' sagte Brooke Chan von OpenAI: "Sie hat sich ganz eigene Strategien beigebracht. Sie hat zum Beispiel gelernt, ihr eigenes verwundbares Territorium aufzugeben um feindliches zu erobern."

Ob das reichen wird, um auch gegen Vollprofis zu bestehen? Das wird sich schon im August zeigen, denn dann will OpenAI die künstliche Intelligenz gegen die besten Spieler auf dem von Valve organisierten Dota-2-Event 'The International' antreten lassen. Ein wenig Optimismus können sich die Forscher wohl leisten, denn immerhin kann die KI bis dahin noch knapp 9.720 Jahre üben.

Hier erfährst du mehr über: Künstliche Intelligenz und PC Gaming

Sag uns deine Meinung!