Program amerykańskiej agencji Departamentu Obrony do spraw rozwoju zaawansowanych projektów badawczych AlphaDogfight Trials zakończył się bezapelacyjnym zwycięstwem sztucznej inteligencji nad człowiekiem. Program komputerowy wygrał wszystkie pięć wirtualnych pojedynków przeciwko pilotowi F-16.

Najlepszy okazał się algorytm opracowany przez Heron Systems, a drugie miejsce zajął produkt Lockheeda. Zwycięski algorytm pokonał programy siedmiu innych producentów (Aurora Flight Sciences, EpiSys Science, Georgia Tech Research Institute, Lockheed Martin, Perspecta Labs, PhysicsAI, SoarTech), a na koniec zmierzył się z prawdziwym pilotem korzystającym z hełmu rzeczywistości wirtualnej. Walki prowadzono z użyciem najbardziej tradycyjnej metody: jedynie za pomocą działka skierowanego do przodu.

Zarówno algorytm zwycięski, jak i ten z drugiego miejsca działały na zasadzie wspomaganego głębokiego uczenia maszynowego (deep learning). Polega to na kolejnych samodzielnych próbach algorytmu rozwiązania danego problemu aż do osiągnięcia optymalnej metody. Wiąże się to również z licznymi porażkami w trakcie procesu uczenia się, ale są one szybko poprawiane.

–  Nauczenie algorytmu walki diametralnie się różni od nauczenia go latania samolotem – powiedział Lee Ritholtz z Lockheeda. – Program rozpoczyna naukę, nie mając pojęcia, jak ma wykonać zadanie. Człowieka nie trzeba uczyć, że nie powinien się rozbić o ziemię, ma on naturalny instynkt, którego algorytm nie ma. To oznacza dużo „umierania” i dużo uderzeń w ziemię.

W trakcie nauki algorytm uczy się, że każdy błąd ma swój koszt, ale te koszty nie są równe. W ciągu kolejnych symulacji program nadaje każdemu manewrowi odpowiednią wagę, znając jego konsekwencje z wcześniejszych prób. Wraz z kolejnymi symulacjami waga poszczególnych manewrów zmienia się wraz ze zdobywaniem doświadczenia przez program. Przedstawiciel zwycięskiej firmy powiedział, że jej program przed przystąpieniem do konkursu AlphaDogfight Trials wykonał ponad 4 miliardy symulowanych walk powietrznych i nabył doświadczenie odpowiadające pilotowi z dwunastoletnim stażem.

Według zasad konkursu w czasie samej rywalizacji algorytmy nie mogły już się uczyć na własnych doświadczeniach. Nie pomogło to anonimowemu pilotowi F-16 o przydomku „Banger”, który przegrał wszystkie pięć starć. Trzeba jednak zauważyć, że starał się on dostosować do stylu walki programu i każda kolejna runda pojedynku trwała dłużej. Problem polegał na tym, że człowiek uczył się zbyt wolno. Pilot stwierdził jedynie, że standardowe rzeczy, które robią piloci myśliwców, się nie sprawdzały.

Mimo zdecydowanego zwycięstwa sztucznej inteligencji droga do zastąpienia pilotów jest jeszcze bardzo daleka, o ile w ogóle okaże się możliwa. Kwestia ta wykracza poza informatykę i techniką, a wiąże się z wieloma aspektami prawnymi i etycznymi. Celem programu DARPA nie jest opracowanie następcy pilota, ale zautomatyzowanie wielu procesów, którymi musi się zajmować człowiek w czasie walki, i stworzenie skutecznych zespołów złożonych z samolotów załogowych, których piloci będą nadzorowali inteligentnych bezzałogowych „lojalnych skrzydłowych”.

Zobacz też: Nigeria modernizuje lotnictwo

(defenseone.com)

DARPA