A Polyphony Digital bemutatta az új, mesterséges intelligens vezetési rendszerét, a „Gran Turismo Sophyt”, amelyet a Sony AI-vel együttműködésben fejlesztettek ki. A Sophy-t a legújabb tanulási technikák felhasználásával hozták létre, amelyek úgy képezik ki az MI-pilótát, hogy „jutalmazza” vagy „bünteti” bizonyos tevékenységekért, amelyeket a környezetben végez. Sophy esetében a Sony AI-kutatói a „Quantile-Regression Soft Actor-Critic (QR-SAC)” elnevezésű edzési algoritmust használták, hogy Sophy megértse, mit kell tennie.
Konkrétabban, Sophy-t arra tanították, hogy sajátítsa el a GT Sport három speciális készségét : az autóirányítást, a versenytaktikát és a verseny etikettjét.
Autóvezérlés
Először Sophy-nak meg kellett tanulnia, hogyan irányítsa az autót, hogy a lehető legjobb köridőt fussa meg a pályán. A „nagy sebességű akciók” lehetséges kimenetelére oktatták, megtanulva, hogyan kell bevenni a kanyarokat a határon. Negatív tettekért – például falak ütközéséért, kanyarok levágásáért vagy pályahatárok elhagyásáért – büntették, és a tiszta, egyre gyorsabb körökért jutalmazták.
Sophyt a GT Sport környezetében képezték ki, több mint 1000 virtualizált PlayStation 4 konzolon futva a Sony Interactive Entertainment speciális felhőalapú játékplatformján. Ez lehetővé tette a Sony AI-kutatóinak, hogy több száz kísérletet hajthassanak végre egyidejűleg, hogy Sophy a lehető leggyorsabban tanulhasson.
„Körülbelül egy napba telik, amíg Sophy a „teljesen tudatlan állapotból” egy adott pályán körbe tud menni” – mondta Michael Spranger, a Sony AI ügyvezető igazgatója. „Ezután körülbelül két napba telik, hogy elérje az emberi sofőrök felső öt százalékát, majd további 10-12 napba, hogy a legmagasabb szinten vezessen, és egyenlővé váljon a legjobb valós pilótákkal. Ez alatt az időkereten belül a Sophy körülbelül 300000 km tapasztalattal gazdagodik.
„Versenyző vagyok, és megtanultam a gyors vezetés technikáit, például a ’slow-in-fast-out’ kanyarvételt” – mondta Kazunori Yamauchi, a Gran Turismo alkotója. „A Gran Turismo Sophy nem így tanul. Úgy gondolom, hogy miután a Sophy világgá indul, a vezetésről szóló tankönyveket meg kell változtatni. Például amikor Sophy bemegy egy kanyarba, valójában fordul és fékez. Általában, amikor az ember kanyarban megy, csak a két első gumit terheli, de Sophy három abroncsot terheli: kettőt elöl és egyet hátul is amire emberi lények hagyományosan nem képesek. Végül az történik, hogy gyorsan be- és kifelé halad.”
Yamauchi azt is megjegyezte, hogy Sophy olyan speciális vezetési technikákat tanult meg, amelyeket a Polyphony Digital csak elit pilóták – például a Forma-1-es világbajnokok, Sebastian Vettel és Lewis Hamilton – használtak a Gran Turismo Sportban .
Versenytaktika
A többi autót is magában foglaló versenytaktika bonyolultabb folyamat volt. Sophyt „vegyes forgatókönyvű” tréning segítségével képezték, amely kézzel készített versenyhelyzeteket tartalmazott, és amelyek valószínűleg minden pályán láthatóak voltak speciális ellenfelekkel. Ez bemutatta Sophy-t a tipikus versenyélményeknek, és megtanította neki, hogyan kell kezelni az olyan dolgokat, mint a zsúfolt versenyrajt, hogyan kell használni a szélárnyékot az ellenfelek megelőzésére, és hogyan védekezheti ki az előzési kisérleteket.
Verseny etikett
Talán a legnehezebb kihívás – mind a mesterséges intelligencia-rendszer, mind a valós versenyzők számára – a versenyzési etikett azaz, hogy mi a megfelelő és mi nem megfelelő viselkedési kultúra a pályán. A Sony AI kutatói megtalálták a módját, hogy „a versenyzés írott és íratlan szabályait egyaránt kódolják” a Sophy jutalmazási funkcióiba. A csapatnak gondosan egyensúlyba kellett hoznia Sophy ellenfeleit is, hogy ne legyen túl agresszív vagy túl passzív.
Hogy bemutassa Sophy képességeit az emberi játékosokkal szemben, a Polyphony Digital vendégül látta a Gran Turismo World Tour legjobb pilótáit két különleges „Race Together” eseményen tokiói irodáiban. Az emberi játékosok legyőzték Sophyt az első versenyen, 2021 júliusában, de a Sony AI csapata győzött a második versenyen néhány hónappal később, októberben.
A Polyphony Digital minden eseményről közzétett videókat – a Gran Turismo hangjának, Tom Brooksnak a kommentárjával kiegészítve –, hogy bemutassa Sophy vezetési technikáit és annak fejlődését.
Sophy a Gran Turismo 7-ben
Bár Sophyt a GT Sport környezetében fejlesztették ki, Kazunori Yamauchi megerősítette, hogy technológiája a játék „jövőbeni frissítése” során megjelenik a Gran Turismo 7 -ben. Egyelőre nem világos, hogy a Sophy pontosan hogyan épül be a játékba, bár tudjuk, hogy a Polyphony nem csupán egy virtuális versenytársnak tekinti a Sophyt, hanem egy tanítási eszköznek is.
„Végső soron szeretnénk örömet és szórakozást nyújtani, miközben Sophy versenyzik az emberekkel” – magyarázta Yamauchi. „Nem az a fő cél, hogy megverjük az embereket, hanem, hogy barátot, vagy egy segítő partnert alkossunk. Azt akarjuk, hogy a játékosok együtt tanuljanak és együtt fejlődjenek Sophyval. Valamit szeretnénk létrehozni, ami pozitív hatással van a társadalomra, ami szimpátiát, kedvességet ébreszt, kreatív és etikus.”