UT Austin Villa
UT Austin Villa (Web page)
Tento americký tím Texaskej univerzity v Austine pôsobí na scéne Robocup-u od roku 2003 a patrí medzi najúspešnejšie tímy v štandardnej lige, 3D simulovanej lige a lige trénerov. Na svojich domovských stránkach majú zverejnené rozsiahle kódy k svojim agentom spolu s dokumentáciou. Ich výskum sa zameriava na trénovanie, hracie stratégie a v poslednom roku aj na optimalizáciu všesmerovej chôdze (angl. omnidirectional walk), ktorú označujú za hlavný dôvod ich víťazstva na majstrovstvách sveta v simulovanom futbale v Turecku. Detaily parametrov použitých na optimalizáciu tejto chôdze však momentálne nie sú zverejnené.
Trénovanie
Princíp trénovania uplatňuje tento tím vo vývoji dvoch druhov agentov:
Tréner (angl. couch) - je to agent schopný na základe záznamov odohratých zápasov analyzovať hru súpera. Po analyzovaní gólových situáciách vie navrhnúť taktiku, ktorá by tomuto gólu zabránila a naopak po analyzovaní obrany vie navrhnúť taktiku, pri ktorej by bolo možné obranu obísť a skórovať
Hráč (angl. couchable player) - agent schopný spracovať pokyny trénera a následne ich vykonať. Hráč zohľadňuje aj ručne pridané rady konfiguračného charakteru (napr. uprednostniť streľbu pred prihrávaním, posúvať loptu viac dopredu než dozadu, pri obrane posúvať loptu k najbližšej čiare ...)
Tréner analyzuje dáta pozostávajúce z cyklicky zaznamenávaného stavu prostredia. Tento stav obsahuje pozície, smer a rýchlosť pohybu lopty a všetkých hráčov. Výsledkom analýzy je identifikácia udalostí vyššej úrovne, ktoré sa počas hry udiali (držanie lopty, strela, prihrávka, získanie lopty ...). Úlohou trénera je následne na základe daného stavu prostredia určiť najpravdepodobnejšiu udalosť a postup, ktorý majú hráči v prípade tejto udalosti vykonať. Tento postup je potom vykonávaný hráčom, na základe rozhodovacieho stromu, ktorý je implementovaný v tréningovom jazyku CLang.
Hracie stratégie
Hracie stratégie určujú správanie agentov pri určitých herných situáciách. Tím UT Austin Villa vyvinul dve podúlohy robotického futbalu, ktoré sú zamerané na kontrolu lopty.
Keepaway - v tejto úlohe figurujú dva tímy, jeden sa snaží kontrolovať loptu a udržať ju na ihrisku obmedzenej veľkosti a druhý tím sa snaží prebrať kontrolu lopty, pričom veľkosť ihriska a počet hráčov oboch tímov je voliteľný. Táto úloha je náročná z pohľadu strojového učenia, pretože:
- stavový priestor je príliš veľký na úplné preskúmanie
- každý agent má len čiastočné informácie o aktuálnom stave
- priestor akcií je kontinuálny
- viacero spoluhráčov sa musí učiť súčasne
Half field offense - je rozšírením keepaway, kedy sa útok jedného tímu má za úlohu dostať cez obranu druhého tímu tak, aby bol schopný streliť gól. Hrá sa na jednej polovici ihriska so začiatočnou pozíciou lopty blízko poliacej čiary.