Aktuální vydání

celé číslo

05

2020

snímače teploty

celé číslo

Roboti, učení a kopaná

Automa 8/2000

Ing. Jindřich Bůcha, CSc.,
Ústav teorie informace a automatizace, AV ČR
(bucha@utia.cas.cz)

Roboti, učení a kopaná

Název příspěvku obsahuje poněkud neobvyklé spojení dosti odlehlých tematik. Chci ukázat, jak je tato kombinace užitečná. Hlavním cílem příspěvku je na tomto spojení ukázat, jaký je stav robotiky z hlediska užití technologií umělé inteligence (AI, artificial intelligence) a v podstatě jaký je stav AI. AI se nebudu zabývat v celé šíři, soustředím se na jeden její důležitý aspekt, učení. To je také dáno tím, že se zabývám (strojovým) učením, tj. automatizací pořizování znalostí pro systémy AI.

Pro můj přístup k učení, aplikovatelnému v reálném prostředí, je charakteristická snaha o integraci všech kognitivních funkcí, tj. tedy např. rozpoznávání, dedukce – plánování, realizace plánu a učení. Integrací se AI příliš nezabývá (pomineme-li aplikační část AI). Výrazně upřednostňuje detailní analýzu jednotlivých kognitivních funkcí a jejich částí. Jednou z výjimek je robotika. Tam, z povahy problematiky, je integrace nutná. Robot musí mít minimálně tyto funkce: funkci, která vnímá stav prostředí, funkci, která rozhoduje, co robot v nejbližší budoucnosti udělá (plánování), a funkci, která rozhodnutí realizuje. Tyto funkce musejí spolupracovat, musejí být integrovány.

Loni se ve Stockholmu konala 16. IJCAI99 (International Joint Conference on Artificial Intelligence), největší světová konference o AI. Při přípravě na účast na této konferenci jsem zjistil, že její součástí bude i RoboCup99, mistrovství světa v kopané robotů. Bez emocí jsem se rozhodl, že se ho zúčastním. (Program konference byl nabitý, velmi zajímavý, někdy se konalo až deset akcí současně, takže bylo důležité dobře se rozhodnout.) „Bez emocí“ jsem uvedl úmyslně. Přestože jsem se předem seznámil s tím, co bylo o jednotlivých lepších týmech prezentováno na webu, to důležité jsem si neuvědomil: „robotí“ kopaná má velký „emoční náboj“. To může významně ovlivnit vývoj robotiky i samotné AI. Proto se domnívám, že jde o důležitý jev.

V tomto příspěvku krátce popíši, jak roboti hrají kopanou, co při tom dělají a nedělají dobře a co v této souvislosti neděláme my Češi dobře.

Obr. 1.

Hlavní slabinu robotů vidím v neadekvátním učení. Proto se stručně zmíním o tom, jak se roboti učí a jak by se učit měli. Některé další informace o robotí kopané lze nalézt v [2].

V rámci této úvodní části problematiku ještě uvedu stručným historicko-futuristickým přehledem: První roboti se začali konstruovat v sedmdesátých letech. V roce 1993 vznikl nápad uspořádat turnaj robotů v kopané. V roce 1996 nápad uzrál a padlo rozhodnutí uspořádat mistrovství světa. V roce 1997 se v Nagoji (Japonsko) spolu s 15. IJCAI97 konal první ročník RoboCup97. Následující rok se s mistrovstvím světa FIFA v „lidské“ kopané konal v Paříži RoboCup98. O RoboCup99 jsem se zmiňoval v předcházejícím textu. A letos se v Melbourne konal RoboCup2000. Dlouhodobým cílem je postavit v roce 2050 tým humanoidních, tj. dvounohých robotů, které podle pravidel FIFA porazí současné „lidské“ mistry světa v kopané. V roce 1999 se ve čtyřech kategoriích soutěží celkem zúčastnilo přibližně sto týmů robotů.

2. Jak (dobře) to hrají

2.1 Základy
Základem kopané, i „robotí“, je dát co nejvíce gólů a co nejméně jich dostat. Dát gól znamená pohybovat míčem tak, aby se dostal do branky. V „robotí“ kopané míčem pohybuje robot. Aby robot mohl míčem pohybovat, musí být mobilní. V současné době se robot pohybuje (v kopané) na kolech nebo na nohou. Svůj pohyb nebo pohyb svých částí přenáší na míč. Buď ho strká, nebo kope.

Musí ovšem vědět jak. Jak (se) pohybovat. Dělá si proto plán, který později uskutečňuje. V přípravě na následující postup hraje důležitou roli další část robota, část vnímání stavu prostředí. Robot většinou pomocí snímací kamery sejme obraz prostředí, který následně zpracuje. Používají se nejrůznější kamery. Například vítězové kategorie středních robotů (v roce1998) užívali kameru Topica PAL CCD s rozlišením 704 × × 510 pixelů a 30 snímků za sekundu [4]. Pro srovnání, nejlevnější současné monitory PC pracují s 1 280 × 1 024 pixely a frekvencí obnovování obrazu 65 snímků za sekundu. Kamery je možné zaměřovat buď pomocí speciálních otáčecích a naklápěcích mechanismů, nebo využitím pohybu celého robota. Kromě kamer se požívají i další čidla, zejména dálkoměry a čidla dotyku. Někteří roboti měli i akustická čidla, mikrofony, ale nevím, zda je použili.

Pomocí čidel a následného zpracování informace z nich robot zjistí – identifikuje (nebo upřesní) existenci různých objektů a jejich vlastnosti, např. polohu. Podle toho naplánuje svou další činnost. Není-li např. u míče, musí se k němu nejprve dostat. Při tom musí někdy obejít i nějaké překážky, např. protivníka. Je-li u míče, může míč vést, vystřelit na branku nebo přihrát.

Podobně jako má zpracování senzorické informace několik úrovní, od úrovně jednotlivých pixelů, přes části objektů, např. hrany obrysů, až po identifikaci jednotlivých objektů, např. míče, brány, hráče-robota, je i realizace plánu několikaúrovňová. Na nejnižší úrovni je řízení motorů, např. samostatně pohánějících dvě kola. Používají se krokové motory, s krokem odpovídajícím např. 0,14° otočení hřídele motoru, s převodovkou 1 : 80 [4]. Na vyšších úrovních může jít o vedení míče z jednoho bodu do druhého, o přihrávku, na ještě vyšší úrovni o realizaci plánu, do kterého může být zapojeno i více hráčů.

Tab. 1. Počty týmů RoboCup2000

Země Kategorie
humanoid střední záchranář simulované simulované (Jr) malé kráčející celkový součet
Japonsko 1 5   16 1 2 1 26
Německo   7 1 7   2 1 18
Írán 1 2   13 1 1   18
?   3   8 2 2   15
Austrálie 1 1   4   6 2 14
Singapur   4   1   6   11
USA   2   4 1 3 1 11
Portugalsko   3       1   4
Švédsko   1   3       4
Itálie   1   2       3
Anglie       2       2
Brazílie       2       2
Katalánsko       1   1   2
Francie       1   1   2
Čína       1   1   2
Korea   1       1   2
Nový Zéland           1 1 2
Rusko       2       2
Venezuela       2       2
Belgie           1   1
Kanada       1       1
Chorvatsko       1       1
Finsko       1       1
Malajsie       1       1
Nizozemí   1           1
Tchajwan       1       1
Rumunsko       1       1
Celkový součet 3 31 1 75 5 29 6 150

2.2 Kategorie
V roce 1999 se oficiálně soutěžilo ve čtyřech kategoriích. Letos jich bude více (tab. 1).

V kategorii středních robotů hraje na hřišti 9 × 5 m v každém týmu maximálně pět robotů. Prostředí je barevné, např. brány jsou barevně odlišeny, aby si je roboti nepletli. Míč vypadá jako zmenšený basketbalový. Roboti mají průměr okolo 50 cm, výšku do 80 cm, hmotnost do 80 kg a pohybují se na kolečkách, která jsou samostatně poháněna motory (zdrojem energie jsou dobíjecí baterie). Někteří mají i kopací mechanismus, s jehož využitím střílejí na bránu nebo přihrávají, videokamery, popř. další snímací čidla (podle libosti návrhářů). Čidla umístěná mimo robota nejsou povolena, např. není možné využít kameru umístěnou mimo robota kdesi nad hřištěm. Rádiem jsou propojeni se svými hlavními počítači, v nichž je uložena největší část „inteligence“ robotů, tj. jejich hlavní programy.

V kategorii malých robotů hraje na hřišti o velikosti pingpongového stolu maximálně dvakrát pět robotů o průměru asi 15 cm. Jejich míček je menší (golfový). Nemají vlastní snímací kamery, ale jednu kameru společnou pro jeden tým. Její signály zpracovávají počítače jednotlivých robotů, které (opět rádiem) své roboty řídí. Malí roboti jsou rychlejší než střední, pohybují se rychlostí do 2 m/s.

V kategorii kráčejících robotů hrají v týmech maximálně tři roboti, hřiště je opět o velikosti pingpongového stolu. Míč mají oproti malým robotům větší a měkčí. V předchozích kategoriích návrháři robotů navrhují hardware (hlavně jejich mechaniku a elektroniku) i software, kdežto u kráčejících robotů pouze řídicí program. Vlastní robot je standardní – umělý pes, hračka firmy Sony. Sony ho nazývá AIBO (http://www.world.sony.com/Electronics/aibo/index.html). Robot má délku 27 cm, hmotnost 1,6 kg a je poháněn baterií. Má nohy o třech kloubech a otáčení hlavy se třemi stupni volnosti, tj. „na všechny strany“. V hlavě má snímací kameru s rozlišením 180 000 pixelů a dálkoměr. Orientuje se pomocí zaměřování na šest barevných lampiónků v rozích hřiště a středech delších lan hřiště. Ještě má dotyková čidla, v kloubech jeho nohou jsou čidla úhlového zrychlení, rychlosti a polohy. Jestliže se mu dobře daří, vrtí ocáskem. To je projev jeho emocí. (Sony inzeruje i další emoce.) Když se mu hodně nedaří, projeví se u něj něco jako nepodmíněný reflex – automaticky se resetuje, svalí se na zem a chvíli se z „toho vzpamatovává“. Vznikaly i komické situace, kdy většina hráčů ležela na zemi. Tento robot je zcela autonomní, všechnu svou „inteligenci“ si nosí s sebou.

V kategorii simulovaných robotů se (téměř) vše odehrává v počítači, serveru. Na obrazovce se objeví nakreslené hřiště. Na něm hraje 2 × 11 virtuálních robotů, které jsou zobrazeny jako pohybující se různobarevné body (podobně je zobrazen i míč). Pohyb hráčů je řízen dalšími počítači, připojenými po LAN k serveru protokolem UDP/IP (TCP/IP). Pohybují se velmi rychle, často je ani nelze sledovat. Jejich pravidla jsou blízká lidské kopané, např. hrají na ofsajd.

Roboti (všech kategorií) by měli být zcela autonomní. To ve skutečnosti neplatí zcela přesně. Asistenti je musejí zapínat, porouchají-li se, odklízet je, a jsou--li vyloučeni, také neodejdou sami, ale musejí být odneseni. Utkání robotů řídí lidský rozhodčí, pouze určitá část rozhodování u simulovaných robotů je zajišťována počítačem.

Obr. 2.

3. Učení

3.1 Co nedělají dobře?
Cílem, pro který byl RoboCup založen, je posílit výzkum v AI a robotice tím, že se poskytne standardizovaný problém – robotí kopaná, na kterém bude možné vyzkoušet a integrovat široké spektrum technologií; mezi tyto technologie patří principy návrhů autonomních agentů, spolupráce agentů, získávání strategií, uvažování v reálném čase, sjednocování senzorů a učení [11].

Proč to vše? Proč se do této „hry“ vkládají nemalé finanční prostředky? Důvodem je, že inteligentní robotika má významný aplikační potenciál: předpokládá se, že se roboti uplatní v oblastech, jako je uklízení domácností i úřadů, v automatizaci nemocnic, jako nejrůznější průvodci, jako záchranáři v nejrůznějších rizikových oblastech (např. postižených zemětřesením) [3]. To je budoucnost. Co jim v tom v současné době brání?

Jsou málo přizpůsobiví. Málo se umějí učit. Pouze 40 % robotů RoboCup99, a to ještě z těch nejlepších, tj. těch, co se umístili na prvních třech místech, má funkci učení. Přitom jde vesměs o jednoduché učení, o schopnost naučit se jednu funkci použitelnou v jedné situaci. Například simulovaný robot se naučí střílet na branku [7]. Použije k tomu 3 000 popisů situací, popsaných pomocí 40 atributů, a dosáhne toho, že 70 % pokusů je úspěšných.

Ve vlastní hře roboti postrádají přesnější, vysoce strukturované znalosti nebo schopnosti je získat. Jinak by se např. nemohlo stát, že by roboti opakovaně měli potíže s odlišením svých spoluhráčů od míče. Roboti v kategorii kráčejících robotů měli modré a červené dresy. Míč byl oranžový. Několika týmům se stalo, že si spletly své červené spoluhráče s míčem, hráči do sebe vzájemně strkali a míč nechali soupeři.

Další situace, opět častá, která svědčí o potřebě učení, bez nějž je neřešitelná, byla tato: Míč byl těsně u mantinelu. Robot si spočítal místo, kam se má dostat, aby mohl s míčem postupovat na bránu. Toto místo však bylo mimo hřiště. Hřiště bylo ohrazeno mantinelem, přes který se robot nemohl dostat. Přesto by to opakovaně donekonečna zkoušel, dokud by ho asistent nebo rozhodčí nevysvobodil. Do podobné bezvýchodné situace se roboti dostali, když se vzájemně zaklesli nohama.

I přesvědčivý vítěz v kategorii simulovaných robotů (soutěží prošel s celkovým skóre 110 : 0) [8] referoval o problémech souvisejících s učením. V utkání s jedním ze soupeřů nebyla střelba na branku tak úspěšná, jak se čekalo. Ukázalo se, že to bylo tím, že soupeř postavil za brankáře ještě dalšího obránce. S tím jinak úspěšný tým nepočítal, své odhady úspěšnosti střelby založil na nesprávném modelu, za brankáře považoval obránce, a odhady tedy byly nepřesné.

Prostředí robotů, ve kterém hrají, je jednoduché. Přesněji, je jednoduché z hlediska robotů. Roboti jsou schopni v něm rozpoznat konečný počet předem daných objektů. Například kráčející roboti rozpoznají míč, spoluhráče a protihráče, branku a orientační lampiónky. Ve skutečnosti je to reálné prostředí. Mohou se v něm projevit, a také se projevují, skutečnosti, se kterými robot nepočítá. Vyskytne-li se neznámý objekt, např. mantinel nebo vlastní noha nebo stín, nevědí si s ním rady. Dokonce i v kategorii simulovaných robotů se projevuje reálné prostředí – simuluje se pomocí reálných počítačů a komunikačních prostředků. Byl jsem svědkem diskuse, kdy si jeden účastník soutěže stěžoval, že jeho systém nepracuje dobře; bylo mu vysvětleno, že zřejmě nepočítá s ne 100% spolehlivostí přenosových linek, což asi je příčinou jeho potíží.

Obr. 3.

3.2 Učení
Tyto a podobné problémy by mohlo řešit učení, které bude schopno rozpoznat a popsat dosud neznámý objekt a rozpoznat i jeho relace ke známým objektům. Dále bude třeba, aby robot rozuměl a uměl řídit nejen míč, ale i sám sebe. Jeho hardwarové, softwarové i znalostní složky jsou dosti složité a je potřebné jim adekvátně rozumět a adekvátně je řídit. Je třeba, aby robot složité, strukturované prostředí řídil pomocí vysoce strukturované báze znalostí a aby s touto strukturovanou bází pracovalo i učení.

Učení se v AI věnuje značná pozornost (obr. 1). (Zastoupení jednotlivých složek odhaduji na základě počtu článků, které jsou jim věnovány na IJCAI99 [3].) Učení se zabývá hlavně jednoduššími přístupy [13], [5]. Jde o to, aby pozornost byla věnována také složitějším formám učení. Náznaky určitého posunu v tomto směru jsou již patrné. Například [7] se zabývá učením na několika znalostních úrovních, autoři [6] se věnují hierarchiím složených objektů, obsahem publikace [14] jsou hierarchie pojmů, Veloso v [12] popisuje integraci učení a plánování. Autor v [1] se zatím na úrovni logického návrhu snaží o integraci všech těchto (a dalších) postupů.

3.3 Co my neděláme dobře
V současné době je na celosvětové úrovni patrné jisté snížení důvěry ve vědu a výzkum (VaV). V České republice je situace pravděpodobně ještě horší, ve srovnání třeba se západoevropským průměrem. Je to mj. patrné z podílu HDP, který je v jednotlivých zemích věnován na VaV. Robotí kopaná je částí VaV a je relativně velmi atraktivní. Je to asi tím, že:

  • lidé se setkávají s problematikou, kterou znají (kopaná je nejrozšířenější sport ve světě),
  • lidé, zejména mladí, si rádi hrají a mají rádi legraci,
  • lidé rádi soutěží.

Tuto atraktivnost je třeba využít.

V tab. 1 jsou účastníci RoboCup2000 (podle http://www.robocup2k.rmit.edu.au/). (Otazník ve sloupci země znamená, že pro některé přihlášené týmy nebyla identifikována země jejich původu.) Z tabulky je patrné, že aktivity RoboCupu se rozšiřují, např. počty kategorií, počty účastníků. Tabulka také naznačuje, které země uskutečňují, podle mého názoru, moudrou informační politiku. Česká republika mezi ně prozatím nepatří, protože nevyužívá atraktivnost robotí kopané. Češi se zatím, na rozdíl od Portugalců a Japonců, nemohou pochlubit tím, že „premiér navštívil RoboCup“. Důvod je v podstatě jasný. Je to dosti drahé. Nemyslím návštěvu premiéra, ale náklady na výzkum. Základní vybavení pro jeden tým kráčejících robotů odhaduji na 28 000 USD, pro tým malých robotů na 50 000 USD.

Obr. 4.

3.4 Hodnocení
Hodnocení trénovacích příkladů je přirozenou součástí učení. Algoritmy AI i učení je potřebné také vyhodnocovat. Tento postup musí být součástí jakéhosi meta-učení. Umělá inteligence se proto sama zabývá hodnocením svých technologií. Poměrně složitě, ale systematicky a přesně počítá nebo měří různé spolehlivosti či chybovosti a jednotlivé technologie srovnává. V publikovaných pracích se lze dočíst formulace jako: „Popsanou metodu jsme otestovali na těch a těch standardních testovacích vzorcích. Pro srovnání jsme na stejných vzorcích testovali několik dalších známých metod. Pro většinu testovacích vzorků dává naše metoda nejméně o 3,1 % lepší výsledky než další nejlepší testované metody.“ Nebo: „Vytvořili jsme systém řízení dopravy velkoměsta. Průjezdnost se zlepšila o 5,2 %.“

Takový je současný trend. Před přibližně patnácti lety se statistika a pravděpodobnost v umělé inteligenci téměř neužívaly, vše bylo deterministické (nebo nedeterministické). Nyní je naopak téměř vše pravděpodobnostní. Je to pochopitelné – vývoj přirozeně postupuje od jednodušších řešení k složitějším (i když módní obliba statistického hodnocení jistě také hraje roli).

Význam robotí kopané je také v tom, že nedostatky robotů názorně zviditelňuje v praxi a že použití složitých vyhodnocovacích postupů pro objevení zcela zřejmých nedostatků dělá zbytečným.

4. Závěr
Ve svém příspěvku jsem se snažil ukázat, jaké jsou současné možnosti robotů z hlediska jejich inteligence. Roboti v současné době již robotí kopanou hrají. To znamená, že jsou v dosti reálném prostředí schopni řešit dosti složité úkoly. Dávají góly. Někdy ovšem i do vlastní branky. Polovina z nich vyhrává, polovina prohrává. V tom jsou podobní lidem. Občas se také ještě dostávají do bezvýchodných situací. To je, podle mého názoru, převážně dáno tím, že se neučí nebo se učí neadekvátně. Další kognitivní funkce jsou v rámci AI poměrně propracovány, např. identifikace, dedukce, organizace znalostí. Učení je třeba ještě propracovat.

Poděkování:
Tato práce byla částečně podporována grantem GA ČR 102/99/1564. Děkuji také za kritické připomínky Ivana Nagyho.

Literatura:

[1] BŮCHA, J.: On Efficiency of Learning: A Framework and Justification. In: Ontology Learning Workshop, 14th European Conference on Artificial Intelligence. Berlin 2000.

[2] BŮCHA, J.: Robotí kopaná. Vesmír 78, 1999, prosinec, s. 687-689.

[3] DEAN, T. (ed.): IJCAI-99, Proceedings of the Sixteenth International Joint Conference on Artificial Intelligence, Vol. 1 a 2. Stockholm, Sweden. Morgan Kaufmann Publishers,an Francisco 1999.

[4] JAMZAD, M.: CS-Sharif ROCS99 team in middle-sized robots league. Robocup 1999 Team Description, p. 118-126, http://www.ida.liu.se/ext/RoboCup-99/

[5] MITCHELL, T. M.: Machine Learning. McGraw-Hill Companies, N. Y. 1997, 414 p.

[6] PFLEGER, K. – HAYES-ROTH, B.: Learning of Compositional Hierarchies for the modeling of context effects. Stanford University, Knowledge systems Laboratory Report KSL-98-04, 1998, 8 p.

[7] STONE, P. – VELOSO, M.: Layered Learning. In: Eleventh European Conference on Machine Learning. ECML 2000, to appear. http://www.research.att.com/~pstone/papers.html

[8] STONE, P. – RILEY, P. – VELOSO, M.: The CMUnited-99 Champion Simulator Team. In „RoboCup-99: Robot Soccer World Cup III“. Eds. M. Veloso, E. Pagello and H. Kitano. Berlin, Springer Verlag 2000, http://www.research. att.com/~pstone/papers.html

[9] TAMBE, M. et al.: Building agent teams using an explicit teamwork model and learning. Artificial Intelligence, 110, 1999, Issue 2, June, pp. 215-239.

[10] The Soar Project at Carnegie Mellon University. http://www.cs.cmu.edu/afs/cs.cmu.edu/project/soar/public/www/home-page.html, 1998.

[11] The Third International Workshop on RoboCup, IJCAI-99, http://www.dsv.su.se/ijcai-99/, 1999.

[12] VELOSO, M. et al.: Integrating Planning and Learning: The PRODIGY Architecture. Journal of Experimental and Theoretical Artificial Intelligence, 7, 1995, No. 1.

[13] VERDENIUS, F. – VAN SOMEREN, M.: Applications of inductive learning techniques: a survey in the Netherlands. AI Communications, 10, 1997, No. 1.

[14] ZUPAN, B. – BOHANEC, M. – DEMŠAR, J. – BRATKO, I.: Learning by discovering concept hierarchies. Artificial Intelligence, 109, 1999, pp. 211-242.

(upravená verze příspěvku předneseného na konferenci AUTOS 2000, Automatizace ve strojírenství)