Článek ve formátu PDF je možné stáhnout
zde.
Mezi novinkami, které společnost NVIDIA představila na letošním veletrhu CES v Los Angeles, bylo také využití generativní umělé inteligence v robotice a při řízení autonomních vozíků a jiných autonomních strojů.
Generativní umělá inteligence: pro někoho jen módní trend, pro někoho vítaná příležitost, pro někoho velká hrozba. Firma NVIDIA byla u vývoje generativní AI od samého počátku. Před zhruba deseti lety zakladatel a generální ředitel NVIDIA Jensen Huang osobně dodal první superpočítač NVIDIA DGX AI firmě OpenAI. A díky aplikaci ChatGPT od OpenAI se nyní generativní umělá inteligence stala jednou z nejrychleji rostoucích technologií naší doby.
Společnost NVIDIA se nyní snaží propojit svět generativní umělé inteligence a robotiky. Není na to sama – mezi jejími partnery jsou velcí výrobci robotů jako Boston Dynamics, Collaborative Robotics a Covariant z USA, kanadská firma Sanctuary AI nebo čínská Unitree Robotics a další.
Načasování je ideální. Autonomní roboty využívající umělou inteligenci jsou stále více využívány ke zvyšování efektivity, snižování nákladů a pro úsporu nedostatkových pracovních sil.
Ovšem pořád je to jen počátek. „Dopad generativní umělé inteligence bude přesahovat generování textů nebo obrázků – zasáhne do domácností a kanceláří, farem a továren, nemocnic a laboratoří,“ předpověděl Deepu Talla, viceprezident NVIDIA pro robotiku a edge computing, na veletrhu CES (Los Angeles, USA, 9. až 12. ledna 2024).
Klíčem jsou velké jazykové modely – LLM
Klíčem, který otevírá dveře generativní AI do světa robotiky, jsou velké jazykové modely (LLM – Large Languague Model), počítačové modely jazyka založené na rozsáhlých mnohovrstvých neuronových sítích s miliardami parametrů trénované na obrovském množství textů. Tyto modely, podobné řečovému centru v mozku, umožní robotům pochopit lidské pokyny a reagovat na ně. Takové stroje se budou moci neustále učit od lidí, od sebe navzájem a od světa kolem nich.
Jak roboty využívají generativní umělou inteligenci
Jak roboty využívají generativní umělou inteligenci? Firmy Agility Robotics, NTT Data a další začleňují do robotů generativní umělou inteligenci, která jim pomáhá porozumět textovým nebo hlasovým příkazům. Robotické autonomní vysavače od Dreame Technology se školí v simulovaných obytných prostorách vytvořených generativními modely umělé inteligence. A výrobce zahradní techniky Electric Sheep vyvíjí model prostředí pro autonomní sekání trávníku.
Na platformy NVIDIA Isaac a Jetson, které usnadňují vývoj a využití robotů s umělou inteligencí, se již spoléhá více než 1,2 milionu vývojářů a 10 000 zákazníků a partnerů. Mnoho z nich bylo na veletrhu CES přítomno.
Architektura se dvěma počítači: generativní AI jako doplněk řídicího systému
Deepu Talla ve své přednášce na CES ukázal model se dvěma počítači, který je nezbytný pro využití umělé inteligence v robotice, a demonstroval tak ucelený přístup společnosti NVIDIA k vývoji aplikací umělé inteligence.
První počítač, který označil jako „továrna na umělou inteligenci“, je zásadní pro vytváření a neustálé zlepšování modelů AI. Továrny na umělou inteligenci (AI Factory) využívají výpočetní infrastrukturu datových center společnosti NVIDIA spolu s jejími platformami AI a NVIDIA Omniverse pro simulaci a trénování modelů umělé inteligence.
Druhý počítač představuje řídicí systém robotu. Může být v cloudu nebo v datovém centru; pro lokální úkoly, jako je např. kontrola kvality při výrobě, může běžet na místním serveru nebo počítači v rozváděči nebo může být součástí autonomního stroje vybaveného snímači a kamerami.
Generativní AI pomáhá vytvářet simulované prostředí pro trénování robotů
Deepu Talla také vyzdvihl roli LLM při odstraňování technických bariér a přeměně typických uživatelů v kreativní techniky schopné vytvářet složité robotické pracovní buňky nebo simulovat činnost celého skladu. S generativními nástroji umělé inteligence, jako je NVIDIA Picasso, mohou uživatelé pomocí jednoduchých textových pokynů vytvářet realistické 3D prvky a přidávat je do digitálních scén pro dynamická a komplexní prostředí vhodná pro trénink robotů.
To samé se vztahuje na vytváření různorodých fyzicky přesných scénářů v Omniverse, čímž se zlepšují možnosti testování a školení robotů, aby byla zajištěna jejich použitelnost v reálném světě.
Díky generativní AI bude rekonfigurace robotů mnohem jednodušší
To je v souladu s transformačním potenciálem, který přináší generativní umělá inteligence do procesu rekonfigurace využití robotů. Tradičně jsou totiž roboty stavěny pro konkrétní úkoly a jejich úprava pro jiné práce je časově náročný proces. Pokroky v LLM a VLM (Vision Language Model, model schopný zpracovávat obrazy i řeč) však toto úzké místo odstraňují a umožňují intuitivnější interakci s roboty prostřednictvím přirozeného jazyka.
Takové stroje – adaptabilní a uvědomující si prostředí kolem sebe – se podle Deepu Talla z firmy NVIDIA brzy rozšíří po celém světě.
[Tisková zpráva NVIDIA z veletrhu CES v Las Vegas, 11. ledna 2024.]
(Foto: NVIDIA)
(Bk)
Obr. 1. Deepu Talla, viceprezident NVIDIA pro robotiku a edge computing, hovoří o propojení generativní AI a robotiky