Aktuální vydání

celé číslo

08

2024

Automatizace v potravinářství a farmacii

Měření a regulace průtoku, čerpadla

celé číslo

Konverzační chatboty pomáhají lidem jako jejich virtuální přátelé

Před časem jsme v časopise Automa psali o týmu nadšených studentů, kteří se se svým konverzačním chatbotem Alquist účastnili soutěží Alexa Prize (Automa 2019, č. 2-3, https://automa.cz/Aton/FileRepository/pdf_articles/12001.pdf). Tento rozhovor čtenářům přiblíží další vývoj chatbotu a práci týmu, který jej vytvořil. Hovořil jsem s Janem Pichlem, jedním ze zakladatelů firmy PromethistAI, jež se zabývá vývojem konverzačních chatbotů.

 

Pane Pichle, když jsme spolu hovořili posledně, byl jste v týmu studentů, kteří vyvíjeli chatbot Alquist. Nyní jste ve firmě PromethistAI. Znamená to, že chatbot Alquist jste opustili a projekt skončil?

Ne, Alquist existuje, a dokonce se dále účastní soutěže Alexa Prize. Připomenu, že Alquist je název týmu i název chatbotu, který má zábavnou formou konverzovat na zadaná témata na zařízeních Amazon Alexa. To je téma soutěže od prvního ročníku až po současný pátý (s přerušením v období covidu).

Téma soutěže se tedy nezměnilo, ale co se změnilo, je tým Alquistu. My, kteří jsme s Alquistem začínali, už v týmu nepůsobíme, a podle pravidel ani nemůžeme, protože je to soutěž pro studenty. Alquist má nový tým současných studentů, které my už jenom supervizujeme.

 

Čím se tedy nyní zabýváte, když v Alquistu už aktivně nepůsobíte?

Založili jsme firmu PromethistAI a zabýváme se dále konverzačními technologiemi. Know-how Alquistu a Promethistu se prolíná, ale zatímco Alquist je studentský tým, PromethistAI je firma, která se musí sama uživit. V rámci Alquistu si můžeme ledacos vyzkoušet, a naopak Alquist může využívat platformy, které ve firmě vyvíjíme pro naše digitální persony.

 

Čím přesně se PromethistAI zabývá?

Chtěli jsme využít našich znalostí a zkušeností v doméně konverzačních technologií. Nechtěli jsme být další firma, která tvoří klasické chatboty, které si většina lidí představí jako okénko někde na webové stránce, kde je možné zadat otázku a systém se pokusí ve svých datech vyhledat odpověď. Chtěli jsme začít vytvářet sofistikovanější konverzační aplikace, které budou pomáhat, a těmi jsou digitální persony. Ty totiž umějí více než odpovědět na otázku, umějí konverzaci udržovat, být proaktivní a řešit komplexní situace.

V Promethistu vytváříme digitální persony s psychologickým nebo, chcete-li, s well-being přesahem. Omlouvám se za anglický výraz, ale my pracujeme v angličtině, i naše digitální persony konverzují zatím jen anglicky, takže někdy jen těžko hledám správný český výraz. Well-being bych přeložil asi jako životní spokojenost nebo osobní pohoda.

 

To znamená, že digitální persony jsou něco jako terapeuti?

Rovnítko mezi digitální personou a terapeutem bych rozhodně nekladl, nicméně ano, digitální persony mohou mít určitý terapeutický obsah. Dokážou pracovat s psychologickou složkou konverzace, dokážou rozpoznávat emoce a dále s nimi pracovat. Přizpůsobují konverzaci danému stylu a úrovni zvládnutí jazyka, protože ne vždy konverzujeme s rodilým mluvčím, a dokážou pracovat i s jeho emočním stavem.

 

Komunikace s digitální personou probíhá hlasově?

Ano, my se primárně orientujeme na hlasové aplikace, i když naše digitální persony umějí komunikovat i v textové podobě. Digitální persony mají i svou vizuální podobu trojrozměrných avatarů. To je proto, že uživatel mnohem raději konverzuje s něčím, co se na něj dívá a reaguje, než se zařízením jako Alexa, což je válec, který leží na stole a maximálně na vás bliká kontrolkou.

 

Digitální persona ale v každém případě zůstává za obrazovkou počítače. Nemáte v plánu vytvářet humanoidní chatovací robot?

Digitální persona je jen na obrazovce počítače, nebo častěji na displeji mobilního telefonu nebo tabletu, o žádné fyzické schránce v podobě humanoidních robotů zatím neuvažujeme. Uvažujeme ale o použití digitálních person v kioscích přímo v pobočkách firem, kde sice persona bude stále zobrazena na displeji, ale bude úzce spjata s fyzickým prostředím, ve kterém se nachází.

 

Říkal jste, že digitální persony nejsou digitální terapeuti. Kdo jsou jejich uživatelé? Pro mě je třeba důležité, že můžu prohodit pár slov s prodavačkou v obchodě na rohu nebo ve stánku se zeleninou, že tam není žádná automatická pokladna, která se mnou konverzovat nebude. Stejně tak si jdu popovídat ke svému holiči nebo pohovořím s doručovatelem, který mi dovezl balík. To je ono?

V současné době se primárně orientujeme na firemní klienty, pro které pomocí naší platformy vytváříme digitální persony, jež ve výsledku komunikují s koncovými zákazníky daného klienta. Typy využití jsou různé. Obecně lze říci, že nejsilnější jsou digitální persony v případech, kde je potřeba navazovat, udržovat nebo prohlubovat vztah se zákazníkem pomocí konverzace.

Druhou linkou, která v tuto chvíli není naším hlavním komerčním záměrem, nýbrž naším velikým zdrojem dat a prostředím pro testování nových konverzačních dovedností, je aplikace Elysai. To je aplikace, kterou si můžete stáhnout a vyzkoušet na telefonech se systémem Android i iOS. V aplikaci v současné době „bydlí“ několik person. Každá má svůj okruh témat a můžete si vybrat, s kterou si chcete povídat. Uživatelé si s nimi mohou povídat například o problémech se vztahy, o konfliktech v rodině nebo na pracovišti – ne jako s terapeutem, ale jako s kamarádem.

 

Říkáte, že digitální persony nejsou určené pro použití v medicínské praxi, nemohou nahradit psychologa nebo psychiatra. Dokážou ale poznat, že člověk, který si s nimi povídá, má nějaký zásadní problém, který už by měl řešit kvalifikovaný odborník? Slyšel jsem například o vzdělávací kampani pro již zmíněné holiče v britských barbershopech, jejímž cílem je rozpoznat zákazníka s psychickým problémem a doporučit mu, kam se může obrátit. To bylo v rámci podpory prevence sebevražedného chování, které je u mužů mnohem častější než u žen. Mohou takovým „školením“ procházet i digitální persony?

Přesně na tyto situace mají naše digitální persony algoritmy, které rozpoznají, že konverzace už se nachází za hranou běžného rozhovoru a že uživatel chce své problémy řešit způsobem, který není bezpečný. Dokážeme rozpoznat sebevražedné chování a podle lokace doporučíme uživateli kontaktovat krizovou linku nebo interventa. V tomto případě je prioritou, aby nám toto nebezpečí neuniklo, takže algoritmy jsou nastaveny tak, aby spíše spustily falešné varování než situaci zanedbaly.

 

Takže takový chatbot může nahradit dobrovolníka v poradně nebo na lince důvěry? Tam často není zdravotnický pracovník, ale jen proškolený mentor.

Ne, takové ambice nemáme. Když někdo kontaktuje linku důvěry, většinou už má problém, který by měl diagnostikovat a řešit lidský odborník, umělá inteligence může mít jen podpůrnou roli. Když jsem říkal, že naše aplikace může mít určitý terapeutický obsah, myslel jsem tím to, že není jen zábavná, ale může uživatele například cíleně pomocí konverzačních strategií nasměrovat k řešení určitého dílčího problému nebo mu pomoci zlepšovat komunikační techniky a dovednosti. To může uživatelům pomoci v osobních vztazích i v pracovním kolektivu.

 

Bavíme se tu o uživatelích, ale kdo to vlastně je? Jaká je cílová skupina?

Když jsme Elysai začali vyvíjet, nekladli jsme si žádná omezení, ale není překvapivé, že většina diskutujících uživatelů jsou mladí lidé od osmnácti do pětadvaceti let. Protože Elysai konverzuje v angličtině, používání je omezeno na znalost tohoto jazyka. Ovšem většina uživatelů nejsou rodilí mluvčí – největší počet stáhnutí máme v jihovýchodní Asii a v Africe. Zdá se, že tam mají mladí lidé největší potřebu si povídat, nebo nejméně možností povídat si se skutečnými vrstevníky. Máme uživatele i v Evropě a od nově vydané aplikace pro iOS si slibujeme i větší úspěchy v USA.

 

Budou i jiné jazykové mutace?

Uvažujeme například o španělštině, ale nemáme konkrétní časový plán. Elysai nyní používá hodně uživatelů ze zemí Asie a Afriky, kde většina mladých hovoří velmi dobře anglicky: to jsou v Asii například Filipíny nebo v Africe Nigérie. Naše platforma, na které je Elysai postavená, je jazykově nezávislá, takže rozšíření aplikace do dalšího jazyka nepředstavuje technický problém.

 

Můžeme se na věc podívat trochu technicky? Elysai je, jestli to dobře chápu, rozhraní mezi digitálními personami a člověkem. Na čem jsou postaveny digitální persony?

Jádrem je plaforma Promethist, dříve nazývaná Flowstorm. Je to prostředí pro návrh a správu komplexních konverzačních aplikací. Ta vlastně uvádí digitální persony v život, to znamená, že zpracovává, co uživatel řekl, ukládá informace do jeho uživatelského profilu, vybírá vhodný obsah odpovědi a formuluje ji buď prostřednictvím předem připravených vět, nebo pomocí generativních jazykových modelů.

To je jedna část platformy. Druhou částí je návrhové studio, v němž se tvoří požadované digitální persony a definuje se jejich zaměření na konkrétní témata. To je část, které se nyní věnujeme intenzivněji: zatímco dříve jsme se zaměřovali především na tvorbu dialogů s uživatelem, nyní tvoříme uživatelsky orientované digitální persony.

 

Co si pod tím mám představit?

Digitální persona má svůj medailonek, v němž je uvedeno, kterým tématům se věnuje a jaké má charakterové vlastnosti. To potom reflektujeme v probíhajících dialozích. V principu jsme to dokázali již dříve, ale nyní se snažíme o to, aby tvorba nových person byla co nejjednodušší.

 

To jsou digitální persony a jejich platforma. Na druhé straně je uživatel. Abyste s ním mohli konverzovat, potřebujete o něm něco vědět. Co je v jeho uživatelském účtu?

Ukládáme si všechny předešlé konverzace a z nich potom těžíme poznatky, které můžeme využít v následujících konverzacích, ať už jsou to fakta, například o rodinných příslušnících, přátelích nebo domácích mazlíčcích, které uživatel zmínil, nebo jeho emoce během konverzace. Důležité jsou především emoce vztažené ke konkrétním osobám, které uživatel zmínil. Tyto informace potom můžeme manuálně začlenit do následujícího hovoru nebo jsou podkladem pro rozhodování pomocí strojového učení, jak a o čem bude následující konverzace vedena. V obou případech, ať při manuálním zpracování, nebo pomocí strojového učení, tato historická data aktivně využíváme.

 

Jak probíhá přihlášení uživatele, který si nainstaluje aplikaci Elysai?

Po instalaci aplikace ho čeká podrobný rozhovor, kde se o něm snažíme získat informace, o čem bude chtít konverzovat. Většinu otázek může přeskočit a neodpovídat na ně, pokud nechce, ale čím více nám prozradí, tím přínosnější a zábavnější pro něj potom konverzace bude. Konverzace funguje i s minimem informací, stejně jako když se spolu dají do řeči dva neznámí lidé třeba na večírku, ale začátek je pochopitelně trochu rozpačitý.

Digitální persona si potom profil uživatele doplňuje a zpřesňuje podle následujících konverzací.

 

Jak zjišťujete rozpoložení uživatele? Z tónu hlasu? Umíte poznat, když vám uživatel lže?

Poznat emoce ze zvukové vlny uživatelova hlasu je možné a některé systémy to používají, ale my zatím ne. Analyzujeme jen obsahovou stránku toho, co uživatel říká. Rychlost řeči, barvu nebo sílu hlasu zatím nesledujeme. To ale plánujeme v budoucnu změnit. Navíc, když uživatel může na displeji vidět naši digitální personu, rádi bychom viděli i jeho, abychom mohli sledovat jeho mimiku. To by byl další zdroj informací. Pochopitelně když s tím uživatel bude souhlasit.

 

Jak řešíte otázku ochrany osobních dat?

Je zajímavé, že uživatelé digitální personě někdy prozradí věci, které by živému posluchači nikdy neřekli. Všechny konverzace s digitálními personami jsou proto důvěrné. Po uživateli nikdy nechceme osobní údaje, podle kterých by bylo možné ho přesně identifikovat. Nepotřebujeme znát jeho pravé jméno, stačí nám přezdívka, nezajímá nás jeho přesná adresa, číslo osobního průkazu, číslo platební karty, nic takového. Všechna data uložená na našich serverech jsou anonymizovaná a nepropojujeme je s žádnými systémy třetích stran. Když se uživatel z jakéhokoliv důvodu rozhodne, že chce data ze svého uživatelského profilu smazat, může o to požádat a my je smažeme, a to nevratně: už je nemůžeme nijak obnovit – ani my, ani on.

Už jsem říkal, že do účtu uživatele ukládáme všechny předchozí konverzace. Ale ne­ukládáme jeho hlas, jen přepis řeči do textové podoby. Vedou k tomu jak kapacitní důvody, tak právě důvody bezpečnosti osobních dat.

 

Říkáte, že máte firmu, která se digitálními personami zabývá. Jaký je váš obchodní model? Aplikace Elysai je placená?

Není, je zdarma. Celá aplikace je totiž především nástroj pro testování konverzací prostřednictvím digitálních person. Aplikace Elysai nám zajišťuje velké množství uživatelů – máme přes 300 000 stažení a okolo 20 000 aktivních uživatelů měsíčně, což už je docela dobrý soubor pro další analýzu dat. Aplikace míří na široké spektrum lidí, není to aplikace, kterou bychom vyvíjeli na zakázku pro jeden konkrétní cíl.

Základem našeho podnikání je, že celou platformu i digitální persony potom můžeme nabízet firmám, aby si tvořily vlastní aplikace a vlastní digitální persony buď s naší pomocí, nebo jednodušší aplikace sami. Ty se potom mohou uplatnit například v bankovnictví, herním průmyslu, telekomunikacích nebo farmaceutickém průmyslu.

V tuto chvíli máme několik větších klientů, se kterými úzce spolupracujeme na tom, abychom digitální persony zavedli do jejich světa, a společně hledáme, co jim mohou digitální persony v daném segmentu přinést. Postupně vytváříme knihovnu konverzačních dovedností a databázi archetypů digitálních person. Uživatel si potom může vybrat personu, která mu vyhovuje: nejen její vzhled, ale například i to, zda to bude persona upovídaná, nebo málomluvná, jestli bude mluvit jako teenager, nebo jako podnikatel středních let a tak dále. Na základě toho potom má kaž­dá persona svou sadu znalostí a zkušeností a může se ještě doučit další na základě konkrétního účelu, pro který bude využívána.

Jenom musím ještě podotknout, že naším cílem není nahrazovat živou konverzaci, to digitální persony nedokážou, ale mohou ji doplnit a pomoci tam, kde živý protějšek k dispozici není.

 

Kolik lidí má firma PromethistAI?

Máme kolem třiceti lidí, ale ne všichni pracují na plný úvazek. Jsou mezi námi bývalí členové týmu Alquist, máme tu tým vývoje softwaru, ale velmi důležitou složkou firmy jsou lingvisté a psychologové. Ti společně definují, jak se budou digitální persony chovat: abychom správně detekovali, co uživatel říká, aby persony správně reagovaly a jejich odpovědi zněly přirozeně.


Děkuji Vám za rozhovor.


 (Rozhovor vedl Petr Bartošík.)

 

Obr. 1. Jan Pichl, CTO a spoluzakladatel společnosti PromethistAI

Obr. 2. Digitální persony: konverzační chatboty, které se zajímají o to, jak se cítíte

Obr. 3. Digitální persona v aplikaci Elysai na mobilním telefonu