19.4.2024 | Svátek má Rostislav


VĚDA: Jak se česká AI mohla ptát “proč?”, ale neptala se

25.12.2019

Navazujeme zde na článek Až se počítače budou ptát “proč?”. Vstupní ideje pro český přístup k umělé inteligenci (AI), zvané OLS (Operational Logic System), vznikaly v Brně v 70. a 80. letech 20. století a měly být počítačově implementovány na Ústavu technické kybernetiky Slovenské akademie věd v Bratislavě. V té době tedy šlo o československý projekt. Hlavní, ověřovací aplikace projektu OLS byla koncipována v Brně, v rámci ekonomického výzkumu na VUT Brno. Tím jsem se zabýval já. Bohužel, jak základní výzkum projektu OLS, tak i jeho hlavní praktická aplikace (OLS expert pro podnikatelské strategie), byla „usmrcena“ ve svém tvůrčím rozpuku, již začátkem 90. let. V navazujícím článku (3), vylíčím, specifické okolnosti úmrtí obou projektů, jako tzv. kritické faktory neúspěchu.

Musím zdůraznit, že mi zde jde jen o předání získaných zkušeností. Nejde o marketingovou přípravu pro nějakou mou další profesní činnost. Tato série článků je určena pro českého čtenáře. Občan má právo to vědět. Potřeboval bych k názornému sdělení celého konfliktu (a navíc pro širokou veřejnost) asi rozsah někdejších Dietlových seriálů. To samozřejmě zde nemám, a asi nejsem ani tak dobrý dramatik, jako v době českého reálného socialismu býval Jaroslav Dietl.

Začněme článek (2) takto: Podobně jako Brňák/Moravák doc. Václav Polák (zemřelý v roce 1995), i americký profesor z prestižní MIT, Patrick Winston (zemřelý v roce 2019), považovali za nejdůležitější projev lidské inteligence schopnost sdělovat, vnímat a porozumět příběhům (ability to tell, perceive, and comprehend stories). To je samozřejmě podstatně jiný problém, než počítačová schopnost rozpoznat v nabízených pixelech obrázek psa či kočky, tvář člověka, rakovinový tumor, nebo pozici automobilu na silnici (což jsou hlavní aplikace dnes dominantního přístupu k AI, strojového učení).

V 70. a 80. letech minulého století bylo třeba nějak technologicky rozumně „uchopit“ nejednoznačný a složitý přirozený lidský jazyk. Rozumně znamená s ohledem na tehdejší stav technologického vývoje, s ohledem na dostupné technologie i lidské zdroje. Nešlo ale o gramatickou editaci napsaného textu (viz počítačové editory textu, automaty, na kterých získal profesuru klíčový oponent Polákova aplikačního projektu OLS). Šlo o lidské i počítačové porozumění realitě. Dle doc. Poláka: Člověk rozumí tehdy, když to, co vidí (či jinak vnímá), zapadá do jeho již existujícího modelu okolního světa (který má člověk již uložen ve svém mozku). Pro počítačové porozumění textu (v projektu OLS doc. Poláka) bylo tedy třeba vyrobit modely světa v jednotlivých oborech lidské činnosti (a pak je propojit nějakou meta-znalostí). A ten model světa, v rámci Polákova projektu OLS, měl být konstruován v modulech, které vždy začínaly otázkou Proč. Porozumění Polákova projektu AI tedy začínalo otázkou Proč.

Poznámka: S mojí manželkou, lékařkou, občas vedu spor o tom, co a jak asi vnímá kojenec. Manželčina dcera přetáhla obvyklou dobu kojení až do doby, kdy klouček už začal primitivně hovořit. V 17-18 měsících ho maminka už konečně chtěla definitivně odstavit od prsu, a proto ho instruovala: „Mlíčko už nebude“. Ozvalo se vzdorovité použití slovesa: „Bude!“ Následovala několikrát konverzační výměna: „Mlíčko už nebude.“ Bude!, „Mlíčko už nebude.“ Bude!, atd. Všimněte si: Klouček použil sloveso ve správném tvaru a času, nikoliv jen podstatné jméno, k označení nějakého objektu z obrázku, na nějž by kojenec primitivně ukazoval prstem.

Klíčovou dosud nezodpovězenou otázkou zůstává: Stihnul tak malý klouček jím vnímaný okolní svět vyjádřit ve správné gramatice jen vlastní životní zkušeností, nebo měl ve svém mozku už nějaké předem připravené struktury pro vnímání přirozeného lidského jazyka (který, dle lingvistického guru, Noama Chomského, má podobnou gramatiku u všech národů světa)? Proč by tam ty předem připravené struktury nemohl (darem od evoluce) už mít? Do lidské genetické informace (v rozsahu cca 3,2 Gigabyte) by se ta jakási hrubá lingvistická struktura přece mohla také vejít (kromě nutné informace o tom, jaké lidské orgány se mají vyvinout).

Jak strukturovat znalosti o okolním světě pro počítačové i lidské porozumění?

Doc. Polák se svou manželkou navrhl pro jejich AI systém párů rolí PROČ a JAK. Přičemž každá věta znalostí v tom páru rolí měla být zapsána ve zjednodušeném, tzv. sémantickém jazyce, ke kterému byl doc. Polák inspirován primitivním jazykem dávných Sumerů. Tomu sémantickému jazyku a struktuře znalostí ve formě párů rolí by pak rozuměl jak člověk, tak i počítač. Viz ilustrativní obrázek níže (byl převzat z výzkumné zprávy ekonomického výzkumu z roku 1989 na VUT Brno). Tisk byl proveden na širokořádkové tiskárně. Lepší grafické možnosti tehdy nebyly dostupné.

AI1

Člověk ale musel udělat určitý vstřícný krok směrem k tehdejší technologii. Ten vstřícný krok představoval cca jeden den lidského zaškolení, což byl přijatelný kompromis.

Určitě ve své době přijatelný kompromis oproti maximalistickému požadavku na plné počítačové porozumění přirozenému lidskému jazyku. Každá znalost o reálném světě (zapsaná v sémantickém jazyce jako odpověď na otázku Jak 1, Jak 2, …) měla nad sebou větu Proč. Takže do této OLS struktury bylo možno umístit i obecné pojmy. Oblíbeným Polákovým takovým příkladem byl pojem „mateřská láska“, a také různé metafory pohybu, jako například „letí rychle jako šíp“. Jenže všechnu tu znalost musel předem dovnitř pracně vložit člověk. Toto k ochutnávce Polákova ambiciózního systému AI, projektu OLS, snad stačí. Tento text je určen pro širokou veřejnost, nikoliv pro specialisty v AI.

Poznámka. Sémantický jazyk pro AI, ke kterému byl doc. Polák inspirován primitivním písmem Sumerů? Hm. V sémantickém jazyce ve svých 21 měsíci života hovořil například už vnouček manželky, když se pokoušel své mamince sdělit, že ho v puse bolí rostoucí zoubek. Vyjádřil své potíže větnou konstrukcí, kterou nemohl získat prostým odposlechem ve svém okolí, protože v přirozeném jazyce se lidé v Česku tak nevyjadřují. Na rozdíl od přirozeného jazyka začíná sémantický jazyk vždy slovesem, které vyjadřuje, že se někde něco děje. Když se nic neděje, není o čem hovořit. Teprve po slovesu následuje podstatné jméno, které označuje aktéra děje. Klouček pronesl pozoruhodnou větu: „Bolí díra zubatá.“

Ještě doplním, že jsem si před několika lety všiml, že firma IBM prováděla počítačový překlad z původního jazyka do kteréhokoliv jiného jazyka vždy přes sémantický jazyk.

Připomenu, že v 80. letech, tzn. v době symbolické logiky jako jediného prostředku pro tvorbu AI, byly dominantním prostředkem pro zápis znalostí počítačových expertních systémů páry rolí „JESTLIŽE“ „PAK“, které ale vůbec nerozuměly textu zapsané znalosti. Byla to pro ně jen jakási sekvence znaků. Měly vyvozovací mechanizmus (inference engine), který porovnával řetězce znaků a na závěr svého strojového vyvozování vyplivl nějaký závěr. Například: JESTLIŽE je identifikován symptom 1, a současně symptom 2, 3…, PAK se jedná o nemoc krve X, na kterou je předepsán lék L. Viz program MYCIN, jehož výhodou i dnes zůstává, že přesně ukazuje, jak, pomocí svých logických kroků (dnes až tisíců možných kroků), došel k závěrečnému doporučení pro lékaře, uživatele expertního systému MYCIN.

Vyvozovací mechanismus „jestliže-pak“ byl a zůstává užitečný, ale nemůže postihnout všechny možné existující větve logiky. Košatý jazyk lidí-filozofů, který se snaží postihnout situaci co nejkomplexněji, je stále dost neproduktivní i pro dnešní počítače s brutálním výpočetním výkonem.

Nehostinné české prostředí pro tak velkou inovaci

Tímto nadpisem zde už fakticky pojmenovávám první kritický faktor neúspěchu projektu OLS. O ostatních kritických faktorech se více dočtete až v části 3. Začátkem 90. let minulého století byl totiž docela velký problém přesvědčit ostatní lidi, že můj počítačový expertní systém, který využíval Polákův přístup OLS je něco zcela odlišného, než tehdy představovaly počítačové expertní systémy (zapisované ve formě jestliže-pak). Na rozdíl od nich, AI OLS neměla žádný explicitní vyvozovací mechanismus, nabízela ale možnost inteligentní navigace po své bázi znalostí (což také byl model okolního světa). A rozuměl by tomu jak člověk, tak i počítač. Polákova AI, OLS, mohla tedy člověkovi sdělovat své znalosti a vyprávět i lidské příběhy (případně případové studie v byznysu, což byl můj aplikační obor).

Hlavní aplikace (připravovaná na VUT Brno) v rámci ekonomického výzkumu byl můj „OLS expertní systém pro podnikatelské strategie“. V prvé fázi byl ten expertní systém koncipován jen jako tzv. sečtělý konzultant, který uživatelům sdělí, co se o zvoleném problému ví - v tržní ekonomice. Svou tržní orientaci jsem tehdy zdůvodňoval úmyslem budoucích joint-ventures, mezi socialistickými a kapitalistickými podniky. Teprve až v další fázi měl OLS expert dělat i nějaká podnikatelská/manažérská rozhodnutí. Ale do té vývojové fáze jsme se nikdy s doc. Polákem nedostali.

Poznámka: Ve zpětném pohledu usuzuji (a prozrazuji dopředu před zveřejněním části 3), že k podílu na úmrtí ambiciózního aplikačního českého high–tech OLS projektu před 30 lety na vědeckém pracovišti VUT Brno, přispělo i velmi kuriózní lidské seskupení: domnělý externí expert na AI (viz obrázek níže), interní specialista na starožitnosti plus interní rekreační docent, přičemž všichni jmenovaní byli koordinováni zlomyslným osmašedesátníkem. Těšte se proto na barvité pokračování 3.

Ve výzkumné zprávě (tzn. jen na papíře) jsme s doc. Polákem otestovali, jak pracná asi bude budoucí počítačová aplikace OLS experta. Že například po provedené systémové, sémantické a lingvistické analýze, tři řádky textu v přirozeném jazyce budou expandovat do cca třiceti řádků v systému OLS. Dle Moorova zákona jsme ale věděli, že počítačová paměť (hardware) poroste rychleji, než kolik textu znalostí bude schopen vyprodukovat člověk, tvůrce počítačového expertního systému. Šlo by ale o několikaletý projekt, než by se projevila užitečnost uložených a sdělovaných expertních informací pro praktické použití (a tím by též byla zdůvodněna ekonomická návratnost projektu). Přístup symbolické logiky byl a zůstává pracný, ale víte přesně, co tvůrce do systému vkládá. A že tedy tvůrce nese za své dílo i plnou zodpovědnost (což u přístupu strojového učení vždy nelze vždy garantovat).

Před třiceti lety bylo také obtížné Čechům vysvětlit i okolnost, že něco tak ambiciózního, nevzniklo na prestižní MIT v USA, ale v zemi československého reálného socialismu. A že autorem toho projektu AI byl člověk, který po politických čistkách v 70. letech pracoval po dobu několika let jako vrátný v brněnském podniku ČSAD. A že po svém vyhození z univerzity tehdy zoufalý doc. Polák vyhodil do popelnice všechny pracně získané vědecké separáty ze svého tehdejšího oboru (matematizace politických věd). A že teprve po prožitém a stráveném životním traumatu se matematik doc. Polák (se svou manželkou) začal věnovat úplně jinému oboru, tj. počítačům a umělé inteligenci.

Jenže ani nově započatý obor studia a v něm obrovské vynaložené osobní úsilí nedospělo u doc. Poláka do patřičného společenského uznání. V Bratislavě nebyl zrealizován počítačový funkční program, který by definitivně rozptýlil pochybnosti o počítačové proveditelnosti OLS projektu, který hlavní oponent mého aplikačního projektu (řešeného na VUT Brno) označil jen jako jakási ničím nepodložená „bombastická tvrzení“. Asi nejvíce toho externího brněnského oponenta dráždila Polákova věta „OLS logika do sebe dokáže včlenit jakoukoliv logiku“. Český oponent (specialista na textové editory) se ambiciózností OLS projektu cítil být odborně ponížen. A protože oponentura (mého aplikačního expertního systému OLS na VUT Brno) nebyla záměrně povolena, nešlo vznesené námitky ve vědecké disputaci vyvrátit. Takže nešlo vysvětlit dokonce ani banální nedorozumění.

Příklad banality ve vědeckém prostředí

Typickým příkladem banální chyby ve vědeckém prostředí byla havárie satelitu Mars Climate Orbiter, o celkových nákladech projektu $327,6 milionů, v září 1999. Proč? Protože jedna skupina vědců počítala vzdálenost v kilometrech, zatímco jiná v mílích.

Já jsem v roce 1989 potřeboval čtenáře své výzkumné zprávy (zpracované na VUT Brno v rámci ekonomickém výzkumu) upozornit, že systém OLS je něco jiného, než tehdy běžné systémy AI. Potřeboval jsem upozornit, že systém OLS představuje až další technologickou vlnu, která teprve přichází a snad i přijde. Odkázal jsem proto čtenáře na obrázek v americké knize, jenže jsem se následně zhrozil, jak ten můj odkaz byl českým oponentem v jeho „vědeckém“ posudku interpretován.

V té americké knize autoři totiž použili metaforické vyjádření očekávané budoucnosti ve dvou vlnách. Budoucnost je vždy vágní, takže tam vágní sdělení předpovědi pomocí metafory nevadí. Pro českého oponenta, matematika z výpočetního střediska, bylo takové vyjádření ale psychicky nestravitelné. Viz více v obrázku. Toto bylo zcela zbytečné nedorozumění, ale dává dobrý ilustrativní vhled i do dnešních mezioborových komunikačních problémů typu: „jeden o koze a druhý o voze“.

V roce 1990 externí oponent, informatik, ze svého nepochopení způsobu vyjadřování se k jinému účelu a v jiném oboru, dělal ze mne blbce – a to se mému nepříteli na VUT Brno (tehdejšímu řediteli našeho ústavu, který se dopustil podvodu a já jsem o tom nemlčel) náramně hodilo.

Expertní posudek od faktického ne-experta byl tedy prvním kritickým faktorem neúspěchu aplikačního projektu OLS na VUT Brno v roce 1990. Stav projektu základního výzkumu OLS v Bratislavě ten posudek asi neovlivnil, protože tam už projekt OLS zemřel na (jinak pozitivní) politické změny roku 1989.

AI2

Druhá vlna

A jak se historicky ve světě realizovala předpověď dvou vln počítačových expertních systémů? Odpověď: Druhá vlna se fakticky nerealizovala. Místo očekávané druhé vlny se dostavilo (metaforicky řečeno) „zimní období“ pro celý obor AI. Obor nesypal peníze a ani technické problémy nebyly řešeny dostatečně rychle, a tedy přesvědčivě. Málokdo byl proto ochoten podporovat stavbu „katedrály“, která by mohla trvat i několik desetiletí. Takovou velkou ideologickou výdrž měli lidé kdysi ve středověku, nikoliv v dnešním pragmatickém kapitalismu.

A to byl i další důvod, proč pro mne bylo asi skutečně rozumnější se profesně věnovat jinému oboru (tématu „podnikání v tržní ekonomice“ a výuce v Česku i USA), abych ekonomicky přežil do důchodu.

Výjimky ale existují vždy. Druhá vlna pokračovala například projektem Cyc Douga Lenata. Je to nejdelší projekt v historii AI, který vznikl v roce 1984 a stále pokračuje. Šlo o projekt zachycení tzv. zdravého selského rozumu (tj. znalosti cca 3-4 letého dítěte). Po 35 letech práce projekt vyústil do více než 25 milionů ručně zapsaných pravidel „jestliže-pak“ (axiomů, pravidel palce), rozsah práce byl vyjádřen 2000 člověkoroky, a peněžními náklady v rozsahu USD 200 milionů. Viz více ve sdělení iniciátora projektu Cyc, například ve videu (pořízeném dne 21. 11. 2019), kde Doug Lenat, pléduje za spolupráci (jeho) přístupu symbolické logiky s dnes dominantním směrem strojového učení.

Poznámka č. 1 k videu: Pedagogika! Hodinové video začíná pedagogicky správnou prezentací závěrů (conclusions), ke kterým se přednášející dostane až na konci své přednášky. Není to tedy žádná detektivka, kde typicky teprve až na poslední stránce tlusté knihy (někdy mezi 2. a 3. hodinnou ranní) se pilný čtenář konečně dozví, že „vrahem je zahradník“.

Poznámka č. 2 k videu: Mimořádná doba vyžaduje mimořádné činy. Ve 33. minutě videozáznamu Doug Lenat upozorňuje, že vynaloženým úsilím je jeho projekt Cyc podobný projektu, jakým (v době ohrožení světa Hitlerem), byl americký projekt Manhattan (tj. výroba americké atomové bomby). Dough Lenat ve videu také připomíná, že v roce 1982, když Japonsko vyhlásilo pokus o realizaci tzv. 5. generace počítačů, USA vzaly tehdejší japonskou výzvu vážně a Americký Kongres dovolil v tomto oboru velkým americkým firmám užší spolupráci (konspirativní tajné ujednání), než kolik tehdy umožňoval americký zákon. Tzn., konkurující si velké firmy v tom oboru mohly i porušit antimonopolní zákon (Antitrust), aby USA jako celek mohly zvítězit nad technologickým konkurenčním úsilím Japonska. Ve hře bylo něco více (nebo to alespoň bylo tak tehdy vnímáno), než bylo slušné dodržování tuzemského zákona pro všechny. (I proto si dnes kladu spekulativní otázku: Jak asi mohla zareagovat americká vláda na (v roce 2017 vyhlášené) úsilí Číny o světové prvenství v umělé inteligenci do roku 2030? Dozvíme se to až po dalších 30 letech, nebo nikdy?)

Polákova poslední kniha

Doc. Polák, zřejmě vybavený nějakou intuicí, mi říkával: „Já vím, že to v životě už nestihnu zrealizovat. Musím proto alespoň vydat knihu, aby se vědělo, že Polák byl na světě první v tomto oboru.“ Tu knihu Polákovi v roce 1992 vydalo nakladatelství Amazon, s vtipným nadpisem: Matematizované humanitní obory pomocí polidštěné matematiky (Mathematized Humanities via Humanized Mathematics).

Závěr

I po 7 desetiletích existence je obor AI stále ve svém dynamickém rozvojovém stádiu, takže na zpětné uznání Polákovy průkopnické práce (navíc z post-komunistického Česka) si asi budeme muset ještě nějaký čas počkat. Vždyť přístup symbolické logiky (kam lze zařadit i Polákovu práci) se dnes často arogantně přehlíží jen jako prehistorie oboru AI. Historií je prý až teprve přístup strojového učení.

Zdá se, že v USA mají podobné problémy s arogancí ve výzkumu, jako jsme před 30 lety měli i my v Česku. Výzkumník Doug Lenat, který ve svém životě toho už hodně pamatuje, považuje symbolickou logiku (logiku) a strojové učení (statistiku) za dvě vývojová stádia AI, nikoliv dvě odlišné (v procesu evoluce vyvinuté) spécie. Oba dva přístupy musely v historii čekat na vývoj v sousedním oboru. Statistický přístup (tj. strojové učení) určitě čekal na výkonnější počítače, aby byl ekonomicky efektivní.

Dobrá zpráva: V závěru výše zmíněného videa upozorňuje Doug Lenat mimo jiné, že pod americkou institucí pro pokročilé výzkumné projekty DARPA se již připravuje hlubší spolupráce statistiky a logiky s cílem propojit jejich přínosy (na cestě k obecné AI). Doufejme, že tam porazí lidskou aroganci a lidstvo bude pak těžit z obou AI přístupů.

Dokončení zítra.

Autor je CSd (celkem spokojený důchodce)