Rozhovor s Janem Kleindienstem, šéfem výzkumu IBM v Praze.

Před dvěma lety zveřejnilo IBM výsledky online průzkumu mezi vývojáři a IT specialisty, ze kterého vyplynulo, že do roku 2015 se prosadí jako nejžádanější platformy pro vývoj aplikací a přístup k informačním systémům mobilní technologie a cloud computing. Podle některých nedávno zveřejněných studií ale budoucnost informačních technologií nestojí na modelu vývoje cloudu, ale na komoditizaci. Jak vidíte budoucnost IT?

Cloud computing a komoditizace nemusejí jít nutně proti sobě. Jsou to slova, která spolu souvisejí, protože mají společnou jednu věc. Řeší složitosti současného světa z hlediska IT a byznysu. Aby se našlo pro zákazníka vhodné řešení, je nutné kombinovat spoustu prvků. Zákazníci mají velké obavy z množství a složitosti informačních technologií, kde sice vytvoření řešení trvá v řádu několika měsíců, ale skutečné nasazení, se může protáhnout až na více než rok. Nasazení totiž naráží na spoustu překážek. Mohou to být bariéry mezi státy, stejně tak jako bariéry mezi jednotlivými odděleními ve firmě. Zákazníci proto volají po systému, který by byl jednoduše konfigurovatelný a zároveň otevřený, co se týče standardů.

Hodně se v posledních letech mluví o cloud computingu. Nedává se ale této technologii přehnaný význam?

To je osud každé technologie. Prošli jsme si tím v technologii, která je mi blízká, v rozpoznávání řeči. Procházíme tím i nyní v dialogových systémech. Patří to ke každé technologii a je to součást vývojového cyklu. Když se inovace dostane do pozornosti zákazníků i firem, vznikají poměrně velká očekávání. Každá technologie se setkává s tlaky a novými požadavky, které vznikají v souvislosti s jejím nasazením. Po období velkého očekávání, dochází většinou k opadnutí zájmu, aby se následně technologie opět vynořila na hladině, kde se očekávání zákazníků, firem a vývojářů srovnají.

Kde jsou v tuto chvíli cloudové technologie není úplně zřejmé, ale vzhledem k tomu, že existuje mnoho firem, které služby na bázi cloudových technologií nabízejí, tudíž dochází k její komoditizaci, je pravděpodobné, že cloudové technologie se nacházejí někde za zenitem hypové křivky.

Slovo cloud, je sice slovo moderní, ale cloudová technologie už existuje relativně dlouhou dobu. Nyní jde hlavně o standardy a zjednodušení přístupu zákazníků k této technologii.

Řídíte výzkumný tým pro rozpoznávání řeči, jak se v této oblasti dosahuje pokroku? Efektivnějšími algoritmy nebo větším výpočetním výkonem?

Většina technologií, které pracují s velkou variabilitou signálu, ať už hlasového signálu nebo lidské řeči, jsou založené na metodách strojového učení. Systémy vedení dialogu člověka s počítačem jsou velmi složité a mnohovrstvé struktury, kde každá vrstva je téměř nezávislá jednotka, která se učí z určitého objemu dat. Data a vhodně strukturované algoritmy, pomáhají k dosažení pokroku.

Rozhodně však neopovrhujeme ani výpočetní silou. Rozpoznávání řeči má za sebou sice šedesát let vývoje, ale stále zkoušíme nové postupy, které využívají více informací. Silnější hardware nám umožňuje lépe s těmito informacemi pracovat. Rozpoznávání řeči má ale v různých situacích různé nároky. Například v automobilech jsme omezeni výkonností hardwaru. Tam, kde si nemůžeme pomoci výpočetní silou, si musíme pomoci chytřejším algoritmem.

Na ceste insideNa čem konkrétně se dnes v oblasti rozpoznávání řeči v IBM pracuje?

V IBM řešíme, jak zacházet s velkými objemy dat. Přizpůsobuje se tomu i výzkum. Snažíme se nejenom rozpoznávat lidskou řeč, ale nad rozpoznáváním modelovat schopnost porozumění obsahu lidské řeči a zároveň vést nějaký způsob rozhovoru mezi systémem a člověkem.

Velký problém lidské řeči je, že tak, jak je tisíciletími svým způsobem vycizelovaná, máme spoustu kulturního kontextu, který v řeči nepoužíváme, ale který všichni známe. Jsou to takové databáze znalostí, které podvědomě používáme, ale které se v řeči nevyskytují. Spousta slov a slovních spojení, které si vyměňujeme, je víceznačných. Musíme strojové dialogové systémy naučit, jak tuto mnohoznačnost vyřešit.

Pracujeme na schopnosti rozumět kontextu při zpracování úloh. Nejen kontextu informačnímu, ale i kontextu prostředí, v kterém se rozpoznávání řeči odehrává – v autě, v kanceláři či na mobilu. To vše může mít vliv na to, jak zkrátit dobu konverzace a interakce na minimum.

Firmy se potýkají s neustálým nárůstem objemu dat. Většina z nově vznikajících dat je nestrukturovaná, tedy například ve formě neupraveného textu, e-mailů, tweetů či příspěvků na sociálních sítích. Jak efektivně dokážou existující technologie tato data zpracovat? Nepřichází část těchto informací vniveč?

Určitě přichází. Soukromně tomu říkám tmavá hmota. Počítače vznikly na základě paradigmatu, že rozumí nějaké formě strukturovaných dat. Toto paradigma funguje u většiny počítačů stále. Nicméně tím jak se lidská komunikace přesouvá více do internetových médií, vzniká obrovské množství nestrukturovaných dat, které nemají formu sloupečků a řádků. Vzniká tu obrovský prostor pro využití počítačové technologie k tomu, aby porozuměla právě nestrukturovanému textu.

Odehrává se to v několika rovinách. Nejdříve dochází k transformaci do přirozeného jazyka a z takových dat pak dokážeme pomocí analytických nástrojů extrahovat pro danou úlohu to podstatné. Díky Twitteru se dají například predikovat módní trendy, které přijdou za pár měsíců. Můžeme určit sentiment, nebo zdali na trhu existuje poptávka po nějakém produktu.

Nestrukturovaná data se obecně považují za obrovskou studnici znalostí a informací, které kdyby se dokázali vytěžit, zoptimalizuje to mnoho procesů a bude to mít velké výhody pro zákazníky, koncové uživatele i pro firmy. Všichni se v současné době snaží z těchto dat vytáhnout podstatné a využitelné informace, které jsou využitelné pro vylepšování produktů či optimalizaci procesů. Netýká se to jen byznysu, ale také vlád. Konečně máme velkou příležitost pochopit, jak spousta lidí, reaguje, přemýšlí a jedná.

Není to jen otázka Internetu a sociálních sítí. Velké množství dat vzniká i ve firmách, které za sebou zanechávají obrovskou digitální stopu. Tu je možné zpracovat a představitelé firem požadují, aby bylo možné tato dat zpracovávat ideálně v reálném čase.  

Na cest k um l inteligenci headVzrůstající objem dat s sebou přináší také nutnost zvyšování investic do budování datových center, stejně tak narůstají výdaje na jejich provoz a údržbu. Podstatná část rozpočtu firem na IT jde právě tímto směrem, tím pádem zbývá stále méně peněz na investice do nových technologií a inovací. Jak je možné se zvyšujícím nákladům na provoz datových center bránit?

Jsme svědky jisté celosvětové společenské změny, kdy informační technologie budou ještě více než dosud pronikat do všech procesů, ať už firemních nebo společenských. Není místo ve firmě, které by nebylo dotčeno tím, že existují informační technologie. I na státní úrovni se ví, že koruna utracená za informační technologie, přináší o něco větší ekonomickou návratnost než koruna utracená jinde. Mění se vzorce přemýšlení, kde informační technologie ve firmě nasazovat. Firma, která investuje do informačních technologií v těch správných oblastech, bude mít velkou konkurenční výhodu.

Na spoustu problémů existují řešení, ale tato řešení nejsou jednoduchá. Dají se ale udělat tak, že složitost je držena uvnitř a výstupy jsou poskytovány v zjednodušené, pochopitelné formě. Dokážeme kombinací různých technologií, které využívá například Watson s databázemi, hardware a software, složit expertní systém, který dané firmě dodáme v podstatě na klíč. Systém si drží schopnost řešit daný problém, ale zároveň si drží schopnost být flexibilní, updatovatelný a upgradovatelný.

V oblasti IT a nasazování IT nás čekají ještě velké změny. IT politika ve firmě už není záležitostí technických a IT ředitelů. O IT se dnes zajímají marketingoví a finanční ředitelé, ředitelé jednotlivých značek či generální ředitelé. Správná IT řešení jsou odpovědí na složitosti a akceleraci procesů na celém světě.

Jak mohou inteligentní počítače typu Watson zefektivnit analýzu dat? Kolik z Watsona lze reálně nasadit v praxi?

Řešení typu Watson je špička ledovce technologií, které pod povrchem v laboratořích zrály už delší dobu. Jsou to technologie, které se zabývají zpracováním znalostí. Učením se nových faktů na základě automatického zpracování různých internetových nebo interních zdrojů. A následné extrahování těchto znalostí do strukturovanější formy tak, aby se nad tím dala dělat analýza.

Watson je úspěšný pokus, jak vtělit expertní znalost do počítačového systému a zároveň tuto znalost dokázat komunikovat v přirozeném jazyce. V tuto chvíli se technologie Watsonu připravuje pro několik domén, např. pro finančnictví a bankovnictví, ale zejména medicíny. Technologie Watsona se objevuje i v řadě IBM produktů, které jsou nyní na trhu. Protože Watson, podobně jako rozpoznávání řeči, se skládá z mnoha složitějších částí, někdy stačí mít jen jednu z nich, aby se vyřešil daný problém.

Nyní máme díky technologiím Watsona k dispozici řešení, které dokáže získat informace od odborníků a metodou, téměř postupné komoditizace, tyto informace nasadit tam, kde je potřeba. Můžeme nabídnout experty v oblastech, kde si třeba dříve experty nemohli z finančních důvodů dovolit.

Je to systém, který nebude dělat rozhodnutí za vás, ale pomůže vám ukotvit si váš vlastní názor nebo zvažovat i jiný názor, který jste původně vůbec nevzali v úvahu. Složitost kolem nás se zvyšuje obrovským tempem, lidská hlava je schopna zpracovat jen velmi omezené množství informací. Musíme mít mezi obrovským mořem informací a naším mozkem nějaký most, který nám pomůže. Jsou to systémy, typu Watson založené na správném mixu hardwaru a softwaru a navrchu je nějaký dialogový konverzační systém, který tyto informace pomáhá převádět na jednu či druhou stranu mostu.

Nemůže vývoj v oblasti inteligentních systémů vést k tomu, že lidé budou na technologie stále více spoléhat a povede to ke snižování jejich schopností a znalostí?

Ať uděláme sebelepší systém, není zatím schopen absorbovat všechny podněty, které odpovídají dané situaci a kontextu. Například v oblasti medicíny ponese z hlediska práva za svá rozhodnutí odpovědnost vždy lékař.

Tyto nové technologie si můžete představit jako dokonalejší internetové vyhledávače. Jako systémy, které vám pomohou řešit každodenní komplexitu. Dají vám varianty a umožní vám koncentrovat se na to podstatné. Rozhodnutí ale bude vždy na vás.

V roce 1997 umělý stroj porazil poprvé nejlepší šachistu světa, loni porazil počítač nejlepší soutěžící ve hře Jeopardy. Co přijde příště?

Když jsme porazili Kasparova, tak to byla poměrně strukturovaná šachová úloha, kde jsou známé algoritmy. Byla to úloha, která favorizovala spíše počítač než člověka.

Úloha Jeopardy ale byla obrácená. Počítač se musel naučit to, co je vlastní člověku - porozumět lidské řeči a najít odpovědi na otázky a rozhodnout se, nakolik si je jistý svojí odpovědí.

Počítače budou v budoucnosti nuceny pochopit a porozumět lidské řeči v různých kontextech. Dnes umíme řídit dialog člověka s počítačem, ale neumíme modelovat dialog více osob najednou. A to je právě jedna z výzev budoucnosti.

Lidé si zvyknou, že mají automatické asistenty na telefonu, kteří jim dokážou plánovat schůzky a odpovídat na dotazy. Ale budou chtít víc. Počítače budou rozumět nejen jazyku, ale i vizuální informaci kolem a budou mít smysly - dobrý sluch, zrak a nějaké kognitivní schopnosti tak, aby dokázali rozumět prostředí, ve kterém se nacházejí. Aby se toto stalo, je potřeba mít dobře nastavený inovační cyklus na úrovni softwaru a hardwaru.