Učíme auta poznat, jestli na ně letí neškodná igelitka, nebo kus ledu

Dáváme strojům oči, říká profesor Jiří Matas o svém oboru počítačového vidění. Díky němu umějí počítače rozpoznávat SPZ při přestupcích nebo určit, od kterého drogového gangu pochází balíček kokainu. Nejvíce se ale nyní věnuje vidění automobilů.

img DALŠÍ FOTOGRAFIE V GALERII

Pane profesore, chodíte někdy do hospody?

Chodím, i když skoro nikdy nepiju alkoholické pivo, tak chodím.

 

Co byste odpověděl, kdyby si k vám přisedl někdo ze štamgastů a zeptal se: Ty, Jirko, a co ty v té práci vlastně děláš?

Asi nejjednodušší odpověď je, že počítačové vidění poskytuje to, co dávají oči mozku. Klasický počítač je něco jako mozek, který ale nevidí, neslyší a jenom chroustá data. A když se má nějakým způsobem napojit na to, co se děje ve světě, tak potřebuje oči a počítačové vidění jsou ty oči pro mozek.

 

Výkladní skříň v metru

Pod počítačovým rozeznáváním obrazu si možná řada z nás představí Face ID, kterým se odemykají moderní mobilní telefony. Je to správný příklad užití rozpoznávání obrazu v praxi?

Je to krásný příklad. Navíc jedna z prvních aplikací tohoto procesu, která funguje. Já jsem na tomto problému pracoval už od roku 1993, kdy to vlastně ještě moc nefungovalo. Pak to probíhalo několika klasickými vlnami od „ono to nefunguje“ přes řeči o Velkém bratru až po dnešní stav, kdy to funguje velmi dobře. I když to, co máte ve svém mobilu, vlastně není identifikace, ale verifikace, protože to poznává, jestli jste to vy, nebo ne. Děsivější varianta je, že jedete na schodech v metru a někdo zná identitu všech osob, které v tom metru jezdí. Na to musíte poznat jednoho z milionu, zatímco váš mobil potřebuje poznat jenom vás.

 

Z filmových detektivek známe scény, kdy software rozezná člověka v davu a hned k němu vypíše, co je zač a kolik má záznamů v jakém rejstříku… Je to reálné?

Ano. Je to až hrůzostrašné. Asi před třemi lety byla taková malá prezentace čínských výzkumníků. Byli to mladí doktorandi a říkali nám: My jsme to testovali v metru u nás ve městě a měli jsme úspěšnost rozpoznávání 60 procent. Tak jsme kroutili očima a ptali se, kde vzali tu potřebnou databázi. A oni nám s klidem odpověděli, že jim ji poskytla místní policie. To je u nás něco naprosto nepředstavitelného.

Navíc v tom metru je to ještě zjednodušené v tom, že když jede eskalátor, tak ty hlavy jsou nad sebou, většina lidí se dívá dopředu, všichni musejí projet stejným místem. Jinými slovy, jsou to ideální podmínky.

 

 

Funguje to i jinde?

Třeba na fotbalových stadionech po Evropě na rozpoznávání chuligánů. Nebo na dodržování zákazu vstupu pro někoho, kdo tam dělal věci, které neměl. Často tomu pomůže i lidský faktor. Často vám to ukáže z databáze pěti tisíc registrovaných chuligánů tři, kteří by to mohli být, někdo to porovná a řekne, že to sedí. Takže tohle je realita, nebo velmi blízká budoucnost – v závislosti na tom, kdo a kolik by do toho úsilí chtěl dát.

 

Ve kterých dalších oblastech zcela běžného života se strojové rozeznávání obrazu používá?

Třeba různé třídicí algoritmy na třídění pošty. To vy vlastně nevidíte, ale hodně vám to zjednodušuje život. Co vám možná nezjednodušuje život, je automatické rozpoznávání SPZ pro udělování pokut.

 

Co dalšího ještě počítačové oči umožňují?

Další větev počítačového vidění, která se dnes prosazuje, jsou 3D rekonstrukce. Dnes si v podstatě můžete koupit software, se kterým si můžete projít zajímavý objekt – dům, kulturní památku a podobně. A z toho videa si pak můžete vytvořit 3D model, který si můžete prohlížet. Nebo ho můžete ukázat potenciálnímu zákazníkovi.

 

Celý rozhovor si také můžete poslechnout v podcastovém pořadu Host Reportéra.

 

​​​​​​​

 

 

Jeden z vašich dalších produktů se podílí na odhalování původu drog. Jakým způsobem pracuje?

To byl úspěšný projekt. Pracuje s tím, že každý balicí stroj má jiný vzorek stisku při lisování balíčků. A právě porovnáváním vzorku toho stisku dokážeme říct, z jakého lisu pochází třeba balíčky kokainu.

 

Koukání zepředu

Pojďme k poněkud obyčejnějším přestupkům. Před lety jste vyvinuli systém na rozpoznávání espézetek aut. Ještě pořád se používá u nás v rychlostních radarech?

Ano a nejen tam, například i když vám po Praze jezdí auto od Eltoda, které zjišťuje, jestli na modré zóně neparkuje někdo, kdo nemá. My jsme s tím začali před sedmnácti lety, dneska už tohle umí kdekdo. Takže to, co umíme navíc, je třeba rozpoznávání typu auta či značky, což se pořád vyvíjí. Dokážeme tedy třeba poznat, jestli náhodou není SPZ od osobního auta na náklaďáku, čímž by někdo chtěl ušetřit náklady na mýtném, a podobně.

 

Vyčetl vám tohle někdo z vašich kamarádů nebo známých, že kvůli vám platí pokuty?

Ne. Typický dotaz je, jestli rychlostní radary snímají SPZ zepředu, protože je to lépe osvětlené, ale na motorkách jsou značky zezadu, takže motorkáře zajímá, jestli se díváme už i dozadu.

 

A díváte?

Ne.

 

Systémy, o kterých jsme mluvili, dělala společnost Eyedea Recognition, která byla vůbec prvním spin-offem na Českém vysokém učení technickém...

A dosud je jediný, což je neuvěřitelné.

 

 

Pojďme tedy čtenářům říct, co je to vlastně spin-off…

Musíme rozlišovat mezi startupem a spin-offem. Spin-off je něco, kde ČVUT má majetkovou účast a je spolumajitelem. Takže kdybychom firmu prodali, což několikrát „hrozilo“, tak ČVUT dostane možná docela zajímavý balík peněz. A když například firma vytvořila zisk, tak 10 procent toho zisku jde ČVUT. Oproti tomu startup, to jsou věci ve stylu, že doktorandi skončí studium, mají nápad, odcházejí a s tímto nápadem tvoří svoji firmu. Z hlediska školy je to reklama, ale finančně z toho nic nemá. Spin-off by byl výhodnější. Jenže ČVUT, stejně jako většina dalších českých vysokých škol, to neumí. Celé schvalovací kolečko trvá dlouho, my jsme tím prošli, ale v podstatě jsme tím odradili všechny následovníky.

 

Igelitka, nebo led

V Centru vizuálního rozpoznávání, které vedete, se věnujete také práci na projektu autonomních aut pro značku Toyota. Jakým způsobem s ní spolupracujete?

Celé to děláme ve škole. Vlastně je to laboratoř, která má v současné době rozpočet ve výši několika desítek milionů korun ročně, které Toyota platí Fakultě elektrotechnické.

 

 

Automobilka má podobnou spolupráci s řadou pracovišť po Evropě. Co je konkrétně vaším úkolem?

My se zaměřujeme na pohybové, hlavně těžko predikovatelné objekty před autem. Například když něco spadne z auta jedoucího před vámi, nebo když tam poletuje igelitová taška. Systém by měl poznat, jestli je to taška, kterou může auto v podstatě ignorovat, nebo zda je to třeba kus ledu, který spadl z autobusu, a je potřeba udělat rychlý úhybný manévr.

 

Může mít váš výzkum nějaký cílový stav? Že prostě s kolegy vyřešíte poslední problém a řeknete, že kamerové rozpoznávání je dotažené k dokonalosti a Toyota si s tím už může dělat, co chce?

V Toyotě je to tak, že oni teď mají nový koncept, kterému říkají Woven City čili něco jako protkané město. A oni říkají: Ano, autonomní auta jsou jedna věc, ale za chviličku budeme mít roboty. Robot přitom, na rozdíl od auta, manipuluje prostředím. Představte si, že doma máte robota, kterému dáte do držáku kolo a on vám ho rozebere, vyčistí, složí a uloží. Robotovi přitom nestačí jen modely prostředí a senzory jako autu, ale on tím prostředím potřebuje i manipulovat, popřípadě si najít nějaké náhradní díly a měnit stav kolem sebe. Takže si myslím, že z aut pokročíme do robotiky.

 

Poměr cena/výkon může hrát důležitou roli i v samotném osudu autonomních aut. I kdyby už dnes byly vyřešeny všechny technické, etické i právní problémy, cena za plně autonomní auto by byla neúměrně vysoká, ne?

To je pravda. Celé senzorické vybavení by stálo možná stejně jako celý zbytek auta. Podle mě to bude v první řadě prospěšné třeba pro cesty, kdy najezdíte hodně kilometrů. Nebo fixní trasy třeba od letiště směrem na terminál metra. Takové auto může jezdit pořád dokolečka, 24 hodin denně sedm dnů v týdnu. A pak se vám vrátí i ty náklady do toho senzorického vybavení.

 

 

Vy sám jste několikrát říkal, že by se autonomní auta mohla prosazovat v městečkách na Floridě, obývaných seniory. Tam by možná poměr cena/výkon skutečně fungoval. Pokud budou movití důchodci stát před volbou autem nejezdit například kvůli zraku nebo na druhé straně zaplatit hromadu peněz za samořídící vůz, mohlo by to fungovat.

Ano, podle mého názoru jsou seniorské komplexy místem, kde může být prostředí pod kontrolou. Většinou to je vesnička, kde můžete mít na silnici nějaké dráty, na každé křižovatce senzory, můžete vědět o polohách všech aut i centralizovaně, nařídit maximální rychlost a tak dále. Zkrátka bezpečné, kontrolované prostředí pro podobnou technologii, kde nikdo moc nespěchá. A užitečné speciálně pro lidi, kterým činí problém chůze.

 

Zmiňovali jsme nevyřešené technické, právní i etické problémy. Které z nich jsou podle vás nejkomplikovanější? A proč?

Na právní problémy nejsem odborník. Myslím ale, že etické problémy se vyřeší tak, že lidé si zvyknou. Tak, jako někdy selže člověk a někoho zabije nebo zabije sám sebe, tak se to může stát i automobilu. Jenže když se mu to bude stávat dvacetkrát méně často než u lidí, lidé se s tím srovnají.

 

Před pěti lety jsem psal velký článek o autonomních autech, protože jsem chtěl dceři odpovědět na otázku, zda až bude dospělá – tedy v roce 2027 –, budou auta bez řidiče. Dospěl jsem k závěru, že asi ještě ne. Co myslíte vy?

Tak ona už teď i nějaká taková auta jezdí... Bude platit, že je možné vyrobit auto, které může v mnoha prostředích jezdit bez řidiče. Nebude to ale běžné auto, do kterého si můžete sednout, ono vyjede z garáže, a vy vyrazíte k babičce.

 

Už zmiňovaná Toyota plánovala pro blížící se olympijské hry v Tokiu spoustu nových modelů, včetně některých se semiautomatickým řízením čtvrté úrovně. Co v překladu pro laiky znamená to semiautomatické řízení?

Myslím, že tam budou jezdit auta, která nebudou mít řidiče, ale to semiautomatické znamená, že něco z toho systému, který zajišťuje to fungovaní, bude v infrastruktuře. Takže to nebude auto, které může běžně autonomně jezdit v provozu, ale bude umět jezdit po nějaké trase a ta trasa tomu bude ještě pomáhat. Ale z hlediska uživatele to bude vypadat, jakože nastoupí do auta, kde nikdo není, auto zavře dveře a odjede.

 

Důležité návraty domů

Mluvili jsme o blízké i vzdálenější budoucnosti. Pojďme nyní na chvilku do minulosti. Vy jste absolvoval ČVUT v roce 1985. Jak tehdy vypadala úroveň umělé inteligence?

Já jsem vlastně jeden z prvních absolventů jakési specializace „umělá inteligence“. Lidé se hodně domnívali, že umělá inteligence spočívá v tom, že si umí hrát se slovy, zvládne hrát šachy a podobně. V dnešní době se obrovská část umělé inteligence týká zpracování senzorických signálů, informací o prostředí. Jinými slovy, máte hodně dat o nějakém problému a vy se ho snažíte vyřešit.

 

Po pádu režimu jste studoval a pracoval v Británii na University of Surrey. Proč jste si vybral právě tuto školu? Nebo si vybrala ona vás?

Něco mezi. Můj tehdejší šéf mě ještě za socialismu doporučil slavnému profesorovi Josefu Kittlerovi, který na University of Surrey vedl obor umělé inteligence. Mezitím padla železná opona a já tam odjel. Původně na šest měsíců, nakonec jsem tam udělal i doktorát, získal místo a byl jsem tam na plný úvazek až do roku 1997. Pak jsem do roku 2001 létal mezi Českem a Británií.

 

Neuvažoval jste, že byste v Británii zůstal natrvalo?

Vždycky jsme se ženou věděli, že se chceme vrátit. Výhodou je, že i tady se už dnes dá dělat moje práce na špičkové úrovni.

 

V nadačním fondu Neuron, který se zabývá podporou a popularizací špičkových českých vědců, jste garantem oboru „computer science“. Máme nějaké opravdu světové talenty v tomto oboru? Dejte nám tajný tip, koho bychom měli do budoucna sledovat…

Třeba takový Tomáš Mikolov má dva vědecké články, které dostaly už několik desítek citací, což je obrovský úspěch. Daniel Sýkora je také vynikající vědec. Oni oba už cenu Neuron dostali a jsou tím nejlepším příkladem. Spoustu vědců nemůžeme ocenit, protože zůstanou v cizině. To je trošku problém celé východní Evropy, že čím je student lepší, tím je větší pravděpodobnost, že bude chtít do zahraničí. A pro naši zemi je velice důležité, aby neplatilo, že ti nejlepší zůstanou v cizině.

 

Je odliv vědců do ciziny způsoben především rozdílným finančním ohodnocením?

Rozdíl v platech není tak velký, ale pokud vám někdo nabídne profesuru na MIT (Massachusetts Institute of Technology, nejprestižnější technická škola světa – pozn. red.), to pak asi není co řešit.

 

 

Reklama
Reklama
Reklama

Sdílení

Reklama

Podpořte nezávislou žurnalistiku

I díky Vám mohou vznikat finančně náročné texty a reportáže v magazínu Reportér.

200 Kč 500 Kč 1000 Kč Jiná částka

On-line platby zajišťuje nadace Via a její služba darujme.cz

Reklama
Reklama