Daniel Kvak: Aby sebediagnostika nebyla cesta do pekel…

S veřejným zpřístupněním nástrojů typu Midjourney či ChatGPT začíná téma a představy o možnostech využití umělé inteligence pronikat širokou veřejností. Ti, kteří fascinaci chytrými algoritmy propadli o něco dříve, mezitím realizují projekty, které ještě pár let nazpět byly vykreslované jen v příbězích science fiction. Autonomní ozdravné moduly známé ze snímků jako jsou Vetřelec či Elysium jsou sice představitelné skutečně jen na plátně, avšak například v diagnostice zažívá AI v posledních pár letech strmý rozmach. Jak se ukazuje, šetřit může čas i peníze, což může hrát tváří v tvář výzvám souvisejícím se stárnoucí populací a nedostatkem zdravotnického personálu významnou roli. Jedním z těch, kdo se do závodů digitálního zdravotnictví zapojili, je i Mgr. Daniel Kvak. Student Filozofické fakulty Masarykovy univerzity, na níž se zabývá využitím strojového učení v audiovizi, ale také tahoun společnosti Carebot, pod jejímž jménem proniká do lékařských ordinací. Nástup ambiciózního start-upu je stejně překotný jako kadence, s níž mladý podnikatel chrlí lékařské pojmy k nerozeznání od medicínského profesionála, a co začalo během pandemie COVIDU-19 systémem na klasifikaci rentgenových snímků plic, dnes škáluje pro další obory. Jedním z projektů, kterým se rostoucí tým Carebotu zabývá, je také nástroj pro rozpoznávání kožních melanomů, a to zejména u pacientů s tmavším odstínem kůže. „Překvapilo mě, že když Google vydal aplikaci DermAssist, tak na odstín kůže příliš nebral zřetel, přitom jde podle mě o vůbec nejdůležitější faktor,“ všímá si Kvak. Ostatně, nutnost poučit se z chyb a být co nejvíc praktický, v rozhovoru zdůrazňuje několikrát. Že jeho snaha dává smysl, potvrzuje mimo jiné nedávné ocenění na konferenci MICAD zaměřené právě na počítačové systémy pomáhající s interpretací lékařských snímků.

24. 3. 2023

Bez popisku
Bez popisku

Baví – nebo bavilo – vás sci-fi?
Velice! Ať už jde o filmy nebo komiksy, třeba Matrix nebo Terminátor. Odtud vlastně můj zájem o umělou inteligenci vzešel.

Nemáte pocit, že určitou sci-fi vizi pomáháte utvářet?
Do jisté míry ano, protože sám jsem ještě několik let zpátky hleděl na spojení umělé inteligence s medicínou jako na sci-fi. Dnes mi ale dává ohromný smysl. Jde o specifický obor s obrovským potenciálem, a zvlášť při přechodu od samotné umělé inteligence do aplikované medicínské praxe k němu mám obrovský respekt. Zároveň ale věřím, že určitý vědecko-fantastický odstup mi pomáhá a inspiruje mě.

S podnikáním v oboru jste začal během pandemie COVIDU-19, kdy jste vyvinul nástroj na rozpoznávaní rentgenových snímků plic. Z čeho vzešel impuls ústící v to, že jste se ze studenta Filozofické fakulty zabývajícího se hudbou, ponořil do zdravotnictví v propojení s IT? Měl jste pocit, že potřebujete během pandemie, kdy rezonovala hesla o společném úsilí, taky nějak přispět nebo jste vnímal i byznysově díru na trhu?
Uznávám, že ten přerod může vypadat zvláštně a lékaři se na něj občas snaží vtipně poukázat. Lidi z IT pro něj mají větší pochopení. (usměje se) Zmínit musím pracovní náplň mojí manželky Karolíny, která působila na Přírodovědecké fakultě Masarykovy univerzity v oboru antropologie a zároveň pracovala v laboratoři morfologie a forenzní antropologie. Přemýšleli jsme, jak propojit naše dva zájmy, tedy umělou inteligenci v rámci zobrazovacích metod, až jsme přišli na návrh systému, který by detekoval odhad stáří kostí pomocí metod osifikace. Když pak přišel COVID-19, tak jsme si řekli, že zkusíme nějak pomoci a dali dohromady první model neuronových sítí, který měl odhalovat pacienty s nálezem covidové pneumonie, ale i s jinými patologiemi. Chvíli poté, co jsme ho zveřejnili, nám začali psát první lékaři, kteří říkali, že jde sice o fajn počin, ale že je potřeba ho ještě hodně vylepšit, aby se dal využívat v medicínské praxi. Tak jsme se do toho vylepšování společně pustili.

Když se ještě vrátím na časové ose zpět, jak se student Filozofické fakulty naučil programovat a vytvářet modely umělé inteligence?
Já jsem se původně živil vytvářením podkresové hudby pro televizní reklamy a když jsem dospěl k tomu, že jde o práci do určité míry automatizovatelnou, tak jsem se začal učit využívat modely neuronových sítí a AI. Až jsem se dopracoval k tomu, že stačilo jedno kliknutí a měl jsem hotovou práci na celý den. (usměje se) U medicíny to tak samozřejmě ani zdaleka není, tam jsou postupy mnohem komplexnější. Když dnes na Filozofické fakultě vedu bakalářské nebo magisterské práce, tak vnímám, že studenti vidí AI všude okolo sebe a zajímají se, jak se dá využít v rámci komunikace, v rámci generování obsahu, v rámci zpracování obrazu a tak dále. Fascinuje mě to a jsem rád, že ta AI vlna, byť má i své nevýhody, přináší i tuto dodatečnou edukaci.

„Byť na akademické půdě vznikají projekty s obrovským impaktem, některé věci tu trošku trvají a občas by mohly být trošku popohnány. Proto jsou důležité start-upy a spin-offy, aby přenášely know-how do praxe.“

Mgr. Daniel Kvak

Kosti, plíce, dnes melanomy a další projekty – progres vašeho start-upu Carebot působí dost raketově…
Pohybujeme se v segmentu, který je vysoce kompetitivní, a u podobných start-upů se říká, že už když člověk začíná, má dva až tři roky ztrátu na ostatní a musí sprintovat. I přesto musíme dbát na to, aby navržené metody a softwary byly robustní, klinicky validované, schválené regulačními úřady a tak dále. Teď bych nerad, aby to vyznělo zle, ale byť na akademické půdě vznikají projekty s obrovským impaktem, některé věci tu trošku trvají a občas by mohly být trošku popohnány. Proto jsou důležité právě start-upy a spin-offy, aby přenášely know-how do praxe. Pro nás bylo v úvodu složité, že jsme sice měli jakési prvotní know-how, ale nikdo z nás neměl radiologické znalosti a šli jsme trošku naslepo. Dnes už v týmu máme interní radioložku a spolupracujeme s více než třiceti radiology z celé Evropy.

Než se dostaneme k melanomům, v jakém stavu vývoje se nachází systém pro detekci plicních nálezů, a jakým dalším projektům jste se mezitím začali věnovat?
V současnosti náš systém detekuje primárně akutní nálezy jako jsou konsolidace v plicním parenchymu, pneumotoraxy, výpotky, případně léze nebo tumory. Aktuálně prochází certifikací a plně ho implementujeme do takzvaných PACS systémů, které lékaři používají k archivaci obrazové dokumentace. To je zásadní: snažíme se přizpůsobit lékařskému workflow a neměnit jej. V rámci škálování pak pracujeme na dalších řešeních, například pro oblast mamografie. A i když jsme de facto komerční subjekt, snažíme se zachovávat i míru vědecké činnosti, takže navíc aktivně publikujeme.

V čem jsou pro vás specifické melanomy?
Melanomy jsou pro nás zajímavým segmentem, protože je u nich vysoká míra možné automatizace. U rentgenu hrudníku je třeba počítat s aspekty jako je nemocnice, rentgen, radiolog, popis, PACS a dalšími, které utváří dost komplexní systém. Oproti tomu nález na kůži jste schopen si na mobilní telefon vyfotit a provést nějakou sebediagnostiku sám. Říkám „nějakou“, protože sebediagnostika je dle mě sice cesta do pekel, ale určitou míru důležitosti má.

Vy jste se přitom zaměřili na detekci melanomů u lidí s tmavším odstínem kůže, který stávající obdobné systémy příliš nezohledňují. Mě původně zarazilo, kde chce česká firma shánět dostatek podkladových materiálů lidí s tmavou pletí, na nichž byste svůj systém učili, pak jsem se však v projektu dočetl, že k tomu chcete využívat takzvaný generativní model. Můžete tento pojem vysvětlit?
Generativní modely tu s námi už pár let jsou, byť si jich lidi s výjimkou deep fake videí či deep fake obrázků moc nevšímali. Fungují na bázi toho, že umělé inteligenci předkládáme data a nechceme, aby je klasifikovala (jako když například samořídící auta rozpoznávají barvu na semaforu), ale chceme, aby vytvářela nová unikátní data. My tedy takové neuronové síti předložíme informace v rámci tzv. nesupervizovaného učení a požádáme ji, aby vygenerovala data nesoucí podobné znaky jako ta předložená. Ty rysy si přitom může vyhledat sama nebo ji můžeme popostrčit. V současnosti se jedná o populární segment i díky projektům jako je DALL-E nebo Midjourney, do nichž zadáme textový příkaz a očekáváme výstup.

„Umělá inteligence musí být nástrojem podobně jako jím je stetoskop nebo pravítko. Musí poskytnout jen další úhel pohledu a zároveň se s ní lékař musí sžít, naučit se na ni reagovat.“

Mgr. Daniel Kvak
Bez popisku

Čili postup je takový, že vezmete sadu reálných snímků melanomů, naplníte jimi umělou inteligenci, ta na jejich základě vygeneruje sadu umělých snímků melanomů odpovídající daným parametrům a tyto pak necháváte hodnotit skutečné lékaře, čímž data a systém dál zdokonalujete…?
Přesně tak! U snímků kožních nálezů je přitom ještě vyšší variabilita než u nálezů na plicích, přičemž nejde jen o velikost nebo tvar. Tím vůbec nejdůležitějším faktorem je odstín kůže a všiml jsem si, že když Google Health loni vydal svou aplikaci DermAssist, tak na něj příliš nebral zřetel. Jejich systém sice pracuje s velkým množstvím vzorků lidí se světlou kůží, ale čím tmavší odstín kůže, tím nižší zastoupení tyto vzorky měly. Překvapilo mě to, protože aby se snížila chybovost těchto systémů, tak ta data musí být robustní, vybalancovaná, a nesmí se upřednostňovat jedna populace, i kdyby u ní byl výskyt melanomů četnější.

Jestliže jste v prvotním cyklu váš systém naplnili zhruba sedmi tisíci reálnými fotografiemi, na základě nichž pak generoval další data a na jejich základě zase další, nedochází pak zákonitě k určitému ředění kvality? Vybavuje se mi, když Meta slavnostně spustila svůj chatbot, který se učil na základě konverzací s uživateli, kteří se ho ptali, co si myslí o zakladateli firmy Marku Zuckerbergovi, a ten ho z dostupných zdrojů a následných diskuzí odpovědí nevykresloval zrovna lichotivě. Zuckerberg už pak z těchto konverzací nikdy nemohl vyjít v dobrém světle…
My jsme s těmi prvními sedmi tisíci snímky natrénovali vlastní klasifikátor. Ke generování jsme pak použili v té době asi dva týdny veřejný model DALL-E. Vytvořili jsme tedy nějaké textové příkazy, na jejichž základě jsme generovali první data, která jsme nechávali hodnotit paní doktorkou Březinovou (MUDr. Eva Březinová, Ph.D. z I. dermatovenerologické kliniky LF MU a Fakultní nemocnice u sv. Anny v Brně) a naším vlastním klasifikátorem, aby nám řekli, zda ty obrázky obsahují typické rysy melanomu. V druhé fázi teď pracujeme s tzv. outpaintingem, kdy se už snažíme napasovat konkrétní nálezy do snímků kůže tmavých odstínů. K tomu, co jste zmiňoval, v minulosti mířily předchozí modely fungující na bázi tzv. generativních sítí, které pracovaly se známou distribucí dat. To znamená, že sice pracovaly s datasety, které se snažily nějakým způsobem modifikovat a vytvořit řekněme unikátní verze, ale ty byly neustále zavřené v jedné univerzální distribuci a nemohly pracovat s ničím venku. DALL-E však představil model natrénovaný na tzv. web scrapingu čili na datech stažených veřejně z internetu. Pravda, není to moc etické, ale díky tomu může pracovat s kontextem a generovat přesnější výstupy.

Váš kolega Matěj Misař se ale přitom loni v rozhovoru pro magazín E15 vyjadřoval skepticky k veřejným datům…
Tady je dobré zmínit, že zatímco na Google Storu a jinde jsou k nalezení všemožné aplikace pro sebediagnózu, my vytváříme certifikovaný zdravotnický prostředek, který prochází složitým regulatorním postupem, klinickým hodnocením a dalšími nezbytnými fázemi, v nichž verifikujeme, jak jsme přišli ke svým datům. Veřejně dostupné datasety zveřejňované různými institucemi zároveň s popisem nemusí být vždy přesné. Společnosti jako Google sbírají datasety různých lézí z různých pracovišť po celém světě a mají tým lékařů, kteří se na těch nálezech shodují – podle vizuální stránky, pomocí hmatu, histopatologického rozboru a tak dále. My se v rámci těchto procesů snažíme tyto datasety spíš doplňovat, aby byly vybalancované a reprezentující. Samozřejmě pro generované snímky nemůžeme udělat histologický rozbor, osahat si je a ani nemůžeme zkoumat jejich velikost, ale jsme schopni vytvořit dataset, který bude mít určité pro melanom specifické znaky. Musíme přitom vycházet z klinicky ověřených dat a následně hledat cesty, jak jim „pomoci“ a pracovat s nimi dál.

Říká se, že umělá inteligence je chytrá jen tolik jako její tvůrci, ale jak vás tak poslouchám, tak modely typu DALL-E sbírající kontextová data z internetu takové tvrzení překračují, ne?
Do jisté míry ano. Asi je ještě brzy na to tvrdit to definitivně, ale řekl bych, že k tomu směřujeme. Sleduju veškeré generativní modely a všímám si, že třeba ChatGPT už lidi začínají používat místo Googlu... Konkrétně v rámci medicíny je pro nás kontext nesmírně důležitý a od počátku se k tomu stavíme tak, že umělá inteligence musí být nástrojem podobně jako jím je stetoskop nebo pravítko. Musí poskytnout jen další úhel pohledu a zároveň se s ní lékař musí sžít, naučit se na ni reagovat. Teprve až se tak stane a až bude zahrnovat klinické hodnocení, které je robustní, multicentrické a které bude obsahovat různé zastoupení pacientů, teprve poté budeme moct říct, že i v rámci klinické praxe začne umělá inteligence, schopná fungovat na pracovištích, z nichž data předtím vůbec neviděla, třeba přesahovat dál.

„Chyby a nepřesnosti pramenící z nepochopení praxe můžou vést ke špatným výstupům.“

Mgr. Daniel Kvak
Bez popisku


Už jste nakousl téma zaujatosti umělé inteligence, kterou se vlastně snažíte eliminovat. Ve Spojených státech nedávno proběhla kauza, když se zjistilo, že lékaři s využitím AI diagnostikovali černošské pacienty zdravější, než ve skutečnosti byli, protože systém hodnotil i aspekty, které se samotným zdravotním stavem až tolik společného neměly, jako například úhradua zdravotního pojištění. S tím se pojí téma spolehlivosti těchto systémů…
Tohle lze ilustrovat i na příkladu z devadesátých let, kdy se v Americe začaly používat systémy na podporu rozhodování v rámci mamografického screeningu, přičemž lékaři byli finančně motivováni, aby tyto systémy používali. Byly to modely ještě ne na bázi neuronových sítí, ale na bázi metody podpůrných vektorů, a pomoci měly větší sensitivitě i lepší specificitě a pomáhaly tak při raném záchytu pacientek, čímž se daly šetřit i nemalé peníze. Problém byl ale v nastavení těchto systémů, kdy jim lékaři jen přihlíželi a slepě důvěřovali, protože se tvrdilo, že budou mít sensitivitu mezi 96 a 97 procenty. A tak vznikl problém. Proto je téma systémů pro podporu rozhodování pořád velice citlivé. Mnoho komerčních projektů selhalo, protože nešlo cestou správné klinické validace. Tím nechci říct, že nové start-upy – natož pak my – dělají věci o tolik lépe, ale myslím, že znalost předchozích problémů a míra kontroly napomáhá tomu, abychom to dělali skutečně robustně. Nakonec i ona klinická validace a hodnocení je dnes velice opatrné.

Jaká je vaše ultimátní ambice se systémem na klasifikaci melanomů? Dostat ho do ordinací nebo snad dokonce do mobilních telefonů, aby si každý mohl provést sebediagnostiku?
Já jsem si samozřejmě moc dobře vědom toho, že řada dermatologů má z podobných systémů hrůzu. Ne proto, že by kvůli nim měli přijít o práci, ale proto, že sebediagnostika je velice komplexní proces. Vyhodnotit konkrétní nález jen z vizuální informace lze spíš složitě. Jedna lékařka krásně zmínila, že takové systémy můžou lékařům přinést benefit v tom, že jim nebudou lidé volat pokaždé, i když je nezhoubnost nálezu zcela zřejmá, ale na druhou stranu při sebemenším podezření je potřeba přistoupit k nálezu komplexně, osahat si ho, odebrat vzorek a tak dále, což žádná aplikace nenahradí. Takhle je třeba k tomu přistupovat. Jestli budoucnost přinese nějaký multimodální přístup, kdy budeme schopni komplexněji pochopit a automatizovat jednotlivé části, tak to potrvá ještě mnoho let. Zatím jsme rádi, že se pohybujeme ve fázi obrazových dat a jsme schopni učinit alespoň nějaký prvotní odhad.

Jak pak v budoucnu předcházet tomu, aby lékaři brali podobné systémy skutečně jen jako nástroj, nezlenivěli a nespoléhali na ně až příliš?
Ty systémy nám můžou pomoct s automatizací, ale my si musíme najít správnou podobu této automatizace. Musíme zjistit, který problém může být automatizován a kdy bude míra klinického impaktu na pacienta co možná nejvyšší. Když vezmu náš systém na klasifikaci snímků hrudníku, který už je testován například v nemocnici v Havířově, snažíme se hledat benefity, které se liší nejen na jednotlivých pracovištích, ale i mezi jednotlivými lékaři. Například mladý lékař si je jistý u určitého množství nálezů a ty zbylé musí konzultovat se zkušenějším kolegou. Náš systém mu může zjednodušeně řečeno pomoct v tom, že nebude každých pět minut docházet za primářem a doptávat se na každou, pro zkušenějšího lékaře, běžnou věc. Když vezmu třeba mamografie, tak prevalence suspektních nálezů je docela nízká neboli vysoké procento nálezů pravidelných screeningů je buď úplně negativních nebo benigních. Ale lékař je samozřejmě musí projít, srovnat s historií dané pacientky a vyhodnotit. Tohle lze do jisté míry automatizovat, díky čemuž by lékař měl víc času na snímky, které si té pozornosti žádají víc. Ačkoliv i tohle může být problém, pokud by si odvykl na ty normální snímky. Snažíme se ho ale ve snaze minimalizace rizik s lékaři aktivně řešit.

Poslední dotaz bude lehčího rázu a vrátím se s ním obloukem k začátku naší konverzace. Co říkáte jako fanoušek sci-fi filmů na to, že většina z těch, v nichž vystupuje umělá inteligence, končí špatně?
(směje se) Ony špatně nekončí jen ty filmy, ale občas i firmy, které se umělé inteligenci věnují. Chyby a nepřesnosti pramenící z nepochopení praxe totiž můžou vést ke špatným výstupům. A v medicíně jsou důsledky takových pochybení daleko viditelnější, než když někomu doporučíme zelenou namísto červené pohovky. My se musíme z projektů, které selhaly, poučit. Podle mě je to vůbec ta nejdůležitější část: pochopit praxi, do které se snažíme umělou inteligenci integrovat, zjistit, jestli je do ní vůbec vhodná a zjistit, jakou konkrétní úlohu by v ní měla sehrávat. To vše při zapojení odborníků z praxe.


Více článků

Přehled všech článků

Používáte starou verzi internetového prohlížeče. Doporučujeme aktualizovat Váš prohlížeč na nejnovější verzi.

Další info