Štúdia predviedla potenciál, ale v žiadnom prípade nepreukázala nahradenie lekárov počítačom. Ukazuje sa však, ako môžu stroje v budúcnosti asistovať pri diagnóze. Píš o tom Technet.cz.
Že počítače pomôžu lekárom odhaľovať rakovinu, o tom sa hovorí už dlho. Počítačový program Watson to napríklad sľuboval od roku 2011, avšak zatiaľ je stále vo fáze testov.
Tiež Google pracuje na automatizovanej detekcii rôznych chorôb s využitím strojového učenia, vrátane chorôb očnej sietnice alebo melanómu kože. Hoci ide zatiaľ takmer výhradne o teoretické projekty, ich vplyv na prax môže byť značný.
Čím skôr sa rakovinotvorné bujnenie v tele podarí odhaliť, tým lepšie sú šance na úspešnú liečbu. Preto sú dôležité preventívne testy. U jednej z najčastejších rakovín - rakoviny prsníka - sa preto odporúča pravidelné mamografické vyšetrenie.
Na röntgenovej snímke z mamografie potom špecializovaný lekár (rádiodiagnostik, tiež rádiológ) hľadá stopy, ktoré na základe svojich skúseností a praxe rozpozná ako začínajúci nádor.
Ak je podozrenie na nádor, odoberajú sa vzorky na histológiu, aby sa mohlo prípadne čo najskôr začať s liečbou. Nie každú rakovinu sa však takto podarí odhaliť, približne dvadsať percent nádorov lekárom unikne.
Automat na odhaľovanie rakoviny prsníka
Novo publikovaná štúdia (PDF) ukazuje, ako by mohla v budúcnosti fungovať spolupráca lekárov s automatizovaným systémom na detekciu rakoviny. „Mamogramy sú veľmi účinnou metódou, ale stále je tu významný počet falošných negatív a falošných pozitív,“ uviedla Shravya Shetty, programátorka firmy Google, ktorá sa na výskume podieľala. „V štúdii sme sa pokúsili aplikovať rovnaké princípy, ktoré používajú lekári radiodiganostici.“ Cieľom bolo porovnať úspešnosť pri rozpoznávaní rakoviny na mamografii v rannom štádiu.
Neurónovú sieť vyvinutú odborníkmi z britskej firmy DeepMind (Google ju kúpil v roku 2014, je známa napríklad svojimi úspechmi v hre go) tentoraz výskumníci natrénovali na obrazových dátach z britských (a neskôr amerických) mamografických kliník. Na vzorke anonymizovaných mamografov viac ako 76 tisíc britských žien sa neurónová sieť naučila rozpoznávať, ako vyzerá obraz, na ktorom je prsník s rakovinou. Počítač pritom nemal k dispozícii žiadne údaje o pacientke ani predchádzajúce meranie, vek a pod.
Sieť (v štúdii výskumníci používajú výraz AI, teda umelá inteligencia) sa na malej vzorke učí rozpoznávať, či je na fotke rakovina, a potom svoj predpoklad konfrontuje s realitou. Ak sa trafila, posilní neuróny (samostatné časti rozhodovacieho algoritmu), ktoré k tomuto správnemu rozhodnutiu viedli. Ak sa netrafila, poučí sa z toho pre nabudúce. To celé sa opakuje napríklad miliónkrát, jednotlivé neuróny sa postupne vyvíjajú a neurónová sieť sa „učí“ rozpoznávať v obrazu informácie a závislosti, dokiaľ nie je výsledná úspešnosť dostatočne vysoká.
Neurónová sieť sa „učí“ na základe spätnej väzby. Tú v tomto prípade zaisťovala s odstupom času potvrdená diagnóza. Preto boli do štúdie zaradené staré snímky, rakovina sa totiž mohla u pacientok rozvinúť neskôr.
Natrénovanú neurónovú sieť potom výskumníci pustili na úplne oddelený, testovací dataset. Britský testovací dataset pozostával zo snímok 25 856 žien. Mamografy pochádzali z rokov 2012 až 2015 (išlo o náhodnú a anonymnú vzorku z približne štvrť milióna žien). U 765 tých žien bola vykonaná biopsia a u 414 z nich bola následne potvrdená rakovina prsníka. Počítač mal k dispozícii iba obrazové dáta (dve snímky ku každému prsníku) a tieto prsia rozdeľoval na tie, kde detekoval rakovinu, a tie, kde nie.
V porovnaní so šesticou ľudských lekárov si neurónová sieť viedla veľmi dobre. Mala vyššie percento úspešných nálezov a nižšiu chybovosť. Rozdiel bol relatívne malý. Miera falošných negatív bola pri počítači o 2,7 percenta nižšia na britskej vzorke, čo je ale štatisticky významný pokrok.
Práve falošnénegatíva sú pritom najhorším výsledkom. Znamenajú totiž, že žena odíde zo skríningu s tým, že rakovinu nemá, zatiaľ čo nádor u nej bujnie až do budúceho vyšetrenia, čím klesá šanca na úspešnú terapiu. Na americkej vzorke, ktorá bola menšia, bola dokonca AI pri eliminácii tohto negatívneho výsledku úspešnejšia o 9,4 percenta.
Dodajme, že zatiaľ čo počítač pracoval len s jednorazovou obrazovou informáciou a inak o testovanej žene nič nevedel, lekári mali k dispozícii ženinu stručnú anamnézu (vek, predchádzajúcu liečbu a pod.). To mohlo dať lekárom výhodu, možno však špekulovať o tom, že to mohlo v istých prípadoch ovplyvniť úsudok aj opačným smerom. Výskumníci k tejto nezrovnalosti pristúpili preto, že lepšie napodobňuje, akým spôsobom rádiodiagnostika prebieha v praxi.
Výskum ukázal dôležitosť spolupráce
Znamená to teda, že by mali ísť lekári do predčasného dôchodku, pretože odteraz za ne rozpoznávania bude robiť počítač, rýchlejšie a efektívnejšie? Rozhodne nie, zdôrazňujú lekári aj autori štúdie. Je k tomu niekoľko dôvodov.
Prvým je, že AI sieť, akokoľvek svojimi výsledkami porazila každého zo šiestich rádiodiagnostikov individuálne, dosiahla v podstate porovnateľné výsledky, ako dvojica diagnostiku. V Británii každú snímku prehliadnu po sebe dvaja odborníci. Až ak sa obaja zhodnú, že snímku nezachytáva nádor, je označený za rakovinyprostý. V porovnaní s týmto systémom boli výsledky AI na rovnakej úrovni, teda neboli horšie. Čo je stále úspech, ale už to predsa len znie inak ako „počítač je lepší ako lekári“.
Ďalším dôvodom, prečo by náhrada lekárov strojom nebol dobrý nápad, je otázka variability systému. Neurónové siete často trpia zvláštnymi vrtochmi, ktoré sú z ľudského pohľadu ťažko pochopiteľné. Stačí trochu pozmeniť spôsob prezentácie obrazových dát - napríklad šumu - a systém zrazu môže dávať úplne iné výsledky, čo by sa u ľudského hodnotiteľa nestalo. Rovnako tak si môže natrénovaný systém zvyknúť na určitú značku mamografie a nedokáže sa prispôsobiť inému prístroju (na to upozorňujú aj autori tejto štúdie platenej Googlom).
No a konečne výskumníci odhalili aj vzorky, ktoré boli vyhodnotené úplne opačne počítačom a ľuďmi. „Je tu nádor, ktorý všetkých šesť rádiológov prehliadol, ale náš algoritmus si ho všimol. Na druhú stranu, boli iné prípady, keď všetkých šesť rádiológov našlo nádor, zatiaľ čo náš algoritmus nie,“ uviedol Scot McKinney, vedúci autor štúdie. „Je zrejmé, že robia - dúfajme - komplementárne rozhodnutie.“
Autori však predviedli praktickú ukážku toho, ako by mohol počítač pomôcť s analýzou snímok v tandeme s človekom. V jednej zo simulácií „zapriahli“ algoritmus čoby druhého člena tímu. Vo chvíli, keď lekár aj počítač usúdili, že je na snímke rakovina, nebol už na analýzu volaný druhý lekár. Tým sa ušetrilo až 88 percent času druhého posudzovateľa, čo je vzhľadom k nenaplnenému dopytu po tejto odbornosti veľký úspech.
Podobne, ako tomu bolo aj v rade ďalších prípadov, sa tak ako najlepšia javí spolupráca človeka a stroja. Pričom človek musí poznať limity počítačovej analýzy a nespoliehať na ňu slepo.