Technologie umělé inteligence a strojového učení mají bezpochyby silný potenciál měnit zdravotní péči. Z obrovského množství dat, která se při poskytování zdravotní péče denně generují, totiž dokáží získávat nové a důležité poznatky. Využívají softwarové algoritmy, které se při reálném použití sami učí a dokáží získaná data využít ke zlepšení svého výkonu. Pro využití těchto nových technologií ve zdravotní péči je ale třeba připravit nová pravidla, standardy a regulační politiky. Je proto asi přirozené, že největší úsilí o nastavení pravidel vzniká v zemích, kde se už dnes v praxi využívá zatím nejvíce certifikovaných zdravotnických softwarových AI řešení.
Americký Úřad pro kontrolu potravin a léčiv (FDA), Health Canada a britská Agentura pro regulaci léčiv a zdravotnických výrobků (MHRA) již v roce 2021 společně vytvořily 10 hlavních zásad, které byly podkladem pro vývoj takzvané Správné praxe strojového učení (Good Machine Learning Practice – GMLP). Tyto hlavní zásady mohou pomoci podpořit bezpečné, účinné a vysoce kvalitní zdravotnické prostředky, které využívají umělou inteligenci a strojové učení (AI/ML).
Deset hlavních zásad určuje oblasti, v nichž Mezinárodní fórum regulátorů zdravotnických prostředků (IMDRF), mezinárodní normalizační organizace a další spolupracující orgány mohou spolupracovat. Tyto oblasti zahrnují výzkum, tvorbu vzdělávacích nástrojů a zdrojů, mezinárodní harmonizaci a standardy. Tyto standardy mohou pomoci při tvorbě regulačních politik a pokynů.
Hlavní zásady
- Multidisciplinární odbornost je využívána během celého životního cyklu výrobku: Důkladné pochopení začlenění modelu do klinického praxe, jeho přínosů a rizik je klíčové. To pomůže zajistit, že zdravotnické prostředky budou bezpečné, účinné a budou řešit potřeby pacientů po celou dobu své životnosti.
- Zavedení správných postupů softwarového inženýrství a zabezpečení:
Při návrhu modelu jsou dodržovány osvědčené postupy softwarového inženýrství, zajištění kvality a správy dat, kybernetické bezpečnosti. Tyto postupy zahrnují metodické řízení rizik, tedy důkladný návrh postupů, implementaci a řízení rizik, jakož i zajištění pravosti a integrity dat. - Účastníci klinické studie a využité soubory dat jsou reprezentativní pro zamýšlenou populaci pacientů: Data musí reprezentovat zamýšlenou populaci pacientů, aby bylo možné výsledky zobecnit na zájmovou populaci. To zahrnuje charakteristiky jako věk, pohlaví, rasu a etnický původ při zajištění přiměřené velikosti vzorku.
- Tréninkové soubory dat jsou nezávislé na testovacích souborech:
Tréninkové a testovací datové sady jsou udržovány nezávisle na sobě, aby se předešlo jakýmkoli závislostem. Tím je zajištěna spolehlivost výsledků. - Vybrané referenční soubory dat jsou založeny na nejlepších dostupných metodách:
K vývoji referenčního souboru dat jsou používány nejlepší dostupné metody, což podporuje zajištění klinicky relevantní a dobře charakterizovaná data. Přijaté referenční soubory zajišťují robustnost a zobecnitelnost modelu v zamýšlené populaci pacientů. - Návrh modelu je přizpůsoben dostupným údajům a odráží zamýšlené použití zařízení:
Návrh modelu reflektuje dostupná data a zamýšlené použití zařízení. Zohledňuje známá rizika, jako je nadměrné úsilí k přizpůsobení modelu, zhoršení výkonu nebo bezpečnostní rizika. Klinické přínosy a rizika související s výrobkem jsou dobře pochopeny a slouží k odvození klinicky smysluplných cílů výkonnosti pro testování. Výrobek bezpečně a účinně dosahuje zamýšleného použití. - Výkonnost zařízení prokazuje testování za klinicky relevantních podmínek:
Testovací plány musí být statisticky spolehlivé a zaměřené na klinicky relevantní informace. Testování zohledňuje zamýšlenou populaci pacientů, podskupiny, klinické prostředí, použití týmem Člověk-AI, vstupy měření, potenciální matoucí faktory a další. - Uživatelům jsou poskytovány jasné a zásadní informace:
Uživatelům jsou poskytovány jasné a kontextuálně relevantní informace o zamýšleném použití produktu, výkonnosti modelu, datech použitých pro trénink a testování, a dalších klíčových aspektech. Poskytované informace jsou vhodné pro zamýšlené publikum (např. poskytovatele zdravotní péče nebo pacienty). Uživatelé jsou také informováni o aktualizacích a možnostech komunikace s vývojáři např. o obavách týkajících se výrobku. - Nasazené modely jsou monitorovány z hlediska výkonnosti a jsou řízena rizika opakovaného trénování:
Nasazené modely je možné monitorovat v „reálném světě“ se zaměřením na zachování nebo zlepšení bezpečnosti a výkonnosti. Pokud jsou navíc modely po nasazení pravidelně nebo průběžně trénovány, jsou zavedeny vhodné kontrolní mechanismy pro řízení rizik nadměrného přizpůsobení, neúmyslného zkreslení nebo degradace modelu, které mohou mít dopad na bezpečnost a výkonnost modelu při jeho používání týmem Člověk-AI. - Je kladen důraz na výkonnost týmu Člověk-AI:
Pokud je model používán ve spolupráci s lidmi, jsou zohledněny faktory jako lidský faktor a interpretovatelnost výsledků. Důraz je kladen zejména na výkon týmu člověk-AI, nejen samotného modelu.
Petr Moláček