Пневмония помещает миллион взрослых американцев в больницу каждый год и убивает 50 000 человек. Если врач подозревает, что у пациента пневмония, он обычно назначает рентген грудной клетки. Конечно, эти рентгеновские снимки должны быть интерпретированы врачом. Но теперь исследователи из Стэнфорда разработали алгоритм, который, по их словам, может диагностировать пневмонию с помощью рентгенографии лучше, чем опытные рентгенологи.
«Преимущество алгоритма состоит в том, что он может извлекать уроки из сотен тысяч рентгеновских снимков грудной клетки и их соответствующих диагнозов от других экспертов», - говорит Пранав Раджпуркар, аспирант из Стэнфордской группы машинного обучения, который был одним из руководителей исследования. «Когда у радиологов когда-либо появляется возможность учиться на сотнях тысяч диагнозов других радиологов и находить закономерности на изображениях, ведущих к этим диагнозам?»
Алгоритм, называемый CheXNet, также может диагностировать 13 других заболеваний, включая эмфизему и пневмоторакс (воздух, попавший между легким и грудной стенкой). Команда создала алгоритм, используя общедоступный набор данных из Национального института здравоохранения (NIH), который содержал более 100 000 рентгеновских снимков грудной клетки, помеченных 14 возможными состояниями. Набор данных был выпущен вместе с первоначальным алгоритмом диагностики, который NIH побудил других исследователей продвинуться вперед.
Раджпуркар и его коллеги по группе машинного обучения решили принять вызов. Исследователи четырёх Стэнфордских радиологов отметили возможные признаки пневмонии на 420 изображениях. Используя эти данные, в течение недели они создали алгоритм, который мог бы точно диагностировать 10 состояний. В течение месяца алгоритм мог превзойти предыдущие алгоритмы при диагностике всех 14 состояний. На этом этапе диагнозы CheXNet чаще совпадают с мнением большинства радиологов, чем с индивидуальным мнением любого радиолога.
Исследование было опубликовано в этом месяце на сайте научной препринта arXiv .
Другие диагностические алгоритмы сделали новости недавно. Обе команды из Канады и Италии разработали алгоритмы диагностики болезни Альцгеймера по данным сканирования мозга. Распределение бляшек в мозге, которые характеризуют заболевание, слишком тонкое для невооруженного глаза, но исследователи говорят, что технология искусственного интеллекта может обнаруживать ненормальные паттерны. Раджпуркар и его коллеги-исследователи из Стэнфордской группы машинного обучения также разработали алгоритм диагностики аритмий сердца, анализируя часы данных с носимых мониторов сердца. Другие алгоритмы пневмонии были разработаны на основе данных NIH, но Стенфордский алгоритм пока является наиболее точным.
Команда CheXNet может быть особенно полезна в тех местах, где люди не имеют легкого доступа к опытным радиологам. Это также может быть полезно в качестве сортировки, определяющей, какие случаи, вероятно, нуждаются в неотложной помощи, а какие - нет. Команда также разработала инструмент, который создает карту потенциальных показателей пневмонии на рентгеновских снимках, давая удобное визуальное руководство для врачей.
Хотя команда с оптимизмом смотрит на диагностические возможности CheXNet, они осторожны в отношении его ограничений.
«ИИ является мощным инструментом, но для того, чтобы понять, как его использовать, требуются годы опыта и много трудных часов, и так же трудно определить, где мы можем использовать его для наиболее положительного воздействия», - говорит Раджпуркар.
Хотя в разработке находится ряд алгоритмов глубокого обучения, ни один из них еще не прошел строгий процесс тестирования и утверждения, необходимый для использования на реальных пациентах.
Пол Чанг, профессор радиологии и вице-председатель отделения радиологии Чикагского университета, скептически отзывается о CheXNet и подобных программах глубокого обучения. Врачи уже используют алгоритмы, чтобы помочь в диагностике любого числа состояний, говорит Чанг. Эти алгоритмы основаны на предварительно сформированной модели того, как выглядит условие: например, рак больше и острее, чем доброкачественные образования. Программы глубокого обучения, напротив, предназначены для того, чтобы выяснить, какие функции важны сами по себе, обрабатывая огромные объемы данных. Но это также означает, что они могут принять неправильные сигналы. Чанг приводит пример алгоритма глубокого обучения, который изучал разницу между различными типами рентгеновских снимков: руки, ноги, маммография. Но исследователи обнаружили, что программа просто научилась распознавать маммограммы благодаря тому факту, что основное изображение было на стороне пленки, а не в центре (поскольку груди прикреплены к стенке груди, они появляются на краю пленки в виде маммограмма. Руки или ноги, напротив, появятся в центре рентгеновского снимка). Алгоритм не изучал ничего существенного о груди, только об их положении на экране.
«Это очень ранние времена», - говорит Чанг, который указывает, что результаты CheXNet не подвергались экспертной оценке. «Глубокое обучение имеет большой потенциал, но мы, как в медицине, так и в радиологии, как правило, находимся на раннем этапе цикла обмана, но нам требуется больше времени для принятия. Мы научимся правильно его потреблять ».