Полуавтоматическое извлечение информации о наличии парезов у пациентов в нейрохирургии из историй болезни: исследования с помощью технологий искусственного интеллекта
Аннотация
Выявление нежелательных явлений по данным клинических документов необходимо в рамках ретроспективных клинических исследований и в задачах мониторинга безопасности и экономической эффективности медицинской помощи. Поскольку нежелательные явления, как правило, описываются в медицинских записях в виде свободного текста, для извлечения информации о них из десятков тысяч историй болезни требуются специальные технологии.
ЦЕЛЬ ИССЛЕДОВАНИЯ: оценить качество предложенного нами алгоритма для полуавтоматической идентификации парезов у пациентов с глиальными опухолями на этапе поступления в нейрохирургический стационар.
МАТЕРИАЛЫ И МЕТОДЫ: Для решения данной задачи был применен разработанный нами комплекс технологий с использованием методов искусственного интеллекта (патент RU 2751993C 1). В основе метода лежит отбор специфического для конкретного нежелательного явления лексикона и расшифровка его использования в микроконтекстах. Проанализированы текстовые медицинские записи, первично внесенные врачами с помощью клавиатуры в электронную медицинскую карту «E-med» ФГАУ «НМИЦ нейрохирургии им. ак. Н. Н. Бурденко» Минздрава России в период с 2000 г. по 2017 г.
РЕЗУЛЬТАТЫ. Предложенный нами алгоритм позволил выявить парезы на дооперационном этапе с высоким качеством (чувствительность = 0,947, специфичность = 0,965, точность = 0,961, F1-мера = 0,926, ROC AUC = 0,956 [0,941; 0,969]). За счет оптимизации предложенного нами способа (использования только существительных при скрининге словаря) удалось сократить время на его реализацию c 13 до 6 часов практически без потери качества.
ЗАКЛЮЧЕНИЕ. Методы анализа текстов, написанных на естественном языке, позволяют улучшить качество извлечения информации из медицинских текстов, что, в частности, может быть успешно применено в исследованиях безопасности оказания нейрохирургической помощи.
Ключевые слова
Об авторах
Г. В. ДаниловРоссия
Данилов Глеб Валерьевич
Москва
А. А. Потапов
Россия
Потапов Александр Александрович
Москва
М. А. Шифрин
Россия
Шифрин Михаил Абрамович
Москва
Ю. В. Струнина
Россия
Струнина Юлия Владимировна
Москва
К. В. Котик
Россия
Котик Константин Владимирович
Москва
Т. В. Цуканова
Россия
Цуканова Татьяна Васильевна
Москва
Т. Е. Пронкина
Россия
Пронкина Татьяна Евгеньевна
Москва
Т. А. Ишанкулов
Россия
Ишанкулов Тимур Александрович
Москва
Е. С Макашова
Россия
Макашова Елизавета Сергеевна
Москва
А. В. Косырькова
Россия
Косырькова Александра Вячеславовна
Москва
С. А. Мельченко
Россия
Мельченко Семен Андреевич
Москва
Т. Р. Загидуллин
Россия
Загидуллин Тимур Рустамович
Москва
Список литературы
1. Wang Y, Wang L, Rastegar-Mojarad M, et al. Clinical information extraction applications: a literature review. J Biomed Inform. 2018;77:34–49. doi:10.1016/j.jbi.2017.11.011
2. Danilov G, Shifrin M, Strunina U, Pronkina T, Potapov A. An Information extraction algorithm for detecting adverse events in Neurosurgery Using documents written in a Natural rich-in-Morphology language. Stud Health Technol Inform. 2019;262:194– 197. doi:10.3233/SHTI190051
3. Данилов Г.В., Шифрин М. А., Потапов А. А., et al. Способ извлечения информации из неструктурированных текстов, написанных на естественном языке (патент rU 2751993C 1). Опубликовано в сети 21 июля 2021 г. По состоянию на 27 декабря 2021 г. https://www.fips.ru/registers-doc-view/fips_servlet?dB=rUpaT&docNumber=2751993&TypeFile=html
4. Danilov G, Shifrin M, Strunina Y, et al. Detection of muscle weakness in medical texts using natural language processing. In: Studies in Health Technology and Informatics. Vol 270. IoS press; 2020:163– 167. doi:10.3233/SHTI200143
5. Danilov G, Shifrin M, Strunina Y, et al. Semiautomated approach for muscle weakness detection in clinical texts. In: Studies in Health Technology and Informatics. Vol 272. IoS press; 2020:55–58. doi:10.3233/SHTI200492
6. Young IJB, luz S, lone N. A systematic review of natural language processing for classification tasks in the field of incident reporting and adverse event analysis. Int J Med Inform. 2019;132:103971. doi:10.1016/j.ijmedinf.2019.103971
7. Gaebel J, Kolter T, Arlt F, Denecke K. Extraction of adverse events From Clinical documents To Support decision Making Using Semantic preprocessing. Stud Health Technol Inform. 2015;216:1030.
8. Campillo-gimenez B, Garcelon N, Jarno P, Chapplain JM, Cuggia M. Full-text automated detection of surgical site infections secondary to neurosurgery in rennes, France. Stud Health Technol Inform. 2013;192:572–575.
9. Tvardik N, Kergourlay I, Bittar A, Segond F, Darmoni S, Metzger M-H. Accuracy of using natural language processing methods for identifying healthcare-associated infections. Int J Med Inform. 2018;117:96–102. doi:10.1016/j.ijmedinf.2018.06.002
Рецензия
Для цитирования:
Данилов Г.В., Потапов А.А., Шифрин М.А., Струнина Ю.В., Котик К.В., Цуканова Т.В., Пронкина Т.Е., Ишанкулов Т.А., Макашова Е.С., Косырькова А.В., Мельченко С.А., Загидуллин Т.Р. Полуавтоматическое извлечение информации о наличии парезов у пациентов в нейрохирургии из историй болезни: исследования с помощью технологий искусственного интеллекта. Российский нейрохирургический журнал имени профессора А. Л. Поленова. 2022;14(2):52-55.
For citation:
Danilov G.V., Potapov A.A., Shifrin M.A., Strunina U.V., Kotik K.V., Tsukanova T.V., Pronkina T.E., Ishankulov T.A., Makashova E.S., Kosyrkova A.V., Melchenko S.A., Zagidullin T.R. Semi-automatic information extraction on the presence of paresis in neurosurgical patients from health records: a research using artificial intelligence. Russian Neurosurgical Journal named after Professor A. L. Polenov. 2022;14(2):52-55. (In Russ.)