Новая модель машинного обучения может помочь чиновникам общественного здравоохранения опередить следующий кризис
Диагностика и сдерживание вспышек заболеваний или последствий для здоровья таких разрушительных событий, как стихийное бедствие, может оказаться огромной задачей. Исследование, опубликованное в пятницу Нью-Йоркским университетом, предполагает, что новая модель машинного обучения может улучшить способность чиновников здравоохранения реагировать на будущие пандемии и другие кризисы общественного здравоохранения.
Исследование проводилось в сотрудничестве с Университетом Карнеги-Меллон и Департаментом здравоохранения и психической гигиены Нью-Йорка.
Кимберли Адамс из Marketplace беседует с Дэниелом Нилом, профессором информатики Нью-Йоркского университета и директором лаборатории «Машинное обучение во благо», опубликовавшей исследование. Он объясняет, как работает эта модель машинного обучения. Ниже приводится отредактированная стенограмма их разговора.
Дэниел Нил: Наш подход использует текстовые данные о посещениях отделений неотложной помощи. В частности, главное, ради чего пациент обратился в отделение неотложной помощи. И эти текстовые данные содержат гораздо более обширную информацию, чем просто «у человека симптомы гриппа». Мы могли бы точно знать, какие у них симптомы или чему они подвергались, и поэтому, выявляя закономерности в этих текстовых данных, мы можем выявлять новые вспышки, вещи, которые общественное здравоохранение еще не искало, а также другие виды события.
Кимберли Адамс:Как можно использовать этот алгоритм в департаменте здравоохранения для выявления новых или неопознанных вспышек заболеваний?
Нил: Есть надежда, что департаменты общественного здравоохранения на самом деле будут применять такой подход ежедневно, при этом каждый день алгоритм будет выявлять кластеры данных за прошлые, скажем, 24 часа, которые общественное здравоохранение могло бы просмотреть и, при необходимости, ответить на. Это также может помочь общественному здравоохранению справиться со всем множеством проблем, с которыми им приходится сталкиваться ежедневно, например, группа случаев возникает в результате вдыхания дыма, или происходит какое-то химическое воздействие, или мы наблюдаем новый кластер передозировок наркотиков из-за какого-то нового синтетического наркотика. Итак, еще раз, цель состоит в том, чтобы дать им повседневную информацию обо всем, что происходит в их юрисдикции.
Адамс:Так может быть, вы сможете обнаружить, я не знаю, вспышку чего-то вроде болезни легионеров раньше, чем в противном случае?
Нил: Да, это верно. Это хороший пример чего-то с редкими симптомами. И вы также можете представить, что что-то сопровождается новыми симптомами, вещами, которых мы никогда раньше не видели, например, у людей из-за этого носы синеют и отпадают. Теперь нам не понадобится очень много подобных случаев, чтобы понять, что у нас есть что-то новое и необычное, с чем должно иметь дело общественное здравоохранение. Но ирония в том, что типичные системы наблюдения за заболеваниями просто сопоставляют их с существующими категориями синдромов и по сути упускают из виду тот факт, что на самом деле здесь есть что-то новое. Итак, мы обеспечиваем систему безопасности, позволяющую улавливать все те события, которые другие системы могут пропустить.
Адамс:Что произойдет, если в данных произойдет ошибка или люди просто не расскажут о своих симптомах?
Нил: Это верно. Это абсолютное ограничение системы, поскольку она зависит от качества данных, доступности и своевременности данных. Так, например, если юрисдикция не получает своевременно данные отделений неотложной помощи из местных больниц, это повлияет на всю их способность реагировать на любые закономерности в этих данных. Аналогичным образом, если в способе сбора данных были допущены серьезные ошибки, они могут распространиться на то, что мы можем обнаружить с помощью этих данных. Кроме того, вы абсолютно правы: вещи, которые могут не привести к посещению отделения неотложной помощи, не обязательно будут обнаружены с помощью этого конкретного источника данных. Однако существует широкий спектр источников данных, которые органы общественного здравоохранения используют для выявления вспышек.
Адамс: Одним из способов тестирования этого алгоритма было изучение данных, поступивших в больницы после урагана «Сэнди». Можете ли вы рассказать мне, что вы видели и как на это отреагировал алгоритм?