Big Data против COVID-19

Как инструменты больших данных помогают в борьбе с пандемией

Масштабы распространения заболевания позволяют компаниям накапливать большие объемы информации. А умная аналитика препятствует распространению инфекции путем внедрения эффективной диагностики и отслеживания режима самоизоляции. При этом нужно дополнительное регулирование для защиты личных данных, считают эксперты.


РЕГИСТРЫ ОТ РОСТЕХА

Наличие адекватной статистики по заболевшим, а, соответственно, необходимость анализа большого количества данных – сегодня первоочередная потребность медиков и смежных специалистов. Объективные цифры позволяют оценить масштаб заболевания и вовремя принять необходимые меры. Так считает гендиректор «БАРС Груп»* Тимур Ахмеров. Он называет Big Data одним из главных помощников в борьбе с эпидемией, который отражает текущее состояние дел практически в режиме реального времени. Эксперт «Ростеха» рассказал RSpectr о создании в Единой государственной системе здравоохранения (ЕГИСЗ) Федерального регистра лиц (ФР), больных COVID-19.

Тимур Ахмеров, «БАРС Груп»:

– Сегодня в регистре работают более 11,5 тыс. пользователей медицинских организаций и ведется учет пациентов с коронавирусной инфекцией и пневмонией. ФР разработан и запущен в промышленную эксплуатацию на платформе BARSUP.JS, а для получения статистической отчетности и работы с большими данными в системе используется аналитическая платформа Alpha BI. Оба решения – собственные разработки «БАРС Груп».

Для Минздрава уже реализовано несколько аналитических панелей, позволяющих производить анализ данных в различных разрезах, и более 23 отчетов. Пять формируются ежедневно, среди них:

  • дайджест заболеваемости,
  • отчет по заболеваемости, в том числе среди медицинских работников,
  • отчет по пациентам и др.

Компанией «БАРС Груп» также разработан региональный регистр COVID-19. Новый модуль в медицинской информационной системе предназначен для мониторинга граждан с подтвержденной коронавирусной инфекцией, а также находящихся под подозрением на заболевание и пребывающих на карантине. Эта система интегрирована с ФР.


ДИАГНОСТИКА ПО КТ, РЕНТГЕНУ, ГАДЖЕТАМ И ИСТОРИЯМ БОЛЕЗНИ

Разрушивший привычки общества коронавирус – хороший кейс для Big Data. Его применение, по словам ведущего специалиста data science Bell Integrator Ивана Прошина, обусловлено: 

  • масштабами распространения заболевания и возможностью накопления больших объемов данных по множеству случаев протекания болезни при различных условиях;
  • значительным потенциалом имеющихся технологий искусственного интеллекта (ИИ) по обобщению больших объемов информации и приобретенным опытом их применения.

Айк Тетевосян, руководитель центра исследования и разработки Cross Technologies:

– С нарастающим темпом распространения COVID-19 остро встает вопрос по своевременному выявлению инфекции. Учитывая повышенную нагрузку на систему здравоохранения, ведется поиск по альтернативным инструментам диагностики и выявления коронавируса. Это и технологии компьютерного зрения, и сверточные нейронные сети, с помощью которых появилась возможность автоматизированной диагностики и выявления COVID-19 по рентгеновским снимкам.

Такая ИИ-система заработала 29 апреля в Москве: она обнаруживает коронавирус именно по данным рентгеновского обследования.

Гендиректор DIS Group Павел Лихницкий напомнил RSpectr, что модели для прогнозирования возможных сценариев пандемии строят аналитики Сбербанка. Банк не только разработал, но и в конце апреля открыл регионам бесплатный доступ к ИИ-модели диагностики инфекции на основе компьютерных томограмм (КТ).

По мнению И. Прошина, для борьбы с COVID-19 эффективно применение носимых устройств. Он рассказал, что с помощью гаджетов, содержащих несколько датчиков (пульсометров, шагомеров, датчиков давления, температуры и др.), можно:

– собирать и накапливать медицинскую информацию,

– проводить мониторинг состояния пациента.

Эксперт Bell Integrator отметил ценность Big Data при изучении истории болезни человека.

Иван Прошин, Bell Integrator:

– Учитывая, что одна из определяющих особенностей при инфицировании коронавирусом – блокирование иммунитета, а, следовательно, и провоцирование (обострение) имеющихся у зараженного заболеваний, важными являются исторические медицинские сведения о пациенте. Поэтому 

наиболее действенная технология применения больших данных в медицине, в том числе и в борьбе с COVID-19, – электронная медицинская карта, объединяющая информацию (диагнозы и принимаемые пациентом лекарства, текущие проблемы со здоровьем, пройденные процедуры, результаты тестов и др.) из множества источников

Александр Жуков, руководитель направления аналитики в здравоохранении SAS Россия/СНГ:

– Инструменты для анализа неструктурированной информации помогут искать скрытые закономерности в историях болезни COVID-19 пациентов, сегментировать их на схожие группы (как по половозрастному признаку, так и по наличию хронических заболеваний, анамнезу и другим влияющим факторам) и персонально подбирать схему терапии или экстренных мероприятий.


ОПЕРАТОРЫ НА СТРАЖЕ

Каждое государство разрабатывает свою систему отслеживания зараженных и потенциальных носителей вируса, рассказала RSpectr гендиректор Института прикладной математики и информатики (ИПМИ) Наталья Полковникова. Она уточнила, что технологически доступны такие варианты:

  • использование видеокамер наружного наблюдения,
  • определение места произведения операций по банковским картам,
  • определение траектории перемещения через сигнал операторов мобильной связи.

Леонид Казаков, руководитель отдела Data Science, «Иннодата»:

– Технология компьютерного зрения (Computer Vision) помогает обрабатывать данные с камер видеонаблюдения, и при помощи распознавания лиц (Face Recognition) удается находить нарушителей карантина или самоизоляции. Помимо этого, Computer Vision выявляет круг тех, с кем контактировал потенциальный заболевший, благодаря чему исполнительные органы могут взять их под наблюдение, направить к ним медицинских работников.

По словам Н. Полковниковой, 

отслеживание перемещений людей с помощью систем видеонаблюдения – не самый эффективный способ, поскольку массовое ношение масок препятствует распознаванию лиц

К тому же не все камеры находятся в рабочем состоянии. Таким образом, отмечает эксперт, основной источник получения информации о гражданах во время пандемии – базы операторов мобильной связи.

Создание системы слежения за теми, кто контактировал с зараженными коронавирусом, было поручено Минкомсвязи еще в конце марта 200 года. Проект функционирует на основе сведений сотовых операторов о геолокации мобильного телефона конкретного человека.

Отслеживание данных мобильных телефонов в период пандемии также легализовано в Германии, отметил И. Прошин.

Л. Казаков уточнил в разговоре с RSpectr, что информация о местонахождении зараженных, полученная с GPS мобильных устройств, обрабатывается как на стороне операторов связи, так и на стороне производителей ПО для смартфонов. Такой кейс есть у «Яндекса»: на основе этих данных выявляется индекс самоизоляции среди граждан, напомнил эксперт компании «Иннодата». Чем выше его значение, тем лучше люди соблюдают карантинный режим, объясняют в IT-холдинге.

О перемещениях своих клиентов с использованием инструментов Big Data узнал и «МегаФон». В конце марта в компании выяснили, что 50% жителей Москвы перестали использовать любой транспорт и исключили пешие перемещения по городу.

Как известно, некоторые операторы предложили законопослушным абонентам «плюшки». Так, Tele2 начисляет гигабайты тем пользователям, которые выполняют рекомендации по борьбе с коронавирусом.


КАК ЗАЩИЩЕНЫ ПЕРСОНАЛЬНЫЕ ДАННЫЕ

У Google и Apple есть собственные трекеры для отслеживания перемещения пользователей смартфонов, напомнила Н. Полковникова. При этом компании объединили усилия при подготовке отчетов, в которых указано, где находятся пользователи.

Сбор сведений о местонахождении пользователей на территории США начал и Facebook.

Все глобальные игроки заявили, что не будут раскрывать персональную информацию, а покажут только анонимные данные, отражающие посещаемость магазинов, аптек, парков и т. д.

То, насколько всеобъемлющим является контроль, зависит от уровня цифровизации государства, говорит Н. Полковникова. В России он ниже, чем в Китае, с которого началось распространение вируса. Но, по мнению эксперта, гораздо важнее, как власти распорядятся собранной информацией.

Наталья Полковникова, ИПМИ:

– История с таким массовым сбором и обработкой персональных данных (ПД) опасна ввиду возможности утечки. Ей можно злоупотреблять как сейчас, в разгар кризисной ситуации, так и позже. У нас нет гарантий того, что системы слежения уйдут в прошлое вместе с вирусом, а не останутся с нами навсегда. Противостоять же этому можно только на законодательном уровне, ограничивая права на обработку и передачу информации, именно на это нацелены разные правовые инициативы по всему миру.

Обработка рентгеновских снимков и сопутствующих ПД должна согласовываться с пациентами, пояснил RSpectr А. Тетевосян. Эксперт отмечает, что 

появляется необходимость разработки дополнительных нормативных документов, регулирующих обеспечение информационной безопасности в интересах соблюдения прав граждан

Иван Прошин, Bell Integrator: 

– Сами технологии Big Data, как и любые другие, не могут нарушать права людей. Важно их использование во благо, а не во вред человеку, что должно регулироваться законодательством. Права граждан не соблюдаются уже при введении карантинных мер. Но еще больше они нарушаются бездействием, когда распространение инфекции исключает само право на жизнь.

Т. Ахмеров уточнил, что на платформе Alpha BI ведется деперсонифицированный учет большого объема информации, что исключает возможность нарушения прав граждан.

Александр Жуков, SAS Россия/СНГ:

– Для аналитической обработки в большинстве случаев работа ведется либо с открытыми данными (статистика заболевших, выздоровевших, умерших и т. п.), либо с обезличенными (истории болезней). Работу ведется с ПД выполняют профильные государственные учреждения, уже располагающие ПД и уполномоченные на работу с ними. Даже если по конкретной истории болезни будет собрано несколько тысяч атрибутов и выявлены десятки влияющих факторов, будет известен пол, возраст, вес и цвет глаз человека и вся история его прививок, идентифицировать его личность все равно нельзя. Законодательные требования соблюдаются.


АНАЛИТИКА ДЛЯ ЭКОНОМИКИ

В апреле 2020 года создана карта технологических решений по борьбе с коронавирусом. Глобальный ресурс в режиме реального времени анализирует мировой опыт по предотвращению распространения COVID-19 и уже включает более 500 инноваций.

Так, компания SAS участвует сразу в нескольких проектах, рассказал RSpectr руководитель направления аналитики в здравоохранении SAS Россия/СНГ Александр Жуков.

Александр Жуков, SAS Россия/СНГ:

Инструменты по анализу больших данных, ИИ и другие технологии применяются в борьбе с пандемией для разных классов задач:

1. Прогнозирование на ближайшую перспективу, что дает возможность превентивно принять необходимые меры, например, ужесточить или ослабить социальное дистанцирование, изменить правила посещения магазинов и т. п.

(Ред.: С помощью кейса «Яндекс.Карт» можно узнать, много ли человек стоит в очереди в супермаркете: это поможет в соблюдении социальной дистанции.)

2. Оценка готовности системы здравоохранения к лечению пациентов: наличие средств индивидуальной защиты, достаточное количество коек в отделениях интенсивной терапии, ИВЛ и других необходимых ресурсов (совместные проекты SAS и клиник проходят в Италии, Германии и США).

(Ред.: Такие задачи реализует и информационная система для автоматизации деятельности региональных оперативных штабов по борьбе с коронавирусом – она развернута в Воронежской области, сообщили в пресс-службе «Ростеха».)

П. Лихницкий добавил, что с помощью методов сбора и интеграции данных (предоставляемых, например, Informatica, Oracle, IBM и прочими) в совокупности с аналитическими инструментами (Sisense, Tableau, Qlik и др.) в лечебных учреждениях по всему миру автоматизируются и другие рутинные задачи, например, в части:

  • оптимизации цепочки поставок средств защиты,
  • эффективного распределения рабочих смен среди персонала.

3. Понимание правительством экономической ситуации и возможных сценариев скорейшего выхода из кризиса, сравнение моделей реагирования (симуляций) и возможных результатов, моделирование тарифных политик, в том числе ОМС и социальных.

(Ред.: В пресс-службе «Ростеха» отметили опытную эксплуатацию созданной в «Росэлектронике» информационно-аналитической системы, которая помогает управлять регионом в условиях кризиса.)

4. Поддержание непрерывности работы жизненно важных отраслей, к которым, помимо здравоохранения и фармацевтики, относятся отрасли пищевой промышленности, энергетики, логистики и многие другие, для которых инструменты по оптимизации и прогнозированию зачастую имеют критическую важность (например, более тщательная оценка изменений в структуре спроса, планировании запасов и доставке продуктов в ритейле).

*дочерняя компания Национального центра информатизации госкорпорации «Ростех»

Изображение: RSpectr, Freepik.com

ЕЩЕ ПО ТЕМЕ:

Как вирус подгоняет онлайн-экономику
Пандемия ускорила процессы цифровизации в бизнесе