«Кардиограмма — как отпечаток пальца, но ее нельзя взломать»

Создатели medtech-устройств Mawi — о разработках, исследованиях и защите данных.

Виталий Саган и Артем Бачинский из продуктовой компании Mawi рассказали нам, почему врачи не доверяют Apple Watch, зачем собирать данные африканских детей и как работать с биосигналами человека.

Как устроен R&D в Mawi
 

Виталий: В R&D-отделе сейчас работает 8 человек. В команде есть hardware- и software-специалисты. Еще несколько человек, включая врачей, консультируют нас по разным вопросам (от ИИ до медицины).  

Я руковожу отделом и веду партнерские R&D-проекты. Основной фокус нашей команды в последнее время — получение медицинских сертификаций, в том числе разрешений FDA на наши продукты. 

Артем отвечает за все, что касается machine learning и data science.

О начале проекта и продуктах
 

Виталий: Проект стартовал, когда мы были студентами.

Сначала мы анализировали записи из открытых источников. Например, с портала Physionet, на котором есть много размеченных очищенных биомедицинских данных. Они не всегда близки к реальному миру, но хороши для старта. 

Со временем мы начали использовать данные пациентов партнерских больниц, а также собирать данные на свои устройства. Сейчас у нас есть три девайса — Mawi Band, Mawi Vital и часы Mawi Blood Pressure Watch, которые будут замерять кардиограмму, определять давление и сатурацию, а также обнаруживать аритмию ночью. 

Одна из задач медицинского продукта — пройти сертификацию. Делая такой продукт, нужно с первого дня думать, как его сертифицировать, каким стандартам он будет соответствовать и с точки зрения hardware, и с точки зрения алгоритмов. Наш флагманский продукт, Mawi Vital, уже сертифицирован в Европе. В ближайшие несколько месяцев планируем получить сертификат FDA. 

Наша целевая аудитория сейчас — люди 50+, с избыточным весом и вредными привычками. Они в группе риска по заболеваниям сердца.


Mawi Band

О первом обнаруженном заболевании
 

Виталий: Однажды мы участвовали в проекте по снижению уровня стресса.

Сам проект был устроен так: на человека надевали VR-шлем, он видел перед собой черный туман и должен был громко кричать, чтобы его развеять. Есть теория, что громкий крик помогает бороться с негативными эмоциями. Постфактум — снижается уровень стресса. 

Чтобы подтвердить теорию, мы замеряли по кардиограмме уровень стресса людей до и после крика. В среднем уровень действительно снижался. 

Но примечателен кейс тем, что это был первый случай, когда мы со своим оборудованием действительно обнаружили у человека болезнь сердца. Мы смотрели на кардиограммы и увидели ярко выраженные признаки аритмии, обратились к одному из наших партнеров-врачей, и он подтвердил диагноз. Это было до появления у нас ИИ для определения болезней. 

О кардиограмме как методе идентификации
 

Виталий: Когда мы создавали первый прототип девайса, то много анализировали свои данные, и в процессе обнаружили, что можем на глаз отличить кардиограммы друг друга. У всех людей они разные из-за индивидуальных физиологических особенностей (например, электрической оси сердца). Разобравшись в этом, мы поняли, что кардиограмма — метод идентификации человека. 

Мы обучили алгоритм не только на собственных, но и на данных из датасетов. Потом на базе этого алгоритма и нашего девайса вместе с «ПриватБанком» сделали браслет с платежным модулем. Прикасаешься к нему, и если он тебя распознал, с его помощью можно расплатиться в терминале. Но сейчас мы сфокусировались на медицине.


Mawi Vital

Об анонимизации данных
 

Виталий: Кардиограмма — как отпечаток пальца, только ее нельзя взломать. Медицинские данные содержат много информации о конкретном человеке. C введением политики GDPR в Европе осторожность в работе с данными сильно возросла. 

Может казаться, что если человек использует кардиограмму для платежей, и ее данные попали в руки злоумышленников, они получат доступ к банковским картам. На практике это маловероятно. Но медицинские данные — это персональная информация, и ее нужно защищать. Поэтому мы обезличиваем все данные. 

Есть интересный кейс. В рамках партнерского проекта нашей research-платформы мы предоставляли девайсы для сбора данных людей. Одна половина команды отвечала за сбор данных, вторая — за их анализ, и эти сотрудники находились в разных местах. 

Для обеспечения безопасности данных человек, который их анализирует, не должен знать, чьи они. При этом сборщик данных не может не видеть имя и отчество, потому что, если он хочет провести замеры одного и того же человека 10 раз, ему нужно понимать, кого он меряет. Это решается разными ID для внутренней и внешней среды. Но мы должны иметь возможность сообщить человеку, если увидим признаки заболевания в его данных. Так что люди из лабораторий должны иметь доступ только к обезличенным данным. При этом у них должна быть возможность связаться с конкретным человеком в случае обнаружения болезни. Поэтому нам пришлось создать разные ID, а также сервис, который позволит звонить анонимным испытуемым, у которых обнаружены проблемы, не разглашая их имена. Нам помог сервис Twilio.

Об обучении моделей и подготовке данных
 

Артем: Для обработки ЭКГ отлично подходят методы computer vision. Они даже немного упрощаются, то есть из 2D мы опускаемся в 1D и используем те же сверточные сети. 

Но мы столкнулись с трудностями при переходе к большим датасетам. Когда мы начинали работать, у нас были датасеты по паре гигабайт, а сейчас это сотни гигабайт, и подход к их обработке и обучению моделей на их основе кардинально иной. Теперь мы используем архитектуры сервисов Amazon. Итерации занимают больше времени, а цена ошибки растет. При этом наши алгоритмы только выигрывают от увеличения объемов данных.

Виталий: В процессе работы мы поняли, что не можем просто брать сырой сигнал и сразу определять аритмию. Часто сигнал может быть настолько зашумленным, что фильтровать и пытаться анализировать его нет смысла. 

Так мы пришли к валидации сигнала. Человек проводит замеры и не знает, как отличить хорошую ЭКГ от плохой. Поэтому мы сделали алгоритм, который в режиме реального времени оценивает качество сигнала и сообщает пользователю, что ему нужны дополнительные замеры, чтобы не подавать слишком плохие сигналы на вход алгоритму. Если человек неправильно пользуется устройством, анализировать сигнал смысла нет.

Кроме того, когда мы обучаем алгоритм, то понимаем, что нам нужно разделить данные в датасете на train, test и validation, чтобы не подталкивать модель к переобучению. 

Но если ты работаешь с датасетами человека, то тебе этого недостаточно. Допустим, выборка — 100 человек, и каждого мы замерили по 20 раз, чтобы решить задачу биометрической идентификации. Но если ты работаешь с биосигналами человека, ты должен делить датасеты на подмножества, основываясь на субъектах. То есть все данные одного человека должны попадать в одну группу. 

Артем: Мы не контролируем, что учит алгоритм. Поэтому если твои данные были и в trial, и в test, то он может выучить специфику твоей кардиограммы и потом очень хорошо ее различать. 

Есть математическое объяснение — кардиограммы одного человека схожи (даже разные фрагменты), а сэмплы в trial и в test должны быть независимы. 

Виталий: При этом, если мы соберем данные с разных девайсов, то не факт, что алгоритм, обученный на данных с одного устройства, заработает на другом. 

Поэтому мы сделали матаппарат, который позволяет нам переводить кардиограммы из любого формата в тот, который мы получаем с наших девайсов.

Можно ли избежать ошибок: кейс Apple
 

Виталий: Всем, кто учится на datascience-специальностях, рассказывают про ошибки первого и второго рода, часто — на примере медицинских кейсов. Выглядит логично: самая страшная ошибка — сказать человеку, что болезни нет, если на самом деле она есть. 

Но на практике все сложнее. Яркий пример — Apple Watch. В 4 поколении они добавили себе функцию сбора данных ЭКГ и определение мерцательной аритмии по ним. У часов очень высокая точность, но любая система не может работать правильно в 100% случаев. И система Apple тоже иногда говорит здоровым, что у них мерцательная аритмия. Но проблема в том, что большинство пользователей Apple Watch — молодые люди, которые не находится в группе риска по развитию мерцательной аритмии.  

Этой функцией пользуются десятки миллионов людей. В какой-то момент врачи из Штатов столкнулись с тем, что к ним приходит много людей и говорят: девайс показал мерцательную аритмию. Сложность в том, что она может проявляться очень редко, например, раз в сутки и ночью. Поэтому ее тяжело обнаружить, и для подтверждения диагноза нужен холтер (кардиограф, который человек носит на себе несколько суток). Так что заявившие о признаках мерцательной аритмии в Штатах получают холтер, а в реалиях американской медицины это дорого.

Если даже ложноположительная ошибка составляет всего 0,1%, то в масштабе Apple Watch это сто тысяч диагнозов на сто миллионов замеров. Это мешает часам быть полноценным продуктом в сфере меддиагностики. 

При этом мы не говорим, что девайс плохой. Это челлендж, который стоит перед всеми, кто занимается медициной, в особенности если это превентивная медицина для больших популяций.


Mawi Blood Pressure Watch

Артем: Мы эти риски проработали, и у нас есть несколько решений. Первое — в сфере UX. Не нужно сразу говорить человеку, если вы только один раз задетектили признаки аритмии. Это расстройство, которое опасно в средне- и долгосрочной перспективе (годы). Поэтому можно отложить алерт, чтобы снизить риск ошибки. Второе — сбор метаданных. Мы их собираем на наших датасетах. Но на прочих они часто отсутствуют или неполные (вес, ИМТ, возраст, наличие сопутствующих заболеваний). Эти данные — дополнительные фичи для модели. Они существенно помогают снизить вероятность ошибок первого и второго рода. 

Виталий: Есть и третий способ минимизировать риски — другой алгоритм общения с врачом. Например, можно сделать так, чтобы пациент не видел результаты своего анализа. Кроме того, при первых признаках мы можем сразу попросить пользователя провести дополнительные замеры, чтобы у нас было больше данных. Если у него обнаруживается мерцательная аритмия, информацию получает врач, который и ставит диагноз. 

 Артем: Индустрия пока не на том уровне, чтобы заменить врача. Мы позиционируем свои продукты как оптимизацию работы врачей. Например, анализ кардиограммы: мы смотрим на всю картину, подсвечиваем критические точки, на которые врачу нужно обратить внимание. 

Кардиограмма большую часть времени абсолютно монотонна (в среднем). Просматривать ее глазами сложно. Мы улучшаем процесс сбора кардиограммы и ее обработки. Нужно показывать врачу только ту запись, на которую сработал алерт. 

Об исследовательской платформе Mawi
 

Виталий: Флагманский проект нашей research-платформы — сбор медицинских данных африканских детей от 1 года до 18 лет. Мы занимаемся им вместе с Цюрихским университетом и UNICEF. Для проекта мы адаптировали существующие устройства, чтобы они подходили для замеров данных детей. 

Есть много технических проблем: замеры проходят в сельской местности в центральной Африке, в одной из беднейших стран мира — Малави.

Мы создаем hardware и software для сбора данных, которым занимаются местные специалисты. Поэтому мы ездили туда, чтобы обучить их. Там мало кто говорит по-английски, нужно было проводить замеры в деревне без электричества. Мы собирали данные маленьких детей, многие из которых никогда не видели светлокожих людей и боялись нас. 

Они видели медицинское оборудование, которое тоже их поражало. При этом для правильных замеров кардиограммы нужно быть неподвижным, что не объяснишь маленьким детям. Но в итоге мы справились с трудностями, и пилотный проект прошел успешно. 

Теперь готовится к запуску исследование длительностью 10+ лет, во время которого будут определять возрастные изменения в организмах детей, собирая их сигналы кардиограммы и фотоплетизмограммы (исследование кровотока в сосудах — Ред.). Также в проекте используются датчики для электроэнцефалограммы. 

Ключевая цель исследования в долгосрочной перспективе — определить паттерны взросления: как с возрастом меняются значения различных биопараметров. В краткосрочной — удаленно мониторить состояние этих детей, чтобы обнаруживать их проблемы со здоровьем (личные и популяционные).

Кроме того, проект позволит, например, сравнить одну деревню с другой, по средним показателям понять, чем они отличаются, как условия окружающей среды, экономические условия влияют на здоровье населения. 

О Mawi Pipeline
 

Виталий: Mawi Pipeline — это переходник, который позволяет подключить двоих людей к одному аппарату ИВЛ в случае, если аппаратов не хватает. 

Использование одной трубки для двоих людей — это не самое лучшее решение, а кризисная мера, потому что ИВЛ — крайне сложное оборудование, задача которого, в том числе — контролировать правильный уровень давления в легких пациента. 

Мы протестировали работу устройства вместе с медиками-партнерами. Переходник действительно может подавать кислород двум людям одновременно. Все безопасно и эффективно. Мы на связи со многими больницами, где лечат пациентов с ковидом, и в любой момент можем начать производство Mawi Pipeline на 3D-принтере. Но на практике ни в одной из стран, куда мы отправляли его (включая Украину), пока, к счастью, не было необходимости в применении аппарата.

Ещё
Прогнозы и персонализация.
Эксперты советуют Telegram- и YouTube-каналы, блоги и книги.