Датасеты, мобильные датчики и метеостанции

Как алгоритмы оценивают страховые риски.

Первые компании, которые покрывали риски полисами, появились еще в Древнем Риме. Доступ к данным и способность быстро их обрабатывать превратили страхование в технологическую индустрию. Вместе с кофаундером платформы страхования SPOKK Александрой Гладышевской рассказываем, чем занимается insurtech.

Александра: «Machine learning в страховом бизнесе применяют в основном в двух направлениях. Первый — оценка рисков или андеррайтинг. Это сбор информации об объекте и формирование тарифа. Раньше его делали вручную. Сейчас оценку рассчитывает алгоритм, а человек только вносит данные. В некоторых случаях и это не нужно. Например, в Украине по индивидуальному идентификационному номеру человека можно узнать его возраст, есть ли у него имущество, зарегистрированы ли на него компании. Это открытые данные.

Второе направление — урегулирование убытков. ML применяют, чтобы оптимизировать его и снизить затраты. Самые распространенные кейсы связаны с image recognition. Например, съемка автомобиля на камеру смартфона для техосмотра или создания заявки на выплату».

Несмотря на преимущества и огромные объемы данных, эксперты отмечают консервативность отрасли и медленное внедрение ML.

Води осторожно — плати меньше

Первыми ML начали применять в автостраховании. На рынке появляются инструменты, которые с помощью компьютерного зрения по фото оценивают ущерб от аварий. Одна из таких программ — разработка британской компании Tractable. Ее представители заявляют, что их алгоритмы способны определить повреждения автомобиля на основе нескольких серий фото. Для этого систему обучили на изображениях миллионов поврежденных машин. Картинки сортировали по типу и тяжести ущерба. Чтобы обучить модель видеть малозаметные повреждения, использовали фото с разных ракурсов и с разным уровнем освещенности.

Программа может подсчитывать примерную стоимость ремонта и предоставлять отчет владельцу и страховщику. В марте 2020 года технологию начало использовать британское представительство Ageas, а в октябре — японская компания MS&AD.

Идея Claim Genius — еще одной компании, которая работает в автомобильном insurtech, — сокращение длительности страхового цикла.

Осмотр автомобиля, составление протоколов и анализ ДТП обычно занимают несколько недель. Алгоритмы Claim Genius делают прогноз повреждения по фото и могут оценить ущерб с 90% точностью менее чем за 30 секунд.

Компания создала еще два связанных инструмента, которые также анализируют фото. Первый, Genius Preinspect, сообщает, нужен ли автомобилю осмотр для оформления страховки или продления полиса. Второй, Genius Recycle, — платформа, которая оценивает пригодность автомобиля или его деталей для восстановления либо переработки.

Кроме осмотров автомобилей, стартапы также создают ПО, которое с помощью сенсоров собирает данные о состоянии машины во время движения. Один из таких проектов — TrueMotion. Приложение анализирует информацию о стиле управления водителя, отвлекающие факторы во время езды и сведения об авариях для персонализации тарифов. Компания передает данные страховым, которые предлагают высокую или низкую стоимость полиса на основе предыдущего водительского опыта клиента.

В начале 2020 года стартап TrueMotion выпустил приложение Openroad, которое взаимодействует с датчиками телефонов и отслеживает, попал ли автомобиль в аварию. Гироскоп смартфона отмечает наклон машины в пространстве, барометр — изменения давления (например, при срабатывании подушки безопасности). Приложение фиксирует нетипичные показатели датчиков и предполагает возможные проблемы с автомобилем. В случае таких сигналов (аварии) пользователю позвонит оператор и отправит аварийную службу. Если водитель не смог принять звонок, приложение автоматически вызовет скорую помощь и полицию.

Точный прогноз погоды — точные выплаты

Погодные данные помогают точно оценить убытки в сельском хозяйстве или повреждения недвижимости. Популярная услуга — найм беспилотных летательных аппаратов. SkyWatch предложила их владельцам застраховать полеты. Компания разработала приложение, которое анализирует, насколько безопасным будет путешествие для беспилотника, учитывая погоду, расстояние от дорог, запрещенные зоны, присутствие людей, а также успешность предыдущих маршрутов пилота. Кроме страхования, SkyWatch предоставляет систему отслеживания полета с оповещением о потенциальных угрозах в режиме реального времени.

Другое решение для оценки погодных катаклизмов предложил стартап Understory. Он разрабатывает метеостанции. Погодные мониторы Understory объединяют в сеть, которая передает данные онлайн. Она лучше фиксирует интенсивность дождя или града, чем спутники и аэрофотосъемка. Система анализирует 125 тыс. единиц данных о погоде в секунду. Среди них — угол наклона, сила и количество осадков, скорость ветра, атмосферное давление. Understory создает карту, которая показывает интенсивность дождя или ветра в отдельных частях города.

Метеостанции стартапа сейчас расположены в шести городах США. Кроме страховых компаний, Understory также сотрудничает с властями Соммервилля (Массачусетс) — оповещает городские службы об ураганах и снегопадах.

Daily routine

Аварии или ураганы случаются нечасто. А вот вероятность пролить кофе на ноутбук или разбить телефон — существенно выше. Поэтому ключевая идея некоторых insurtech-стартапов — покрыть повседневные риски. Это микрострахование, но защитить таким образом можно любой предмет.

Приложение Pineapple разработали в ЮАР. Оно использует компьютерное зрение, чтобы оценить предмет, который фотографирует клиент, и автоматически определить стоимость страховки.

В отрасли, связанной с повседневностью, также планирует работать стартап Spokk.

Александра: «Мы запускаем платформу по страхованию домашних животных.

Вы фотографируете питомца, мы подключаем image recognition и больше не спрашиваем, кот это или собака, какой породы, сколько ему лет.

Для распознавания животных мы собираемся использовать API сервисов Amazon Recognition. Некоторые данные нужно будет вводить вручную, но это сокращает время создания заявки.

Когда клиент захочет использовать страховку, он сделает новое фото, а алгоритмы сравнят изображения, проверят подлинность заявки и автоматически начнут обработку. Еще технология будет поддерживать распознавание текста латиницы в документах».

Сейчас проект на стадии MVP. Он будет ориентирован на американский рынок. Бета-версию продукта запустили в начале декабря 2020 года. Разработчики хотят получить как можно больше информации о клиентах и собирают датасет.

Александра: «Когда вы покупаете полис, мы предлагаем скидку за ответы на дополнительные вопросы. Это помогает нам составить портрет потребителя и собрать датасет. На его основе мы можем предположить, насколько вероятно, что клиент принесет убытки».

Основной конкурент компании — американский Lemonade, капитализация которого составляет сейчас $3 млрд. Проект разработал 3 продукта:

AI.Maya — виртуальный помощник, который собирает информацию и обрабатывает платежи.
AI.Jim — бот претензий, обрабатывает 30% заявок самостоятельно или проводит предварительную работу для сотрудников.
CX.AI — бот, который отвечает на вопросы клиентов.

Александра: «Когда вы включаете камеру и рассказываете о происшествии, Lemonade активирует алгоритмы AI, которые помогают бороться с мошенничеством и ускоряют выплату страхового возмещения».

Защита от мошенников

По данным ФБР, сумма страховых махинаций в США превышает $40 млрд. Из-за этого стоимость полисов для каждой американской семьи возрастает в среднем на $400-$700. Технологии способны предотвратить выплаты аферистам.

Attestiv — это набор ML-программ, которые проверяют достоверность фото, видео и текстовых документов. Алгоритм Attestiv помогает обнаружить подделки в файлах (измененные время и место происшествия; наложенные, повторно использованные или отредактированные фото), которые подают в заявках страховым компаниям, чтобы увеличить прибыль.

Некоторые из страховых компаний используют алгоритмы ML для обнаружения мошенничества. Например, турецкая фирма Aksigorta в сотрудничестве с американским аналитическим центром SAS разработала платформу, которая повысила количество обнаруженных фактов мошенничества на 66%, а процент обнаруженных и доказанных махинаций возрос с 2,4% до 6,2%.

Ни один алгоритм не способен анализировать каждую мошенническую схему. Поэтому исследователи применяют гибридные методы. Например, сначала для изучения взаимосвязей в пределах данных используют деревья решений. Для уточнения прогнозов их комбинируют с другими способами обработки данных: методом повышения градиента или случайным лесом.

Значительная часть махинаций связана с медицинскими страховками. Обнаружить аномалии можно, используя закон Бенфорда. Согласно ему, в массиве информации данные чаще всего будут начинаться с цифры 1 (с частотой в 30%), а с цифры 2 — примерно в 17% случаев. Закон работает для сумм платежей и других финансовых показателей. Несоответствие с последовательностью Бенфорда позволяет предположить, что данные неверны.Таким способом, например, пользовался проект по управлению рисками Milliman, проводя исследования для нидерландской страховой компании VGZ.

Также Milliman воспользовалась методом изолирующего леса (isolation forest) для поиска выбросов аномальных данных, которые могут свидетельствовать о нарушениях и махинациях. Компания проанализировала 5 тыс. медицинских работников, а системы определили 50 наиболее подозрительных согласно двум методикам. Прогнозировалось, что уровень мошенничества — 2%, а поэтому лишь один случай будет действительным. Но оказалось, что компания обнаружила 11 настоящих случаев: 2 по закону Бенфорда и 9 — с помощью изолирующего леса. При этом случаи закона Бенфорда были в первой тройке выборки, как наиболее подозрительные. Исследователи предполагают, что закон Бенфорда лучше работает на небольших объемах данных, а лес — в больших выборках.

Автор: Александр Тартачный