Хто і як працює з відкритими даними в Україні
Екологія, контроль держзакупівель, боротьба з корупцією та social impact
Десятки українських проєктів у різних сферах — від транспорту до agrotech — застосовують open data, допомагаючи бізнесу і суспільству. Часто за відкриття даних доводиться боротися, а доступну інформацію — обробляти вручну.
Разом із Євгенією Клепою, виконавчою директоркою 1991 Open Data Incubator, Олексієм Іванкіним, засновником сервісу «Опендатабот», і Юрієм Томіним, аналітиком і Compliance Officer проєкту YouControl, розбираємося, як стартапи, держсервіси та соціальні проєкти використовують відкриті дані.
Що таке open data
Відкриті дані — це публічна і безоплатна для застосування інформація у форматі, який дає змогу автоматично її обробляти. Наприклад, інформація з держреєстрів, список чиновників, стан поверхневих вод на території країни, відомості про ЖКГ. Концепція open data робить прозорими дії бізнесу і влади.
Відкриті дані допомагають впоратися з політичними, соціальними, екологічними та економічними проблемами. Наприклад, британський проєкт Check That Bike перевіряє, чи не вкрадений велосипед, виставлений на продаж. Також відкриті дані у світі використовують для вимірювання та контролю викидів вуглекислого газу.

У 2019 році в ЄС ухвалили директиву, що закликає країни відкривати деякі держдані та спрощувати до них доступ.
Принципи роботи з відкритими даними:
- доступність і читабельність;
- дозвіл повторного використання;
- доступ для всіх.
Щоб з ними було легко працювати, набори відкритих даних мають бути уніфікованими.
«Відкритість» України: проблеми з доступом
У 2019 році Україну визнали однією з найбільш «відкритих» країн. Вона посіла 31 місце з 94 у рейтингу Global Open Data Index.
Набори відкритих даних в Україні зібрані на порталі data.gov.ua.
Найпопулярніші:
- відомості про транспортні засоби та їхніх власників;
- реєстр юридичних, фізичних осіб-підприємців;
- реєстр судових рішень за 2019 рік.

Євгенія: «Багато даних в Україні ще закриті. Відкриті ж доступні в таких форматах, які неможливо обробити автоматично. Часто держструктури замість бази даних надсилають пачку pdf-документів.
Щоб змінити ситуацію, opendata-ком’юніті й держава мають співпрацювати. Саме команди стартапів борються за відкриття даних, їхнє оновлення та уніфікацію.
Приклад — чат-бот LvivCityHelper. Він надає львів’янам інформацію про громадський транспорт, обслуговування багатоквартирних будинків, заплановані ремонти. Команда чат-бота вручну обробляє дані, отримані від влади.
На старті роботи команда вручну приводила до машиночитного вигляду з pdf перелік капітальних ремонтів муніципальних об’єктів. Наступне оновлення вийшло в Excel, і структура таблиць відрізнялася. Так часто буває: базу даних доводиться розшифровувати вручну, а оновлення перекреслює роботу».

Олексій: «“Опендатабот” б’ється з державою за відкриття даних. Кожен новий відкритий реєстр — це не тільки перемога для продукту, а й розвиток усієї екосистеми. Цим реєстром потім можуть користуватися журналісти, ГО, активісти, творці інших продуктів».
Проблеми українських відкритих даних — невалідність і розрізненість, відсутність стандартів і єдиного механізму пошуку. Вимоги до структури типових наборів даних і рекомендації до опису метаданих ще не розроблено.

Юрій: «YouControl — сервіс для перевірки контрагентів бізнесу. Він допомагає аналізувати ринки, проводити ділову розвідку і журналістські розслідування.
Нам вкрай важлива інтероперабельність — можливість легко комбінувати дані з різних реєстрів. Але часто в даних у реєстрах різні формати, способи внесення. Зводити їх між собою — складне завдання. Наприклад, замість українських літер “І” та “С” пишуться латинські “І” та “С”, що для людини має однаковий вигляд, але програмою сприймається по-різному. Також різниться написання апострофів.
У реєстрі ЄДР стикаємося з різними форматами написання адреси та старими назвами замість нових (наприклад, “Кіровоград-Кропивницький”). У реєстрі МВС інформація про людей у розшуку публікується російською».
Реєстри оновлюють інформацію з різною періодичністю. Одні — щодня (загублені паспорти, люди в розшуку), інші — раз на місяць із двотижневою затримкою. Записи можуть з’являтися і зникати. Нещодавно команда YouControl виявила, що на порталі зникли дані за 2 роки (з червня 2016 до серпня 2018 року). Посилання на набори є, але за переходу видається помилка.
Проблеми є і зі значеннями даних. В Україні не можна називати юрособи однаково. Але збіги трапляються. Наприклад, у держреєстрі 12 юросіб із назвою «Споживче товариство “Мрія”». Ба більше, існують юрособи з одним кодом, який має бути унікальним ідентифікатором (так, за кодом 34563104 можна знайти дві юрособи).
Постановою Кабміну № 835 зафіксовано принципи політики відкритих даних, визначено перелік даних до публікації. Але в постанові не закріплено відповідальних осіб. Коли з набором даних щось не гаразд — немає до кого звернутися, щоб змінити ситуацію. Серед «проблемних» наборів — ліцензійний реєстр МОЗ, дані земельного держкадастру, реєстр транспортних засобів, реєстр юридичних осіб Мін’юсту.
Open data на практиці
Відкриті дані використовують для створення нових продуктів, карт і рекомендацій, для розв’язання виробничих і бізнес-завдань.
Євгенія: «Популярні напрями opendata-стартапів — транспортні, освітні, юридичні сервіси, антикорупційна діяльність, робота муніципалітетів. Виокремлюють в кластери також agrotech та екосервіси».
Розповідаємо про чотири проєкти в різних сферах.
#1. Соціальний вплив: карта «коронавірусних закупівель»
Під час пандемії держустановам дозволили закуповувати медичні товари в прискореному порядку. Щоб знизити корупційні ризики, у Prozorro створили «Карту коронавірусних закупівель», яка оновлюється в режимі реального часу. Вона охоплює всю Україну і розповідає, на які товари та послуги витратили гроші платників податків. Можна шукати закупівлі за назвою/адресою установи або обирати на карті конкретну організацію. Наприклад, карта показує, що Київська міська дитяча лікарня № 6 закупила засоби для дезінфекції на 6 602 грн.

#2. Екологія: бот для моніторингу якості повітря
Дніпровські активісти запустили перший в Україні Telegram-екобот SaveEcoBot. Він дає інформацію про якість повітря, а також попереджає про небезпечний рівень забруднень. Інтерактивна карта на сайті проєкту показує вимірювання в режимі реального часу.

Джерело: saveecobot.com
#3. Економіка: податкова звітність в «Опендатаботі»
Кожен приватний підприємець має подавати звітність до податкової служби вчасно. Інакше він ризикує отримати штраф або позбутися статусу платника єдиного податку. Крім того, багато ФОПів працюють не за місцем реєстрації, а візит до податкової може бути довгим.
З 2019 року користувачі «Опендатабота» можуть подати звітність через месенджери: Telegram, Viber і Facebook Messenger. Інша корисна фіча сервісу — моніторинг статусу податкового боргу та єдиного податку для ФОПів.

Выбор раздела в Telegram-боте
Олексій: «Бізнес, який стежить за відкритими держданими, може вчасно розпізнати рейдерство, перестати працювати із сумнівними бізнес-партнерами, перевірити персонал, дізнатися про штрафи та санкції.
Відкриті дані можна використовувати по-різному. Наприклад, CRM-системи, банки застосовують «Опендатабот» для поліпшення клієнтського сервісу. Багатьом дані допомагають автоматизувати процеси й уникнути людських помилок».
Так, чат-бот «Райффайзен Банк Аваль» надсилає податкові звіти ФОПів та отримує квитанції з податкової про успішне подання. Крім того, він автоматично нагадує клієнтам подати наступний звіт у потрібний термін.
#4. Політика: скоринг корупційних ризиків Anticorrupt
Громадська організація «Відкрита влада» та проєкт SAPPHIRE розробили інтерактивну дошку для антикорупційних розслідувань.
(Ред. — SAPPHIRE — програмне ядро, яке розпізнає, нормалізує, структурує та об’єднує відкриті дані різних форматів різними мовами в єдину базу даних. Отримана база працює за принципом теорії графів).
Алгоритм розраховує потенційну схильність людини до корупції. Індекс схожості з корупціонерами виводиться за параметрами електронних декларацій та інших документів. Сервіс виявляє патерни й аномалії в даних, знаходить збіги й визначає рівень ризику.

Джерелр: прес-реліз проекта «Відкрита влада»
Розробники сервісу кажуть, що Anticorrupt можна буде застосувати для перевірки кандидатів на посади в бізнесі та держструктурах. У 2019 році сервіс став фіналістом конкурсу стартапів, який проводить 1991 Open Data Incubator, — Open Data Challenge.