Селфи, миграция, экспорт: как и зачем визуализируют данные

Селфи, миграция, экспорт: как и зачем визуализируют данные

Кейсы и инструменты.

Визуализация помогает видеть инсайты и паттерны в данных. Как пишет исследователь Майкл Френдли, визуализировать данные пытались еще в X веке. Тогда анонимный автор графически отобразил изменения положения небесных тел в пространстве и времени. 

Сейчас люди анализируют самые разные данные — от политических рейтингов до количества деревьев в городе. Составляют графики, таблицы, диаграммы, карты, инфографики и дашборды. 

Рассказываем о ярких примерах визуализации и инструментах для ее создания. 

6 кейсов визуализации
 

#1. Глобальное потепление

Чтобы привлечь внимание к проблемам окружающей среды, британский профессор Эд Хокинс создает визуализации климатических изменений. Самый известный его проект — #ShowYourStripes. Он отражает колебания температур во всем мире, на континентах и в разных странах. Тенденция — потепление. 

На сайте проекта можно выбрать регион и получить его тепловую (в прямом смысле) карту по годам. Темно-синие года — самые холодные. Ярко-красные — самые жаркие. Вот так, например, выглядят температурные колебания Украины с 1901 по 2019 год:

Источник: Ed Hawkins

Другая динамическая графика Хокинса показывает, как нагревалась планета год от года — с 1850-го по 2017-й. Этот график использовали даже на церемонии открытия Олимпиады в Рио. 

Источник: Ed Hawkins

#2. Интерактивный экономический атлас 

Правительства публикуют отчеты в неудобных для изучения форматах. Поэтому Harvard’s Growth Lab и Центр международного развития создали интерактивный экономический атлас. Он в динамике рассказывает, что страны импортируют и экспортируют, как развиваются торговые отношения, что влияет на рост экспорта, каковы перспективы роста ВВП разных стран, какие отрасли экономики могут появиться, а какие — исчезнуть.

Атлас используют инвесторы, предприниматели, ученые и журналисты.

Источник: Atlas of Economic Complexity

Экспорт Австралии за 2018 год / The Atlas of Economic Complexity

#3. Тренды селфи

Selfiecity — это совместный проект The Graduate Center, Городского университета Нью-Йорка, Калифорнийского института телекоммуникаций и информационных технологий и Фонда Эндрю У. Меллона.

Selfiecity анализирует селфи как транснациональный феномен. Создатели обработали более 120 000 селфи, чтобы понять, как люди в разных странах фотографируют себя. Проект отображает тенденции позирования, тренды селфи по городам, частоту улыбок среди половозрастных групп. Так, жительницы Сан-Паулу сильнее наклоняют голову, чем остальные пользователи, а на фото из Бангкока все улыбаются.

#4. Демография США 

Анимированная пирамида проекта The Next US показывает, как менялось соотношение женщин и мужчин в Штатах с 1950 года до наших дней. На графике видно, что после бэби-бума рождаемость снижается, а продолжительность жизни растет. За 60 лет пирамида превращается в прямоугольник. Визуализация прогнозирует, как изменится демографическая ситуация в США к 2060 году.

Источник: pewresearch

#5. География прав человека

Графический дизайнер Федерика Фрагапане создает инфографику на социально значимые темы. Эта визуализация Федерики показывает, как изменялся индекс защиты прав человека с 1950 по 2014 года в 50 странах мира. На инфографике страны отсортированы горизонтально — по ВВП на душу населения, вертикально — по количеству населения. Данные для визуализации взяты из открытых источников: data.worldbank.org и ourworldindata.org. Рассмотреть графику в деталях можно в портфолио Фредерики на Behance

Источник: Behance

#6. Мировой импорт и экспорт

Проект Global Commodities показывает, как менялся импорт и экспорт за последние десять лет. Визуализацию создала команда аналитического портала DailyFX.com. На интерактивной панели пользователь может выбрать тип товаров, год и географию, и интерактивная графика покажет изменения.

Источник: dailyfx

Где и как визуализировать данные
 

Основные языки, на которых создают визуализации, — R и Python. R — статистический язык. Он подходит для разработки аналитических моделей в графическом режиме. RStudio — самая популярная платформа для разработки на R и документирования проектов. Ggplot2 — основной пакет генерации графики в R. Python поддерживает разные библиотеки для дата-визуализации. Среди них — Matplotlib, Seaborn, Ggplot, Bokeh, Dash.

Делать визуализации можно с помощью библиотек и инструментов. Например:

Это аналитическая платформа от Microsoft. У Power BI есть версия для ПК (Power BI Desktop) и онлайн-версия (Power BI Service).

Сервис может обрабатывать данные из самых разных источников. Например, файлов (XLS, CSV, XML, JSON), баз данных (SQL Server, Access, SQL Server Analysis Service, Oracle, IBM DB2, MySQL), сервисов (Facebook, Google Analytics, Salesforce, GitHub, MailChimp, Marketo, Stripe).

Источник: Power BI

В программе можно создавать графики, диаграммы, дашборды и карты без программирования. Она совместима с Excel, SQL, SAP, Amazon. Альтернативы Tableau — Qlik и Chartio. 

Источник: Tableau

Это библиотека с открытым исходным кодом на Python. Ее используют для создания графических веб-приложений. Библиотека Dash полностью открыта и имеет лицензию использования MIT. Хотя фреймворк оптимизирован под Python, он также поддерживает библиотеки R, Shiny и Javascript для генерации дашбордов.

Dash-приложение, которое отображает пользовательскую мета-информацию при наведении курсора на точки / Medium

Это графическая библиотека javascript, поддерживающая языки разметки XML и JSON для рендеринга интерактивных графиков, датчиков и карт. Библиотека поддерживает серверные оболочки для PHP, Ruby on Rails, ASP.NET и клиентских плагинов jQuery, ReactJS и AngularJS. FusionCharts базируется на основе технологии Flash, поэтому полученная графика легко встраивается в презентации и веб-страницы.

Ещё статьи
Как системы работают с высокими нагрузками.
Зачем нужны библиотеки для векторизации.