Визуализация данных: классификация
Материал о визуализации данных подготовлен для Эксперимент.ру Юрием Ветровым, руководителем UI Modeling Company, которая занимается проектированием пользовательских интерфейсов. В общих чертах Юрий рассказывает о набирающих в последнее время популярность дизайнерских методиках — визуализации и инфографике, о сферах их применения и классификации, процессе создания, инструментах и примерах из практики.
Тема визуализации информации и инфографики регулярно всплывает при работе, да и в целом интересна как практика проектирования и дизайна. Хотя мы в компании работаем над веб-системами, где большинство задач решается стандартными средствами конструирования вроде форм или информационных блоков, иногда требуется емко и компактно подать большое количество информации. Часто это достаточно специфичные задачи, на продумывание интерфейса которых уходит немало времени. Правда, и задачи эти — одни из самых интересных.
У практики отображения информации в графическом виде много синонимов, но в последнее время чаще всего используются два: визуализация данных и инфографика. Существуют эти подходы уже достаточно давно, литературы по этому поводу написано много (среди наиболее известных авторов и дизайнеров: Edward Tufte, Stephen Few, Ben Fry), но в первую очередь интересно, где и как используется инфографика.
Применение
Сейчас существует множество интересных примеров визуализации, но многие из них — скорее объекты искусства, чем практически полезные носители информации. И для тех, и для других можно выделить следующие области использования:
Статистика и отчеты
Самодостаточный жанр, когда данные за некий период времени показываются вместе. Например, статической картинкой в приложении к отчету или настраиваемым графиком в сервисе статистики, с возможностью изменения параметров его отображения.
Справочная информация
Дополнение к основному тексту, наглядно иллюстрирующее его упоминаемыми данными. Скажем, дать общее представление о динамике одного из показателей, либо отобразить какой-то процесс и его этапы; может быть — показать структуру некого явления.
Интерактивные сервисы
Продукты и проекты, в которых инфографика является частью функциональности. Так, в качестве средства навигации по сервисам со сложным workflow может выступать диаграмма процесса. Почти все, что связано с работой с картами и вовсе редко обходится без смешения инфографики и интерактивности, не говоря уже о специализированных системах вроде диспетчерских и большей части компьютерных игр.
Иллюстрации
Не совсем чистый жанр — скорее, использование практик и подходов красивого отображения данных для создания самостоятельных иллюстраций. Они несут некий смысл, но это не основная их задача — основной ценностью является качество исполнения.
Эксперименты и искусство
Визуализация данных без особого практического смысла, скорее в качестве экспериментов или инсталляций. Чаще всего это сложные и громоздкие изображения, которые сложно «прочитать» бегло — объем данных и взаимосвязей между ними таков, что нужно разбираться с картинкой по частям; либо просто абстрактные изображения, автоматически сгенерированные. В последнее время направление все более популярно и периодически выходит за рамки компьютерной графики — например, в виде графиков-скульптур.
Показать полные версии всех изображений (внимание! более 9 мегабайт)
Классификация
Набор инструментов визуализации достаточно обширен — от простейших линейных графиков до сложных отображений множества связей. Разбить их можно на несколько типов:
Графики
Показывают зависимость данных друг от друга. Строятся по осям X и Y, хотя могут быть и трехмерными.
Линейный график (line chart, area chart)
Наиболее распространенный случай. Объединяет линией набор точек, соответствующих значениям по осям. Например, ежедневная посещаемость сайта за месяц. Может показывать сразу несколько наборов данных — например, статистику просмотров для 3 наиболее популярных страниц.
График рассеивания (scatterplot)
Показывает распределение ограниченного набора точек, соответствующих значениям по осям. Между точек часто рисуется выравнивающая кривая — она наглядно показывает закономерности среди значений. Например, связь между стажем работы и производительностью труда среди 50 сотрудников компании (просто соединить полученные точки в виде линейного графика нельзя — и смысл искажается, и линия будет дерганой).
Примеры: © Statcon
Диаграммы сравнения
Показывают соотношения набора данных. Во многих случаях строятся вокруг осей, хотя и необязательно.
Столбиковая диаграмма (bar chart)
Показывает один или несколько наборов данных, сравнивая их между собой. Существует два варианта отображения в случае нескольких наборов: либо в виде нескольких стоящих рядом столбиков, либо в виде одного, но поделенного внутри в соответствии с долями значений. Например, ежегодная прибыль трёх компаний за последние 5 лет или их доли рынка за это же время.
Гистограмма (histogram)
Показывает распределение набора данных внутри выборки в виде столбиков. Например, количество сотрудников компании в нескольких возрастных группах.
Круговая диаграмма (pie chart)
Отображает процент, занимаемый каждым значением внутри набора данных, в виде разбитого на части круга. Например, доли рынка сотовых операторов. Может отображать сразу несколько наборов данных — в этом случае диаграммы наложены друг на друга, причем каждая из них меньше предыдущей. Например, доли рынка сотовых операторов за последение 3 года.
Площадная диаграмма (bubble chart)
Смесь графика и диаграммы — по двум осям расставлен набор точек, соответствующий значениям. При этом сами точки не соединены и имеют различную величину, которая задается третьим параметром. Например, сравнение количества купленных товаров, общей стоимости покупки и величины общего бюджета покупателя.
Кольцевая диаграмма (ring chart)
Показывает процент от максимального количества, которое занимает одно из значений в наборе данных, в виде частично закрашенного кольца. Например, количество завоеванных на чемпионате медалей относительно максимального. Часто используется сразу несколько таких диаграмм, сравнивающих разные значения.
Диаграмма разброса (span chart)
Показывает минимальную и максимальную величину значений внутри набора данных в виде урезанной столбиковой диаграммы. Начало столбика лежит не на горизонтальной оси, а в точке минимального значения по вертикали. Например, разброс стоимости квадратного метра жилья в разных районах города.
Пример: © Potsdam University of Applied Sciences
Лепестковая диаграмма (radar chart)
Сравнивает величины нескольких значений, каждая из которых соответствует точке на оси. Количество осей соответствует количеству значений, а точки объединены линями. Например, сравнение рентабельности каждого из 8 направлений деятельности компании.
Облако тегов (tag cloud)
Сравнивает ключевые слова или фразы (значения), содержащиеся внутри фрагмента текста (набора данных), задавая каждому из них свой размер шрифта. Размер шрифта зависит от величины параметра. Например, 25 самых часто упоминаемых в газетах слов за декабрь 2008 года.
Тепловая диаграмма (heat map)
Сравнивает значения внутри набора данных, закрашивая их одним из цветов в заранее выбранном спектре. Основой является изображение или другая диаграмма, на которой расставлены значения. Цвет зависит от величины параметра и чаще всего накладывается в виде пятен. Например, элементы главной страницы сайта, по которым пользователи кликают чаще всего.
Деревья и структурные диаграммы
Показывают структуру набора данных и взаимосвязи между его элементами.
Дерево (tree)
Показывает иерархию набора данных, в которой элементы являются родительскими или дочерними по отношению друг к другу. Выстраивается в виде соединенных линиями узлов, как правило, сверху вниз. Узел обычно отображается кругом или прямоугольником. Например, карта сайта.
Ментальная карта (mind map)
Показывает состав и структуру явления или понятия в виде дерева, в котором каждый узел имеет один или несколько дочерних элементов. Это частный случай дерева, с той разницей, что ветви расходятся из узла, расположенного в центре изображения. Например, конспект книги по управлению проектами, который отражает ее содержание и основные понятия.
Формализованные структурные диаграммы
Показывают состав и структуру системы или ее части в виде карточек, которые описаны с разной степенью детализации и связаны друг с другом как родительские и дочерние.
Отображается в стандартизованном виде — например, с помощью UML (Unified Modeling Language) или IDEFIX (Integration Definition for Information Modeling). Например, все сущности, необходимые для работы одного из модулей программной системы.
Диаграмма Венна-Эйлера (Venn/Euler diagram)
Показывает отношения между значениями набора данных в виде накладывающихся друг на друга кругов (чаще всего трёх). Область, в которой пересекаются все круги, показывает общее между ними. Например, пересечением соблюдения сроков, бюджета и поставленных задач является успех проекта.
Плоское дерево (tree map)
Показывает иерархию набора данных, в которой элементы являются родительскими или дочерними по отношению друг к другу. Отображается в виде набора вложенных прямоугольников, каждый из которых является ветвью дерева, а находящиеся внутри него — дочерними элементами и ветвями. Прямоугольники различаются по размеру в зависимости от параметра и имеют цвет, который задается другим параметром. Например, детальная структура бюджета компании, в котором цветом показан процент изменения каждого пункта по сравнению с предыдущим годом.



































Ура! Прекрасный материал — дико полезный. Ждем вторую часть!
Очень интересно, читал с пеной у рта. Найдутся ли исхдники покрупнее?
Всё, разобрался :)
@deapoj все картинки кликабельны, размер их в большинстве случаев оригинальный
Да, я уже понял. Спасибо.
Спасибо! Действительно интересное и ёмкое обощение. И здесь сразу хочется поделиться ссылками на такие инструменты как many eyes или wordle.net/, например. Уверен, что не все с ними знакомы. При этом достаточно удобно и увлекательно можно испробовать некоторые методы визуализации. Лично меня завораживает.
Совсем недвано что-то запустил и Google.
А какие подобные сервисы знаете вы?
Удивительно, что нет ни слова о ”Визуальной статистике» Отто Нойрата. (ISOTYPE)
Нежелание делиться профессиональными секретами?:)
http://www.fulltable.com/iso/
спасибо! исчерпывающе!
дам ссылку на своем блоге http://www.infographer.ru
А почему в разделе «Географические карты» иллюстрация «мира» дана в виде календаря? Может, я чего и не понимаю, никто не заметил, может, так и надо?
@ValP: затесался лишний блок. поправили, спасибо!
С удовольствием познакомился с этим материалом.
Хотел бы еще заметить следующее: очень сложно рисовать процессы. Несмотря на то, что вроде бы их можно изображать линиями-стрелочками, все равно, мы теряем содержание и смысл процессов. Показывая, откуда и куда, через какие пункты, мы лишь абстрагируем дорогу/путь/маршрут. И всё!
А есть возможность подтягивать суть процесов, если мы ухватываем ее по типу последовательных кадров кино.
Чего еще здесь нет — нет специфической методологической «живописи». Там есть масса интересных типов рисования и ситуаций, и пространств, и конфликтов… Лично я с этим справляюсь и в простом Word’e. Но конечно, людей нужно учить всей этой графикации. Все это — настоящая профессиональная культура!
Иллюстрация с долларом я делал для журнала «Популярные финансы», непонятно откуда возник журнал «Все Ясно»
@chatsky Поправим, спасибо!
Подскажите, какая программа наиболее популярна для создания диаграмм в таких редакциях, как Секрет фирмы или Эксперт?
Некорректный вопрос. Главный инструмент это такой преобразователь внутри своей головы который все непонятное превращает в понятное. а какой программой фиксировать это, хоть флешем, хоть экселем
Спасибо за хорошую статью. Не так уж много пишут по-русски про визуализацию данных и инфографику. По этой статье хотя бы узнал, как называются типы представления данных. Кстати, если здесь есть единомышленники, то возможно заинтересуют темы визуализации — http://asjudc.com/tag/visualization/. Я упоминаю софт, который можно использовать для создания визуализации, а также околовизуализационные темы. Было бы приятно обсудить и найти отлкик.
Удобный инструмент для создания диаграмм Сэнки в рамках Excel — http://www.sankey-diagrams.com/sankeyturtle/
A Tour through the Visualization Zoo
A survey of powerful visualization techniques, from the obvious to the obscure
Вот примеры особой графикации из отсутствующего здесь типа — методологические схемы:
Принципиальная схема организационо-деятельностной игры “Харьков-2020. Культурная столица»
http://vkontakte.ru/photo22875882_157562656
Концепция миропорядка для организации понимания университетской автономии
http://vkontakte.ru/photo22875882_157562656#photo/22875882_158567307
По нижеприведенной ссылке можно ознакомиться с культурой методологической графикации/схематизации: http://www.fondgp.ru/lib/conferences
Вопрос, а как по-русски назвать wave graph, которые строит Last.fm Extra Stats — http://www.lastfm.ru/forum/5/_/328901/1 График волны? Косноязычно.
«как по-русски назвать wave graph»
Этот стиль определенно может именоваться «волновая графика».
Если бы уже многие десятилетия не был закреплен термин «граф» за известными представлениями (и в математике, и в организационно-управленческих дисциплинах), можно было бы и такие картинки именовать «графами». Так что этот термин — отбрасываем.
Я думаю, что вполне можно попробовать такой перевод названия, как «волновой портрет».
По русски , то что у них на сайте называется волнообразный график, весьма распространенная форма подачи данных. Господа, не занимайтесь пожалуйста вольным переводом, уже достаточно всякого безобразия наподобие «ресечеров» и ”брендирования автотранспорта», откройте СНИП и посмотрите, как такой тип графика называется или спросите у образованных дизайнеров:)
ValP и Nika Tsesevichene спасибо. Для своей заметки буду использовать термин «волнообразный график». ValP и Nika Tsesevichene, а с вами можно пообщаться кроме как через комментарии? Может поделитесь e-mail или чиркните мне на piccardenator СОБАЧАТИНА gmail ТОЧКА com? Хотелось бы поговорить об информационном дизайне со знающими людьми.
а зачем с такой злобой? знаете какие-то стандарты, так просто приведите цитату со ссылкой, тем более, что я отвечал конкретному человеку на конкретный и так, как счел нужным (имею право!), и я заведомо не предполагаю хамства НИ ОТ КОГО БЫ ТО НИ БЫЛО, хоть от самых образованных инфо-дизайнеров
Уважаемый Эсъюдс, я не являюсь дизайнером, я занимаюсь методологической и управленческой схематизацией. Так как я понимаю, это совершенно НЕ ГРАФИК. А Вы конечно же делайте так, как Вам удобно. Свое мнение я уже высказал. Можете писать мне на (если воспроизведется)
valp_ros@mail.ru
по инфографике ещё можно вот блог почитать http://infoanalyze.blogspot.com/
есть ещё vmestoslov.info тоже хороший
Юрий Ветров или читатели, подскажите пожалуйста. Есть такое понятие Stream Graph — http://www.leebyron.com/else/streamgraph/ — как его правильно называть по-русски? И может быть кому встречалось подробное описание подобного вида визуализации. На русском языке. Если уж никто не ответит, то придется браться за словарь и заниматься переводом.