数字化之道高维数据可视化

白癜风能全愈吗 http://news.39.net/bjzkhbzy/180529/6288655.html

导读:在这信息大爆炸及数字化转型的当下,高效的梳理数据并快速的传递或发现有效信息已越来越迫切。小编将带你化繁为简,一窥高维数据可视化之道,圆你数据图表天才之梦…

引言

高维数据可视化就是用有效的图形及交互设计来表现高维度(多维)的数据。在我们日常应用中经常会遇到一些高维度数据,例如:时间、产品、品牌、型号、地区、部门、级别…每个维度又可按不同粒度划分多个层次,这增加了我们从数据中发现信息的难度。人们通常很难快速的理解四维以上的数据,然而通过一些经典的可视化的方法(套路),人们能够直观的理解数据,并通过直觉来快速传递有效信息,这些方法已成为处理高维数据行之有效的手段。

普通可视化

零维没有空间,没有时间,没有物质,即点。一维只有长度、没有宽度和厚度,即线。二维既有长度也有宽度,但没有厚度,即面。三维有长度、宽度、厚度,即体。

在日常可视化图表中,一维通过柱状、饼图表达,二维通过平面坐标系表示,三维使用空间坐标系表达,人类视觉很难超出三维空间。

那么多维数据怎样在三维空间/二维平面表达呢?

高维可视化

在高级分析中,我们通常会用到降维,将高维数据投影到低维空间,尽量保留高维空间中原有的特性和聚类关系。主成分分析(PCA)、多维尺度分析(MDS)、自组织图(SOM)等都属于降维方法。但降维(高维投影)只能提供宏观结构,损失了细节数据,今天我们要讨论的是非降维方法,讨论怎样展示数据在每个维度上的所有数据。

增加视觉通道

我们可以通过增加视觉通道的方式来表示更多的维度,例如标记的位置、大小、形状、方向、色调、饱和度、亮度等。

但人眼能同时处理的视觉通道只有5~7种。

多视图组合联动

我们可以将多个可视化图形,按照合理的布局组合。其中每个图形表示不同的几个维度,通过多个图形之间的选择关联,来组合分析更多的维度。

但缺点是单个视图都只能展示局部数据,无法直观显示数据的整体。

超高维可视化

在信息可视化中,实际应用的数据往往具有很高的维度。当维度和数据量增多,又需要无损的精确呈现时,散点图矩阵(ScatterplotMatrix)和平行坐标法(ParallelCoordinates)这种更具伸缩性(Scalability)的高维可视化方法就显得更加合适。

散点矩阵图

通过两两维度间散点图按照矩阵形式排列而成。每个散点图都表现出两个维度间的相关性及聚类情况。

但它不能显示各个数据在多个维度上的协同关系,且需要显示空间的面积正比于维度数目的平方。

平行坐标图

将高维数据的各个变量维度用一系列相互平行的坐标轴来表示,变量值对应轴上的位置。将描述不同变量维度的同一数据对应各点连接成折线,代表一个数据的一条折线在平行的坐标轴上的投影就反映了变化趋势和各个变量维度间的相互关系。

需要的显示面积仅正比于维度的数目。但两个维度之间关系的表现不如散点图清楚,且更易受堆叠影响。

其它变种如桑基图(Sankey)、雷达图星状图等。

除了这种理论上的常用方式,还有很多高维可视化的方法,例如树图(TreeMap)、切尔诺夫脸谱图(ChernoffFaces)、交互可视化等。小编温馨提醒,在你做各种高维可视化图形的时候,不要忘了还有一个终极利器“表格”及表格变种。由于篇幅所限,我们这里就不做详细介绍,感兴趣的读者可以参考相应文献。

让我们在高维可视化的基础上,一起领略数字化世界的力量与美丽吧。

往期回顾

数字看奥运

IP地理数据可视化

数字奥运解析

里约奥运会热点集锦

数字看气温

Tableau与R集成,打通可视化分析的任督二脉

你真的会用Tableau地图吗?10项小技巧让地图更加酷炫记忆·科技之争从商务智能到人工智能还有多远,BI+AI=?HowfarawayfromBItoAI,BI+AI=?那些无与伦比的数据之美让你不得不爱的那些屌爆炸了的——可视化技术可视化技术三板斧,让你做出最炫酷的数据分析报告身处大数据时代,我们应该了解数据可视化扭曲的图形表——那些藏在角落的坑                


转载请注明:http://www.xolkj.com/bjff/8870.html

  • 上一篇文章:
  • 下一篇文章: 没有了