在这个被大数据环抱的时代,数据的价值被不断强调,因此作为解开数据“封印之力”的数据可视化也逐渐升温。
数据可视化是数据探索以及数据表现的重要方式,也是很多网站项目的必备功能。虽然数据呈现的方式多种多样,但数据可视化的根本目的在于高效利用数据,所以我们要将数据转换为更便于理解的图形和可视化形象,从中获取需要的洞察。
大部分数据可视化教程,都会让你从原始数据集开始。而实际上,当你处理数据时,80%的时间都要用来搜索、获取、载入、清洗、转换等。
当然,你也可以选择利用自动化工具来完成。但是,当你需要处理多个数据集时,就需要人工协助了,因此,你需要留出足够时间处理数据。例如,如果你想把公司内部使用的销售类型与竞争对手进行比对,或者检查输入错误时,就只能靠手工来处理了。
先尝试柱状图或线状图,如果这些方式不能表现你的数据再考虑其他图。
和柱状图相比,气泡图可以在同样的空间展现更多数据,饼图可以更清晰地表现整体和局部的关系,树状图能够更好地表现分层的结构,用简单的散点图或直方图来发现一些超正常范围的错误数据。然而,柱状图在单一维度上可视化一个可量化的数据集是最简单明了的。
时间序列最好表现为线状图, 而散点图一般用来表现两个线性度量的相关性。而柱状图对于进行数据比较的可视化来说是最佳方式。
“柱状图优先”揭示了一个真理——最酷的可视化往往用处反而最小。追求新奇以及美观的可视化往往增加了比较的难度,甚至会扭曲数据,导致用户得出错误的结论。如,比较面积,角度,色彩或者透明度等。
3、真实数据不可替代
当公司各个部门都有各自的数据库,而你又需要把不同部门的数据进行可视化时,你的第一想法可能是抓一些Demo的数据来进行可视化,并且你的可视化库里可能就有一些标准的样本数据。
然而,真实数据是不可替代的。Demo数据一般遵循正态分布而且数据量有限。过度依赖Demo数据可能会满足不了真实数据的数据分析或数据表现需求。
那么,当你在设计基于多个数据集的可视化时,可以遵循以下规则:
如果你无法访问整个数据集,不妨试试从真实数据集中随机取些样本数据
保留无效或缺失数据,如果你在可视化前不准备清洗数据集,那么也不要清洗样本数据
当真实数据集过大时,在生成可视化图前,你可以等比例调整样本数据规模
首先来看一张图:
如上图,水平排列数据标识看不清,旋转90度又浪费空间。因此,你需要在设计可视化时留出添加标识的空间,而注释或者横轴纵轴通常都是在初始可视化后才考虑的。
要保证横纵轴上的标识不相互覆盖而且可读,必要时,可以将标识进行旋转来增加可读性。如果有一块空间标识过于集中,而这些标识又要可读,则可以让考虑让标识离它们所指的元素远一些,然后用连接线连接标识和元素。另外,你也可以把标识整合成一个组,用标识工具提示的方式来进行可视化。
类似的,对图的注释也需要事先计划好。除了在可视化中保留空白区域添加注释外,你也可以把注释做成可拖拽形式,这样用户可以把注释移开来看注释遮盖的部分。
总之,数据标识在图形设计中可能不是最主要的,但它却是非常重要的:
在设计时留好数据标识、数据轴及注释空间
对数据标识定义最大字符数,超出部分通过缩写或删减文字等方式处理
把相近的标识组合在一起, 在用户点到时再显示
对长注释,采取滚动或展开的方式
动画是一种连接数据和变化趋势的非常有用的工具,但在加动画之前,你需要对它进行评估。为了提高用户理解,动画设计有几大原则:
动画尽量简单
多次播放:方便用户看到动画元素从哪里开始到哪里停止
如果动画复杂或动画元素较多,可以考虑分阶段动画
避免不同元素在移动中互相覆盖
可视化可以用来辅助数据分析,但不能作数据分析或数据统计的替代。除非你是数据分析师,否则不要对数据可视化得出的结论轻易下判断。
如果你一定要用可视化进行数据分析,那么,一定要尝试多种可视化方式,而不要依赖于某一种方式。要知道,任何一些细小的设计改变, 都可能改变可视化结论。
大量的可视化编程库和教程,使得普通人员也可以设计出高质量的可视化产品。而初学者也只需坚持一些最基本的原则,就可以创造出好的可视化作品来。例如:
尽可能使用柱状图
不要把圆半径按线性比例设定
设计尽量简单
然而,要想真正设计出能够提供深入见解的可视化产品,还需要很多其它技能,例如,图像设计、数据分析、交互设计等。
如果觉得我的文章对您有用,请随意打赏。你的支持将鼓励我继续创作!