数据可视化顺应了发展,让数据更直观的用图像和图形表式出来,这样做的目的是要吸引人的注意,并且能够让人一眼就能看到想要看的。因为数据可视化的直观性,所以才非常有必要数据可视化,即用某种适合的图像来表示某些数据,那么常见的图像表示方法有哪些呢?培训网的具体问题可以到我们网站了解一下,也有业内领域专业的客服为您解答问题,为成功合作打下一个良好的开端!
常见图像和用图总结
1散点图
还记得高中物理课学过的折定律吗?也称为斯涅尔定律,假设不知道,我们就探索一下。用验的方式分别测量光线入某透明介质的入角和折角大小,测量多次,于是就得到了入角和折角的数据集,分别用和表示。
有了这两组数据,怎么研究入角和折角之间的关系呢?它们之间符合什么函数关系?
一种常用的方法是:
建立一个坐标系,横坐标表示入角,纵坐标表示折角;
将入角及其对应的折角,作为坐标系中的一个坐标点,在此坐标系中把点标记出来。
这样就在坐标系中散落了很多点,如下图所示:接下来的任务就是观察这些点在坐标系中的分布,猜测它们应该符合什么函数关系,比如可能符合某个一次函数关系等(看起来像符合正比例函数的关系,人类曾经很长时间都这么认为,直到伟大的物理学家斯涅耳揭示了其中的奥秘为止)。
2柱形图
柱形图(也称为:柱状图),适用于二维数据集,但是有一个维度的数据需要具有比较意义。比如下面的数据:对于这份数据,就比较适合用柱形图进行可视化。图中所示的柱子高度,表示数据表中各省的GDP值。
通过柱形图,非常明显地反映了各省GDP数据的差异。但是注意,柱形图不适合大数据,在横坐标上如果排满了柱子,看着多眼晕呀。
3条形图
条形图,貌似就是柱状图横过来,对于数值都是大于0的数据而言,画出来的条形图可以这样理解。但是,下面这种类型的数据也是比较常见的。从数据表中可以看出,我国部分城市1月份比较低气温,有的在0℃以上,有的在0℃以下。对于这类数据,用条形图显示,结果是这样的。当然,这份数据也可以用前面的柱形图现可视化。
4折线图
下面这份数据,是1961~2022年我国的GDP年度增长率。显然,如果用条形图、柱形图来现可视化,效果都不是太好,因为数据量有点大了。对这份数据现可视化,比较好的选择是绘制折线图。从图示结果中,可以看出GDP的发展变化趋势。
折线图比较典型的应用应该算是在股票方面了,范围大一点可以说是金融数据分析方面。
5直方图
直方图貌似柱形图,但两者有很大区别。
直方图是以各个矩形的面积描述各组的频数,所有矩形的面积之积为各组频数的和。
例如,使用下面的程序构造了一批随机数。想直观地了解这个数据集中数字分布的特征,就可以利用直方图。从图中可以看出,虽然是随机生成的,但是数据的分布还是有规律的,这就是统计学中的正态分布。
6饼图
饼图常用于表达某些量所占比例的情况。例如:图中显示了不同量占据总量的百分比,通过饼状图就能够对比分类数据的数值大小。当然,如果类别太多,会把饼分成太多的小份,不美观,也不易于观察。
7箱形图
箱形图又称盒须图、盒式图或箱线图。下图显示了通常的箱形图的形状:通过箱形图,可以观察到如下信息:
数据的统计值为中位数、比较大值、比较小值等
数据集中是否存在异常值,以及异常值的具体数值
数据是否是对称的
数据的分布是否密集、集中
数据是否有偏向性
还要提到股票,如果仔细观察,里面也用到了箱形图。
以上列出的几种图形,是常见的,也是基本的。在这个基础上,还有很多变形,这些变形可能综合了多种含义。
此外,根据不同的用途,还可以创造性地开发新的图像。对数据进行可视化的时候,要根据数据特征、绘图目的选择适合的图像。
以上将数据可视化分为了艺术性可视化和数学性可视化两类。数学性可视化是基于统计学基本知识,运用编程技能现数据可视化,这种方式特别适用于大数据的问题中。是不是很简单?那么,就以比较的速度掌握了数据可视化比较基本的知识,以备不时之需。 |