散点图是以一个特征为横坐标,另一个特征为纵坐标,利用坐标点的分布形态反映特征间的统计关系的一种图形。
可以提供两类关键信息:
1)特征之间是否存在数值或者数量的关联趋势,若存在,是线性的还是非线性的
2)找到异常值。
3)散点图可以通过散点的疏密程度和变化趋势表示两个特征的数据量关系,若有3个特征,则其中一个特征为类别型,散点图改变不同特征的点的形状或者颜色,即可了解两个热证和这个类别型之间的关系。
pyplot中绘制散点图的函数为scatter,语法:
plt.scatter(x , y ,s = none , c = none ,marker = none , cmap = none ,norm = none ,vimin = none ,vmax = none ,alpha = nne ,linewidths = none , verts = none , edgecolors = none , data = none,**kwargs)
常用参数及其说明:
x , y 接收array,表示x轴和y轴对应的数据,无默认
s 接收数值或者一维的array
c 接收颜色
marker 接收特定的string,表示绘制点的类型
alpha 接收0~1的小数,表示点的透明度
import numpy as np
import matplotlib.pyplot as plt
plt.rcParams['font.sans-serif'] = 'SimHei' # 设置中文显示
plt.rcParams['axes.unicode_minus'] = False
data = np.load('E:/python/data/国民经济核算季度数据.npz')
name = data['columns'] #提取其中的columns数组视为数据的标签
values = data['values'] #提取其中的values数组视为数据的存在位置
plt.figure(figsize = (8,7)) #设置画布
plt.scatter(values[:,0],values[:,2] , marker = '*',c= 'r')#以数据的第零列做x轴,第三列做y轴,来描绘散点图
plt.xlable('年份')
plt.ylable('生产总值(亿元)')
plt.ylim((0,225000))
plt.xticks (range(0,70,4),values[range(0,70,4),1],rotation = 45)#此时取得值都是第一季度的
plt.title('2000-2017年各季度国民生产总值')
plt.show()
原创文章 11获赞 17访问量 1227
关注
私信
展开阅读全文
作者:爱吃泡菜的king