SAS实验03 ——相关分析

Bella ·
更新时间:2024-09-21
· 600 次阅读

实验03 相关分析

一、实验目的
在教育业中寻找各类相关关系以做分析。
二、实验内容
①绘制小学毕业生和初中毕业生的散点图
②分析小学毕业,初中毕业和高中毕业以及本科入学四个变量之间的相关关系
③做研究生招生人数和留学生人数的偏相关分析
④做毕业院校水平和毕业生薪资水平的等级相关分析
三、实验数据准备
前三个实验在国家数据网(http://data.stats.gov.cn/vchart.htm)的年度数据中取得
第四个实验数据为中国薪酬网取得
四、实验过程
(一)SAS程序
①:散点图

Data; Input pupil junior @@; Cards; 1647.9 1616.4927 1565.9 1507.4 1437.3 1476.6 1641.6 1662.8 1739.6 1805.2 1865 1870.2 1928.5 2019.5 2135.2 2267.9 2351.9 2396.9 2419.2 2313.7 2117.4 1960.1 1934.1 1961.5 1899.6 1841.5 1872.4 1846.7 1863.1 1454.1 1367.8 1397.5 1423.9 1417.6 1413.5 1561.5 1660.8 1736.7 1750.4 1797.7 1868 1963.7 2071.6 1213.4 2087.3 2018.5 1903.7 1731.5 1633.5 1613.9 1603.1 1463.3 1297.8 1244.4 1166.4 1148.7 1116.3 1099.2 1123 Proc plot; Plot junior*pupil='*'; Run;

②多变量相关分析

Data; Input pupil junior senior undergraduate @@; Cards; 1647.9 1616.4927 1565.9 1507.4 1437.3 1476.6 1641.6 1662.8 1739.6 1805.2 1865 1870.2 1928.5 2019.5 2135.2 2267.9 2351.9 2396.9 2419.2 2313.7 2117.4 1960.1 1934.1 1961.5 1899.6 1841.5 1872.4 1846.7 1863.1 1454.1 1367.8 1397.5 1423.9 1417.6 1413.5 1561.5 1660.8 1736.7 1750.4 1797.7 1868 1963.7 2071.6 1213.4 2087.3 2018.5 1903.7 1731.5 1633.5 1613.9 1603.1 1463.3 1297.8 1244.4 1166.4 1148.7 1116.3 1099.2 1123 422.159 410.7534 405.4007 389.4184 383.4152 381.4331 374.0574 356.6411 351.2563 326.1081 297.0601 282.0971 253.0854 236.3647 209.9151 182.5262 158.7939 138.1835 116.0191 93.669 65.3135 Proc Corr; Run;

③偏相关分析

Data t03; Input undergraduate postgraduate abroad @@; Cards; 410.7534 405.4007 389.4184 383.4152 381.4331 374.0574 356.6411 351.2563 326.1081 297.0601 282.0971 253.0854 236.3647 209.9151 182.5262 158.7939 138.1835 116.0191 93.669 65.3135 85.7966 80.6103 66.7064 60.5055 62.1323 61.1381 58.9673 56.0168 53.8177 51.0953 44.6422 41.8612 39.7925 36.4831 32.6286 26.8925 20.2611 16.5197 12.8484 66.2100 60.8400 54.4500 52.3700 45.9800 41.3900 39.9600 33.9700 28.4700 22.9300 17.9800 14.4000 13.4000 11.8515 11.4682 11.7307 12.5179 8.3973 3.8989 Proc Corr data=t03 ; Var abroad; With postgraduate; Partial undergraduate; Run;

④等级相关

Data spearman; input diploma salary@@; cards; 3 9065 3 8620 1 6755 2 7780 2 8485 3 8842 2 7494 1 7230 1 7075 1 6718 ; Proc Corr spearman kendall; var diploma; with salary; run;

(二)SAS运行结果
①:散点图
在这里插入图片描述
②多变量相关分析
在这里插入图片描述在这里插入图片描述③偏相关分析

在这里插入图片描述在这里插入图片描述在这里插入图片描述
④:等级相关
在这里插入图片描述 在这里插入图片描述(三)运行结果分析
①:散点图
没什么好分析的,基本在同一条直线上,属于相关度较高的正相关,说明上小学和上高中存在高相关度,而其中有一点偏移中心,属于我一不小心数据输入输错。
②:多变量相关分析
整体来看四个变量间都存在高度相关关系(P<0.0001).其中距离越近的两个变量,其相关度越高,如初中毕业和高中毕业生数量;距离越远相关度越低,如小学毕业生人数和本科招生数。
③:偏相关分析
经运行,发现出国留学和研究生招生数存在相关系数为0.68855的正相关,P值为0.0016(小于0.01),系显著性差异。因此可以得出,在排除掉本科生的影响下,我国留学水平和研究生入学水平存在较为高度的正相关关系。意味着更高层次的教育往往是同步发展的,进一步推测,为20年来我国国力的提升所导致其二者同步发展。
④:等级相关
等级相关系数为0.94388,说明显著正相关,接近完全正相关。而P值小于0.0001,则拒绝假设相关系数为0的原假设。实验结果表明文凭院校(3为985,2为211,1为双非)与毕业工资呈显著等级相关。


作者:jingmingx1



sas

需要 登录 后方可回复, 如果你还没有账号请 注册新账号