通过样本推断总体。
点估计使用样本的统计量代替总体参数。但受随机抽样影响,无法保证准确性。
区间估计根据样本的统计量,计算出一个可能的区间和概率,表示总体的参数会有多少概率位于该区间中。
指定的区间称为置信区间,概率称为置信度。
如果总体(分布不重要)均值为μ,方差为δ²,我们进行随机抽样,样本容量为n,当n增大时,则样本均值逐渐趋近服从正态分布:
1.进行多次抽样,则每次抽样会得到一个均值,这些均值会围绕在总题左右,呈正态分布。
2.当样本容量n足够大时,样本均值服从正态分布。
-样本均值构成的正态分布,其均值等于总体均值μ
-样本均值构成的正态分布,其标准差等于总体的标准差δ除以根号n
import numpy as np
import pandas as pd
scale = 50 # 定义标准差
x = np.random.normal(0, scale, size=100000)
for times in range(1, 4):
y = x[(x >= -times * scale) & (x <= times * scale)]
print(times,'倍标准差:')
print(f"{len(y) * 100 / len(x)}%")
假设检验