正态分布在机器学习的重要性

Aure ·

更新时间:2024-09-21

· 799 次阅读

文章目录1. 概率分布是什么2. 正态分布意味着什么2.1 中心极限定理2.2 重要性3. 正态分布的变量有哪些4.python来检验数据的分布5.特别注意 1. 概率分布是什么

我们可以投10000次骰子，每次都有6种可能的取值，我们可以将类别数设为6，然后我们就可以开始对每一类出现的次数进行计数了。我们可以画出上述结果的曲线，该曲线就是概率分布曲线。目标变量每个取值的可能性就由其概率分布决定。

一旦我们知道了变量的概率分布，我们就可以开始估计事件出现的概率了，我们甚至可以使用一些概率公式。至此，我们就可更好的理解变量的特性了。概率分布取决于样本的一些特征，例如平均值，标准偏差，偏度和峰度。

2. 正态分布意味着什么

正态分布的这种统计特性使得问题变得异常简单，任何具有正态分布的变量，都可以进行高精度分预测。但是现实世界中发现的变量，大多近似服从正态分布。

2.1 中心极限定理

那为何如此多的变量都大致服从正态分布？
这里就需要引入中心极限定理。

中心极限定理：

在适当的条件下，大量相互独立随机变量的均值经适当标准化后依分布收敛于正态分布。每次从这些总体中随机抽取 n 个抽样，一共抽 m 次。然后把这 m 组抽样分别求出平均值，这些平均值的分布接近正态分布。设从均值为μ、方差为σ**2（有限）的任意一个总体中抽取样本量为n的样本，当n充分大时，样本均值X的抽样分布近似服从均值为μ、方差为σ**2/n的正态分布。

中心极限定理告诉我们，当样本量足够大时，样本均值的分布慢慢变成正态分布。

2.2 重要性 总体本身的分布不要求正态分布：
掷一个骰子是平均分布，最后每组的平均值也会组成一个正态分布。服从正态分布的变量总是服从正态分布。例如，假设 A 和 B 是两个具有正态分布的变量，那么：

A x B 是正态分布
A + B 是正态分布

因此，使用正态分布，预测变量并在一定范围内找到它的概率会变得非常简单。

3. 正态分布的变量有哪些

正态分布只依赖于数据集的两个特征：样本的均值和方差。

均值，样本所有取值的平均方差，该指标衡量了样本总体偏离均值的程度

正态分布很容易解释，因为：

正态分布的均值，模和中位数是相等的。我们只需要用均值和标准差就能解释整个分布。 4.python来检验数据的分布

直接用pandas中的hist()，就能加载所有特征。

DataFrame.hist(bins=10)

5.特别注意

由于正态分布简单且易于理解，因此它也在预测研究中被过度使用。假设变量服从正态分布会有一些显而易见的缺陷。

例如，我们不能假设股票价格服从正态分布，因为价格不能为负。
同时我们也知道股票收益可能为负数，因此收益可以假设服从正态分布。

作者：孟不知

学习分布机器学习正态分布

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

AJAX 数据库实例

Hana 2021-02-27

548

Kotlin Android 环境搭建

Quirita 2021-04-07

999

asp.net开发sql server转换成oracle的方法详解

Paloma 2021-02-26

737

Shell中去除字符串前后空格的方法

Iris 2021-08-03

567

Redisson实现分布式锁、锁续约的案例

Tia 2023-05-13

1861

Docker AIGC等大模型深度学习环境搭建步骤最新详细版

Jacinda 2023-05-13

1807

一文带你学习一下C++中的构造函数

Winona 2023-05-13

520

C++中set的用法学习

Fawn 2023-05-13

226

Three.js概述和基础知识学习

Echo 2023-05-13

1103

Vue自定义指令学习及应用详解

Maha 2023-05-13

1234

写给小白学习的地理信息的表示法GeoJSON

Kande 2023-05-15

702

从错误中学习改正Go语言五个坏习惯提高编程技巧

Viridis 2023-05-17

1281

Java NIO下ByteBuffer的常用方法学习

Maleah 2023-05-17

473

MySQL基础学习之字符集的应用

Nafisa 2023-05-17

1150

C++函数模板学习示例教程指南

Pandora 2023-07-07

go语言定义零值可用的类型学习教程

Tallulah 2023-07-17

216

Redis+IDEA实现单机锁和分布式锁的过程

Crystal 2023-07-20

818

Redis数据结构之intset整数集合使用学习

Janna 2023-07-20

1721

Redis数据结构之跳跃表使用学习

Ophelia 2023-07-20

644

Redis数据结构之listpack和quicklist使用学习

Natalia 2023-07-20

1968

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座