如下所示:
data = np.random.randn(20)
factor = pd.cut(data,4)
pd.get_dummies(factor)
0 0 0 0 1
1 1 0 0 0
2 0 0 0 1
3 0 0 1 0
4 1 0 0 0
5 0 1 0 0
6 0 1 0 0
7 0 1 0 0
8 0 0 1 0
9 0 1 0 0
10 0 0 0 1
11 0 1 0 0
12 0 1 0 0
13 0 0 1 0
14 0 0 1 0
15 0 1 0 0
16 0 1 0 0
17 1 0 0 0
18 0 0 1 0
19 0 0 0 1
其中参数中的4表示的是,划分为4段。
以上这篇利用Python将数值型特征进行离散化操作的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持软件开发网。
您可能感兴趣的文章:Pandas数据离散化原理及实例解析python数据分析数据标准化及离散化详解使用pandas实现连续数据的离散化处理方式(分箱操作)关于pandas的离散化,面元划分详解