基于简单模型KNN——泰坦尼克号获救分析

Stella ·

更新时间:2024-11-01

· 959 次阅读

数据来源：Kaggle数据集 → 共有1309名乘客数据，其中891是已知存活情况（train.csv），剩下418则是需要进行分析预测的（test.csv）
字段意义：
PassengerId: 乘客编号
Survived :存活情况（存活：1 ; 死亡：0）
Pclass : 客舱等级
Name : 乘客姓名
Sex : 性别
Age : 年龄
SibSp : 同乘的兄弟姐妹/配偶数
Parch : 同乘的父母/小孩数
Ticket : 船票编号
Fare : 船票价格
Cabin :客舱号
Embarked : 登船港口
目的：通过已知获救数据，预测乘客生存情况
研究问题：
1、整体来看，存活比例如何？
要求：
① 读取已知生存数据train.csv
② 查看已知存活数据中，存活比例如何？
提示：
① 注意过程中筛选掉缺失值之后再分析
② 这里用seaborn制图辅助研究

2、结合性别和年龄数据，分析幸存下来的人是哪些人？
要求：
① 年龄数据的分布情况
② 男性和女性存活情况
③ 老人和小孩存活情况

3、结合 SibSp、Parch字段，研究亲人多少与存活的关系
要求：
① 有无兄弟姐妹/父母子女和存活与否的关系
② 亲戚多少与存活与否的关系

4、结合票的费用情况，研究票价和存活与否的关系
要求：
① 票价分布和存活与否的关系
② 比较研究生还者和未生还者的票价情况

5、利用KNN分类模型，对结果进行预测
要求：
① 模型训练字段：‘Survived’,‘Pclass’,‘Sex’,‘Age’,‘Fare’,‘Family_Size’
② 模型预测test.csv样本数据的生还率
提示：
① 训练数据集中，性别改为数字表示 → 1代表男性，0代表女性
导入模块

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import os
import time
# 导入时间模块
% matplotlib inline
import warnings
warnings.filterwarnings('ignore')

os.chdir('C:/Users/5467/Desktop/项目15泰坦尼克号获救问题/')
train_data = pd.read_csv('train.csv')
test_data = pd.read_csv('test.csv')

运用饼图来看存活比例

sns.set()
sns.set_style("ticks")
plt.axis('equal')
train_data['Survived'].value_counts().plot.pie(autopct='%1.2f%%')

原创文章 14获赞 5访问量 333 关注私信展开阅读全文
作者：dibiaozuiq

泰坦尼克号 knn

1024 个赞

需要登录后方可回复, 如果你还没有账号请注册新账号

Go 中 slice 的 In 功能实现探索

Netany 2020-02-06

958

为google量身定做的sitemap生成代码asp版

Kita 2021-05-30

535

kaggle入门赛TOP%7：泰坦尼克号（1.数据分析，特征处理）基于百度aistudio平台

Pascall 2020-07-16

873

一看就懂的机器学习k-近邻算法（KNN）

Trixie 2020-11-18

661

6-机器学习之KNN（K-近临算法）

Frieda 2020-01-28

715

如何实现一个KNN算法

Willow 2020-09-11

994

数据挖掘案例: 泰坦尼克号

Kalika 2020-01-05

777

初入Kaggle，泰坦尼克号遇难预测项目详解。

Iris 2021-02-23

803

机器学习实战一：knn算法约会网站

Olga 2020-05-24

965

基于简单模型KNN——泰坦尼克号获救分析

Stella 2021-01-22

959

K最近邻算法(KNN)---sklearn+python实现方式

Raissa 2020-10-01

902

Python图像识别+KNN求解数独的实现

Nabila 2021-01-01

741

python实现KNN近邻算法

Welcome 2021-02-17

966

K近邻法(KNN)相关知识总结以及如何用python实现

Jayne 2020-12-26

828

python机器学习基础K近邻算法详解KNN

Viola 2021-12-16

1904

Python机器学习之底层实现KNN

Dabria 2021-12-16

866

python 如何通过KNN来填充缺失值

Iria 2021-12-16

519

Python机器学习之KNN近邻算法

Elaine 2021-12-16

1197

Python机器学习之手写KNN算法预测城市空气质量

Kohana 2022-01-14

1651

Python-OpenCV实战：利用KNN算法识别手写数字

Octavia 2022-01-14

1717

我要提问

致谢

帮助他人，成就自己。

人生最大成功就是伸出热情而温暖的双手，尽自己所能去帮助身边的每一个人，只要无私的奉献，就会收获到美好的生活。

1024问感谢每一位朋友的帮助和支持。

软件开发网提供编程的基础软件技术培训教程,软件开发编程实例讲解Go,Node,HTML,CSS,Javascript,Python,Java,Ruby,C,PHP,MySQL等软件开发编程语言以及数据开发的基础知识，也提供大量的软件开发在线实例、从入门到精通就在1024问。

育儿网微养生全球行美食街育儿菜谱大全海南旅游女性养狗百科星座