还记得上世纪轰动全球的泰坦尼克吗?
1912年4月,正在处女航的泰坦尼克号在撞上冰山后沉没,2224名乘客和机组人员中有1502人遇难,这场悲剧轰动全球,遇难的一大原因正式没有足够的就剩设备给到船上的船员和乘客。
虽然幸存者活下来有着一定的运气成分,但在这艘船上,总有一些人生存几率会更大,今天就用当下流行的10种最流行的机器学习分类算法的来帮大家计算一下哪些人更容易幸存。
数据解释
数据表单
变量名称 | 数据定义 | 变量解释 |
---|---|---|
Survived | 是否生还 | 0=否,1=是 |
Pclass | 票类别、社会地位 | 1=1类(上层),2=2类(中层),3=3类(底层) |
Name | 姓名 | |
Sex | 性别 | male=男性,female=女性 |
Age | 年龄 | |
SibSp | 家庭关系 | Sibling=兄弟、姐妹、表兄弟、表姐妹,Spouse=正式丈夫、妻子 |
Parch |