behind the theory,original from the real problem.
solve problems by tools,present the result.
理论的背后,来自真实问题。
用工具解决问题,呈现结果。
预测问题 无非:分类问题 与 回归问题
比赛PK的就是数据清洗和特征选择的能力。
回归问题:研究(目标)和(特征)之间的关系。
必知必会的神器:
对日期类型的处理方式:
1.时间多尺度:(年月日)
2.时间diff:找一个基线base做时间差值。 拿现在的时间去-一个时间
脱敏的方法:MD5编码等数字编码。