摘要:大数据时代, 电商平台积累了大量用户在平台上的行为数据, 比如浏览、点击、下单和加入购物车等等. 如何使用机器学习算法去探索大数据背后的用户消费喜好和习惯成为了一个新的研究热点. 本文主要在特征工程和模型搭建两个方面对用户购买预测的效果做出提高. 通过深入理解电商业务知识, 利用统计学知识, 分别从用户、商品和评论数据等多个方面的数据构建了115个特征; 在模型搭建方面, 主要设计了一个两层融合模型, 第一层采用了XGBoost、CatBoost和逻辑回归作为基分类器, 从不同的角度考虑用户购买预测, 第二层采用加权平均的方法对基类模型的预测结果进行融合, 其权重由线性分类器学习生成. 实验结果表明该融合模型的F1评分要高于个体分类器, 并且多次实验证明, 融合模型的稳定性也要比个体分类器好.