课程推荐预测模型优化方案及数据离散化算法
作者:
基金项目:

2020年中国社会科学院大学校级科研项目


Optimization Scheme of Course Recommendation Prediction Model and Data Discretization Algorithm
Author:
  • 摘要
  • | |
  • 访问统计
  • |
  • 参考文献 [15]
  • |
  • 相似文献 [20]
  • | | |
  • 文章评论
    摘要:

    本研究基于k-NN算法建立了课程推荐预测模型.由于原始样本数据的局部不均衡和数据叠交性,预测模型在不进行任何参数调整和数据优化的情况下,模型预测评分并不理想.针对上述问题,本研究设计了一套预测模型参数优化方案和样本数据优化方案,包括最优k值选择算法设计、距离公式优化、数据离散化算法设计.本研究提出的“数据离散化算法”驱使kd树的分类空间排序按照我们期望的特征向量的权重排序,该算法对提升模型预测评分起到了积极作用.上述优化方案和算法设计使课程推荐预测模型的评分从0.67提升到0.85,预测结果的准确度提高了27个百分点,学生对课程推荐的满意度得到显著提升.

    Abstract:

    In this study, the course recommendation prediction model based on k-NN algorithm has been built. Due to the original sample data of the local imbalance and data overlapped, the prediction score of the prediction model is not ideal without any parameter adjustment and data optimization. Aiming at the above problems, this study designed a set of parameter optimization scheme and sample data discretization algorithm of the prediction mode, including the best k value selection algorithm, distance formula optimization, and data discretization algorithm design. In the study, the design of the “data discretization algorithm” drives kd tree classification feature space order sorted by the weight of the characteristic vector that we expect, this algorithm plays a positive role in improving model prediction score. Therefore, all of that increases the grade of the model from 0.67 to 0.85, and the accuracy of prediction results is increased by 27 percentage points, and students' satisfaction with course recommendation is significantly improved.

    参考文献
    [1] 严晓明. 基于类别平均距离的加权KNN分类算法. 计算机系统应用, 2014, 23(2):128-132.[doi:10.3969/j.issn.1003-3254.2014.02.022
    [2] 应毅, 任凯, 刘亚军. 基于GIS技术和加权kNN算法的实时揽件调度方法. 计算机工程与应用:1-6. http://kns.cnki.net/KCMS/detail/11.2127.tp.20190911.1128.004.html. (2019-09-28)[2019-12-18].
    [3] Shi KS, Li LM, Liu HT, et al. An improved KNN text classification algorithm based on density. Proceedings of 2011 IEEE International Conference on Cloud Computing and Intelligence Systems. Beijing, China. 2011. 113-117.
    [4] 张万桢, 刘同来, 邬满, 等. 使用环形过滤器的K值自适应KNN算法. 计算机工程与应用, 2019, 55(23):45-52, 85.[doi:10.3778/j.issn.1002-8331.1905-0388
    [5] 张清清, 李长云, 李旭, 等. 基于不规则区域划分方法的k-Nearest Neighbor查询算法. 计算机系统应用, 2015, 24(9):186-190.[doi:10.3969/j.issn.1003-3254.2015.09.033
    [6] 刘星毅, 韦小铃. 基于欧式距离的最近邻改进算法. 广西科学院学报, 2010, 26(4):409-411.[doi:10.3969/j.issn.1002-7378.2010.04.006
    [7] 桑应宾, 刘琼荪. 一种基于特征加权的K Nearest Neighbor算法. 海南大学学报(自然科学版), 2008, 26(4):352-355
    [8] 文武, 李培强. 基于K中心点和粗糙集的KNN分类算法. 计算机工程与设计, 2018, 39(11):3389-3394
    [9] 陆凯, 徐华. 基于最近邻距离权重的ML-KNN算法. 计算机应用研究:1-5. http://kns.cnki.net/KCMS/detail/51.1196.TP.20190122.1326.007.html. (2019-09-28)[2019-12-18].
    [10] 路敦利, 宁芊, 臧军. 基于BP神经网络决策的KNN改进算法. 计算机应用, 2017, 37(S2):65-67, 88
    [11] 高亮, 谢健, 曹天泽. 基于Kd树改进的高效K-means聚类算法. 计算技术与自动化, 2015, 34(4):69-74.[doi:10.3969/j.issn.1003-6199.2015.04.015
    [12] 万家山, 陈蕾, 吴锦华, 等. 基于KD-Tree聚类的社交用户画像建模. 计算机科学, 2019, 46(S1):442-445, 467
    [13] 刘云, 袁浩恒. 数据挖掘中并行离散化数据准备优化. 四川大学学报(自然科学版), 2018, 55(5):993-999
    [14] 董跃华, 刘力. 基于自适应改进粒子群优化的数据离散化算法. 计算机应用, 2016, 36(1):188-193.[doi:10.11772/j.issn.1001-9081.2016.01.0188
    [15] 姜楠, 周晓沧. 基于非线性规划的数据离散化方法及其应用. 清华大学学报(哲学社会科学版), 2006, 21(S1):54-59, 70
    引证文献
    网友评论
    网友评论
    分享到微博
    发 布
引用本文

张戈.课程推荐预测模型优化方案及数据离散化算法.计算机系统应用,2020,29(4):248-253

复制
分享
文章指标
  • 点击次数:1440
  • 下载次数: 3040
  • HTML阅读次数: 1091
  • 引用次数: 0
历史
  • 收稿日期:2019-08-14
  • 最后修改日期:2019-09-06
  • 在线发布日期: 2020-04-09
  • 出版日期: 2020-04-15
文章二维码
您是第11204110位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号