改进FP-growth融合K-means算法的西装定制搭配方法
作者:
基金项目:

陕西省科技成果转移与推广计划(2019CGXNG-018)


Suit Customization Matching Method Based on Improved FP-Growth and K-means Algorithm
Author:
  • 摘要
  • | |
  • 访问统计
  • |
  • 参考文献 [21]
  • |
  • 相似文献 [20]
  • | | |
  • 文章评论
    摘要:

    为解决西装定制企业中用户定制款式信息未充分利用这一问题, 结合关联规则FP-growth算法对多维大型数据集进行挖掘时, 存在内存资源消耗较大以及执行效率不高的问题, 本文提出一种改进FP-growth融合K-means算法的西装定制搭配挖掘方法, 对FP-growth算法从使用哈希表建立项头表、有序FP-tree代替传统FP-tree建树过程和新增不平衡比评价指标3个角度对其进行改进. 实验结果表明, 与其他关联规则算法对比, 改进FP-growth算法的内存资源使用减少了约6.7%、执行效率提高了15%左右; 通过人工审核实验结果得出, 该算法将挖掘出用户感兴趣且有意义的关联规则, 验证该算法提出的可行性.

    Abstract:

    The suit customization enterprise fails to fully utilized the information about customized style. The FP-growth algorithm in the association rule consumes a large amount of memory with low execution efficiency when it comes to multidimensional big data. Aiming at such issues above, this study proposes an improved mining method for the suit customization based on FP-growth and K-means algorithm. It improves the FP-growth algorithm from three aspects: using hash table to establish item header table, replacing traditional FP-tree with ordered FP-tree, and adding imbalance ratio as the new evaluation index. Experimental results show that compared with other association rule algorithms, the improved FP-growth algorithm reduces the memory consumption by about 6.7% and increases the execution efficiency by about 15%. Through the manual review of experimental results, this algorithm can find meaningful association rules attractive to users, verifying the the proposed algorithm.

    参考文献
    [1] 邵芬娟, 侯真威. 数据挖掘在服装领域的应用分析. 纺织科技进展, 2021, (2): 1–5.
    [2] 金正昆. 西装的选择与搭配. 新湘评论, 2010, (8): 44–45.
    [3] 纪丹丹, 戴宏钦. 服装搭配方法研究综述. 现代丝绸科学与技术, 2020, 35(4): 31–35.
    [4] 字云飞, 李业丽, 孙华艳, 等. 改进FP-Growth算法在旅游线路规划中的应用研究. 计算机与现代化, 2018, (2): 17–21, 26.
    [5] 杜梦欣. 基于FP-Growth的关联规则算法研究及其在高校教育大数据中的应用[硕士学位论文]. 长春: 吉林大学, 2019.
    [6] 刘云翔, 韩贝. 基于改进FP算法的隧道交通事故关联分析. 现代电子技术, 2018, 41(17): 141–144.
    [7] 何晴, 陆黎明. 基于哈希和合并技术的FP-Growth新算法. 上海师范大学学报(自然科学版), 2018, 47(4): 469–473.
    [8] 岳帅, 尹绍宏. 基于有序FP树和二维列表的频繁模式挖掘算法. 哈尔滨商业大学学报(自然科学版), 2018, 34(6): 692–697.
    [9] Li JW, Yu N, Jiang JW, et al. Research on student behavior inference method based on FP-growth algorithm. International Conference on Geomatics in the Big Data Era (ICGBD). Guilin: ISPRS, 2020. 981–985.
    [10] Chunduri RK, Cherukuri AK. Scalable algorithm for generation of attribute implication base using FP-growth and spark. Soft Computing, 2021, 25(14): 9219–9240.
    [11] 叶福兰. 基于改进的FP-growth算法的高校课程关联度实证研究. 科技和产业, 2020, 20(4): 186–190.
    [12] 毛宁宁, 苏怀智, 高建新. 基于FP-growth的大坝安全监测数据挖掘方法. 水利水电科技进展, 2019, 39(5): 78–82.
    [13] Wang XY, Jiao GE. Research on association rules of course grades based on parallel FP-Growth algorithm. Journal of Computational Methods in Sciences and Engineering, 2020, 20(3): 759–769.
    [14] 姬海波. 基于MapReduce框架的关联规则算法研究与优化[硕士学位论文]. 成都: 电子科技大学, 2018.
    [15] 李敏波, 丁铎, 易泳. 基于FP-Growth改进算法的轮胎质量数据分析. 中国机械工程, 2019, 30(2): 244–251.
    [16] Yang XD, Lin XX, Lin XL, et al. Application of Apriori and FP-growth algorithms in soft examination data analysis. Journal of Intelligent & Fuzzy Systems, 2019, 37(1): 425–432.
    [17] 殷茗, 王文杰, 张煊宇, 等. 一种基于邻接表的最大频繁项集挖掘算法. 电子与信息学报, 2019, 41(8): 2009–2016.
    [18] 文芳, 黄慧玲, 李腾达, 等. 基于FP-growth关联规则的图书馆数据快速挖掘算法研究. 重庆理工大学学报(自然科学版), 2020, 34(6): 189–194.
    [19] Wang TY, Hou JX, Yu ZH. Analysis of hierarchical and time-phased model of large-scale power grid based on FP-growth algorithm. IOP Conference Series: Earth and Environmental Science, 2018, 192: 012031. [doi: 10.1088/1755-1315/192/1/012031
    [20] 倪德, 马传香. FP-growth算法及其优化在税务系统中的应用. 计算机应用, 2018, 38(S2): 140–143.
    [21] 王利军, 唐立. 基于有序FP-tree结构和投影数据库的最大频繁模式挖掘算法. 淮阴师范学院学报(自然科学版), 2020, 19(1): 35–39, 44.
    引证文献
    网友评论
    网友评论
    分享到微博
    发 布
引用本文

赵鑫,毋涛.改进FP-growth融合K-means算法的西装定制搭配方法.计算机系统应用,2022,31(6):368-375

复制
分享
文章指标
  • 点击次数:593
  • 下载次数: 1059
  • HTML阅读次数: 1009
  • 引用次数: 0
历史
  • 收稿日期:2021-08-18
  • 最后修改日期:2021-09-13
  • 在线发布日期: 2022-05-26
文章二维码
您是第11201210位访问者
版权所有:中国科学院软件研究所 京ICP备05046678号-3
地址:北京海淀区中关村南四街4号 中科院软件园区 7号楼305房间,邮政编码:100190
电话:010-62661041 传真: Email:csa (a) iscas.ac.cn
技术支持:北京勤云科技发展有限公司

京公网安备 11040202500063号