摘要:进行基于表征学习的网络游戏流量识别研究. 首先, 由于流量识别领域公开数据集中缺乏游戏流量, 采集各类游戏流量, 并建立各种游戏与进程端口的映射关系, 基于该映射关系从采集的流量中过滤游戏流量, 扩展公开数据集; 利用深度学习中的表征学习模型, 对经过预处理的原始端到端游戏流量自动进行特征学习和特征选择; 最后用分类器进行游戏类别识别. 通过构建特征空间由卷积神经网络自学习原始信息的特征, 成功避免传统机器学习算法中流量数据集的二次处理导致的信息丢失以及流量分类模型对特征选择的依赖. 实验结果表明, 相比于原数据集的分类效果, 扩充后的数据集在神经网络模型上的分类准确率提高了5%, 游戏流量识别准确率达到92%, 识别性能明显提升.