2023, 32(1):197-205.DOI: 10.15888/j.cnki.csa.008887
摘要:随着信息技术的发展, 推荐系统作为信息过载时代的重要工具, 正扮演着越来越重要的角色. 基于内容和协同过滤的传统推荐系统, 倾向于以静态方式对用户与商品交互进行建模, 以获取用户过去的长期偏好. 考虑到用户的偏好往往是动态的, 且具有非持续性和行为依赖性, 序列化推荐方法将用户与商品的交互历史建模为有序序列, 能有效捕获商品的依赖关系和用户的短期偏好. 然而多数序列化推荐模型过于强调用户-商品交互的行为顺序, 忽视了交互序列中的时间信息, 即隐式假设了序列中相邻商品具有相同的时间间隔, 在捕捉包含时间动态的用户偏好上具有局限性. 针对以上问题, 文中提出基于自注意力网络的时间感知序列化推荐(self-attention-based network for time-aware sequential recommendation, SNTSR)模型, 该模型将时间信息融入改进的自注意力网络中, 以探索动态时间对下一商品预测的影响. 同时, SNTSR独立计算位置相关性, 以消除可能引入的噪声相关性, 增强捕获用户序列模式的能力. 在两个真实世界数据集上的大量实验表明, SNTSR始终优于一组先进的序列化推荐模型.
2023, 32(4):317-328.DOI: 10.15888/j.cnki.csa.009027
摘要:视频显著性目标检测需要同时结合空间信息和时间信息, 连续地定位视频序列中与运动相关的显著性目标, 其核心问题在于如何高效地刻画运动目标的时空特征. 现有的视频显著性目标检测算法大多使用光流, ConvLSTM以及3D卷积等提取时域特征, 缺乏对时间信息的连续学习能力. 为此, 设计了一种鲁棒的时空渐进式学习网络(spatial-temporal progressive learning network, STPLNet), 以完成对视频序列中显著性目标的高效定位. 在空间域中使用一种U型结构对各视频帧进行编码解码, 在时间域中通过学习视频序列中帧间运动目标的主体部分和形变区域特征, 渐进地对运动目标特征进行编码, 能够捕捉到目标的时间相关性特征和运动趋向性. 在4个公开数据集上与13个主流的视频显著性目标检测算法进行一系列对比实验, 所提出的模型在多个指标(maxF, S-measure (S), MAE)上达到了最优结果, 同时在运行速度上具有较好的实时性.
2021, 30(1):54-62.DOI: 10.15888/j.cnki.csa.007732
摘要:置信度判决用于确定语音数据与模型之间的匹配程度, 可以发现语音命令系统中的识别错误, 提高其可靠性. 近年来, 基于身份矢量(identity vector, i-vector)以及概率线性判别分析(Probabilistic Linear Discriminant Analysis, PLDA)的方法在说话人识别任务中取得了显著效果. 本文尝试将i-vector以及PLDA模型作为一种命令词识别结果置信度分析方法, 其无需声学模型、语言模型支撑, 且实验表明性能良好. 在此基础上, 针对i-vector在刻画时序信息方面的不足, 尝试将该系统与DTW融合, 有效提升了系统对音频时序的鉴别能力.