摘要:针对人体运动目标的实时检测与定位问题,采用深度学习的方法进行研究.在Caffe框架下,采用SSD (Single Shot multibox Detector)检测方法.以VGG16作为基础网络模型,增加额外特征卷积层,提取多尺度的卷积特征.然后对实验数据集进行迭代训练,得到运动目标检测模型.利用训练好的模型,通过2路摄像机检测运动目标,并双目视觉定位.实验结果表明,整个系统运行速度可达40 fps,在10 m×10 m的场景下,平均定位误差在6 cm以内,在速度和精度上均有很好的表现,为大中型场景的人体运动实时检测定位问题提供了有效的解决方案.