在AR试衣中,可以直观呈现不同姿势下的穿着效果;在老年人或病人监护中,能实时监测跌倒或其他异常行为;在健身应用中,能通过分析用户的动作并实时反馈,帮助改善姿势、预防受伤……随着智能技术的发展,“视觉三维人体姿态估计”已经在生活中得到了诸多应用。
近日,位于嘉定菊园新区的中国科学院上海微系统与信息技术研究所仿生视觉系统实验室李嘉茂研究员团队在视觉三维人体姿态估计领域取得重要进展,通过创新模型,将三维人体姿态精度提升34.9%,并一举解决了困扰已久的动作反向问题。
“视觉三维人体姿态估计”是当前计算机视觉领域的热点研究问题,该技术通过计算机视觉和算法推测出人体的关节位置、角度和运动轨迹等三维姿态信息。“直接获得高精度的三维人体姿态成本较高,目前,机器视觉都是从多视角的二维图像中进行三维预测。”研究团队介绍说,“三维相较于二维增加了一个维度——深度,具体到三维人体姿态上,就是人的动作方向,目前现有的模型中,即使人的动作反了,机器视觉也分辨不出,这严重损害了模型的稳定性。”
为解决上述问题,团队提出全新模型,引入骨骼运动学对动作方向进行预测和判断,有效解决了动作整体反向问题,并最终完成验证,为该技术领域提供了新的研究视角和解决方案。
“‘视觉三维人体姿态估计’在医疗健康、安防监控、人机交互、AR/VR娱乐休闲、运动指导领域等都具有广泛的应用前景,人体姿态精度显著提升后,可以进一步推动以上领域的技术发展,同时优化用户体验。”研究团队介绍说,“比如,在医疗健康领域,可以更精准识别各场景中的姿态,提升监测准确性,减少错报漏报;在AR/VR领域,操作体验会更加准确灵敏;在运动指导上,可以准确识别用户的运动姿势,从而提供更有效的运动指导或康复训练。”