OpenPose是一个由美国卡耐基梅隆大学(CMU)开发并开源的人体姿态识别库,基于深度学习的卷积神经网络和监督学习,以Caffe为框架。它实现了对动作、表情和手指运动的精确估计,适用于单人和多人场景,具有极高的鲁棒性。作为首个基于深度学习的实时多人二维姿态识别工具,其应用范围广泛,如抖音的尬舞机,以及体育健身、动作捕捉、3D试衣和舆情监测等领域。
此项目具有丰富的应用场景,包括:抖音的舞蹈动作识别、体育动作教学中的技术辅助、3D健身教练的互动、虚拟试衣的3D模拟,甚至游戏人物动作的采集。为了方便中国开发者,已将项目README文档翻译成中文,以促进本地社区的发展和学习。
OpenPose的技术基础源于曹哲、Tomas Simon等人在CVPR 2017年发表的Realtime Multi-Person 2D Pose Estimation using Part Affinity Fields。其功能特点包括:精确的人体躯干、脸部、手部和关键点识别,甚至支持三维重建。此外,文档详细介绍了Windows版本的下载、安装指南,以及如何快速启动Demo、查看输出格式和优化性能的方法。
该项目由Gines Hidalgo、Zhe Cao等人创建,目前由Gines Hidalgo和Yaadhav Raaj维护。原版CVPR 2017代码库包含Matlab和Python版本,以及模型训练代码。对于开源社区的贡献者,我们非常感谢,他们的名字可在doc/contributors.md中找到。
如果您的研究受到OpenPose的帮助,请在引用中提及(例如:人脸关键点识别采用的是[Simon et al. 2017]的训练方法)。非商业使用是免费的,而对于商业使用,详情请参考license。关于商业应用的咨询,可以联系Yaser Sheikh。