手语识别和翻译
手语获取 数据处理 手语训练和分类 使用“svm-predict”可以预测用户所做的手语属于哪一类。 参考文献:
双手交叉握于腹部前方。这一动作我们称之为“预备动作”,表示手语的开始和结束。为了避免潜在的识别错误,我们要求每相邻的两帧(0.13s),用户至少移动5厘米。如果用户做预备动作超过100帧(6.67s),系统将会停止获取手语数据。
正如我们之前提到的常态化处理,我们将获取的一系列帧通过均分和插入的方法统一成121帧,即2178个三维空间向量。我们对常态化处理后的数据进行特征提取,产生1694个特征向量。最后我们将所有的特征向量放在一个矩阵里,用于SVM分类。
LIBSVM是一个用于支持向量机的集成软件,支持多类分类。用户使用LIBSVM提供的库,可以更容易地使用SVM。我们使用“svm-train”读取输入文件(Input File),生成模型文件(Model file)。我们的输入文件包含1694个特征向量。我们对每个手语单词训练20到30次。到目前为止,我们总共训练了48个手语。我们可以通过训练更多的手语扩展我们的数据库。
[1]Chinese Sign Language [R/OL].http://baike.baidu.com/view/42806.htm
[2]OpenNI [R/OL].http://75.98.78.94/About.aspx
[3]PrimeSense 3D Sensor Data Sheet[R/OL].http://www.primesense.com/press-room/resources/file/4-primesense-3d-sensor-data-sheet?lang=en
[4]LIBSVM [R/OL].http://www.csie.ntu.edu.tw/~cjlin/libsvm/
[5]Hardware Requirements of Kinect[R/OL].http://www.microsoft.com/en-us/kinectforwindows/purchase/sensor_setup.aspx
[6]FPGA-based MP3 Player[R/OL].http://cegt201.bradley.edu/projects/proj2010/fpgamp3/FPGAMP3_Project_Report.pdf
[7]Altera wiki - MP3 player[R/OL].http://www.alterawiki.com/wiki/MP3_Player
Intel Kinect OpenNI 201209 相关文章:
- linux下Intel 3945ABG 安装无线网卡驱动(06-25)
- MeeGo是什么?(06-05)
- Intel定义智能系统三属性(01-05)
- Intel还是AMD?10个问题看懂CPU该如何选(09-21)
- 一文详解ARM、Intel、MIPS处理器啥区别(04-28)
- 大联大世平集团推出基于Intel、NXP和TI的安防网关解决方案(03-23)