手语识别和翻译

时间：09-21 来源：电子产品世界点击：

手语获取
　　双手交叉握于腹部前方。这一动作我们称之为“预备动作”，表示手语的开始和结束。为了避免潜在的识别错误，我们要求每相邻的两帧(0.13s)，用户至少移动5厘米。如果用户做预备动作超过100帧(6.67s)，系统将会停止获取手语数据。

数据处理
　　正如我们之前提到的常态化处理，我们将获取的一系列帧通过均分和插入的方法统一成121帧，即2178个三维空间向量。我们对常态化处理后的数据进行特征提取，产生1694个特征向量。最后我们将所有的特征向量放在一个矩阵里，用于SVM分类。

手语训练和分类
　　LIBSVM是一个用于支持向量机的集成软件，支持多类分类。用户使用LIBSVM提供的库，可以更容易地使用SVM。我们使用“svm-train”读取输入文件(Input File)，生成模型文件(Model file)。我们的输入文件包含1694个特征向量。我们对每个手语单词训练20到30次。到目前为止，我们总共训练了48个手语。我们可以通过训练更多的手语扩展我们的数据库。

使用“svm-predict”可以预测用户所做的手语属于哪一类。

参考文献：
　　[1]Chinese Sign Language [R/OL].http://baike.baidu.com/view/42806.htm
　　[2]OpenNI [R/OL].http://75.98.78.94/About.aspx
　　[3]PrimeSense 3D Sensor Data Sheet[R/OL].http://www.primesense.com/press-room/resources/file/4-primesense-3d-sensor-data-sheet?lang=en
　　[4]LIBSVM [R/OL].http://www.csie.ntu.edu.tw/~cjlin/libsvm/
　　[5]Hardware Requirements of Kinect[R/OL].http://www.microsoft.com/en-us/kinectforwindows/purchase/sensor_setup.aspx
　　[6]FPGA-based MP3 Player[R/OL].http://cegt201.bradley.edu/projects/proj2010/fpgamp3/FPGAMP3_Project_Report.pdf
　　[7]Altera wiki - MP3 player[R/OL].http://www.alterawiki.com/wiki/MP3_Player

上一篇：显示控制器SSD1906与AT91RM9200的接口技术
下一篇：基于Q-Coder算术编码器的IP核设计与仿真

Intel Kinect OpenNI 201209 相关文章：

栏目分类