微波EDA网,见证研发工程师的成长!
首页 > 硬件设计 > 嵌入式设计 > 手语识别和翻译

手语识别和翻译

时间:09-21 来源:电子产品世界 点击:

 

手语获取
  双手交叉握于腹部前方。这一动作我们称之为“预备动作”,表示手语的开始和结束。为了避免潜在的识别错误,我们要求每相邻的两帧(0.13s),用户至少移动5厘米。如果用户做预备动作超过100帧(6.67s),系统将会停止获取手语数据。

数据处理
  正如我们之前提到的常态化处理,我们将获取的一系列帧通过均分和插入的方法统一成121帧,即2178个三维空间向量。我们对常态化处理后的数据进行特征提取,产生1694个特征向量。最后我们将所有的特征向量放在一个矩阵里,用于SVM分类。

手语训练和分类
  LIBSVM是一个用于支持向量机的集成软件,支持多类分类。用户使用LIBSVM提供的库,可以更容易地使用SVM。我们使用“svm-train”读取输入文件(Input File),生成模型文件(Model file)。我们的输入文件包含1694个特征向量。我们对每个手语单词训练20到30次。到目前为止,我们总共训练了48个手语。我们可以通过训练更多的手语扩展我们的数据库。

使用“svm-predict”可以预测用户所做的手语属于哪一类。

参考文献:
  [1]Chinese Sign Language [R/OL].http://baike.baidu.com/view/42806.htm
  [2]OpenNI [R/OL].http://75.98.78.94/About.aspx
  [3]PrimeSense 3D Sensor Data Sheet[R/OL].http://www.primesense.com/press-room/resources/file/4-primesense-3d-sensor-data-sheet?lang=en
  [4]LIBSVM [R/OL].http://www.csie.ntu.edu.tw/~cjlin/libsvm/
  [5]Hardware Requirements of Kinect[R/OL].http://www.microsoft.com/en-us/kinectforwindows/purchase/sensor_setup.aspx
  [6]FPGA-based MP3 Player[R/OL].http://cegt201.bradley.edu/projects/proj2010/fpgamp3/FPGAMP3_Project_Report.pdf
  [7]Altera wiki - MP3 player[R/OL].http://www.alterawiki.com/wiki/MP3_Player

Copyright © 2017-2020 微波EDA网 版权所有

网站地图

Top