三方面详解如何为机器人构建起一个“三维世界”
端的应用需求,被分为了sparse(稀疏)和dense(稠密)两大类,前者侧重空间中对位置的感知与描述,后者侧重空间中对环境的构建与理解,但无论是哪一类,其基础性的构造框架对于数据的处理一定是分为前端和后端两部分的。其中前端用来对数据进行实时的特征提娶剔除噪声、帧匹配得到位置转移向量,这一部分又可以单独作为轻量级的视觉定位定姿算法,成为VO,常见的优化包括加入IMU惯性测量单元数据进行计算,也叫VIO。后端主要从全局的角度出发,通过滤波算法、图优化、树优化等方法对前端得到的结果进行闭环检测、循环迭代等方法的二次优化,最终得到最优的计算结果。
对于SLAM算法,很多人觉得掌握了SLAM算法就解决了机器人移动这样关键性的基本问题,事实上并非如此。SLAM在今天之于人工智能机器人等领域的发展上,已经越来越像深度神经网络一样,成为一项基础性的工具。一个表现好的SLAM框架可以帮助我们得到一个鲁棒性高的空间运动模型和空间环境模型,但是只是让机器人看到了世界,并不能真正指导机器人的决策,因此我们需要利用这样的模型,回到具体环境中有针对性的进行接下来的自主导航与路径规划等方案的开发。目前我们基于vSLAM算法,针对机器人在环境中的全局路径规划和局部路径规划,我们开发了一套鲁棒性高,可以实时决策的路径规划与导航算法框架,可以有针对性的结合vSLAM得到的最优计算结果,进行有效的多传感器融合与前端处理器的嵌入式集成,使其可以在不同复杂的环境中获得良好的表现结果。
在这一点上,我觉得过去这几年,人工智能的研究始终停留在对于感知算法的迭代优化上,包括人脸识别、 语义分析等等,我们追求更高的测试与跑分结果,反倒是忽略了这样的技术应该如何更好地在商业领域、工业领域产生更多的价值。因此我们也发现,从去年开始的这一波人工智能浪潮,正在推动学术界在人工智能的研究从感知向真正的决策与使用转移。比如今天我们看到的VR/AR设备、无人驾驶汽车等等都是将这样的技术在一个具体细分的行业里面加以实践,实践中遇到了棘手的问题,然后寻找解决办法,指导底层硬件进行决策。我觉得这是真正的进步,而在接下来的几年,人工智能最大的增长点应该是如何帮助人们去优化地进行决策。
三维视觉在机器人上的发展方向
机器人自诞生之日起,视觉功能就是其最核心的功能与智能化的入口,三维视觉已经在近10年的发展中逐渐成为机器人的主流与标准配置,用以解决以往移动机器人"看不见"这一难题。但是由于从目前的硬件发展局限性而言,依然存在计算量大、使用环境受限等问题。针对更细分的应用场景,设计实现三维视觉技术的小型化、模块化、前端化将会成为今后两到三年业内主流的发展方向。
小型化:从CCD、CMOS芯片的相机,再到一维、二维激光雷达及三维视觉传感器,数据量在增加的同时,小型化的体积更加利于系统的集成;
模块化:机器人视觉系统功能与定位越来越明确,通用性的接口与标准正在逐步形成,行业进入方向明确化发展阶段;
前端化:GPU、FPGA、DSP等专用处理器飞速发展,通用处理器的计算资源需求正在被简化,将更侧重于交互功能的实现。
在这条道路上,整个机器人行业正在兴起,行业格局也越发清晰,产业链的上下游已经初见成熟,希望速感科技目前在做的事情,能够通过自身在发展中的不断积累,真正的,实实在在的推动正在兴起的机器人产业的进步与发展。(本文独家首发钛媒体,根据速感科技创始人、CEO陈震在钛坦白上的分享整理)
陈震毕业于清华大学信息交叉学科(计算机方向)信息科学国家实验室,主攻机器人交互技术。是中关村双创服务机器人产业联盟(RFC)成员、2016中关村U30成员、北京市海淀区青年英才、"雏鹰计划"成员、多所国际顶尖学术机构访问学者。曾担任国家重点科研项目负责人,获全国大学生挑战杯金奖,参与多项机器人研究项目合作,个人拥有多项国家科技发明专利及学术论文。速感科技是一家以机器视觉为核心的人工智能创业公司,目前已完成三轮融资。
- SLAM技术,让真正的智能机器人触手可及(02-16)
- 机器人自主移动的秘密,从SLAM技术说起(10-21)
- 揭秘机器人自主移动背后技术,从SLAM技术说起(10-22)
- 自主移动机器人的定位与地图创建(SLAM)关键性问题(02-07)
- LT3751如何使高压电容器充电变得简单(08-12)
- 三路输出LED驱动器可驱动共阳极LED串(08-17)