您的当前位置:主页 > 科技实践 > 实践日志 >

绘游记——“探访人工智能创新型企业”——世界机器人大会(二)

发布时间: 2018-09-10 14:04 文字: 新闻传媒中心浏览:

819日早晨,实践队来到了北京亦创国际会展中心,参观世界机器人大会。当日下午,两位组员刘子翰,吴凌辉前往北京大学和前沿计算中心博士后庄一新学长探讨了人工智能的相关问题。

(北京大学前沿计算中心)

 

大会会馆总共分为AE五个馆。我们首先进入了A馆工业机器人展区。顾名思义,A馆的机器人主要展出的都是工业用的机器人,其形状也并非人型。工业机器人更多的是智能化生产线、协作机器人以及一些机器人,体现了比较强的硬件水平和设计水平。


其中一个机器人应用了深度学习以及三维相机,实现了工业零件的自动分拣。其中双目三维相机可以得到物体的深度信息,结合一定的算法可以成功实现零件的抓取而不会抓空。原理便是单目观测物体会造成物体的前后视差,而双目观测可以对此进行弥补。


(例如,两手各握一支铅笔,让笔尖相对,距离30厘米左右。闭一只眼,将两支铅笔的笔尖慢慢向中间靠拢。一般说,第一次不能让笔尖碰到一起。因为人的视觉习惯是双视线在空间里交叉于物体进行定位。闭上一只眼睛后,神经仍然会指挥双手按照习惯运动,而单眼与双眼的视觉效果是不同的,因此不会碰在一起。但在多次试验后会碰上,因为神经已经适应了,能够做出正确的定位判断了。)

 

深度学习则是通过对机器的训练,让机器对零件的形状进行单模板匹配,得出不同类型零件与模板之间的相关值取值范围,从而在之后的应用中,实现对不同零件的分类。每一次的成功分类都会加权后对取值范围进行改动。归功于深度学习,单模板的成功率相较于多模板才没有下降,反而提高了速度(通过简单询问在场的工作人员,对深度学习应用于地物标识等方面的可能性有了一定的认识。因为地物形状、大小各异,因此相较于分拣零件这类的简单学习过程,会需要更长的训练周期,也需要硬件上进行一定的升级。)

 

接下来的B馆以服务机器人为主题,更贴近日常的使用。在具体的应用方面,主要有安防、配送、服务类三种,也包含医疗、物流等方面。其中京东的铁甲钢拳和机器人家族很吸引观众的目光,北京理工大学研发的专家决策系统辅助的医疗穿透设施和斯坦福大学的研究成果都是AI在医疗机器人方面的展现。

 


中信重工开诚智能装备有限公司研发的消防、防爆、灾区侦测机器人以及安泽智能工程有限公司研发的多款巡逻、讲解、防爆机器人也吸引了我们的目光。


正如人的生活离不开眼睛,这三类机器人中的绝大多数都和视觉脱不开关系,这也契合了庄学长说的内容,即视觉计算(Vision Computing是机器人必不可少的部分

 

视觉的功能主要体现在图像重建(Image Reconstruction)和即时定位(Navigation可以称为SLAMSimultaneous Localization And Mapping)或者CML (Concurrent Mapping and Localization)。该模块的作用便是将机器人镜头/激光发射器获取的照片/点位信息,通过不同的数学模型进进行计算,得到周围物体的深度信息。若与已知坐标系相关联,则可以得到周边物体的位置坐标。

 

SLAM中具体的计算过程和摄影测量学中的思想方法十分一致,逐帧对周围环境进行拍摄,相邻的每一帧图像或者每一束激光都有重叠部分,对重叠部分进行影像配准从而连接两个两张图像并进行深度信息的还原。若是利用RGBD相机或三维相机,则可以直接得到距离信息(深度信息),使得环境重建更接近真实值。

 

图像拼接与重建中的一个很重要的问题便是误差的累积导致的图像无法闭合(loop,这就涉及了优化问题。由于知识的积累薄弱,我们暂时没有对这个问题进行进一步的了解。

 

除了视觉,另一个重要的模块就是路径规划(Path Planning(庄一新学长语),使得机器人能够自主/半自主规划巡航路径。这个模块大多会离线好环境的地图,预先规划好一条路径,再与视觉模块结合,对动态的物体进行识别、对动作进行预判,从而对路径进行优化。路径的优化则又涉及了很多问题,例如路线光滑程度(二阶/三阶光滑)、避障等。

 

除却展会上的机器人,在探访庄学长时,他也指出,比较新的扫地机会有一个机制:在每一次清洗中,对室内的地图进行一次修改,经过多次清洗后,得到一个趋于稳定的室内地图,已达到清理每一寸地板的目的。限于我们的知识积累,学长和我们交谈的内容也比较浅显,但也使我们对在机器人大会上看到的一些产品的功能有了些许原理、技术上的理解。学长也是刚刚进入视觉计算这一部分,他认为:同组的学生愿意不断尝试,得到的成果甚至比自己更加丰硕。而每个对这一领域有兴趣的同学都可以在练习好编程的基础上,试着对已有的系统进行了解。在了解后都可以进行实践,联系校内相关的老师进行实习。这说明AI并不是遥不可及,而是我们身边可以去尝试的一个事物。



小专题:机器人大会之视觉SLAM

    2018世界机器人大会与815日在京召开,此次展区由工业机器人、服务机器人、特种机器人、人工智能等部分组成。涵盖世界机器人领域的最新科研成果、应用产品与解决方案,为我国机器人产业提供国际性产业交流平台。

在未知的环境从一个未知位置开始移动,如何在移动过程中根据位置估计和地图进行自身定位,同时在自身定位的基础上建造增量式地图,来实现机器人的自主定位与导航。对于机器人来说,这是至关重要的一个问题,这也被称作SLAM问题。

 

SLAM是Simultaneous Localization and Mapping的缩写,中文译作同时定位与地图构建。它是搭载特定传感器的主体,在没有环境先验信息的情况下,与运动过程中建立环境的模型,同时估计自己的运动。如果这里的传感器主要为相机,那就称为视觉SLAM”[1]

 

通俗来说,就是机器人没有地图的情况下,想办法知道怎么走,以及自己都走过些什么地方,即让机器人知行合一[2]双目+IMUSLAM的优质方案,利用摄像头的运动和运动传感器的互补性,可为视觉SLAM的研究提供精度更高、成本更低、布置简单、同时可以实现人脸和物体识别的SLAM优质方案。


轻客智能科技有限公司是MYNTAI(小觅智能)旗下在无锡设立的全资子公司,专注立体视觉技术整体解决方案。核心技术包括自主研发的实时3D视觉惯性导航技术VPS、视觉里程计VIO技术、自动驾驶、环境物体识别、人脸/身份识别等。


该公司小觅双目摄像头,内置双红外主动光探测器,可有效增加白墙和无纹理物体的识别精度;六轴IMU传感器能为视觉SLAM以及空间移动算法的研发提供数据矫正;双目帧的同步,可为视觉SLAM算法研发提供精确的图像源,减小因图像不同步而导致的误差,同步精度可达0.05ms;同时也可用于VIO算法的研究。开放SDK并支持多种主流平台和开源项目,通过软硬件的绝佳融合,可以适应丰富发实际应用场景。为我们的进行相应的算法研究与平台开发提供无限可能。



(小觅双目摄像头)

 

 上步科自动化股份有限公司专注于工业自动化产品的研发、生产、销售和技术服务,为工业自动化设备制造商提供整体解决方案,是中国领先的机器自动化解决方案提供商。

 

该公司的百度小型Boteye双目摄像头,采用视觉惯性SLAM技术,并且支持百度VSLAM算法,将无已知地图时定位误差小于1%行走距离,有已知地图时小于0.5%地图尺寸;创新采用深度学习的方法,在摄像头校正不良的情况下仍可恢复图像的深度信息;结合百度云平台,拥有云端物体检测功能,可进行人脸识别,物体识别以及OCR

Boteye双目摄像头)

 

 视觉SLAM作为机器人行业的典型问题,它的解决方案也给我们测绘,导航专业提供了不错的思路,双目+IMU,作为主流的解决方案,贴合现在人工智能的浪潮,其必将大放异彩。

 

[1]---《视觉SLAM十四讲 从理论到实践》高翔,张涛 第1

[2] ---陈士凯

责任编辑: 新闻传媒中心