深度学习让机器变人脑,谷歌打造新一代的智能地图
2018-09-28 17:36:10
  • 0
  • 0
  • 0

超过10亿个活跃用户、涵盖3300万公里、220个国家与上亿的地标资料,结合运作超过10年的地面实况计划(Ground truth),使得谷歌地图(Google Map)早早成为地图软件的世界霸主。

2017年,谷歌将人工智能技术里的"深度学习"与地图结合。谷歌地图的软件工程师Andrew Lookingbill于2018年9月举办的"谷歌机器学习发表会-谷歌地图应用",分享深度学习在地图上的应用。

Lookingbill指出,在辨识店家照片、路牌、门牌等街景信息对于电脑自动化作业是很大的挑战。虽然门牌或招牌已涵盖制作地图所需的内容,但这些信息通常混杂且无序,而派出的街景车并非每次都能以同样的角度截取图片资料。

过去我们通过字元辨识软体去分析影像内容的光学字元识别(OCR)方法,并不足以应付此类杂乱环境的消息,深度学习便很适合在此时发挥力量。

何谓深度学习?人工智能在应用层面有强弱之分,强人工智能意指任何领域通用且具备人的能力;弱人工智能则专指在某些特定领域具备人的能力,例如声音、图像识别。

深度学习则属于弱人工智能里机器学习的一个分支,用机器模拟人类大脑在处理资料的运作模式,配合大量资料让机器深度学习,就能训练机器学习出一套辨识模型,让机器能够从未结构化的抽象资料判读出有意义的内容。

Lookingbill团队利用深度学习里的"递归神经网络(RNN)",建立出一套注意力机制,让机器能够主动关注或忽视图像里的某些元素;甚至能在机制里制定规范化指令,例如要求机器将影像路牌里的"Av."字元,指定辨识为大道"Avenue"。

这套模型不仅能够大幅改善地图资讯的辨识率,也能对地图信息匮乏的国家,带来许多正面效益。谷歌于2017年在尼日利亚拉各斯城的地图绘制计划中,导入这套注意力机制的成果着实立竿见影,计划期间就能新增2万多条街道名称、5万个地址与10万个店家资讯。

深度学习的力量可不仅如此。通过机器建立出的模型机制,不仅能自动在错综复杂的卫星地图辨识出建筑物,更能在地图上标示出建筑物的俯视平面图。今年初开始,就有超过1.1亿个建筑物透过这套模型绘制到地图上。

随着科技的进步,谷歌地图的功能也不断推陈出新。从支援手机的行动地图,到步行、汽车驾驶与大众运输等不同的导航系统,都提供使用者便利的地图服务。


用AR拯救地图小白

今年举行的I/O大会上,谷歌宣布将把增强现实(AR)技术应用到地图中,使用者只要在使用地图时,同步开启手机摄像头,就能在实景中直接显示导航信息。这解救了一打开地图就眼花缭乱、难以判读的"无方向感一族",可通过直觉式引导,顺利抵达目的地。

增强现实的功能不仅于此,画面若侦测到商家,也会直接在建筑物画面显示店家资讯和评价。更融入虚拟导游的功能,使用者利用增强现实模式找路时,一支虚拟的小狐狸会跳进导航页面里,为这趟虚拟旅程带路。

 
最新文章
相关阅读