深度学习让机器变人脑，谷歌打造新一代的智能地图-老段的专栏

深度学习让机器变人脑，谷歌打造新一代的智能地图

2018-09-28 17:36:10栏目：默认栏目 IP属地：北京市大兴区

超过10亿个活跃用户、涵盖3300万公里、220个国家与上亿的地标资料，结合运作超过10年的地面实况计划（Ground truth），使得谷歌地图（Google Map）早早成为地图软件的世界霸主。

2017年，谷歌将人工智能技术里的"深度学习"与地图结合。谷歌地图的软件工程师Andrew Lookingbill于2018年9月举办的"谷歌机器学习发表会-谷歌地图应用"，分享深度学习在地图上的应用。

Lookingbill指出，在辨识店家照片、路牌、门牌等街景信息对于电脑自动化作业是很大的挑战。虽然门牌或招牌已涵盖制作地图所需的内容，但这些信息通常混杂且无序，而派出的街景车并非每次都能以同样的角度截取图片资料。

过去我们通过字元辨识软体去分析影像内容的光学字元识别（OCR）方法，并不足以应付此类杂乱环境的消息，深度学习便很适合在此时发挥力量。

何谓深度学习？人工智能在应用层面有强弱之分，强人工智能意指任何领域通用且具备人的能力；弱人工智能则专指在某些特定领域具备人的能力，例如声音、图像识别。

深度学习则属于弱人工智能里机器学习的一个分支，用机器模拟人类大脑在处理资料的运作模式，配合大量资料让机器深度学习，就能训练机器学习出一套辨识模型，让机器能够从未结构化的抽象资料判读出有意义的内容。

Lookingbill团队利用深度学习里的"递归神经网络（RNN）"，建立出一套注意力机制，让机器能够主动关注或忽视图像里的某些元素；甚至能在机制里制定规范化指令，例如要求机器将影像路牌里的"Av."字元，指定辨识为大道"Avenue"。

这套模型不仅能够大幅改善地图资讯的辨识率，也能对地图信息匮乏的国家，带来许多正面效益。谷歌于2017年在尼日利亚拉各斯城的地图绘制计划中，导入这套注意力机制的成果着实立竿见影，计划期间就能新增2万多条街道名称、5万个地址与10万个店家资讯。

深度学习的力量可不仅如此。通过机器建立出的模型机制，不仅能自动在错综复杂的卫星地图辨识出建筑物，更能在地图上标示出建筑物的俯视平面图。今年初开始，就有超过1.1亿个建筑物透过这套模型绘制到地图上。

随着科技的进步，谷歌地图的功能也不断推陈出新。从支援手机的行动地图，到步行、汽车驾驶与大众运输等不同的导航系统，都提供使用者便利的地图服务。

今年举行的I/O大会上，谷歌宣布将把增强现实（AR）技术应用到地图中，使用者只要在使用地图时，同步开启手机摄像头，就能在实景中直接显示导航信息。这解救了一打开地图就眼花缭乱、难以判读的"无方向感一族"，可通过直觉式引导，顺利抵达目的地。

增强现实的功能不仅于此，画面若侦测到商家，也会直接在建筑物画面显示店家资讯和评价。更融入虚拟导游的功能，使用者利用增强现实模式找路时，一支虚拟的小狐狸会跳进导航页面里，为这趟虚拟旅程带路。