超过 4PB 的数据怎么用?四维图新搞了个 MineData 位置大数据平台
百度最近因为自动驾驶风光无限,但在地图领域占据半壁江山的四维图新也没闲着。6 月 13 号,他们发布了一个名为「MineData」的位置大数据平台。 这也成为继数字地图、车联网、自动驾驶之外,四维图新第四个重要的业务板块。这个产品将由四维图新旗下的子公司世纪高通负责运营。 我们先来说说四维图新做这个平台的缘由。 世纪高通副总经理兼四维图新首席架构师石清华在发布会上作了说明。在他看来,现在的地图早已不再是单纯的地图,而是变成了一个平台和载体,开始为各行业提供全方位的服务。未来,各行各业对地图的需求将与各自的特征紧密结合,越来越专业化、定制化。但是,现在企业用到的地图大多是从 2C 端的产品演化而来各种开放平台,同质化非常严重,缺乏专门定制的行业地图。因此,MineData 应运而生。 当然,如果以上说法太晦涩,我们再换个角度来看。根据四维图新副总裁、世纪高通总经理梁永杰的说法,MineData 其实是一个随项目而生的平台,也就是说,四维图新在解决用户遇到的问题的过程中,慢慢发现可以做一个这样的产品。这在 MineData 的一些特点中也有体现,如数据的可视化和数据分析便利性,数据在行业和业务里的适应性等等,这些都是 MineData 所要重点服务的 B 端用户所关注的点。 所以,MineData 位置大数据平台到底是什么?事实上,它主要包含数据蜂巢(MineCatalog)、可视化地图(MineMap)、实验室(MineLab)三大板块,通过数据汇聚、可视化和分析能力,为全行业提供基于位置大数据的解决方案。 先说说数据蜂巢。既然是大数据平台,自然少不了数据的收集和整理。目前,四维图新的数据总量已经超过了 4PB,而且还在以每天 2.8TB 的速度增长(这些都是规格化之后的有序数据,而不是原始的、杂乱无序的数据)。随着车联网、自动驾驶等业务的发展,数据规模的增长速度势必会更加迅速。 不过,这体量庞大的数据并不是集中在一起的,而是分散在四维图新不同事业部乃至子公司的服务器上,如何聚集、整合、打破潜在的信息孤岛,让数据发挥更大的价值,是一个必须要解决的问题。「数据只有盘活才有新的价值,数据只有跨界才有新的故事」。而这正是数据蜂巢要做的事情。 数据蜂巢系统由「探针-蜂巢-数据沙盒」这个三层结构组成。首先,在每个业务口的数据集群处有一个如探针般导流数据的机器,这些机器把数据源源不断地导流入被称为「蜂巢」的数据仓库,并进行数据清洗。然后,它们被依据属性分门别类地存储在数据沙盒里对外供给。而且,企业也可以在自己那边部署数据蜂巢和四维图新的数据蜂巢相对接,形成一个生态循环网络。世纪高通副总经理兼四维图新首席架构师石清华在专访时透露,四维图新采取了自建 IDC 和腾讯云的混合云机制来为这些数据提供双重的安全保障。作为 MineData 的基石,数据蜂巢系统保证了数据的活力和多维度性。 有了数据,接下来就要考虑如何去用了,这也就是 MineMap 和 MineLab 要干的事儿。 按照四维图新的说法,MineMap 提供所见即所得的地图定制服务,将以前非常专业的地图配置问题按照互联网的交互体验进行了重构,使数据在视觉方面达到用户想要的效果。 考虑到具体业务需要与地图进行叠加显示,MineMap 推出了可视化模板,包含轨迹点亮图、城市柱形图、热力图等等各种地图特效。 此外,MineMap 还提供了表现一致的引擎,为 Web、Android 和 IOS 多平台准备了第三方开发接口,实现了一处配置、多屏运行。 如果说 MineMap 的操作流程大致是选择数据、配置数据、出定制地图,那么 MineLab 则是选择数据、配置算法、出分析结果。如春节期间的人口迁徙图就是基于一种叫做 OD(交通出行量) 的算法得出的结果。而且,相比于 MineMap 的锦上添花,MineLab 的数据分析才是 MineData 的核心所在。 在石清华看来,MineLab 是 MineData 中最有魅力的部分,因为它可以提供近似真实环境的实验室,里面有近似真实的场景数据。他认为,现在大数据分析最难的不是技术,也不是算法,更不是可视化,因为算法可以不断调整,可视化有很多借鉴,最难的是数据和完备的数据场景。 说了这么多理论的东西,MineData 具体可以有哪些应用场景?梁永杰举了一个汽车长途行驶的例子:当行驶区域天气状况恶劣复杂时,传统的天气预报就不够用了,而 MineData 的处理方式是,首先选取实时更新的、精确的天气数据,然后选择路径规划算法,将天气数据按时间和空间与路径相匹配,最后再选择路径的可视化方案,将路径上的天气生动地呈现出来。这样,乘客就可以规避天气比较恶劣的出行路线,提高出行的舒适度和安全度。 除了一般的汽车行驶,MineData 同样可以运用到自动驾驶上。例如,一方面汽车可以为 MineData 提供数据来源,另一方面,MineData 可以帮助训练自动驾驶模型。 而不管是梁永杰还是石清华,他们口中提到最多的词就是「开放」。在四维图新看来,MineData 是个开放且极具互动性的平台,而且只有开放和互动才能发挥这个平台真正的作用。 例如,在数据整合方面,作为 B 端产品,MineData 不像 C 端产品那样仅仅自己收集数据,而是同样允许用户自己上传数据,通过数据的融合去发掘更大的价值,并通过这样一种互动和配合来实现定制化、个性化的服务。 同样,在如何处理数据这个问题上,MineData 也将给予用户很大的自由,它仅仅只是在 MineMap 和 MineLab 中为用户提供基本的模板和算法,具体的结果需视用户自己上传的数据以及选择的数据处理方式而定。 总而言之,MineData 的使命和任务是基建和开放。也就是说,四维图新完成基础地图和位置大数据的工作,为各行各业提供一个开放合作的大数据平台,而各行各业则根据自身的需求,运用这个平台为自己定制个性化服务,二者分工合作,以盘活更多的商业价值和行业价值。 在 MineData 的实际应用上,目前,世纪高通已经和西安交警互联网服务中心联手建立了「西安交警互联网+路况大数据平台」,通过提供各种位置大数据服务来协助交通管理部门进行指挥调度,疏导城市交通。 总之,如何利用好自己手中的数据,让它不再是冷冰冰的数据,甚至产生更大的价值,这就是四维图新在想的事儿,其实也是很多手握数据的公司在琢磨的。MineData,只是这股大潮的一个缩影。 有一个细节很有意思。在发布会当天早上,天空阴云密布、雷雨交加,后来转而晴空万里。梁永杰应着这个景说了一句「雨就是财,晴空万里就是顺」。或许,这也是这个时代对大数据的祝福? 原创声明: 本文为 GeekCar 原创作品,欢迎转载。转载时请在文章开头注明作者和「来源自 GeekCar」,并附上原文链接,不得修改原文内容,谢谢合作! 欢迎关注 GeekCar 微信公众号: GeekCar 极客汽车 (微信号:GeekCar)& 极市 (微信号:geeket)。