首页 > 代码库 > 读“图”智慧:大数据“画像”的应用未来
读“图”智慧:大数据“画像”的应用未来
互联网的内容主流,已经出现从文字转向图片的趋势,这标志着互联网已经进入“读图时代”。在“读图时代”的大背景下,图像中的海量非结构化数据的挖掘成为价值潜力的集聚地,如何挖掘其中隐藏的用户“密码”,成为大数据“落地”遇到的一大挑战。
图片大数据挖掘,主要目标是从中提取出图片的自身特征,包括语义、质量、关联度、实体义项等。由于在互联网的推动下,信息载体和用户交流媒介已经从文字转变到了图片,图片的便捷性,使得网站与用户之间的互动更加频繁,而图片的交互输入与展现,也让数据的展现更加直观。
随着图片数据规模的增大,万亿量级的数据对算法的效率提出了更高要求,这不仅仅需要数据结构方面的优化,而且需要对数据的形态进行更深入的把 握,以往那些以结构化为主的数据形式,不再能满足图像分析所需,面向知识本身的数据模型逐步建立起来,这些模型能够支持支持用户的任务与决策支持购物、决 策,还可以支持数据自动与其任务标的、属性相结合,对图像背后隐藏的需求进行挖掘,并通过与周边环境信息进行关联计算,形成完整的大数据“画像”系统。
另外,为了避免图片质量的良莠不齐,人工智能计算的引入,将为图片大数据分析带来自动预测和计算图片质量的能力。这一基于图像的大数据“画像”能力,在谷歌的Gmail中率先得到了应用。
日前,谷歌利用数据库技术打击Gmail邮寄儿童色情图片的行动获得了成效,一名休斯敦男子在企图利用Gmail邮寄儿童色情图片时被警方逮捕,而通知警察的正是他的邮件服务提供商谷歌。谷歌希望利用这种技术与政府合作,防止犯罪,并降低犯罪率。
据称,谷歌的这项数据库技术主要是通过对出现在网络上的儿童色情图片进行扫描,每一张图片都将拥有一个独特的数字ID,就如同指纹一样。而如果 谷歌在用户的Gmail邮件中发现可疑的儿童色情图片,就会比对图片“指纹”,通过人工审核之后提交给相关部门,例如警方之类。
除了线上的应用之外,大数据图像挖掘技术在线下一样有着广阔的前景,这最明显体现就在城市管理和交通优化方面。
通过对交通拥堵建立模型,我们不仅可以对整个城市交通的状况做实时监测,并发布交通的拥堵状况,还可以对一个城市交通可能会发生的大面积的交通 瘫痪作出提前预测。目前的城市交通路况信息还只是采集技术,告诉你现在堵和不堵。而更公众更关心的是,到底什么时间走,到底多长时间能够到达,到达之后会 不会又堵了?到底要花费多长时间,甚至我要产生多少能耗,我要花多少油钱,基于这些,进而引导公众的出行,真正实现绿色交通。如此,在交通诱导服务的基础 上,就可以实现城市交通的优化配置。
另外,参照交通优化模型,还可以开发城市环境模型,对持续的城市雾霾给出一个明确的发生原因,以便做出实时监测和应对。例如,可以通过监测到任 何一个路段,任何一个区域或者全市实时监测,在这个时间里面所有车辆碳排放的情况,结合交通系统进行综合优化,用技术来引导公众出行,跟信息服务结合起 来,综合促进智慧城市的形成。
尽管目前线上线下的图片数据信息已经极大丰富,但我们对图像中所蕴藏数据价值的探索,还处于初级阶段,不论是互联网方面的信息服务,还是线下结 合物联网的服务,未来的应用前景都非常广阔。可以说相关技术已渐成熟,但是普及尚需一段时间。当前的主要问题不是技术方面,而是如何应用这些技术、将技术 与相关需求有效结合。在这方面,需要综合性的跨产业支持策略和智慧协作,才能够切实推动。