2018年7月5日,中国地理信息产业协会常务副会长胥燕婴,中国测绘科学研究院副院长、首席科学家、国家智慧城市标委会委员李成名、吉林省测绘地理信息局副局长吴向东来到省政府门户网站访谈直播间,介绍吉林省地理信息产业发展及大数据技术应用有关情况。
【
主持人】:这两年,关于“大数据”的话题日益火爆,频繁出现在各种报告和演讲中。网友们非常感兴趣的是,到底什么是大数据?什么又是时空大数据?请李成名院长为我们解读一下。
【
李成名】好,谢谢主持人。大数据是一个普通的概念,但就这么一个普通的概念,目前在国际上在学术研究领域还没有一个公认的统一的概念和说法,我们综合相关信息可以这样认为:大数据是指规模(体量)和复杂度(多样性)常常超出了现有数据管理软件和传统数据处理技术在可接受的时间内收集、存储、管理、检索、分析、挖掘和可视化(价值)能力的数据集的聚合。
尽管在概念上还没有统一的认识,但它的五个特点是非常清晰的。第一是体量比较大,我们现在常说TB级的大数据,到了大数据阶段,我们可能是PB级的、EB级的、ZB级的。第二是种类比较多,我们有结构化的数据、非结构化的数据、半结构化的数据。结构化的数据就像我们地理信息这类数据,像地形图、影像图,这类数据是结构化的数据,我们过去传统的数据库管理的多是这种结构化的数据。还有一种是半结构化的数据,像公安的户籍数据、统计的各种表格数据,还有其他各种各样的专业部门所产生的表格式的数据,这些数据都属于半结构化的数据。第三类是指非结构化的数据,我们最常见的如大街上各种交通部门、公安部门的视频流的数据,就是视频监控的数据,这类数据是非结构化数据。现在大数据管理和传统不一样的地方,过去多为结构化数据,现在都为半结构化数据和非结构化数据。
第三个特点,更新变化速度比较快。过去结构化的数据常常是半年甚至一两年才更新一次,可是现在我们进入了大数据的阶段,我们更新的频次、频率可能是每秒钟数据都在变化,都在更新。这些更新变化的数据每时每刻都要追加到我们的大数据当中来,对它的管理、对它的其他的要求比过去要高得多。
第四个特点,价值较大。正因为汇集了、聚集了这么多的数据,这些数据潜藏着很多的规律、知识、模式,对我们政府的决策、对便捷老百姓的生活意义很大,价值很大。
第五个特点,高并发。一个城市当中,我们这种非结构化的基于传感获取的实时的动态数据有的城市是几万、几十万甚至上百万、上千万个探头不断在探测城市的变化,这些数据和高并发的要追加到我们的数据当中来。
所以,五个特点是非常明确也是非常明显的,尽管定义不统一,但是它的特点是非常清晰的。
那么,大数据的作用既对我们地理信息有很大的价值,同时我们地理信息时空大数据这一块又对整个大数据非常有价值,我首先说第一个方面:时空大数据对大数据是非常有价值的。时空大数据是大数据的一种,是一类大数据。这类大数据是指时间和空间有关系。它同时又是其他各种大数据的载体,以各种时间、各种其他专题的大数据要放在这个时间和空间的载体上,就可以进行交换、集成和共享,它是一个基础的平台。所以,时空大数据既是大数据的一种,同时也对其他各种类型的大数据进行承载,又是他们集成、交换、共享的平台,所以它的作用和价值是非常大的。
大数据本身的发展、形成又对整个地理信息时空大数据提供了很多的发展机遇,比如在维度上,过去我们看到的地图时空数据多是二维的,后来我们可以看到三维的地理信息,现在它作为各种专题大数据的承载平台,要把多种力度多种类型大数据放在这个时间和空间的框架上,这个时空大数据一定是多维的、动态的,我们有室内、室外、地上、地下、虚拟空间和现实空间,而且还是随着时间变化的。所以,给整个大数据要提供这样一个多维的动态的时空框架,才能承载各类大数据,所以第一个,大数据的发展对时空大数据带来的机遇是这样的。
第二,尺度的概念。我们都知道,地图地理信息时空大数据是源于模拟时代,几千年前,人类把所获得的知识刻在瓦片上、树皮上,是干什么?是一个模拟的建制。所以,这个时候为了人类使用它的时候好计好算,我们往往尺度设置为1:500、1:10000、1:50000、1:10000,口算心算就可以了。但是我们到了计算机时代,到了数字时代,计算机更易识别的尺度是2、4、8,2的N次方,所以将来地图的尺度可能不是1:100、1:1000,人类心算口算,将来的尺度可能是2、4、6、8,计算机更容易计算的尺度和空间。
第三个方面,时空大数据带来的发展机遇和变化就是内容上。过去可能是八大要素、九大要素,在地图上承载的是这些信息。将来它作为各种专题数据、各种其他大数据承载的载体,它要起到一个桥梁的作用,能够把各种大数据集成到我们的基础平台上,这个时空大数据上,这时候能承载各种专题大数据和时空大数据之间的桥梁要建起来,这个桥梁就是地理地址,我们把地名地址更加精细化、更加精准化,追加到地图上去,有了这个桥梁,将来再把各类大数据在时间和空间上有序化,就非常方便、非常便捷,而大数据只有在时间和空间上有序地排列起来,有序地规整起来、管理起来,我们后续才能够深挖它的价值,才能分析潜在数据背后的知识、规律和模式,来支撑我们的科学决策,来支撑老百姓生活的便捷,来支撑政府的精细科学管理。