什么是大数据呢?如何分别?

现在AI流行,大数据已不新鲜了,已经悄然进入到应用阶段。

但是什么是大数据呢?这似乎不是问题,我们一提起就说,数据量有TB,PB级,这其实是说数据量规模很大。而大不是一个绝对的词,而是相对的,相对于小。这里的“小”指的是网络信息化时代以前,我们现在说的大数据是指网络信息化时代的数据规模相对于以前很大,是大数据。数据类型相对于很以前很多,是大数据。这些数据量大类型多样的数据,往往蕴含着我们未曾发掘的巨大价值,是大数据。这些巨大价值,传统的数据处理方式已经不能试用,需要新的处理模式,是大数据。

 

大数据是网络信息化时代产生的,还可以依据其产生的来源分别。不管多大数据,数据都是一种度量数值,都是对人类活动的描述,如太阳一天走过的刻度是二十四小时3600秒,麦迪35秒13分,卡特44秒12分,独立的纯数学数据毫无意义。如此,我们可以把大数据按来源分为两种一种是to B,一种是to C。企业端大数据,主要指的是“全时”采集而产生的大量实时历史数据。如历年产量,价格变化数据,每分每秒温压变化数据。什么是大数据呢?如何分别?

消费端大数据,主要是指“全量”采集而产生大量活动历史数据。如全国各地区各用户的访问数据,交易记录。

什么是大数据呢?如何分别?       企业端的数据主体往往是确定的,主要是全时采集。消费端的数据主体往往是不确定的,主要是全量采集。

大数据的首要问题就是获取数据,清晰的认识大数据的产生,来源,特性,有助于我们健全,准确的获取数据。

  • 我的微信
  • weinxin
  • 我的微信公众号
  • weinxin
avatar

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: