大数据及其可视化
上QQ阅读APP看书,第一时间看更新

1.1.1 数据与信息

数据是反映客观事物属性的记录,是信息的具体表现形式。数据经过加工处理之后,就成为信息;而信息需要经过数字化转变成数据才能存储和传输。所以,数据和信息之间是相互联系的。

数据和信息也是有区别的。从信息论的观点来看,描述信源的数据是信息和数据冗余之和,即数据=信息+数据冗余。数据是数据采集时提供的,信息是从采集的数据中获取的有用信息,即信息可以简单地理解为数据中包含的有用的内容。

一个消息越不可预测,它所含的信息量就越大。事实上,信息的基本作用是消除人们对事物了解的不确定性。信息量是指从N个相等的可能事件中选出一个事件所需要的信息度量和含量。从这个定义看,信息量与概率是密切相关的。