大数据挖掘及相关编程语言学习
大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具, 在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。(在维克托 ·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查) 这样的捷径,而采用所有数据的方法[1])大数据的4V特点:Volume、Velocity、Variety、Veracity。
相关编程语言
python
- 结合了pylab 等诸多插件以后,python变成了超越matlab,R语言等的超级武器.(如matplotlib,numpy,pandas,ipython等)
- 特点是全免费,全部公开源代码.
- 参见教程 利用python进行数据分析