大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
//最小的基本单位是bit按顺序给出所有单位: bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。 //它们按照进率1024(2的十次方)来计算: 1 Byte =8 bit 1 KB = 1,024 Bytes = 8192 bit 1 MB = 1,024 KB = 1,048,576 Bytes 1 GB = 1,024 MB = 1,048,576 KB 1 TB = 1,024 GB = 1,048,576 MB 1 PB = 1,024 TB = 1,048,576 GB 1 EB = 1,024 PB = 1,048,576 TB 1 ZB = 1,024 EB = 1,048,576 PB 1 YB = 1,024 ZB = 1,048,576 EB 1 BB = 1,024 YB = 1,048,576 ZB 1 NB = 1,024 BB = 1,048,576 YB 1 DB = 1,024 NB = 1,048,576 BB //全称: 1 Bit(比特) =Binary Digit 8 Bits = 1 Byte(字节) 1,000 Bytes = 1 Kilobyte 1,000 Kilobytes = 1 Megabyte 1,000 Megabytes = 1 Gigabyte 1,000 Gigabytes = 1Terabyte 1,000 Terabytes = 1 Petabyte 1,000 Petabytes = 1 Exabyte 1,000Exabytes = 1 Zettabyte 1,000 Zettabytes = 1 Yottabyte 1,000 Yottabytes = 1Brontobyte 1,000 Brontobytes = 1 Geopbyte洛杉矶警察局和加利福尼亚大学合作利用大数据预测犯罪的发生
海量化(Volume) 数据量从TB到PB级别
多样化(Variety) 数据类型复杂,超过80%的数据是非结构化的
快速化(Velocity) 数据量在持续增加(两位数的年增长率) 数据的处理速度要求高
高价值(Value) 在海量多样数据的快速分析下能够发挥出更高的数据价值
快速查询 - 全量查询
数据存储 - 量大,文件大
快速计算 - 对比传统方案
实时计算 - 最新数据
数据挖掘 - 新价值