大数据时代:3V(Volume、Velocity、Variety)——>分布式存储
Twitter工程师Nathan Marz提出,Lambda系统架构提供了一个结合实时数据和Hadoop预先计算的数据环境的混合平台,以提供一个实时的数据视图,包括:批处理层、实时处理层、服务层
架构总览:
架构实现总览:
应用举例:信用卡欺诈系统
特点:
日志收集Flume
数据同步工具
分布式存储
分布式计算
产生视图
数据序列化
视图数据库
HBase Cassandra Impala Redis/memcache MySQL Lambda架构之实时处理层
特点
实时数据收集
实时数据分析
Spark Streaming
视图存储数据库
HBase Cassandra Impala Redis/memcache MySQL Lambda架构之服务层特点
支持随机读 需要在非常短的时间内返回结果 读取batch layer和speed layer结果,并对其归并Lambda架构实现1
Lambda架构实现2