什么是storm
- 分布式实时计算系统;
- 与hadoop为批处理提供map和reduce这两种操作原语类似,storm为实时处理也提供了spout和bolt这两种操作原语。
storm的特点:
- 可扩展性,通过增加集群机器、调整计算并行度,即可以扩展计算性能;
- 保证数据不丢失,每条消息至少能被执行一次;
- 健壮性,集群状态保存在zookeeper中,节点不保存状态,节点故障不影响系统运行;
- 容错性,计算任务错误时,能够及时重新分配、运行计算任务,保证计算任务永远运行;
- 支持多种开发语言,java、python等。