资源调度框架(是Hadoop2.X引入的)
主要作用:解决了mr1的缺陷() 将JobTracker和TaskTracker进行分离 解决了mr中JobTracker的单点故障问题 兼容spark等框架
管理整个集群资源 RM:由 调度器(Scheduler)和应用程序管理器(Applications Manager,ASM)组成
启动完成后向RM汇报资源 管理一个 YARN 集群中的每个节点,做到资源隔离
提交application的时候回创建(AM) 负责 分配和监控task 管理一个在 YARN 内运行的应用程序的每个实例
是由 ResourceManager scheduler 服务分配的资源组成 容器授予ApplicationMaster使用特定主机的特定数量资源的权限 ApplicationMaster也是在容器中运行的
yarn的运行流程步骤
用户向yarn提交应用程序,其中包括ApplicationMaster程序、启动ApplicationMaster的命令、用户程序等。ResourceManager为应用程序分配第一个Container,并与对应的nodeManager通信,要求它在这个Container中启动应用程序的ApplicationMasterApplicationMaster会向ResourceManager注册,这样用户可以通过ResourceManager查看应用程序的运行状态;然后ApplicationMaster会为各个任务申请资源,并监控的他们的运行状态,直至运行结束,重复步骤4~7步。ApplicationMaster采用轮询的方式通过rpc协议向ResourceManager申请和领取资源一旦ApplicationMaster申领到资源后,会与对应的nodeManager通信,要求它启动任务NodeManager为任务设定好运行环境,将任务启动命令写到一个脚本中,并通过运行脚本启动任务各个任务通过rpc协议向ApplicationMaster汇报自己的状态和进度,从而可以在任务失败的时候重启任务。在程序运行过程中,用户可以随时通过ApplicationMaster查看应用程序的当前运行状态应用程序完成之后,ApplicationMaster向ResourceManager注销并关闭自己。扩展性 mr1中jobtracker负责的太多为瓶颈,所有mr1最多支持4000个节点的集群 yarn 却可以支持1万个节点,并行10万个task
可靠性 yarn的ResourceManager的职责比较简单,容易实现HA
并行性 mr1只支持MapReduce,yarn 支持更多的分布式Application
有差错或者需要补充的地方,还望大家评论指出,并详细论证,相互学习,共同进步哈!