YARN采用了基于事件驱动的并发模型,该模型能极大的提高应用程序并发性,在RM中,几乎所有的事件都通过AsyncDispatcher进行事件的派发.
其基本架构图如下:
从基本的架构图可以简单的看出,该模型还需要几个基本的要素,那就是 事件(Event) , 事件类型(EventType) 和处理事件对应的 处理器(Handler) .
在HADOOP中,事件被定义如下:
1 | public interface Event<TYPE extends Enum<TYPE>> { |
事件类型(EventType)则是简单的枚举类
主要功能定义事件有哪几种类型 :
1 | public enum NodesListManagerEventType { |
处理事件的接口
主要功能处理相应的事件
1 | public interface EventHandler<T extends Event> { |
Dispatcher通过 不同的事件类型(EventType)找到相应的handler对事件(event)进行处理 .
对于AsyncDispatcher来说,它实现了Dispatcher接口:
1 | public interface Dispatcher { |
其中有两个基本的方法,register和getEventHandler
register在AsyncDispatcher使用之前就需要先注册eventType和对应的EventHandler,而getEventHandler方法主要则是把事件(event)放入eventQueue中.
接下来在ResourceManager举个简单的例子:
在RM初始化自身基本服务的时候,会把相应的事件类型(EventType)和事件处理器(EventHandler),先注册在AsyncDispatcher上,以便于派发器在事件(event)到来时做出相应的处理.
RM的部分代码:
1 | // Register event handler for RmNodes |
其实注册也就是把相应的类型和处理器放到一个HashMap中
因为是资源管理方面的服务,所以我们进入ResourceTrackerService类中,找到nodesListManager这个实例,通过代码可以知道nodesListManager是用来管理节点是否可用,并作出相应的处理
1 | // 2. Check if it's a valid (i.e. not excluded) node |
从代码可以看出,如果节点是非法的,则从Dispatcher获取Handler,并构造一个RMNodeEventType.DECOMMISSION类型的事件,这个RMNodeEvent将会被放到eventQueue中
1 | class GenericEventHandler implements EventHandler<Event> { |
最后由dispatch进行通过传入的RMNodeEventType找到相应的NodeEventDispatcher(即EventHandler),并调用handle进行处理.
总结:
通过了解AsyncDispatcher可以提升自己理解Yarn的工作流程,加深对Yarn的设计实现的了解.