Ruby 2.0 中模块前置的实现

Nicole ·
更新时间:2024-09-20
· 580 次阅读

  Ruby 2.0 为模块添加了一个 Module#prepend 方法,根据 API 文档的描述,它以相反的顺序对参数逐一调用 prepend_features 方法。和模块包含类似,会把一个模块的祖先链插入到另一个模块的祖先链中,但跟模块包含把祖先链插到该模块之后不一样,它会把祖先链插到该模块之前。我喜欢把这个特性叫做模块前置。   先举个例子来说明模块前置的作用,并和模块包含作了对比。在这个例子中,类 C 前置了模块 A 和 B;类 D 包含了模块 A 和 B。 module A def foo; 'A' end end module B def foo; 'B' end end class C prepend A, B   # Prepending is done by this line def foo; 'C' end end class D include A, B def foo; 'D' end end C.ancestors # => [A, B, C, Object, Kernel, BasicObject] D.ancestors # => [D, A, B, Object, Kernel, BasicObject] C.new.foo # => 'A' D.new.foo # => 'D'   第 10 行,我们在 C 中前置了模块 A 和 B,这样 A 和 B 插入到 C 的祖先链中了。从 21 和 22 行中的注释中,我们可以看到,在 C 的祖先链中,A 和 B 位于 C 之前。而在 D 的祖先链中,A 和 B 位于 D 之后。   这是为什么第 24 行,C.new.foo 的返回值是 'A',因为模块 A 前置于 C,位于祖先链的前面,方法查找会优先找到 A 中的 foo 方法。   我们看到了模块前置的强大的特性,但疑问也随之而来。显而易见的问题是,C.ancestors 为什么不是从类 C 开始。要解开这个疑问,首先应该弄清楚 prepend 方法都做了哪些工作。我们跟到源代码中去一探究竟,下面是 prepend 的默认实现 Module#prepend 对应的源代码: static VALUE rb_mod_prepend(int argc, VALUE *argv, VALUE module) { int i; ID id_prepend_features, id_prepended; CONST_ID(id_prepend_features, "prepend_features"); CONST_ID(id_prepended, "prepended"); for (i = 0; i < argc; i++) Check_Type(argv[i], T_MODULE); while (argc--) { rb_funcall(argv[argc], id_prepend_features, 1, module); rb_funcall(argv[argc], id_prepended, 1, module); } return module; }

  可以看到,它的行为和 Module#include 方法几乎一样,只不过回调的方法不一样。这里,它回调了参数模块的 prepend_features 方法和 prepended 方法。同样,Module#prepend_features 才是真正干活的地方,所以跟进去看看。 static VALUE rb_mod_prepend_features(VALUE module, VALUE prepend) { switch (TYPE(prepend)) { case T_CLASS: case T_MODULE: break; default: Check_Type(prepend, T_CLASS); break; } rb_prepend_module(prepend, module); return module; }   它做了一些类型方面的检查,然后把工作交给了 rb_prepend_module 函数,我们看看 rb_prepend_module 函数做了什么。 void rb_prepend_module(VALUE klass, VALUE module) { void rb_vm_check_redefinition_by_prepend(VALUE klass); VALUE origin; int changed = 0; rb_frozen_class_p(klass); if (!OBJ_UNTRUSTED(klass)) { rb_secure(4); } Check_Type(module, T_MODULE); OBJ_INFECT(klass, module); origin = RCLASS_ORIGIN(klass); if (origin == klass) { origin = class_alloc(T_ICLASS, klass); RCLASS_SUPER(origin) = RCLASS_SUPER(klass); RCLASS_SUPER(klass) = origin; RCLASS_ORIGIN(klass) = origin; RCLASS_M_TBL(origin) = RCLASS_M_TBL(klass); RCLASS_M_TBL(klass) = st_init_numtable(); st_foreach(RCLASS_M_TBL(origin), move_refined_method, (st_data_t) RCLASS_M_TBL(klass)); } changed = include_modules_at(klass, klass, module); if (changed < 0) rb_raise(rb_eArgError, "cyclic prepend detected"); if (changed) { rb_clear_cache(); rb_vm_check_redefinition_by_prepend(klass); } }   这个函数做了一些工作,我们来分析一下。前 16 行都是在做一些类型检查等工作,我们跳过。从第 17 行开始分析。   首先,宏 RCLASS_ORIGIN 获取 klass 的 origin 成员,并且把它和 klass 比较。我们不知道 origin 字段有什么作用,我们先假设测试条件为真,即 klass 的 origin 成员指向自身。我们来分析一下 if 语句中的逻辑:   19 行为 klass 创建了一个新的包含类,我们把它称为原始类;   20 ~ 21 行把新创建的包含类插入到 klass 和 klass 的父类中间;   22 行将 klass 的 origin 成员指向了新类;   接下来,23 ~ 24 行把 klass 的方法表转移到新类中,并清空 klass 的方法表;   后,25 行又把 klass 原先的方法表中的 Refined 方法移了回来。   分析完 if 语句,我们继续前进,来到第 28 行。等等,你好像看到了熟悉的东西。没错,那是 include_modules_at 方法。在前一篇文章中,我们讨论了这个函数,它用来包含某个模块。你简直不敢相信自己的眼睛,明明是在前置模块,怎么突然又变成包含模块了?   是的,没错,它是在包含模块。被包含的模块的祖先链插入到了 klass 和 klass 的原始类之间。由于 klass 内部的方法表已经转移到上游的原始类中,所以插入的位置正好合适。Ruby 通过这种变换,巧妙地将前置模块转化为包含模块,太棒了。   下面这个图描述了文章开头的那个例子中,类 C 中 prepend A, B 语句执行前后的状态:   +-----+      +--------+   Before:  |  C  |----->| Object |   +-----+      +--------+   +--------------- klass ----------------+   |                                      |   v                                      |   +-----+      +-----+      +-----+      +-----+      +--------+   After:  |  C  |----->|  A  |----->|  B  |----->|  C' |+---->| Object |   +-----+      +-----+      +-----+      +-----+      +--------+   |                                      ^   |                                      |   +--------------- origin ---------------+

  正如之前分析的那样,C' 是那个新创建的包含类,它是 C 的原始类。但如果是这样的话,还是无法解释之前的疑问:为什么 C.ancestors 不是从类 C 开始?要搞清楚这个问题,我们来看看 C.ancestors 是如何工作的。   我们找到了 Module#ancestors 的源代码,它看起来比较简单: VALUE rb_mod_ancestors(VALUE mod) { VALUE p, ary = rb_ary_new(); for (p = mod; p; p = RCLASS_SUPER(p)) { if (FL_TEST(p, FL_SINGLETON)) continue; if (BUILTIN_TYPE(p) == T_ICLASS) { rb_ary_push(ary, RBASIC(p)->klass); } else if (p == RCLASS_ORIGIN(p)) { rb_ary_push(ary, p); } } return ary; }   该函数首先创建了一个数组,然后对遍历模块的祖先链,对每个祖先,如果是包含类或者原始类指向自身,放在返回的数组里面。另外,它还会跳过单例类。   至此,之前的疑问也得到了解释,C.ancestors 并没有把 C 自身包含进去,因为它既不是包含类,也不是 origin 指向自身的类。而 C.ancestors 返回的数组中的 C 其实是 C 的原始类,同时也是 C 的包含类,所以它才有 C 这个名字。   模块前置其实也是通过模块包含来完成的,只不过在包含之前做了一些特殊处理:创建了一个原始类,然后在原始类之前包含模块。但由于原始类也是一个包含类,因此被前置模块的某个祖先可能会越过原始类,比如下面这个例子: A = Module.new module B def bar; 'B' end end module C include A, B end class D include A prepend C def bar; 'D' end end D.new.bar # => 'D'   类 D 在前置模块 C 之前,包含了模块 A。下图中,前两个是 D 前置模块 C 之前,D 和 C 的祖先链,第三个是 D 前置模块 C 之后,D 的祖先链。   +---+    +---+    +--------+   | D |--->| A |--->| Object |   +---+    +---+    +--------+   +---+    +---+    +---+    +--------+   | C |--->| A |--->| B |--->| Object |   +---+    +---+    +---+    +--------+   |   +-----------------+  A 使得插入点移到了 D' 的后面   |   v   +---+    +---+    +---+    +---+    +---+    +--------+   | D |--->| C |--->| D'|--->| A |--->| B |+-->| Object |   +---+    +---+    +---+    +---+    +---+    +--------+   正如图中标注的那样,模块 A 的存在使得插入点移到了 D' 的后面,所以 B 位于 D' 的后面。所以 D.new.bar 的值是 'D' 而不是 'B'。   现在,我们理解了模块前置在 Ruby 内部是如何实现的。模块前置非常有用,只要明白了它是如何工作的,你一定能想到它的用武之地。



模块 Ruby

需要 登录 后方可回复, 如果你还没有账号请 注册新账号
相关文章
Lassie 2021-02-21
729