Node.js 的模块加载对用户来说十分简单,只需调用 require 即可,但其内部机制较为复杂。我们通过这一节简要介绍一下 Node.js 模块加载的一些细节,帮你减少开发中可能遇到的问题。
模块的类型Node.js 的模块可以分为两大类,一类是核心模块,另一类是文件模块。
核心模块就是Node.js 标准 API 中提供的模块,如 fs、http、net、vm 等,这些都是由 Node.js 官方提供的模块,编译成了二进制代码。我们可以直接通过 require 获取核心模块,例如require('fs')。核心模块拥有最高的加载优先级,换言之如果有模块与其命名冲突,Node.js 总是会加载核心模块。
文件模块文件模块则是存储为单独的文件(或文件夹)的模块,可能是 JavaScript 代码、JSON 或编译好的 C/C++ 代码。文件模块的加载方法相对复杂,但十分灵活,尤其是和 npm 结合使用时。在不显式指定文件模块扩展名的时候,Node.js 会分别试图加上 .js、.json 和 .node扩展 名。.js 是 JavaScript 代码,.json 是 JSON 格式的文本,.node 是编译好的 C/C++ 代码。
Node.js 模块的类型,从上到下加载优先级由高到低。
按路径加载模块文件模块的加载有两种方式,一种是按路径加载,一种是查找 node_modules 文件夹。如果 require 参数以“ / ”开头,那么就以绝对路径的方式查找模块名称,例如 require ('/home/byvoid/module') 将会按照优先级依次尝试加载 /home/byvoid/module.js、/home/byvoid/module.json 和 /home/byvoid/module.node。如果 require 参数以“ ./ ”或“ ../ ”开头,那么则以相对路径的方式来查找模块,这种方式在应用中是最常见的。例如前面的例子中我们用了require('./hello')来加载同一文件夹下的hello.js。
通过查找 node_modules 目录加载模块如果require参数不以“ / ”、“ ./ ”或“ ../ ”开头,而该模块又不是核心模块,那么就要通过查找 node_modules 加载模块了。我们使用npm获取的包通常就是以这种方式加载的。在某个目录下执行命令npm install express,你会发现出现了一个叫做node_modules 的目录。
加载缓存我们在前面提到过,Node.js 模块不会被重复加载,这是因为 Node.js 通过文件名缓存所有加载过的文件模块,所以以后再访问到时就不会重新加载了。注意,Node.js 是根据实际文件名缓存的,而不是 require() 提供的参数缓存的,也就是说即使你分别通过require('express') 和 require('./node_modules/express') 加载两次,也不会重复加载,因为尽管两次参数不同,解析到的文件却是同一个。
加载顺序下面总结一下使用 require(some_module) 时的加载顺序。
(1) 如果some_module 是一个核心模块,直接加载,结束。 (2) 如果some_module以“ / ”、“ ./ ”或“ ../ ”开头,按路径加载 some_module,结束。 (3) 假设当前目录为 current_dir,按路径加载 current_dir/node_modules/some_module。
如果加载成功,结束。
如果加载失败,令current_dir为其父目录。 重复这一过程,直到遇到根目录,抛出异常,结束。
控制流基于异步 I/O 的事件式编程容易将程序的逻辑拆得七零八落,给控制流的疏理制造障碍。让我们通过下面的例子来说明这个问题。