一、webpack编译过程
webpack 的作用是将源代码编译(构建、打包)成最终代码。
整个过程大致分为三个步骤:
- 初始化
- 编译
- 输出
1.初始化
初始化时我们运行的命令 webpack 为核心包, webpack-cli 提供了 webpack 命令,通过命令启动 webpack , webpack 命令就是在调用核心包里面的功能。
此阶段, webpack 会将 CLI 参数(--mode --config等)、配置文件(webpack.config.js)、默认配置进行融合,形成一个最终的配置对象。
对配置的处理过程是依托一个第三方库 yargs 完成的。
此阶段相对比较简单,主要是为接下来的编译阶段做必要的准备。
目前,可以简单的理解为,初始化阶段主要用于产生一个最终的配置。
2.编译
(1)创建 chunk
chunk 是 webpack 在内部构建过程中的一个概念,译为块,它表示通过某个入口找到的所有依赖的统称。
根据入口模块 (默认为 ./src/index.js ) 创建一个 chunk 。
main chunk => 入口模块: ./src/index.js
chunk 可以有多个,每个 chunk 都有至少两个属性:
- name :默认为 main
- id :唯一编号,开发环境和 name 相同,生产环境是一个数字,从 0 开始
(2)构建所有依赖模块
构建过程入下图:
- 模块文件:首先拿到模块文件 ./src/index.js ,根据路径检查这个模块是否已经加载过。
- 已记录则结束,未记录则继续:根据右侧模块记录表格中的路径找到模块检查是否记录。
- 读取文件内容(node环境可以读取文件):未加载将文件内容读取出来,通过语法分析转换为 AST 抽象语法树。
- AST抽象语法树:AST explorer,通过 AST 语法树准确地找到依赖关系,记录依赖,进行树形结构遍历,找到所有依赖.
- 保存到 dependencies 中:将所有依赖保存到 dependencies 数组中,记录完整相对路径即模块 id 。
- 替换依赖函数:将有依赖的地方转换为另一种代码格式,例: require("./a") ,转换为__webpack_require("./src/a.js") ,将 require 转换为 __webpack__require ,将路径转换为绝对路径即模块 id 。
- 保存转换后的模块代码:将上图中的模块记录表格保存。模块 id 为完整绝对路径,转换后的代码为示例中 index.js - 2 代码。
例: index.js - 1
console.log("index");
require("./a");
require("./b");
index.js - 2
console.log("index");
__webpack_require("./src/a.js");
__webpack_require("./src/b.js");
a.js
require("./b");
console.log("a");
module.exports = "a";
b.js
console.log("b");
module.exports = "b";
转换后的 chunk 中模块记录:
模块id | 转换后代码 |
---|---|
index.js | console.log("index"); __webpack_require("./src/a.js"); __webpack_require("./src/b.js"); |
a.js | __webpack_require("./src/b.js"); console.log("a"); module.exports = "a"; |
b.js | console.log("b"); module.exports = "b"; |
示例编译过程:
- ./src/index.js 未加载。
- 内容(字符串): index.js - 1 代码。
- --> AST --> 树形结构遍历,找到所有依赖。
- dependencies:["./src/a.js","./src/b.js"] 。
- index.js - 1 中代码被转换为 index.js - 2 。
- 保存转换后的代码。
- 循环依赖,重新加载 ./src/a.js 。
- 重复 1-6 过程。
- 根据 a.js 文件中的依赖关系,重新加载 ./src/b.js 。
- 重复 1-6 过程,此时 a.js 文件的依赖关系已分析完毕, chunk 模块记录表格已经记录了所有模块信息。
- index.js 模块按顺序应该加载 b.js 模块,但是由于 b.js 已经加载过了,为已记录状态。所以不需要重新加载 b.js 模块。
- 依赖模块构建结束。
(3)产生 chunk assets
在第二步完成后, chunk 中会产生一个模块列表,列表中包含了模块id和模块转换后的代码。
接下来, webpack 会根据配置为 chunk 生成一个资源列表,即 chunk assets ,资源列表可以理解为是生成到最终文件的文件名和文件内容( ./dist/main.js 等)
chunk 中的模块记录:
模块id | 转换后的代码 |
---|---|
./src/index.js | xxxxxxxxxx |
./src/a.js | xxxxxxxxxx |
chunk assets :
文件名 | 文件内容 |
---|---|
./dist/main.js | xxxxxxxxxxxx |
./dist/main.js.map | xxxxxxxxxxxx |
chunk hash:xxxxxxxxxxxxxxxxxxxxxxx
chunk hash 是根据所有 chunk assets 的内容生成的一个 hash 字符串。
hash :一种算法,具体有很多分类,特点是将一个任意长度的字符串转换为一个固定长度的字符串,而且可以保证原始内容不变,产生的 hash 字符串就不变。
(4)合并 chunk assets
将多个 chunk 的 assets 合并到一起,形成一个总的资源列表,并产生一个总的 hash 。
3.输出
此步骤非常简单, webpack 将利用 node 中的 fs 模块(文件处理模块),根据编译产生的总的 assets ,生成相应的文件。
二、总过程
如果开启 watch ,每一次文件变化都会重新进行编译。
涉及术语
- module :模块,分割的代码单元, webpack 中的模块可以是任何内容的文件,不仅限于 JS 。
- chunk : webpack 内部构建模块的块,一个 chunk 中包含多个模块,这些模块是从入口模块通过依赖分析得来的。
- bundle : chunk 构建好模块后会生成 chunk 的资源清单,清单中的每一项就是一个 bundle ,可以认为 bundle 就是最终生成的文件。
- hash :最终的资源清单所有内容联合生成的 hash 值。
- chunkhash : chunk 生成的资源清单内容联合生成的 hash 值。
- chunkname : chunk 的名称,如果没有配置则使用 main 。
- id :通常指 chunk 的唯一编号,如果在开发环境下构建,和 chunkname 相同;如果是生产环境下构建,则使用一个从 0 开始的数字进行编号。