首页 > 代码库 > gulp源码解析(二)—— vinyl-fs

gulp源码解析(二)—— vinyl-fs

在上一篇文章我们对 Stream 的特性及其接口进行了介绍,gulp 之所以在性能上好于 grunt,主要是因为有了 Stream 助力来做数据的传输和处理。

那么我们不难猜想出,在 gulp 的任务中,gulp.src 接口将匹配到的文件转化为可读(或 Duplex/Transform)流,通过 .pipe 流经各插件进行处理,最终推送给 gulp.dest 所生成的可写(或 Duplex/Transform)流并生成文件。

本文将追踪 gulp(v4.0)的源码,对上述猜想进行验证。

技术分享

为了分析源码,我们打开 gulp 仓库下的入口文件 index.js,可以很直观地发现,几个主要的 API 都是直接引用 vinyl-fs 模块上暴露的接口的:

var util = require(‘util‘);var Undertaker = require(‘undertaker‘);var vfs = require(‘vinyl-fs‘);var watch = require(‘glob-watcher‘);//略...Gulp.prototype.src = vfs.src;Gulp.prototype.dest = vfs.dest;Gulp.prototype.symlink = vfs.symlink;//略...

因此了解 vinyl-fs 模块的作用,便成为掌握 gulp 工作原理的关键之一。需要留意的是,当前 gulp4.0 所使用的 vinyl-fs 版本是 v2.0.0。

vinyl-fs 其实是在 vinyl 模块的基础上做了进一步的封装,在这里先对它们做个介绍:

一. Vinyl

Vinyl 可以看做一个文件描述器,通过它可以轻松构建单个文件的元数据(metadata object)描述对象。依旧是来个例子简洁明了:

//ch2-demom1var Vinyl = require(‘vinyl‘);var jsFile = new Vinyl({    cwd: ‘/‘,    base: ‘/test/‘,    path: ‘/test/file.js‘,    contents: new Buffer(‘abc‘)});var emptyFile = new Vinyl();console.dir(jsFile);console.dir(emptyFile);

上述代码会打印两个File文件对象:

技术分享

简而言之,Vinyl 可以创建一个文件描述对象,通过接口可以取得该文件所对应的数据(Buffer类型)、cwd路径、文件名等等:

//ch2-demo2var Vinyl = require(‘vinyl‘);var file = new Vinyl({    cwd: ‘/‘,    base: ‘/test/‘,    path: ‘/test/newFile.txt‘,    contents: new Buffer(‘abc‘)});console.log(file.contents.toString());console.log(‘path is: ‘ + file.path);console.log(‘basename is: ‘ + file.basename);console.log(‘filename without suffix: ‘ + file.stem);console.log(‘file extname is: ‘ + file.extname);

打印结果:

技术分享

更全面的 API 请参考官方描述文档,这里也对 vinyl 的源码贴上解析注释:

技术分享
var path = require(‘path‘);var clone = require(‘clone‘);var cloneStats = require(‘clone-stats‘);var cloneBuffer = require(‘./lib/cloneBuffer‘);var isBuffer = require(‘./lib/isBuffer‘);var isStream = require(‘./lib/isStream‘);var isNull = require(‘./lib/isNull‘);var inspectStream = require(‘./lib/inspectStream‘);var Stream = require(‘stream‘);var replaceExt = require(‘replace-ext‘);//构造函数function File(file) {    if (!file) file = {};    //-------------配置项缺省设置    // history是一个数组,用于记录 path 的变化    var history = file.path ? [file.path] : file.history;    this.history = history || [];    this.cwd = file.cwd || process.cwd();    this.base = file.base || this.cwd;    // 文件stat,它其实就是 require(‘fs‘).Stats 对象    this.stat = file.stat || null;    // 文件内容(这里其实只允许格式为 stream 或 buffer 的传入)    this.contents = file.contents || null;    this._isVinyl = true;}//判断是否 this.contents 是否 Buffer 类型File.prototype.isBuffer = function() {    //直接用 require(‘buffer‘).Buffer.isBuffer(this.contents) 做判断    return isBuffer(this.contents);};//判断是否 this.contents 是否 Stream 类型File.prototype.isStream = function() {    //使用 this.contents instanceof Stream 做判断    return isStream(this.contents);};//判断是否 this.contents 是否 null 类型(例如当file为文件夹路径时)File.prototype.isNull = function() {    return isNull(this.contents);};//通过文件 stat 判断是否为文件夹File.prototype.isDirectory = function() {    return this.isNull() && this.stat && this.stat.isDirectory();};//克隆对象,opt.deep 决定是否深拷贝File.prototype.clone = function(opt) {    if (typeof opt === ‘boolean‘) {        opt = {            deep: opt,            contents: true        };    } else if (!opt) {        opt = {            deep: true,            contents: true        };    } else {        opt.deep = opt.deep === true;        opt.contents = opt.contents !== false;    }    // 先克隆文件的 contents    var contents;    if (this.isStream()) {  //文件内容为Stream        //Stream.PassThrough 接口是 Transform 流的一个简单实现,将输入的字节简单地传递给输出        contents = this.contents.pipe(new Stream.PassThrough());        this.contents = this.contents.pipe(new Stream.PassThrough());    } else if (this.isBuffer()) {  //文件内容为Buffer        /** cloneBuffer 里是通过         * var buf = this.contents;         * var out = new Buffer(buf.length);         * buf.copy(out);         * 的形式来克隆 Buffer        **/        contents = opt.contents ? cloneBuffer(this.contents) : this.contents;    }    //克隆文件实例对象    var file = new File({        cwd: this.cwd,        base: this.base,        stat: (this.stat ? cloneStats(this.stat) : null),        history: this.history.slice(),        contents: contents    });    // 克隆自定义属性    Object.keys(this).forEach(function(key) {        // ignore built-in fields        if (key === ‘_contents‘ || key === ‘stat‘ ||            key === ‘history‘ || key === ‘path‘ ||            key === ‘base‘ || key === ‘cwd‘) {            return;        }        file[key] = opt.deep ? clone(this[key], true) : this[key];    }, this);    return file;};/** * pipe原型接口定义 * 用于将 file.contents 写入流(即参数stream)中; * opt.end 用于决定是否关闭 stream */File.prototype.pipe = function(stream, opt) {    if (!opt) opt = {};    if (typeof opt.end === ‘undefined‘) opt.end = true;    if (this.isStream()) {        return this.contents.pipe(stream, opt);    }    if (this.isBuffer()) {        if (opt.end) {            stream.end(this.contents);        } else {            stream.write(this.contents);        }        return stream;    }    // file.contents 为 Null 的情况不往stream注入内容    if (opt.end) stream.end();    return stream;};/** * inspect原型接口定义 * 用于打印出一条与文件内容相关的字符串(常用于调试打印) * 该方法可忽略 */File.prototype.inspect = function() {    var inspect = [];    // use relative path if possible    var filePath = (this.base && this.path) ? this.relative : this.path;    if (filePath) {        inspect.push(‘"‘+filePath+‘"‘);    }    if (this.isBuffer()) {        inspect.push(this.contents.inspect());    }    if (this.isStream()) {        //inspectStream模块里有个有趣的写法——判断是否纯Stream对象,先判断是否Stream实例,        //再判断 this.contents.constructor.name 是否等于‘Stream‘        inspect.push(inspectStream(this.contents));    }    return ‘<File ‘+inspect.join(‘ ‘)+‘>‘;};/** * 静态方法,用于判断文件是否Vinyl对象 */File.isVinyl = function(file) {    return file && file._isVinyl === true;};// 定义原型属性 .contents 的 get/set 方法Object.defineProperty(File.prototype, ‘contents‘, {    get: function() {        return this._contents;    },    set: function(val) {        //只允许写入类型为 Buffer/Stream/Null 的数据,不然报错        if (!isBuffer(val) && !isStream(val) && !isNull(val)) {            throw new Error(‘File.contents can only be a Buffer, a Stream, or null.‘);        }        this._contents = val;    }});// 定义原型属性 .relative 的 get/set 方法(该方法几乎不使用,可忽略)Object.defineProperty(File.prototype, ‘relative‘, {    get: function() {        if (!this.base) throw new Error(‘No base specified! Can not get relative.‘);        if (!this.path) throw new Error(‘No path specified! Can not get relative.‘);        //返回 this.path 和 this.base 的相对路径        return path.relative(this.base, this.path);    },    set: function() {        //不允许手动设置        throw new Error(‘File.relative is generated from the base and path attributes. Do not modify it.‘);    }});// 定义原型属性 .dirname 的 get/set 方法,用于获取/设置指定path文件的文件夹路径。// 要求初始化时必须指定 path <或history>Object.defineProperty(File.prototype, ‘dirname‘, {    get: function() {        if (!this.path) throw new Error(‘No path specified! Can not get dirname.‘);        return path.dirname(this.path);    },    set: function(dirname) {        if (!this.path) throw new Error(‘No path specified! Can not set dirname.‘);        this.path = path.join(dirname, path.basename(this.path));    }});// 定义原型属性 .basename 的 get/set 方法,用于获取/设置指定path路径的最后一部分。// 要求初始化时必须指定 path <或history>Object.defineProperty(File.prototype, ‘basename‘, {    get: function() {        if (!this.path) throw new Error(‘No path specified! Can not get basename.‘);        return path.basename(this.path);    },    set: function(basename) {        if (!this.path) throw new Error(‘No path specified! Can not set basename.‘);        this.path = path.join(path.dirname(this.path), basename);    }});// 定义原型属性 .extname 的 get/set 方法,用于获取/设置指定path的文件扩展名。// 要求初始化时必须指定 path <或history>Object.defineProperty(File.prototype, ‘extname‘, {    get: function() {        if (!this.path) throw new Error(‘No path specified! Can not get extname.‘);        return path.extname(this.path);    },    set: function(extname) {        if (!this.path) throw new Error(‘No path specified! Can not set extname.‘);        this.path = replaceExt(this.path, extname);    }});// 定义原型属性 .path 的 get/set 方法,用于获取/设置指定path。Object.defineProperty(File.prototype, ‘path‘, {    get: function() {        //直接从history出栈        return this.history[this.history.length - 1];    },    set: function(path) {        if (typeof path !== ‘string‘) throw new Error(‘path should be string‘);        // 压入history栈中        if (path && path !== this.path) {            this.history.push(path);        }    }});module.exports = File;
View Code

技术分享

二. Vinyl-fs

Vinyl 虽然可以很方便地来描述一个文件、设置或获取文件的内容,但还没能便捷地与文件系统进行接入。

我的意思是,我们希望可以使用通配符的形式来简单地匹配到咱想要的文件,把它们转为可以处理的 Streams,做一番加工后,再把这些 Streams 转换为处理完的文件。

Vinyl-fs 就是实现这种需求的一个 Vinyl 适配器,我们看看它的用法:

var map = require(‘map-stream‘);var fs = require(‘vinyl-fs‘);var log = function(file, cb) {  console.log(file.path);  cb(null, file);};fs.src([‘./js/**/*.js‘, ‘!./js/vendor/*.js‘])  .pipe(map(log))  .pipe(fs.dest(‘./output‘));

如上方代码所示,Vinyl-fs 的 .src 接口可以匹配一个通配符,将匹配到的文件转为 Vinyl Stream,而 .dest 接口又能消费这个 Stream,并生成对应文件。

这里需要先补充一个概念 —— .src 接口所传入的“通配符”有个专有术语,叫做 GLOB,我们先来聊聊 GLOB。

技术分享

技术分享

GLOB 可以理解为我们给 gulp.src 等接口传入的第一个 pattern 参数的形式,例如“./js/**/*.js”,另外百度百科的“glob模式”描述是这样的:

所谓的 GLOB 模式是指 shell 所使用的简化了的正则表达式:
⑴ 星号(*)匹配零个或多个任意字符;
⑵ [abc]匹配任何一个列在方括号中的字符(这个例子要么匹配一个 a,要么匹配一个 b,要么匹配一个 c);
⑶ 问号(?)只匹配一个任意字符;
⑷ 如果在方括号中使用短划线分隔两个字符,表示所有在这两个字符范围内的都可以匹配(比如 [0-9] 表示匹配所有 0 到 9 的数字)。

在 vinyl-fs 中,是使用 glob-stream <v5.0.0>通过算法(minimatch)来解析 GLOB 的,它会拿符合上述 GLOB 模式规范的 pattern 参数去匹配相应的文件,:

var gs = require(‘glob-stream‘);var stream = gs.create(‘./files/**/*.coffee‘, {options});stream.on(‘data‘, function(file){  // file has path, base, and cwd attrs});

而 glob-stream 又是借助了 node-glob 来匹配文件列表的:

//ch2-demo3var Glob = require("glob").Glob;var path = require(‘path‘);var pattern = path.join(__dirname, ‘/*.txt‘);var globber = new Glob(pattern, function(err, matches){    console.log(matches)});globber.on(‘match‘, function(filename) {    console.log(‘matches file: ‘ + filename)});

打印结果:

技术分享

这里也贴下 glob-stream 的源码注解:

技术分享
‘use strict‘;var through2 = require(‘through2‘);var Combine = require(‘ordered-read-streams‘);var unique = require(‘unique-stream‘);var glob = require(‘glob‘);var micromatch = require(‘micromatch‘);var resolveGlob = require(‘to-absolute-glob‘);var globParent = require(‘glob-parent‘);var path = require(‘path‘);var extend = require(‘extend‘);var gs = {    // 为单个 glob 创建流    createStream: function(ourGlob, negatives, opt) {        // 使用 path.resolve 将 golb 转为绝对路径(加上 cwd 前缀)        ourGlob = resolveGlob(ourGlob, opt);        var ourOpt = extend({}, opt);        delete ourOpt.root;        // 通过 glob pattern 生成一个 Glob 对象(属于一个事件发射器<EventEmitter>)        var globber = new glob.Glob(ourGlob, ourOpt);        // 抽取出 glob 的根路径        var basePath = opt.base || globParent(ourGlob) + path.sep;        // Create stream and map events from globber to it        var stream = through2.obj(opt,            negatives.length ? filterNegatives : undefined);        var found = false;        //Glob 对象开始注册事件        globber.on(‘error‘, stream.emit.bind(stream, ‘error‘));        globber.once(‘end‘, function() {            if (opt.allowEmpty !== true && !found && globIsSingular(globber)) {                stream.emit(‘error‘,                    new Error(‘File not found with singular glob: ‘ + ourGlob));            }            stream.end();        });        //注册匹配到文件时的事件回调        globber.on(‘match‘, function(filename) {            //标记已匹配到文件(filename 为文件路径)            found = true;            //写入流(触发 stream 的 _transform 内置方法)            stream.write({                cwd: opt.cwd,                base: basePath,                path: path.normalize(filename)            });        });        return stream;        //定义 _transform 方法,过滤掉排除模式所排除的文件        function filterNegatives(filename, enc, cb) {            //filename 是匹配到的文件对象            var matcha = isMatch.bind(null, filename);            if (negatives.every(matcha)) {                cb(null, filename); //把匹配到的文件推送入缓存(供下游消费)            } else {                cb(); // 忽略            }        }    },    // 为多个globs创建流    create: function(globs, opt) {        //预设参数处理        if (!opt) {            opt = {};        }        if (typeof opt.cwd !== ‘string‘) {            opt.cwd = process.cwd();        }        if (typeof opt.dot !== ‘boolean‘) {            opt.dot = false;        }        if (typeof opt.silent !== ‘boolean‘) {            opt.silent = true;        }        if (typeof opt.nonull !== ‘boolean‘) {            opt.nonull = false;        }        if (typeof opt.cwdbase !== ‘boolean‘) {            opt.cwdbase = false;        }        if (opt.cwdbase) {            opt.base = opt.cwd;        }        //如果 glob(第一个参数)非数组,那么把它转为 [glob],方便后续调用 forEach 方法        if (!Array.isArray(globs)) {            globs = [globs];        }        var positives = [];        var negatives = [];        var ourOpt = extend({}, opt);        delete ourOpt.root;        //遍历传入的 glob        globs.forEach(function(glob, index) {            //验证 glob 是否有效            if (typeof glob !== ‘string‘ && !(glob instanceof RegExp)) {                throw new Error(‘Invalid glob at index ‘ + index);            }            //是否排除模式(如“!b*.js”)            var globArray = isNegative(glob) ? negatives : positives;            // 排除模式的 glob 初步处理            if (globArray === negatives && typeof glob === ‘string‘) {                // 使用 path.resolve 将 golb 转为绝对路径(加上 cwd 前缀)                var ourGlob = resolveGlob(glob, opt);                //micromatch.matcher(ourGlob, ourOpt) 返回了一个方法,可传入文件路径作为参数,来判断是否匹配该排除模式的 glob(即返回Boolean)                glob = micromatch.matcher(ourGlob, ourOpt);            }            globArray.push({                index: index,                glob: glob            });        });        //globs必须最少有一个匹配模式(即非排除模式)的glob,否则报错        if (positives.length === 0) {            throw new Error(‘Missing positive glob‘);        }        // 只有一条匹配模式,直接生成流并返回        if (positives.length === 1) {            return streamFromPositive(positives[0]);        }        // 创建 positives.length 个独立的流(数组)        var streams = positives.map(streamFromPositive);        // 这里使用了 ordered-read-streams 模块将一个数组的 Streams 合并为单个 Stream        var aggregate = new Combine(streams);        //对合成的 Stream 进行去重处理(以“path”属性为指标)        var uniqueStream = unique(‘path‘);        var returnStream = aggregate.pipe(uniqueStream);        aggregate.on(‘error‘, function(err) {            returnStream.emit(‘error‘, err);        });        return returnStream;        //返回最终匹配完毕(去除了排除模式globs的文件)的文件流        function streamFromPositive(positive) {            var negativeGlobs = negatives.filter(indexGreaterThan(positive.index))  //过滤,排除模式的glob必须排在匹配模式的glob后面                .map(toGlob); //返回该匹配模式glob后面的全部排除模式globs(数组形式)            return gs.createStream(positive.glob, negativeGlobs, opt);        }    }};function isMatch(file, matcher) {    //matcher 即单个排除模式的 glob 方法(可传入文件路径作为参数,来判断是否匹配该排除模式的 glob)    //此举是拿匹配到的文件(file)和排除模式GLOP规则做匹配,若相符(如“a/b.txt”匹配“!a/c.txt”)则为true    if (typeof matcher === ‘function‘) {        return matcher(file.path);    }    if (matcher instanceof RegExp) {        return matcher.test(file.path);    }}function isNegative(pattern) {    if (typeof pattern === ‘string‘) {        return pattern[0] === ‘!‘;    }    if (pattern instanceof RegExp) {        return true;    }}function indexGreaterThan(index) {    return function(obj) {        return obj.index > index;    };}function toGlob(obj) {    return obj.glob;}function globIsSingular(glob) {    var globSet = glob.minimatch.set;    if (globSet.length !== 1) {        return false;    }    return globSet[0].every(function isString(value) {        return typeof value =http://www.mamicode.com/== ‘string‘;    });}module.exports = gs;
View Code

留意通过 glob-stream 创建的流中,所写入的数据:

    stream.write({        cwd: opt.cwd,        base: basePath,        path: path.normalize(filename)    });

是不像极了 Vinyl 创建文件对象时可传入的配置。

技术分享

我们回过头来专注 vinyl-fs 的源码,其入口文件如下:

‘use strict‘;module.exports = {  src: require(‘./lib/src‘),  dest: require(‘./lib/dest‘),  symlink: require(‘./lib/symlink‘)};

下面分别对这三个对外接口(也直接就是 gulp 的对应接口)进行分析。

2.1 gulp.src

该接口文件为 lib/src/index.js,代码量不多,但引用的模块不少。

主要功能是使用 glob-stream 匹配 GLOB 并创建 glob 流,通过 through2 写入 Object Mode 的 Stream 去,把数据初步加工为 Vinyl 对象,再按照预设项进行进一步加工处理,最终返回输出流:

技术分享

代码主体部分如下:

技术分享
function createFile(globFile, enc, cb) {    //通过传入 globFile 来创建一个 vinyl 文件对象    //并赋予 cb 回调(这个回调一看就是 transform 的格式,将vinyl 文件对象注入流中)    cb(null, new File(globFile));}function src(glob, opt) {    // 配置项初始化    var options = assign({        read: true,        buffer: true,        sourcemaps: false,        passthrough: false,        followSymlinks: true    }, opt);    var inputPass;    // 判断是否有效的 glob pattern    if (!isValidGlob(glob)) {        throw new Error(‘Invalid glob argument: ‘ + glob);    }    // 通过 glob-stream 创建匹配到的 globStream    var globStream = gs.create(glob, options);    //加工处理生成输出流    var outputStream = globStream        //globFile.path 为 symlink的情况下,转为硬链接        .pipe(resolveSymlinks(options))        //创建 vinyl 文件对象供下游处理        .pipe(through.obj(createFile));    // since 可赋与一个 Date 或 number,来要求指定某时间点后修改过的文件    if (options.since != null) {        outputStream = outputStream            // 通过 through2-filter 检测 file.stat.mtime 来过滤            .pipe(filterSince(options.since));    }    // read 选项默认为 true,表示允许文件内容可读(为 false 时不可读 且将无法通过 .dest 方法写入硬盘)    if (options.read !== false) {        outputStream = outputStream            //获取文件内容,写入file.contents 属性去。            //预设为 Buffer 时通过 fs.readFile 接口获取            //否则为 Stream 类型,通过 fs.createReadStream 接口获取            .pipe(getContents(options));    }    // passthrough 为 true 时则将 Transform Stream 转为 Duplex 类型(默认为false)    if (options.passthrough === true) {        inputPass = through.obj();        outputStream = duplexify.obj(inputPass, merge(outputStream, inputPass));    }    //是否要开启 sourcemap(默认为false),若为 true 则将流推送给 gulp-sourcemaps 去初始化,    //后续在 dest 接口里再调用 sourcemaps.write(opt.sourcemaps) 将 sourcemap 文件写入流    if (options.sourcemaps === true) {        outputStream = outputStream            .pipe(sourcemaps.init({loadMaps: true}));    }    globStream.on(‘error‘, outputStream.emit.bind(outputStream, ‘error‘));    return outputStream;}module.exports = src;
View Code

这里有个 symlink 的概念 —— symlink 即  symbolic link,也称为软链(soft link),它使用了其它文件或文件夹的链接来指向一个文件。一个 symlink 可以链接任何电脑上的任意文件或文件夹。在 Linux/Unix 系统上,symlink 可以通过 ln 指令来创建;在 windows 系统上可以通过 mklink 指令来创建。

更多 symlink 的介绍建议参考 wiki —— https://en.wikipedia.org/wiki/Symbolic_link。

技术分享

2.2 gulp.dest

该接口文件为 lib/dest/index.js,其主要作用自然是根据 src 接口透传过来的输出流,生成指定路径的目标文件/文件夹:

function dest(outFolder, opt) {    if (!opt) {        opt = {};    }    // _transform 接口    function saveFile(file, enc, cb) {        // 写入文件之前的准备处理,主要是 opt 初始化、file对象的 path/base/cwd 等属性        // 修改为相对 outFolder 的路径,方便后面 writeContents 生成正确的目的文件        prepareWrite(outFolder, file, opt, function(err, writePath) {            if (err) {                return cb(err);            }            //通过 fs.writeFile / fs.createWriteStream 等接口来写入和创建目标文件/文件夹            writeContents(writePath, file, cb);        });    }    // 生成 sourcemap 文件(注意这里的 opt.sourcemaps 若有则应为指定路径)    var mapStream = sourcemaps.write(opt.sourcemaps);    var saveStream = through2.obj(saveFile);    // 合并为单条 duplex stream    var outputStream = duplexify.obj(mapStream, saveStream);        //生成目标文件/文件夹    mapStream.pipe(saveStream);    //依旧返回输出流(duplex stream)    return outputStream;}module.exports = dest;

接前文的流程图:

技术分享

至此我们就搞清楚了 gulp 的 src 和 dest 是怎样运作了。另外 gulp/vinyl-fs 还有一个 symlink 接口,其功能与 gulp.dest 是一样的,只不过是专门针对 symlink 的方式来处理(使用场景较少),有兴趣的同学可以自行阅读其入口文件 lib/symlink/index.js。

本文涉及的所有示例代码和源码注释文件,均存放在我的仓库(https://github.com/VaJoy/stream/)上,可自行下载调试。共勉~

技术分享

gulp源码解析(二)—— vinyl-fs