首页 > 代码库 > sizzle分析记录:分解流程

sizzle分析记录:分解流程

<form>  <label>Name:</label>  <input name="name" />  <fieldset>      <label>Newsletter:</label>      <div name="newsletter" /><p>1<p</div>      <div name="letter" /><p name=‘aaron‘>2<p></div>      <div name="tter" /><p>3<p</div> </fieldset></form>

js

$("form div > p[name=aaron]")

解析的流程:

编译器:分5个步骤

涉及: TAG元素 关系选择器 属性选择器

1:通过tokenize词法分析器分组

image

 


2:遍历tokens,从右边往左边开始筛选,最快定位到目标元素合集

//先看看有没有搜索器find,搜索器就是浏览器一些原生的取DOM接口,简单的表述就是以下对象了            // Expr.find = {            // ‘ID‘    : context.getElementById,            // ‘CLASS‘ : context.getElementsByClassName,            // ‘TAG‘   : context.getElementsByTagName            //        }

操作如下

Expr.find["TAG"] = support.getElementsByTagName ?    function( tag, context ) {        if ( typeof context.getElementsByTagName !== strundefined ) {            return context.getElementsByTagName( tag );        }    } :

那么第一筛选找到的定位元素,就形成了一个 seed种子合集,那么余下的所有的操作都是围绕这个种子合集处理

因为节点总是存在各种关系的,所以不管是通过这个最靠近的目标的元素,往上还是往下 都是可以处理的

 


3:重组选择器,开始执行继续分解"form div > [name=aaron]"

因为种子合已经抽出了,所以选择器就需要重新排列

"form div > [name=aaron]"

踢掉了P元素,已经被抽离了

 


4 : 生成编译处理器

这里为什么要这么复杂,因为生成了编译闭包可以缓存起来,通过这种机制,增加了重复选择器的效率

在matcherFromTokens方法中通过分解tokens生成对应的处理器

例如:form div [name=aaron]

在分解过程中分2大块

A:关系选择器的处理  > + ~ 空

B: ATTR CHILD CLASS ID PSEUDO TAG的处理

用matchers保留组合关系

1:分解第一个TAG:form 保存处理器到matchers.push( Expr.filter[“TAG”]) ;

2:分解第二个“空”的关系选择器,此时

 A:用elementMatcher把之前的matchers压入到这个匹配里面,生成一个遍历方法的处理

function elementMatcher( matchers ) {    return matchers.length > 1 ?        function( elem, context, xml ) {            var i = matchers.length;            while ( i-- ) {                if ( !matchers[i]( elem, context, xml ) ) {                    return false;                }            }            return true;        } :        matchers[0];}

B:用addCombinator再次包装,生成一个位置关系的查找关系

function addCombinator( matcher, combinator, base ) {    var dir = combinator.dir,        checkNonElements = base && dir === "parentNode",        doneName = done++;    return         // Check against all ancestor/preceding elements        // 检查所有祖先/元素        function( elem, context, xml ) {            var oldCache, outerCache,                newCache = [ dirruns, doneName ];                while ( (elem = elem[ dir ]) ) {                    if ( elem.nodeType === 1 || checkNonElements ) {                        outerCache = elem[ expando ] || (elem[ expando ] = {});                        if ( (oldCache = outerCache[ dir ]) &&                            oldCache[ 0 ] === dirruns && oldCache[ 1 ] === doneName ) {                            // Assign to newCache so results back-propagate to previous elements                            return (newCache[ 2 ] = oldCache[ 2 ]);                        } else {                            // Reuse newcache so results back-propagate to previous elements                            outerCache[ dir ] = newCache;                            // A match means we‘re done; a fail means we have to keep checking                            if ( (newCache[ 2 ] = matcher( elem, context, xml )) ) {                                return true;                            }                        }                    }                }        };}

 

所以此时的matchers的关系是一个层级的包含结构,然后依次这样递归

image

这个地方相当绕!!!!

生成的最后

cached = matcherFromTokens( match[i] );

变成了一个超大的嵌套闭包

 


5: 通过matcherFromGroupMatchers这个函数来生成最终的匹配器

var bySet = setMatchers.length > 0,        byElement = elementMatchers.length > 0,        superMatcher = function(seed, context, xml, results, outermost) {            //分解这个匹配处理器        }    return superMatcher

通过matcherFromGroupMatchers的处理最直接的就是能看出,elementMatchers, setMatchers 2个结果不需要再返回出去,直接形成curry的方法,在内部就合并参数

外面就直接调用了,这样

var compileFunc = compiled || compile( selector, match );compileFunc(    seed,    context,    !documentIsHTML,    results,    outermost);

compileFunc 一直是持有elementMatchers, setMatchers 的引用的,这个设计的手法还是值得借鉴的

 


执行期:

至此之前的5个步骤都是编译成函数处理器的过程,然后就是开始执行了

粗的原理就是把直接分解出来的seed种子合集丢到这个处理器中,然后处理器就会根据各种关系进行分解匹配

从而得到结果集

superMatcher:

while ( (matcher = elementMatchers[j++]) ) {    if ( matcher( elem, context, xml ) ) {        results.push( elem );        break;    }}

抽出第一个seed元素,p

然后把p丢到atrr是过滤筛选器中去匹配下,看看是否能找到对应的这个属性

当然还是继续从右往左边匹配过滤了

一次是【name=aaron】 => div => from

matchers[i] => Expr.filter.ATTR =>

p.getAttribute(‘name=aaron’) => 得到结果

function elementMatcher( matchers ) {    return matchers.length > 1 ?        function( elem, context, xml ) {            var i = matchers.length;            while ( i-- ) {                if ( !matchers[i]( elem, context, xml ) ) {                    return false;                }            }            return true;        } :        matchers[0];}

如果匹配失败,自然就退出了  return false ,就不需要在往前找了 ,然后再次递归seed

如果成功,就需要再深入的匹配了

因为是从右到左逐个匹配,所以往前走就会遇到关系选择器的问题,

那么jQuery把四种关系 > + ~ 空的处理给抽出一个具体的方法就是addCombinator

1 "form div > p[name=aaron]"
2 seed => p
3 筛选[name=aaron]
4 > => addCombinator方法 找到对应关系映射的父节点elem
5 elem中去匹配div 递归elementMatcher方法
6 “空” =>  addCombinator方法找到祖先父节点elem
7 elem中去找form为止
 
可见这个查找是及其复杂繁琐的
总结:

sizzle对选择器的大概是思路:

分解所有的选择器为最小单元,从右往左边开始挑出一个浏览器的API能快速定位的元素TAG,ID,CLASS节点,这样就能确定最终的元素跟这个元素是有关系的

然后把剩余的选择器单元开始生成一个匹配器,主要是用来做筛选,最后根据关系分组

如果就依次匹配往上查找,通过关系处理器定位上一个节点的元素,通过普通匹配器去确定是否为可选的内容