'f'
mh-two-thousand-and-two
2024-04-12 26f2711ef9461961fb953e2b497bd314ef95e345
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
var last = require('./last');
var arrToMap = require('./arrToMap');
var startWith = require('./startWith');
var lowerCase = require('./lowerCase');
 
exports = function(html, handler) {
    var stack = [];
    var text;
    var lastHtml = html;
    while (html) {
        text = true;
        if (!last(stack) || !SPECIAL[last(stack)]) {
            if (startWith(html, '<!--')) {
                var endIdx = html.indexOf('-->');
                if (endIdx >= 0) {
                    if (handler.comment) {
                        handler.comment(html.substring(4, endIdx));
                    }
                    html = html.substring(endIdx + 3);
                    text = false;
                }
            } else if (startWith(html, '<!')) {
                var match = html.match(regDoctype);
                if (match) {
                    if (handler.text)
                        handler.text(html.substring(0, match[0].length));
                    html = html.substring(match[0].length);
                    text = false;
                }
            } else if (startWith(html, '</')) {
                var _match = html.match(regEndTag);
                if (_match) {
                    html = html.substring(_match[0].length);
                    _match[0].replace(regEndTag, parseEndTag);
                    text = false;
                }
            } else if (startWith(html, '<')) {
                var _match2 = html.match(regStartTag);
                if (_match2) {
                    html = html.substring(_match2[0].length);
                    _match2[0].replace(regStartTag, parseStartTag);
                    text = false;
                }
            }
            if (text) {
                var _endIdx = html.indexOf('<');
                var _text = _endIdx < 0 ? html : html.substring(0, _endIdx);
                html = _endIdx < 0 ? '' : html.substring(_endIdx);
                if (handler.text) handler.text(_text);
            }
        } else {
            var execRes = new RegExp('</'.concat(last(stack), '[^>]*>')).exec(
                html
            );
            if (execRes) {
                var _text2 = html.substring(0, execRes.index);
                html = html.substring(execRes.index + execRes[0].length);
                if (_text2 && handler.text) handler.text(_text2);
            }
            parseEndTag('', last(stack));
        }
        if (lastHtml === html) {
            throw Error('Parse Error: ' + html);
        }
        lastHtml = html;
    }
    parseEndTag();
    function parseStartTag(tag, tagName, rest, unary) {
        tagName = lowerCase(tagName);
        unary = !!unary;
        if (!unary) stack.push(tagName);
        if (handler.start) {
            var attrs = {};
            rest.replace(regAttr, function(all, $1, $2, $3, $4) {
                attrs[$1] = $2 || $3 || $4 || '';
            });
            handler.start(tagName, attrs, unary);
        }
    }
    function parseEndTag(tag, tagName) {
        tagName = lowerCase(tagName);
        var pos;
        if (!tagName) {
            pos = 0;
        } else {
            for (pos = stack.length - 1; pos >= 0; pos--) {
                if (stack[pos] === tagName) break;
            }
        }
        if (pos >= 0) {
            for (var i = stack.length - 1; i >= pos; i--) {
                if (handler.end) handler.end(stack[i]);
            }
            stack.length = pos;
        }
    }
};
var regDoctype = /^<!\s*doctype((?:\s+[\w:]+(?:\s*=\s*(?:(?:"[^"]*")|(?:'[^']*')|[^>\s]+))?)*)\s*(\/?)>/i;
var regEndTag = /^<\/([-A-Za-z0-9_]+)[^>]*>/;
var regStartTag = /^<([-A-Za-z0-9_]+)((?:\s+[-A-Za-z0-9_:@.]+(?:\s*=\s*(?:(?:"[^"]*")|(?:'[^']*')|[^>\s]+))?)*)\s*(\/?)>/i;
var regAttr = /([-A-Za-z0-9_:@.]+)(?:\s*=\s*(?:(?:"((?:\\.|[^"])*)")|(?:'((?:\\.|[^'])*)')|([^>\s]+)))?/g;
 
var SPECIAL = arrToMap('script,style'.split(','));
 
module.exports = exports;