首页 > 代码库 > 正则表达式清除Html

正则表达式清除Html

正则表达式,去除所有HTML标签

protected void Page_Load(object sender, EventArgs e)    {        //string regexstr = @"<[^>]*>";    //去除所有的标签        //@"<script[^>]*?>.*?</script>" //去除所有脚本,中间部分也删除                 // string regexstr = @"<img[^>]*>";   //去除图片的正则       // string regexstr = @"<(?!br).*?>";   //去除所有标签,只剩br        // string regexstr = @"<table[^>]*?>.*?</table>";   //去除table里面的所有内容        string regexstr = @"<(?!img|br|p|/p).*?>";   //去除所有标签,只剩img,br,p           str = Regex.Replace(str, regexstr, string.Empty, RegexOptions.IgnoreCase);    }

正则表达式获取HTML中的Img

(src\s?=\s?["|‘‘|\s]?)(\S+/)(\S+\.[^"^‘‘^ ]+)

正则表达式中.代表换行以外任意字符,正则表达式匹配任意字符(包括换行)

([\s\S]*) 

 一直在用的正则表达式工具 Regex Match tracer

 

  

正则表达式清除Html