正则表达式的威力--轻松消除HTML代码

jackxiang 2010-1-9 20:43 | |
http://www.cnblogs.com/meil/archive/2007/09/14/875874.html

正则表达式再次让我震撼,寥寥数行代码就可以完成普通代码不易实现的功能,至少是实现起来比较复杂的功能。

一、清楚内容中的Javsscript 代码

1 Function ClearJSCode(originCode)
2
3   Dim reg
4
5   set reg = New RegExp
6
7   reg.Pattern = "<SCRIPT[^<]*</SCRIPT>"
8   reg.IgnoreCase = True
9   reg.Global = True
10
11   clearJSCode = reg.Replace(originCode, "")
12
13 End Function
14
二、清除内容中的HTML代码

1 Function ClearHTMLCode(originCode)
2
3     Dim reg
4     set reg = new RegExp
5
6     reg.Pattern = "<[^>]*>"
7     reg.IgnoreCase = True
8     reg.Global = True
9  
10     ClearHTMLCode = reg.Replace(originCode, "")
11
12 End Function
13

现在好多网站的内容都是使用采集程序生成的,使用上边的代码就可以轻松的将内容中的HTML和JS代码清除掉。

作者:jackxiang@向东博客 专注WEB应用 构架之美 --- 构架之美,在于尽态极妍 | 应用之美,在于药到病除
地址:https://jackxiang.com/post/2530/
版权所有。转载时必须以链接形式注明作者和原始出处及本声明!

评论列表
发表评论

昵称

网址

电邮

打开HTML 打开UBB 打开表情 隐藏 记住我 [登入] [注册]