另存为asp文件执行,可以去掉远程抓取后的html标记。
<%
Option Explicit
Function stripHTML(strHTML)
''Strips the HTML tags from strHTML
Dim objRegExp, strOutput
Set objRegExp = New Regexp
objRegExp.IgnoreCase = True
objRegExp.Global = True
objRegExp.Pattern = "<.+?>"
''Replace all HTML tag matches with the empty string
strOutput = objRegExp.Replace(strHTML, "")
''Replace all < and > with < and >
strOutput = Replace(strOutput, "<", "<")
strOutput = Replace(strOutput, ">", ">")
stripHTML = strOutput ''Return the value of strOutput
Set objRegExp = Nothing
End Function
%>
<form method="post" id=form1 name=form1>
<b>Enter an HTML String:</b><br>
<textarea name="txtHTML" cols="50" rows="8" wrap="virtual"><%=Request("txtHTML")%></textarea>
<p>
<input type="submit" value="Strip HTML Tags!" id=submit1 name=submit1>
</form>
<% if Len(Request("txtHTML")) > 0 then %>
<p><hr><p>
<b><u>View of string <i>with no</i> HTML stripping:</u></b><br>
<xmp>
<%=Request("txtHTML")%>
</xmp><p>
<b><u>View of string <i>with</i> HTML stripping:</u></b><br>
<pre>
<%=StripHTML(Request("txtHTML"))%>
</pre>
<% End If %>
抓取html中的内容
原创文章如转载,请注明:转载自悠悠博客 [ http://www.ajaxstu.com/ ]
相关文章:
- 正则表达式的作用(2007-4-21 5:2:37)
- 正则表达式:选择与编组(2007-4-2 11:9:19)
- 字符匹配(2006-11-19 6:15:34)
- 正则表达式特殊字符(2006-11-10 11:40:54)
- 突出显示字符串中查询到的单词(2006-11-5 2:5:51)
- 17种正则表达式(2006-10-27 9:19:46)
- 正则表达式:定位符(2006-10-18 7:16:38)
- ASP 正则表达式和UBB(2006-10-14 1:53:21)
- 正则表达式匹配语法(2006-10-8 5:21:6)
- 正则小偷的部份核心函数(2006-9-10 1:52:58)
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
