« SQL Server中使用正则表达式如何在IIS上搭建WAP网站 »

抓取html中的内容

另存为asp文件执行,可以去掉远程抓取后的html标记。

<%
Option Explicit

Function stripHTML(strHTML)
''Strips the HTML tags from strHTML

 Dim objRegExp, strOutput
 Set objRegExp = New Regexp

 objRegExp.IgnoreCase = True
 objRegExp.Global = True
 objRegExp.Pattern = "<.+?>"

 ''Replace all HTML tag matches with the empty string
 strOutput = objRegExp.Replace(strHTML, "")
 
 ''Replace all < and > with < and >
 strOutput = Replace(strOutput, "<", "<")
 strOutput = Replace(strOutput, ">", ">")
 
 stripHTML = strOutput    ''Return the value of strOutput

 Set objRegExp = Nothing
End Function


%>

<form method="post" id=form1 name=form1>
 <b>Enter an HTML String:</b><br>
 <textarea name="txtHTML" cols="50" rows="8" wrap="virtual"><%=Request("txtHTML")%></textarea>
 <p>
 <input type="submit" value="Strip HTML Tags!" id=submit1 name=submit1>
</form>

<% if Len(Request("txtHTML")) > 0 then %>
   <p><hr><p>
   <b><u>View of string <i>with no</i> HTML stripping:</u></b><br>
   <xmp>
   <%=Request("txtHTML")%>
   </xmp><p>
   <b><u>View of string <i>with</i> HTML stripping:</u></b><br>
   <pre>
   <%=StripHTML(Request("txtHTML"))%>
   </pre>
<% End If %>
原创文章如转载,请注明:转载自悠悠博客 [ http://www.ajaxstu.com/ ]

相关文章:

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。