這里所說(shuō)的“小偷”指的是在ASP中運(yùn)用XML中的XMLHTTP組件提供的強(qiáng)大功能,把遠(yuǎn)程網(wǎng)站上的數(shù)據(jù)(圖片,網(wǎng)頁(yè)及其他文件)抓取到本地,經(jīng)過(guò)各種處理后顯示到頁(yè)面上或者存儲(chǔ)進(jìn)數(shù)據(jù)庫(kù)的一類程序。你可以通過(guò)這種小偷程序,完成過(guò)去一些似乎完全不可能實(shí)現(xiàn)的任務(wù),比如說(shuō)把某個(gè)站的頁(yè)面偷梁換柱后變成自己的頁(yè)面,或者把某個(gè)站的一些數(shù)據(jù)(文章,圖片)保存到本地?cái)?shù)據(jù)庫(kù)中加以利用!靶⊥怠钡膬(yōu)點(diǎn)有:無(wú)須維護(hù)網(wǎng)站,因?yàn)樾⊥党绦蛑械臄?shù)據(jù)來(lái)自其他網(wǎng)站,它將隨著該網(wǎng)站的更新而更新;可以節(jié)省大量的服務(wù)器資源,一般小偷程序就幾個(gè)文件,所有網(wǎng)頁(yè)內(nèi)容都是來(lái)自其他網(wǎng)站。缺點(diǎn)在于:不穩(wěn)定,如果目標(biāo)網(wǎng)站出錯(cuò),程序也會(huì)出錯(cuò),而且,如果目標(biāo)網(wǎng)站進(jìn)行升級(jí)維護(hù),那么小偷程序也要進(jìn)行相應(yīng)修改;速度,因?yàn)槭沁h(yuǎn)程調(diào)用,速度和在本地服務(wù)器上讀取數(shù)據(jù)比起來(lái),肯定要慢一些。怎么樣,聽(tīng)起來(lái)很神奇吧?我們現(xiàn)在就開(kāi)始來(lái)學(xué)習(xí)一些“小偷”程序的入門(mén)知識(shí)吧! 我們拿個(gè)簡(jiǎn)單點(diǎn)的東西來(lái)研究一下吧,QQ網(wǎng)站上的天氣預(yù)報(bào)程序 代碼如下: <% On Error Resume Next Server.ScriptTimeOut=9999999 Function getHTTPPage(Path) t = GetBody(Path) getHTTPPage=BytesToBstr(t,"GB2312") End function ' 首先,進(jìn)行小偷程序的一些初始化設(shè)置,以上代碼的作用分別是忽略掉所有非致命性錯(cuò)誤,把小偷程序的運(yùn)行超時(shí)時(shí)間設(shè)置得很長(zhǎng)(這樣不會(huì)出現(xiàn)運(yùn)行超時(shí)的錯(cuò)誤),轉(zhuǎn)換原來(lái)默認(rèn)的UTF-8編碼轉(zhuǎn)換成GB2312編碼,否則直接用XMLHTTP組件調(diào)用有中文字符的網(wǎng)頁(yè)得到的將是亂碼。 Function GetBody(url) on error resume next Set Retrieval = CreateObject("Microsoft.XMLHTTP") With Retrieval .Open "Get", url, False, "", "" .Send GetBody = .ResponseBody End With Set Retrieval = Nothing End Function '然后調(diào)用XMLHTTP組件創(chuàng)建一個(gè)對(duì)象并進(jìn)行初始化設(shè)置。 Function BytesToBstr(body,Cset) dim objstream set objstream = Server.CreateObject("adodb.stream") objstream.Type = 1 objstream.Mode =3 objstream.Open objstream.Write body objstream.Position = 0 objstream.Type = 2 objstream.Charset = Cset BytesToBstr = objstream.ReadText objstream.Close set objstream = nothing End Function Function Newstring(wstr,strng) Newstring=Instr(lcase(wstr),lcase(strng)) if Newstring<=0 then Newstring=Len(wstr) End Function '處理抓取回來(lái)的數(shù)據(jù)需要調(diào)用adodb.stream組件并進(jìn)行初始化設(shè)置。%> '以下即為頁(yè)面顯示部分 <% Dim wstr,str,url,start,over,city '定義一些需要使用到的變量 city = Request.QueryString("id") '程序傳回的ID變量(即用戶選擇的城市)賦給id url="http://appnews.qq.com/cgi-bin/news_qq_search?city="&city&"" '這里設(shè)置需要抓取的頁(yè)面地址,當(dāng)然你也可以直接指定某個(gè)地址而不使用變量 wstr=getHTTPPage(url) '獲取指定頁(yè)面的全部數(shù)據(jù) start=Newstring(wstr," <html>") '這里設(shè)置需要處理的數(shù)據(jù)的頭部,這個(gè)變量應(yīng)視不同情況而設(shè)置,具體內(nèi)容可以通過(guò)查看需要抓取的頁(yè)面的源代碼來(lái)確定。因?yàn)樵谶@個(gè)程序里我們需要抓取整個(gè)頁(yè)面,所以設(shè)置為頁(yè)面全部抓取。注意,設(shè)置的內(nèi)容必須是頁(yè)面內(nèi)容唯一的,不可以重復(fù)。 over=Newstring(wstr," </HTML>") '和start相對(duì)應(yīng)的就是需要處理的數(shù)據(jù)的尾部,同樣的,設(shè)置的內(nèi)容必須是頁(yè)面中唯一的。 body=mid(wstr,start,over-start) '設(shè)置顯示頁(yè)面的范圍 '下面就是動(dòng)用乾坤挪移+++的時(shí)候了,通過(guò)replace可以用一些字符替換掉數(shù)據(jù)中指定的字符。 body = replace(body,"skin1","天氣預(yù)報(bào) - 斯克網(wǎng)絡(luò)") body = replace(body,"http://appnews.qq.com/cgi-bin/news_qq_search?city","tianqi.asp?id") '本程序中已經(jīng)完成了替換的工作,如果有其他需要的話可以繼續(xù)進(jìn)行類似的替換操作。 response.write body %> 替換完需要修改的內(nèi)容后,就可以把修改的內(nèi)容顯示在頁(yè)面上了。至此程序結(jié)束 程序使用方法及結(jié)果:把上述代碼去掉說(shuō)明部分后保存為tianqi.asp,上傳到支持ASP和XML的空間下,在瀏覽器中運(yùn)行即可。你可以在在這個(gè)程序的基礎(chǔ)上進(jìn)行進(jìn)一步的界面美化或者程序優(yōu)化。 以上只是一些關(guān)于XMLHTTP組件的初級(jí)應(yīng)用,實(shí)際上它還能實(shí)現(xiàn)的功能還有很多,比如說(shuō)保存遠(yuǎn)程圖片到本地服務(wù)器上,配合adodb.stream組件可以把獲取來(lái)的數(shù)據(jù)保存進(jìn)數(shù)據(jù)庫(kù)。小偷的作用和使用范圍都很廣。但是不可以拿來(lái)做違法的事哦! 也許還有人要問(wèn)了,這種“小偷”程序難道只是ASP的專利嗎?非也,PHP通過(guò)fopen函數(shù)一樣可以實(shí)現(xiàn)同樣的效果,由于PHP本身的各種特點(diǎn),寫(xiě)出來(lái)的小偷程序和ASP相比,在體積和執(zhí)行效率上都有者明顯的優(yōu)勢(shì),但限于篇幅,這里就不一一說(shuō)明了。 |
免責(zé)聲明:本站部分文章和圖片均來(lái)自用戶投稿和網(wǎng)絡(luò)收集,旨在傳播知識(shí),文章和圖片版權(quán)歸原作者及原出處所有,僅供學(xué)習(xí)與參考,請(qǐng)勿用于商業(yè)用途,如果損害了您的權(quán)利,請(qǐng)聯(lián)系我們及時(shí)修正或刪除。謝謝!
始終以前瞻性的眼光聚焦站長(zhǎng)、創(chuàng)業(yè)、互聯(lián)網(wǎng)等領(lǐng)域,為您提供最新最全的互聯(lián)網(wǎng)資訊,幫助站長(zhǎng)轉(zhuǎn)型升級(jí),為互聯(lián)網(wǎng)創(chuàng)業(yè)者提供更加優(yōu)質(zhì)的創(chuàng)業(yè)信息和品牌營(yíng)銷服務(wù),與站長(zhǎng)一起進(jìn)步!讓互聯(lián)網(wǎng)創(chuàng)業(yè)者不再孤獨(dú)!
掃一掃,關(guān)注站長(zhǎng)網(wǎng)微信