本著互聯網共享主義精神,特寫此文獻給建站新手,授人以魚,不如授人以漁,本文所講的只是方法和原理,希望大家看完此文,能夠從中得到些幫助和啟發(fā)。
本文從一個ASP程序員的角度用大量實例祥細介紹了動態(tài)網站如何生成靜態(tài)頁面原理,又從一個采集程序開發(fā)者的角度去祥細介紹了網站數據采集的原理及功防策略。
關于網站生成靜態(tài)頁面,為了讓本文讀者容易理解,文內列舉了目前常用的多種生成靜態(tài)頁面的方法,其中用了很多的實例代碼進行說明。
關于網站數據采集攻防,作者本身是一個采集程序的開發(fā)者,同時作者也收集研究了多種采集程序,列舉了目前國內比較流行的幾種防采集策略,并對每種策略作了簡單客觀的分析評價,希望能給廣大站長們提供一些幫助。此章節(jié)也把作者原創(chuàng)的防采集方法奉獻給大家,目地是為了讓大家了解,防采集,不防搜索引擎,是可行的,有效的。
聲明:希望各位朋友轉載時,不要把原有作者版權去掉,謝謝合作。
由于本人寫作水平有限,寫的不好的地方,還請大家多多包涵,如要批評或意見,請加我QQ。
目前很多人都開始注重動態(tài)頁面生成HTML頁了,但選擇哪種生成HTML的方法和防采集卻不防搜索引擎的問題卻經常困擾大家。解決此問題則是本文產生的原因。
首先祥細說一下常用的幾種生成HTML的方法:
生成HTML方法主要步驟只有兩個:
一、獲取要生成的html文件的內容
二、將獲取的html文件內容保存為html文件
我在這里主要說明的只是第一步:如何獲取要生成的html文件的內容:
目前常用獲取html文件的內容的方法有幾下幾種:
1、str="<html標記>內容</html標記>"
str=str&"內容數據庫讀取內容........."
這種方法與是在腳本內寫要生成的html內容,不太方便預覽生成頁面的內容,無法可視化布局頁面,更改html模板時會更加復雜。
用這種方法的人很多,但我感覺這種方法是最不方便的。
2、制作單獨的HTML模板頁,動態(tài)的內容用特定的字符作為標記(如:有人用$title$標記為網頁標題),用ADODB.Stream或者Scripting.FileSystemObject將其模板內容載入,然后再用替換方法把原先定好的標記替換為動態(tài)內容(如:Replace(載入的模板內容,"$title$",rs("title")))。
3、用XMLHTTP或serverXMLHTTP獲取動態(tài)頁所顯示的HTML內容。
|