摘要:隨著Web技術的發(fā)展,越來越多的信息需要通過異步Web傳輸來獲取,提出一種基于Msxml2的異步信息搜索方法,通過采集Web偵聽頁,分析XML信息結(jié)構(gòu),達到信息傳送的目的。
關鍵詞:Msxml2;request;ActiveXObject;偵聽頁
1 引言
XmlHttp2.0提供客戶端同http服務器異步通訊協(xié)議,客戶端可通過Msxml2對象向Web服務器發(fā)送請求并使用文檔對象模型DOM處理同應,且所有通訊都可在后臺進行,擴展了Web的信息處理能力。
2 Msxml2對象特色技術
Msxml2(或XmlHttp)對象屬于ActiveX,使用Msxml2.XmlHttp方式創(chuàng)建,可注冊一個函數(shù)給XmlHttp對象的on-readystatechange方法,該對象的open方法可發(fā)出Http請求,對象的Send方法可自動調(diào)用所注冊的函數(shù)。
2.1 使用XmlHttp抓取目標地址的Web頁面
頁面分析的GetBody函數(shù)通過XmlHttp組件可后臺獲取目標地址Web頁的內(nèi)容,這種方式獲得的Web頁面結(jié)構(gòu)可被應用系統(tǒng)后臺分析。
2.2 字符轉(zhuǎn)換
后臺獲取的Web數(shù)據(jù)往往有亂碼現(xiàn)象,可以使用Adodb.Stream對其進行二進制處理,SaveToFile(FileName)方法可將數(shù)據(jù)存入文件;Object.LoadFromFile(FileName)方法可以從文件中讀取數(shù)據(jù);Object.Write(Data,[Options])將指定的文本數(shù)據(jù)裝入對象中;Object.ReadText(NumChars)讀取指定長度的文本及參數(shù)說明:NumChars指定要讀取的字符串長度,未指定則讀取全部數(shù)據(jù)。
2.3 后臺頁面保存
后臺網(wǎng)頁的內(nèi)容可以作為Msxml2.XmlHttp對象的Re-sponse屬性返回,意味著可以使用FileSystem對象將頁面的內(nèi)容保存到文件中,例如:
保存后文檔的格式可能與網(wǎng)頁的格式不同,這取決于所使用樣式表的格式。多數(shù)情況下,即使格式有點缺漏,頁面也可按文本方式讀取。
2.4 跨域訪問
跨域訪問就是A網(wǎng)站的JavaScript代碼試圖訪問B網(wǎng)站,包括提交內(nèi)容和獲取內(nèi)容。由于安全原因,直接跨域訪問是被瀏覽器所禁止的,可以使用StreamReader對象后臺獲取。
3 XML信息控制
IE客戶端可通過JavaSeript命令將XML命令控制文件通過后臺發(fā)送給Web偵聽頁,并獲得信息反饋。邏輯過程是:(JS)應用->偵聽頁->ActiveX控件,ActiveX控件->偵聽頁->客戶端(JS)接收,如圖1所示。
IE客戶端發(fā)出“XML命令”的JavaScript命令典型過程:
在IE客戶端,可以不用XML格式命令而使用普通文件構(gòu)造指令,但使用XML格式容易解析指令及其參數(shù),例如“Open”函數(shù)的“Xml_receive.a(chǎn)sp”網(wǎng)頁被稱為偵聽頁;第3個參數(shù)決定是否異步執(zhí)行;還可以再加上用戶名和口令兩個參數(shù),此時要求進行同步查詢,即IE窗口在完成查詢前只進行等待。
3.1 偵聽頁基本功能
IE客戶頁面提交查詢時,通過“偵聽頁”發(fā)出XML格式指令。由XmlHttp向WWW服務器請求交互,Web服務器即解釋該命令,并調(diào)用相應ActiveX控件,以XML字符串形式將查詢結(jié)果返回給IE端用戶。偵聽頁執(zhí)行的基本過程:[!--empirenews.page--]
(1)將查詢請求加載到XML DOM,并對指令及其參數(shù)進行解析。支持Java,Script的所有瀏覽器都支持文檔對象模型(DOM)。DOM涉及W3C標準文檔的對象模型,以樹形結(jié)構(gòu)表示HTML和XML文檔,可以定義遍歷、檢查和修改樹節(jié)點的方法和屬性,如圖2所示。使用DOM技術可以解析XML文件中的查詢指令和參數(shù)(parameter),可以有多個參數(shù)。
(2)根據(jù)客戶要求,調(diào)用Active X控件的處理方法,執(zhí)行結(jié)果用XML字符串表示。創(chuàng)建Active X對象并調(diào)用預定的GetTitlesXML()方法,返回Pubs數(shù)據(jù)庫的查詢結(jié)果,結(jié)果用XML字符串方式返回。
(3)將返回結(jié)果加載到XML DOM并用Response對象返回給IE用戶。Response對象可將結(jié)果反饋給IE用戶。具體方法是使用XML DOM的Save方法返回結(jié)果。例如,下面的程序片段中,反饋信息為XML串:resuhsXML,它通過Response對象設置輸出流格式。
3.2 XML信息接收
IE客戶端一旦接收到返回結(jié)果,就將其加載到XMLDOM,并使用XML解析方式分析信息,以獲得相應的信息。先將XmlHttp的ResponseXML信息加載到XML DOM對象中。如果出錯,可以分析“偵聽頁”返回的出錯信息;如果正確,DOM里就有查詢結(jié)果,并可通過分析該XML文檔求得信息結(jié)果。另外XmlHttp還有responseText方法用于加載普通文件,但推薦使用XML文件格式。
3.3 XML_SQL查詢
對于預定的性能函數(shù)GetTitlesXML(),可以結(jié)合SQL命令加強功能,進行數(shù)據(jù)庫操作。例如,根據(jù)書籍的類型、價格和銷售日期等信息,由Form表單的信息組成SQL條件字句,在IE客戶端查詢書籍的代碼如下:
4 結(jié)語
總結(jié)了使用Msxml構(gòu)件在客戶端和后臺Web服務器之間建立通訊聯(lián)系的基本環(huán)節(jié)的實現(xiàn)方法,給出用戶需要的ActiveX控件的部分方法和屬性。Msxml提高得整個Web應用系統(tǒng)的自制性能,這為進一步實現(xiàn)胖B/S應用奠定了技術基礎。