在上一篇「HTTP通訊協定」文章內,除了找到一些HTTP的基本資料,也從「[HTTP]Http GET、POST Method」文章內學到利用「HttpWatch」工具協助查詢HTTP的封包內容;這個很重要,特別是在POST Method模式時,沒有這些互動過程的記錄是沒辦法取得想要的網頁資料。
而這裡來寫一下另一個我喜歡的工具─「LiveHttpHeaders」,這個工具只能在Firefox上執行,對於已經習慣Firefox環境的我來說,「LiveHttpHeaders」相對來說更為簡單與方便(「HttpWatch」不只支援Firefox,也支援IE,呈現的資訊更豐富,但是在很多情況下其實用不到這麼多資訊,所以「LiveHttpHeaders」相對簡潔有力,也是我愛用的原因)。
在「Rhino環境應用Java的URL類別抓取網頁資料」文章中,使用該段程式後確實可以取得該網頁的資料,但取回的內容為近幾期的內容,且預設取得之資料包括各類彩券的最近期獎號。當然,如果"定時"的取得這個網頁資料回來剖析並記錄,也能完整的得到所有的樂透彩資料(隨著時間會更新期數/獎號內容)。但如果想更進一步只取得想要的期數與獎號,就必須透過網頁上的查詢功能,而從這裡開始,網頁採用的就是POST Method向主機交換資料,所以必需依照樂透網頁的溝通方式送出正確的封包。這時候就是應用「LiveHttpHeaders」這套工具的場合,執行Firefox的「工具/Live HTTP headers」選項,開啟如下的畫面:
接著在網頁輸入欲查詢的期數後進行查詢,如下圖:
在Live HTTP headers的畫面中,就可以順利得到封包送出/取回的過程,如下圖:
有了這些資料,接下來只要模擬這個處理過程,「應該(?)」就可以順利取得所需要的網頁資料了。
沒有留言:
張貼留言