廣告廣告
  加入我的最愛 設為首頁 風格修改
首頁 首尾
 手機版   訂閱   地圖  簡體 
您是第 6615 個閱讀者
 
發表文章 發表投票 回覆文章
  可列印版   加為IE收藏   收藏主題   上一主題 | 下一主題   
osmaiwinner 手機
個人文章 個人相簿 個人日記 個人地圖
初露鋒芒
級別: 初露鋒芒 該用戶目前不上站
推文 x0 鮮花 x19
分享: 轉寄此文章 Facebook Plurk Twitter 複製連結到剪貼簿 轉換為繁體 轉換為簡體 載入圖片
推文 x0
[求助] 最近想學寫自動抓文PO文程式
最近想學寫自動抓文PO文程式
例如自動抓取新聞文章然後PO在自己的部落格 ..

訪客只能看到部份內容,免費 加入會員 或由臉書 Google 可以看到全部內容



獻花 x0 回到頂端 [樓 主] From:歐洲 | Posted:2011-02-20 22:54 |
ebolaman 手機 會員卡
個人文章 個人相簿 個人日記 個人地圖
特殊貢獻獎

級別: 副版主 該用戶目前不上站
版區: 程式設計
推文 x38 鮮花 x458
分享: 轉寄此文章 Facebook Plurk Twitter 複製連結到剪貼簿 轉換為繁體 轉換為簡體 載入圖片

大概要朝 HTML 解碼前進

用 軟體 Notepad++  將 Html 碼放進去 並選 程式語言 Html
或是用 Google Chrome 開啟網頁,點右鍵 >> 檢查元素 也很好用

就會發現 Html 中是一塊一塊的,這與程式碼的構造很相似


那麼寫程式就會簡單多了,只要連線到想要的該網頁 (只要封包,不要元件),讀取 Html 原始碼

再讀取區塊的開頭構造, a href.... table..... tr.... 之類的


有個軟體可以去參考: 瑞士刀

可以把網頁以及包含超連結的 分支網頁 抓下來

至於該用哪個程式,我沒辦法給你明確的答案


My BOINC stats :

獻花 x0 回到頂端 [1 樓] From:台灣台灣寬頻 | Posted:2011-02-26 08:32 |

首頁  發表文章 發表投票 回覆文章
Powered by PHPWind v1.3.6
Copyright © 2003-04 PHPWind
Processed in 0.069272 second(s),query:16 Gzip disabled
本站由 瀛睿律師事務所 擔任常年法律顧問 | 免責聲明 | 本網站已依台灣網站內容分級規定處理 | 連絡我們 | 訪客留言