監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設計管理系統(tǒng) | 甲方項目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關閉

泛普軟件分析聚焦爬蟲技術和特定主題—OA 資源

申請免費試用、咨詢電話:400-8352-114

  泛普軟件分析聚焦爬蟲技術和特定主題—OA 資源

  1 聚焦爬蟲技術

  泛普軟件通過文獻檢索獲知:聚焦爬蟲(Focused Crawler)又稱為主題爬蟲(Topical Crawler),它的工作流程(如圖1)比傳統(tǒng)網絡爬蟲復雜一些,在抓取頁面并提取出URL以后,會根據相應的URL分析算法保留盡可能多的主題相關度高的URL,并將其放入等待抓取的URL隊列;與主題無關或相關度不高的URL將被丟棄。然后再從URL隊列里讀取URL進行抓取,并重復上述過程,直到滿足爬行停止條件為止。而且,聚集爬出的系統(tǒng)中有專門的數據庫,用來存貯被爬蟲抓取的網頁,并有專門的功能模塊對網頁進行內容分析、特征詞提取,從而建立起相應的主題特征詞庫。特征詞庫建立以后,可以更好的對之后抓取的網頁進行分析和評價,把與主題無關或相關度不高的網頁排除。

  2 特定主題—OA 資源

  泛普軟件通過文獻檢索獲知:Open Access即開放存取,簡稱OA,2002年2月14日發(fā)表的《布達佩斯開放存取計劃》對OA做了如下的定義:“古老的學術傳統(tǒng)和嶄新的技術已經結合起來,可能將給公眾帶來空前的利益。古老的學術傳統(tǒng)是為了接受咨詢和傳播知識的目的,在毋需付費的條件下,科學家和學者們很樂意將自己的研究成果發(fā)表于學術期刊上。嶄新的技術是英特網。這種結合可能將給公眾帶來的利益就是:經過同行評價的期刊文獻可以被所有的科學家、學者、教師、學生以及其他充滿好奇心的人在全球范圍內發(fā)布其電子文本并可以完全免費的、無限制的使用。消除對這些文獻的存取障礙將會加快研究的速度,使教育更加豐富多彩,富人與窮人之間互相共享彼此的學問,從而使這些文獻達到最大限度的利用,并在共同的理智交流和知識的追求中建立人類聯合的基礎。這種免費的無限制的聯機獲取方式,稱之為開放存取(open access)。”

  Open Access是國際科技界、學術界、出版界、信息傳播界為推動科研成果利用網絡自由傳播而發(fā)起的運動。通過網絡技術,任何人可以免費的獲得各類文獻。

  此文章為泛普軟件所寫,轉載請留版權,泛普軟件專注OA,OA系統(tǒng),OA辦公系統(tǒng),OA軟件,OA辦公軟件。 52tianma.cn

  泛普軟件編輯

發(fā)布:2006-12-13 22:12    編輯:泛普軟件 · hujian    [打印此頁]    [關閉]
相關文章:

泛普泛普期刊其他應用

泛普OA商務合同 泛普OA需求調研 泛普OA實施方案 泛普OA項目啟動 泛普網絡硬件配置 泛普OA部署安裝 泛普流程模板表單 OA系統(tǒng)二次開發(fā) 泛普常見問題解決 泛普OA操作手冊 泛普軟件項目驗收 泛普培訓推廣上線 泛普OA售后服務 泛普新聞 泛普期刊 泛普博客