當前位置:工程項目OA系統(tǒng) > 泛普服務體系 > 泛普期刊
泛普軟件分析聚焦爬蟲技術和特定主題—OA 資源
泛普軟件分析聚焦爬蟲技術和特定主題—OA 資源
1 聚焦爬蟲技術
泛普軟件通過文獻檢索獲知:聚焦爬蟲(Focused Crawler)又稱為主題爬蟲(Topical Crawler),它的工作流程(如圖1)比傳統(tǒng)網絡爬蟲復雜一些,在抓取頁面并提取出URL以后,會根據相應的URL分析算法保留盡可能多的主題相關度高的URL,并將其放入等待抓取的URL隊列;與主題無關或相關度不高的URL將被丟棄。然后再從URL隊列里讀取URL進行抓取,并重復上述過程,直到滿足爬行停止條件為止。而且,聚集爬出的系統(tǒng)中有專門的數據庫,用來存貯被爬蟲抓取的網頁,并有專門的功能模塊對網頁進行內容分析、特征詞提取,從而建立起相應的主題特征詞庫。特征詞庫建立以后,可以更好的對之后抓取的網頁進行分析和評價,把與主題無關或相關度不高的網頁排除。
2 特定主題—OA 資源
泛普軟件通過文獻檢索獲知:Open Access即開放存取,簡稱OA,2002年2月14日發(fā)表的《布達佩斯開放存取計劃》對OA做了如下的定義:“古老的學術傳統(tǒng)和嶄新的技術已經結合起來,可能將給公眾帶來空前的利益。古老的學術傳統(tǒng)是為了接受咨詢和傳播知識的目的,在毋需付費的條件下,科學家和學者們很樂意將自己的研究成果發(fā)表于學術期刊上。嶄新的技術是英特網。這種結合可能將給公眾帶來的利益就是:經過同行評價的期刊文獻可以被所有的科學家、學者、教師、學生以及其他充滿好奇心的人在全球范圍內發(fā)布其電子文本并可以完全免費的、無限制的使用。消除對這些文獻的存取障礙將會加快研究的速度,使教育更加豐富多彩,富人與窮人之間互相共享彼此的學問,從而使這些文獻達到最大限度的利用,并在共同的理智交流和知識的追求中建立人類聯合的基礎。這種免費的無限制的聯機獲取方式,稱之為開放存取(open access)。”
Open Access是國際科技界、學術界、出版界、信息傳播界為推動科研成果利用網絡自由傳播而發(fā)起的運動。通過網絡技術,任何人可以免費的獲得各類文獻。
此文章為泛普軟件所寫,轉載請留版權,泛普軟件專注OA,OA系統(tǒng),OA辦公系統(tǒng),OA軟件,OA辦公軟件。 52tianma.cn
泛普軟件編輯
- 1工作流程來剖析存包箱管理OA軟件存包箱管理系統(tǒng)的實現流程
- 2集團協(xié)同辦公系統(tǒng)(OA)建設項目-集團信息化應用系統(tǒng)總體技術要求
- 3協(xié)同OA辦公系統(tǒng)與NC ERP系統(tǒng)集成的方案技術指導
- 4OA系統(tǒng)的項目目標包括以下三個方面:
- 5泛普軟件分析公共圖書館OA系統(tǒng)資源發(fā)展
- 6信息環(huán)境下OSSP的目標和基本思想及OA辦公系統(tǒng)的應用
- 7OA辦公自動化軟件的整體亮點四:血脈
- 8OA辦公自動化軟件以柱狀圖、餅圖方式顯示
- 9OA辦公系統(tǒng)中CRM的廣泛應用與基礎應用功能
- 10企業(yè)管理的輔助工具有哪些?
- 112015年泛普軟件將推動國內OA系統(tǒng)(辦公自動化)廣泛普及
- 122015-2016年國內哪一家OA辦公系統(tǒng)最好呢?
- 13OA辦公自動化管理系統(tǒng)的研究及應用起步較晚、水平較低
- 14泛普軟件協(xié)同OA系統(tǒng)在系統(tǒng)中的結構體系
- 15協(xié)同OA辦公軟件系統(tǒng)財務費用報銷流程圖
- 16OA軟件管理平臺設計理念及技術特點是什么?
- 17泛普軟件( 52tianma.cn)推出的OA系統(tǒng)主要以下八個模塊
- 18企業(yè)OA軟件系統(tǒng)的工作交流自動化管理平臺
- 19泛普軟件告訴您企業(yè)OA辦公自動化系統(tǒng)實現的可行性分析
- 20OA辦公系統(tǒng)為大家進行簡單介紹
- 21OA辦公自動化的集團化平臺技術支撐體系
- 22研究縣級政府OA系統(tǒng)設計都有哪些需求呢?
- 23協(xié)同OA軟件中流程的配合使用有什么好的作用呢?
- 24OA辦公系統(tǒng)有哪六易標準呢?
- 25聚焦蜘蛛爬蟲體系對OA辦公軟件行業(yè)的網站的作用及功能分析如下
- 26泛普OA軟件中人力資源部的CRM應用
- 27OA系統(tǒng)中的信息發(fā)布共享模塊
- 28泛普軟件推出的基于B/S模式的OA系統(tǒng)
- 29廣東高校OA自動化系統(tǒng)使用現狀與分析
- 30OA辦公軟件系統(tǒng)5.0 項目管理功能使用指南