監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價咨詢管理系統(tǒng) | 工程設計管理系統(tǒng) | 甲方項目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關閉

基于Lucene檢索引擎的電子病歷全文檢索系統(tǒng)

申請免費試用、咨詢電話:400-8352-114

1 前言
        隨著醫(yī)院信息化建設的進行,電子病歷作為臨床醫(yī)療信息的基礎和醫(yī)院信息系統(tǒng)的核心構成了業(yè)務管理、醫(yī)療衛(wèi)生決策系統(tǒng)的基礎6但國內目前各大醫(yī)院通常并不把電子病歷管理視為一個獨立的單元, 電子病歷管理系統(tǒng)一般都是作為醫(yī)院信息系統(tǒng)的一個模塊存在。目前,對于病歷信息的查詢?yōu)g覽也只能通過查詢患者的一些結構化的數(shù)據(jù)庫信息得到該患者的ID號,然后通過病歷的存儲規(guī)則來找到相應的病歷。每次得到的信息都是個別的,而且無法實現(xiàn)全文檢索.存在于病歷文本中的大量非結構化的信息不能作為檢索條件,因而這些信息也不能為醫(yī)療工作者所利用。因此. 目前電子病歷管理系統(tǒng)的檢索查詢機制迫切需要向滿足醫(yī)生需求、科研輔助和采用全文檢索的方向轉變,為以后電子病歷管理正式成為醫(yī)院管理的一個獨立分支打下良好的基礎?;诖?,我們提出了基于Lucene檢索引擎建立電子病歷全文檢索系統(tǒng),它以基于關鍵字的全文檢索技術為基礎.能夠提供方便快捷的方式為臨床醫(yī)療、醫(yī)學科研工作及病歷管理提供支持。 

2 電子病歷的前期預處理
      病歷是患者在醫(yī)院診斷治療全過程的原始記錄,貫穿于患者在醫(yī)院就診的各個環(huán)節(jié)中。由于目前病歷信息的電子化大都附屬于傳統(tǒng)的HIS系統(tǒng),但HIS系統(tǒng)并不等于電子病歷系統(tǒng)。因為從電子病歷的角度看患者信息應該是完整的、集成的.電子病歷系統(tǒng)應該能夠以統(tǒng)一的視圖向用戶提供患者的繼承信息;而從傳統(tǒng)的HIS每個子系統(tǒng)來看,患者信息卻是局部的、分散的。所以要對電子病歷進行全文檢索,首先要建立一個規(guī)范的、合乎要求的電子病歷描述模型,將分散于HIS系統(tǒng)中的電子病歷信息讀出并轉換為統(tǒng)一形式的文件存儲于電子病歷庫中。XML(eXtensible Markup Language,即擴展標記語言)就是建立并實現(xiàn)該模型的一個有效手段。

        XML是一種結構化描述語言。其優(yōu)勢在于,它不僅是一種標識語言,更是一種可以定義描述對象結構的元語言。XML采用了層次化的面向對象的結構描述方法.非常適合于描述病歷這樣復雜的內容.在表達能力方面優(yōu)于關系數(shù)據(jù)庫。

        使用XML描述病歷內容,要先定義病歷內容的結構。在此基礎上實現(xiàn)以數(shù)據(jù)庫形式存儲的患者信息到病歷結構的轉換,從而實現(xiàn)由以支持日常業(yè)務管理為目的的數(shù)據(jù)庫描述到以患者為中心的描述。形成的XML文件是病歷存儲管理的基本單位。

3 全文檢索引擎Lucene簡介
        Lucene是Apache軟件基金會Jakarta項目組的一個子項目,是一個開放源代碼的全文檢索引擎工具包,作為一個優(yōu)秀的全文檢索引擎,其系統(tǒng)結構具有強烈的面向對象特征。首先是定義了一個與平臺無關的索引文件格式;其次通過抽象將系統(tǒng)的核心組成部分設計為抽象類.具體的平臺實現(xiàn)部分設計為抽象類的實現(xiàn);此外,與具體平臺相關的部分(比如文件存儲)也封裝為類,經(jīng)過層層的面向對象式的處理,最終達成了一個低耦合高效率、容易二次開發(fā)的檢索引擎系統(tǒng)。因此.Lucene得到了非常廣泛的應用。
4 系統(tǒng)的設計與實現(xiàn)

4.1 平臺和開發(fā)環(huán)境簡介
        本系統(tǒng)的平臺和開發(fā)環(huán)境為:操作系統(tǒng):Windows NT/2O00/XP;開發(fā)語言:Java,JSP;全文檢索開發(fā)庫:Apache Lucene 2.2;Web服務器:ApacheTomcat 6.0:開發(fā)工具:IBM Eclipse 3.2.0。
4.2 總體架構
     不電子病歷全文檢索系統(tǒng)主要實現(xiàn)對電子病歷的表示、存儲、組織和訪問,即根據(jù)用戶的查詢要求,從電子病歷庫中檢索出相關信息資料。其中心環(huán)節(jié)是電子病歷內容的表達、信息查詢的獲得以及相關信息的匹配。整個系統(tǒng)設計為4個功能模塊:數(shù)據(jù)預處理模塊、索引建立模塊、全文檢索模塊和用戶界面模塊。各個模塊的基本功能和模塊之間的邏輯和數(shù)據(jù)關系如圖1所示。

依圖l中的序號,整個系統(tǒng)的信息處理流程為:
        A.數(shù)據(jù)預處理模塊讀入電子病歷的原始數(shù)據(jù)(一般以數(shù)據(jù)庫表的形式儲存在HIS系統(tǒng)中),將原始電子病歷加工為XML文件.然后儲存于XML電子病歷庫中;
       B.索引建立模塊讀入XML電子病歷庫中儲存的XML文件.把建立好的全文索引儲存于全文索引庫中;
        C.用戶通過用戶界面模塊提出檢索請求,用戶界面模塊調用全文檢索模塊使用電子病歷的全文索引進行檢索,將得到的檢索結果返回給用戶;
        D.用戶查看了檢索結果中電子病歷的摘要后如果需要進一步查看電子病歷的全文,可以通過用戶界面模塊直接根據(jù)檢索結果中的文檔ID從XML電子病歷庫中獲取全文。
5 系統(tǒng)測試和評價
5,1 測試環(huán)境

(1)軟件環(huán)境
測試環(huán)境采用Sun公司的JDK1.5.0,操作系統(tǒng)采用的是微軟的Windows XP SP2。數(shù)據(jù)庫服務器采用的是Oracle8i及其自帶的JDBC驅動。
(2)硬件環(huán)境
運行服務器采用的CPU為Inter Pentium 3.0E,內存2 GB.硬盤160GB。
5.2 測試結果
測試過程中一共選取了3個和疾病癥狀有關的關鍵詞“肥胖”、“腹痛”和“惡心”作為測試檢索條件數(shù)據(jù),測試結果經(jīng)過進一步分析計算后可以得到的數(shù)據(jù)見表1。

注:P@30指前30個檢索結果中符合條件的文檔數(shù)
由于測試數(shù)據(jù)集過大(共約26 000多篇),很難通過人工方式確定全部文檔集中符合條件的文檔數(shù),所以無法有效地計算查全率;檢索出的命中文檔數(shù)量也比較多,但和搜索引擎一樣,通常只有“First Page”的結果會被用戶關注,因此我們計算的查準率只基于前30個檢索結果。通過上表可以看出,本系統(tǒng)的查準率較高,基本達到了系統(tǒng)設計的性能要求。
6 小結
從測試結果可以看出系統(tǒng)滿足設計要求,符合功能需要。但是僅僅基于關鍵字檢索顯然是不夠的,下一步要實現(xiàn)“智能”全文檢索還需要對系統(tǒng)進行基于語義的檢索功能擴展,使檢索結果不僅僅滿足于與用戶提交的關鍵字進行字面上的匹配。而是檢索出與此概念有關的、用戶真正想要的信息,以進一步提高查全率[31。
【參考文獻】
【1] 1 王曉,羅二平,張?。谡Z義的電子病歷智能全文檢索叨.醫(yī)療衛(wèi)生裝備,2008,29(4):45-46.
【2 】薛萬國.XML與電子病歷m.國外醫(yī)學:醫(yī)院管理分冊,2002(1):33—34.
[3] 高少琛.基于查詢拓展和聚類技術的資源檢索系統(tǒng)的研究與應用[D1.上海:上海交通大學碩士學位論文,2007:10一11.

發(fā)布:2007-04-09 11:22    編輯:泛普軟件 · xiaona    [打印此頁]    [關閉]
相關文章:

泛普門診收費管理系統(tǒng)其他應用

醫(yī)院行業(yè)管理系統(tǒng) 醫(yī)院信息管理系統(tǒng) 醫(yī)藥管理軟件 病案管理系統(tǒng) 藥店管理系統(tǒng) 醫(yī)院his系統(tǒng) 醫(yī)院預約軟件 住院收費管理系統(tǒng) 區(qū)域醫(yī)療衛(wèi)生信息化平臺 社區(qū)醫(yī)療管理系統(tǒng) 門診收費管理系統(tǒng) 醫(yī)療衛(wèi)生軟件 新農合軟件 醫(yī)院管理系統(tǒng)免費版 免費醫(yī)院信息管理系統(tǒng) 醫(yī)藥管理軟件免費版 免費藥店管理系統(tǒng) 醫(yī)院管理系統(tǒng)下載 醫(yī)院信息管理系統(tǒng)下載 醫(yī)藥管理軟件下載 病案管理系統(tǒng)下載 藥店管理系統(tǒng)下載 醫(yī)院his系統(tǒng)下載 醫(yī)療一體化管理系統(tǒng)下載 新農合軟件下載 藥品管理系統(tǒng)下載