監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

基于Lucene檢索引擎的電子病歷全文檢索系統(tǒng)

申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114

1 前言
        隨著醫(yī)院信息化建設(shè)的進(jìn)行,電子病歷作為臨床醫(yī)療信息的基礎(chǔ)和醫(yī)院信息系統(tǒng)的核心構(gòu)成了業(yè)務(wù)管理、醫(yī)療衛(wèi)生決策系統(tǒng)的基礎(chǔ)6但國(guó)內(nèi)目前各大醫(yī)院通常并不把電子病歷管理視為一個(gè)獨(dú)立的單元, 電子病歷管理系統(tǒng)一般都是作為醫(yī)院信息系統(tǒng)的一個(gè)模塊存在。目前,對(duì)于病歷信息的查詢?yōu)g覽也只能通過(guò)查詢患者的一些結(jié)構(gòu)化的數(shù)據(jù)庫(kù)信息得到該患者的ID號(hào),然后通過(guò)病歷的存儲(chǔ)規(guī)則來(lái)找到相應(yīng)的病歷。每次得到的信息都是個(gè)別的,而且無(wú)法實(shí)現(xiàn)全文檢索.存在于病歷文本中的大量非結(jié)構(gòu)化的信息不能作為檢索條件,因而這些信息也不能為醫(yī)療工作者所利用。因此. 目前電子病歷管理系統(tǒng)的檢索查詢機(jī)制迫切需要向滿足醫(yī)生需求、科研輔助和采用全文檢索的方向轉(zhuǎn)變,為以后電子病歷管理正式成為醫(yī)院管理的一個(gè)獨(dú)立分支打下良好的基礎(chǔ)?;诖耍覀兲岢隽嘶贚ucene檢索引擎建立電子病歷全文檢索系統(tǒng),它以基于關(guān)鍵字的全文檢索技術(shù)為基礎(chǔ).能夠提供方便快捷的方式為臨床醫(yī)療、醫(yī)學(xué)科研工作及病歷管理提供支持。 

2 電子病歷的前期預(yù)處理
      病歷是患者在醫(yī)院診斷治療全過(guò)程的原始記錄,貫穿于患者在醫(yī)院就診的各個(gè)環(huán)節(jié)中。由于目前病歷信息的電子化大都附屬于傳統(tǒng)的HIS系統(tǒng),但HIS系統(tǒng)并不等于電子病歷系統(tǒng)。因?yàn)閺碾娮硬v的角度看患者信息應(yīng)該是完整的、集成的.電子病歷系統(tǒng)應(yīng)該能夠以統(tǒng)一的視圖向用戶提供患者的繼承信息;而從傳統(tǒng)的HIS每個(gè)子系統(tǒng)來(lái)看,患者信息卻是局部的、分散的。所以要對(duì)電子病歷進(jìn)行全文檢索,首先要建立一個(gè)規(guī)范的、合乎要求的電子病歷描述模型,將分散于HIS系統(tǒng)中的電子病歷信息讀出并轉(zhuǎn)換為統(tǒng)一形式的文件存儲(chǔ)于電子病歷庫(kù)中。XML(eXtensible Markup Language,即擴(kuò)展標(biāo)記語(yǔ)言)就是建立并實(shí)現(xiàn)該模型的一個(gè)有效手段。

        XML是一種結(jié)構(gòu)化描述語(yǔ)言。其優(yōu)勢(shì)在于,它不僅是一種標(biāo)識(shí)語(yǔ)言,更是一種可以定義描述對(duì)象結(jié)構(gòu)的元語(yǔ)言。XML采用了層次化的面向?qū)ο蟮慕Y(jié)構(gòu)描述方法.非常適合于描述病歷這樣復(fù)雜的內(nèi)容.在表達(dá)能力方面優(yōu)于關(guān)系數(shù)據(jù)庫(kù)。

        使用XML描述病歷內(nèi)容,要先定義病歷內(nèi)容的結(jié)構(gòu)。在此基礎(chǔ)上實(shí)現(xiàn)以數(shù)據(jù)庫(kù)形式存儲(chǔ)的患者信息到病歷結(jié)構(gòu)的轉(zhuǎn)換,從而實(shí)現(xiàn)由以支持日常業(yè)務(wù)管理為目的的數(shù)據(jù)庫(kù)描述到以患者為中心的描述。形成的XML文件是病歷存儲(chǔ)管理的基本單位。

3 全文檢索引擎Lucene簡(jiǎn)介
        Lucene是Apache軟件基金會(huì)Jakarta項(xiàng)目組的一個(gè)子項(xiàng)目,是一個(gè)開放源代碼的全文檢索引擎工具包,作為一個(gè)優(yōu)秀的全文檢索引擎,其系統(tǒng)結(jié)構(gòu)具有強(qiáng)烈的面向?qū)ο筇卣?。首先是定義了一個(gè)與平臺(tái)無(wú)關(guān)的索引文件格式;其次通過(guò)抽象將系統(tǒng)的核心組成部分設(shè)計(jì)為抽象類.具體的平臺(tái)實(shí)現(xiàn)部分設(shè)計(jì)為抽象類的實(shí)現(xiàn);此外,與具體平臺(tái)相關(guān)的部分(比如文件存儲(chǔ))也封裝為類,經(jīng)過(guò)層層的面向?qū)ο笫降奶幚?,最終達(dá)成了一個(gè)低耦合高效率、容易二次開發(fā)的檢索引擎系統(tǒng)。因此.Lucene得到了非常廣泛的應(yīng)用。
4 系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

4.1 平臺(tái)和開發(fā)環(huán)境簡(jiǎn)介
        本系統(tǒng)的平臺(tái)和開發(fā)環(huán)境為:操作系統(tǒng):Windows NT/2O00/XP;開發(fā)語(yǔ)言:Java,JSP;全文檢索開發(fā)庫(kù):Apache Lucene 2.2;Web服務(wù)器:ApacheTomcat 6.0:開發(fā)工具:IBM Eclipse 3.2.0。
4.2 總體架構(gòu)
     不電子病歷全文檢索系統(tǒng)主要實(shí)現(xiàn)對(duì)電子病歷的表示、存儲(chǔ)、組織和訪問(wèn),即根據(jù)用戶的查詢要求,從電子病歷庫(kù)中檢索出相關(guān)信息資料。其中心環(huán)節(jié)是電子病歷內(nèi)容的表達(dá)、信息查詢的獲得以及相關(guān)信息的匹配。整個(gè)系統(tǒng)設(shè)計(jì)為4個(gè)功能模塊:數(shù)據(jù)預(yù)處理模塊、索引建立模塊、全文檢索模塊和用戶界面模塊。各個(gè)模塊的基本功能和模塊之間的邏輯和數(shù)據(jù)關(guān)系如圖1所示。

依圖l中的序號(hào),整個(gè)系統(tǒng)的信息處理流程為:
        A.?dāng)?shù)據(jù)預(yù)處理模塊讀入電子病歷的原始數(shù)據(jù)(一般以數(shù)據(jù)庫(kù)表的形式儲(chǔ)存在HIS系統(tǒng)中),將原始電子病歷加工為XML文件.然后儲(chǔ)存于XML電子病歷庫(kù)中;
       B.索引建立模塊讀入XML電子病歷庫(kù)中儲(chǔ)存的XML文件.把建立好的全文索引儲(chǔ)存于全文索引庫(kù)中;
        C.用戶通過(guò)用戶界面模塊提出檢索請(qǐng)求,用戶界面模塊調(diào)用全文檢索模塊使用電子病歷的全文索引進(jìn)行檢索,將得到的檢索結(jié)果返回給用戶;
        D.用戶查看了檢索結(jié)果中電子病歷的摘要后如果需要進(jìn)一步查看電子病歷的全文,可以通過(guò)用戶界面模塊直接根據(jù)檢索結(jié)果中的文檔ID從XML電子病歷庫(kù)中獲取全文。
5 系統(tǒng)測(cè)試和評(píng)價(jià)
5,1 測(cè)試環(huán)境

(1)軟件環(huán)境
測(cè)試環(huán)境采用Sun公司的JDK1.5.0,操作系統(tǒng)采用的是微軟的Windows XP SP2。數(shù)據(jù)庫(kù)服務(wù)器采用的是Oracle8i及其自帶的JDBC驅(qū)動(dòng)。
(2)硬件環(huán)境
運(yùn)行服務(wù)器采用的CPU為Inter Pentium 3.0E,內(nèi)存2 GB.硬盤160GB。
5.2 測(cè)試結(jié)果
測(cè)試過(guò)程中一共選取了3個(gè)和疾病癥狀有關(guān)的關(guān)鍵詞“肥胖”、“腹痛”和“惡心”作為測(cè)試檢索條件數(shù)據(jù),測(cè)試結(jié)果經(jīng)過(guò)進(jìn)一步分析計(jì)算后可以得到的數(shù)據(jù)見(jiàn)表1。

注:P@30指前30個(gè)檢索結(jié)果中符合條件的文檔數(shù)
由于測(cè)試數(shù)據(jù)集過(guò)大(共約26 000多篇),很難通過(guò)人工方式確定全部文檔集中符合條件的文檔數(shù),所以無(wú)法有效地計(jì)算查全率;檢索出的命中文檔數(shù)量也比較多,但和搜索引擎一樣,通常只有“First Page”的結(jié)果會(huì)被用戶關(guān)注,因此我們計(jì)算的查準(zhǔn)率只基于前30個(gè)檢索結(jié)果。通過(guò)上表可以看出,本系統(tǒng)的查準(zhǔn)率較高,基本達(dá)到了系統(tǒng)設(shè)計(jì)的性能要求。
6 小結(jié)
從測(cè)試結(jié)果可以看出系統(tǒng)滿足設(shè)計(jì)要求,符合功能需要。但是僅僅基于關(guān)鍵字檢索顯然是不夠的,下一步要實(shí)現(xiàn)“智能”全文檢索還需要對(duì)系統(tǒng)進(jìn)行基于語(yǔ)義的檢索功能擴(kuò)展,使檢索結(jié)果不僅僅滿足于與用戶提交的關(guān)鍵字進(jìn)行字面上的匹配。而是檢索出與此概念有關(guān)的、用戶真正想要的信息,以進(jìn)一步提高查全率[31。
【參考文獻(xiàn)】
【1] 1 王曉,羅二平,張健.基于語(yǔ)義的電子病歷智能全文檢索叨.醫(yī)療衛(wèi)生裝備,2008,29(4):45-46.
【2 】薛萬(wàn)國(guó).XML與電子病歷m.國(guó)外醫(yī)學(xué):醫(yī)院管理分冊(cè),2002(1):33—34.
[3] 高少琛.基于查詢拓展和聚類技術(shù)的資源檢索系統(tǒng)的研究與應(yīng)用[D1.上海:上海交通大學(xué)碩士學(xué)位論文,2007:10一11.

發(fā)布:2007-04-09 11:22    編輯:泛普軟件 · xiaona    [打印此頁(yè)]    [關(guān)閉]
相關(guān)文章:

泛普門診收費(fèi)管理系統(tǒng)其他應(yīng)用

醫(yī)院行業(yè)管理系統(tǒng) 醫(yī)院信息管理系統(tǒng) 醫(yī)藥管理軟件 病案管理系統(tǒng) 藥店管理系統(tǒng) 醫(yī)院his系統(tǒng) 醫(yī)院預(yù)約軟件 住院收費(fèi)管理系統(tǒng) 區(qū)域醫(yī)療衛(wèi)生信息化平臺(tái) 社區(qū)醫(yī)療管理系統(tǒng) 門診收費(fèi)管理系統(tǒng) 醫(yī)療衛(wèi)生軟件 新農(nóng)合軟件 醫(yī)院管理系統(tǒng)免費(fèi)版 免費(fèi)醫(yī)院信息管理系統(tǒng) 醫(yī)藥管理軟件免費(fèi)版 免費(fèi)藥店管理系統(tǒng) 醫(yī)院管理系統(tǒng)下載 醫(yī)院信息管理系統(tǒng)下載 醫(yī)藥管理軟件下載 病案管理系統(tǒng)下載 藥店管理系統(tǒng)下載 醫(yī)院his系統(tǒng)下載 醫(yī)療一體化管理系統(tǒng)下載 新農(nóng)合軟件下載 藥品管理系統(tǒng)下載