當(dāng)前位置:工程項目OA系統(tǒng) > 領(lǐng)域應(yīng)用 > 醫(yī)院管理OA系統(tǒng) > 門診收費管理系統(tǒng)
基于Lucene檢索引擎的電子病歷全文檢索系統(tǒng)
1 前言
隨著醫(yī)院信息化建設(shè)的進行,電子病歷作為臨床醫(yī)療信息的基礎(chǔ)和醫(yī)院信息系統(tǒng)的核心構(gòu)成了業(yè)務(wù)管理、醫(yī)療衛(wèi)生決策系統(tǒng)的基礎(chǔ)6但國內(nèi)目前各大醫(yī)院通常并不把電子病歷管理視為一個獨立的單元, 電子病歷管理系統(tǒng)一般都是作為醫(yī)院信息系統(tǒng)的一個模塊存在。目前,對于病歷信息的查詢?yōu)g覽也只能通過查詢患者的一些結(jié)構(gòu)化的數(shù)據(jù)庫信息得到該患者的ID號,然后通過病歷的存儲規(guī)則來找到相應(yīng)的病歷。每次得到的信息都是個別的,而且無法實現(xiàn)全文檢索.存在于病歷文本中的大量非結(jié)構(gòu)化的信息不能作為檢索條件,因而這些信息也不能為醫(yī)療工作者所利用。因此. 目前電子病歷管理系統(tǒng)的檢索查詢機制迫切需要向滿足醫(yī)生需求、科研輔助和采用全文檢索的方向轉(zhuǎn)變,為以后電子病歷管理正式成為醫(yī)院管理的一個獨立分支打下良好的基礎(chǔ)?;诖?,我們提出了基于Lucene檢索引擎建立電子病歷全文檢索系統(tǒng),它以基于關(guān)鍵字的全文檢索技術(shù)為基礎(chǔ).能夠提供方便快捷的方式為臨床醫(yī)療、醫(yī)學(xué)科研工作及病歷管理提供支持。
2 電子病歷的前期預(yù)處理
病歷是患者在醫(yī)院診斷治療全過程的原始記錄,貫穿于患者在醫(yī)院就診的各個環(huán)節(jié)中。由于目前病歷信息的電子化大都附屬于傳統(tǒng)的HIS系統(tǒng),但HIS系統(tǒng)并不等于電子病歷系統(tǒng)。因為從電子病歷的角度看患者信息應(yīng)該是完整的、集成的.電子病歷系統(tǒng)應(yīng)該能夠以統(tǒng)一的視圖向用戶提供患者的繼承信息;而從傳統(tǒng)的HIS每個子系統(tǒng)來看,患者信息卻是局部的、分散的。所以要對電子病歷進行全文檢索,首先要建立一個規(guī)范的、合乎要求的電子病歷描述模型,將分散于HIS系統(tǒng)中的電子病歷信息讀出并轉(zhuǎn)換為統(tǒng)一形式的文件存儲于電子病歷庫中。XML(eXtensible Markup Language,即擴展標(biāo)記語言)就是建立并實現(xiàn)該模型的一個有效手段。
XML是一種結(jié)構(gòu)化描述語言。其優(yōu)勢在于,它不僅是一種標(biāo)識語言,更是一種可以定義描述對象結(jié)構(gòu)的元語言。XML采用了層次化的面向?qū)ο蟮慕Y(jié)構(gòu)描述方法.非常適合于描述病歷這樣復(fù)雜的內(nèi)容.在表達能力方面優(yōu)于關(guān)系數(shù)據(jù)庫。
使用XML描述病歷內(nèi)容,要先定義病歷內(nèi)容的結(jié)構(gòu)。在此基礎(chǔ)上實現(xiàn)以數(shù)據(jù)庫形式存儲的患者信息到病歷結(jié)構(gòu)的轉(zhuǎn)換,從而實現(xiàn)由以支持日常業(yè)務(wù)管理為目的的數(shù)據(jù)庫描述到以患者為中心的描述。形成的XML文件是病歷存儲管理的基本單位。
3 全文檢索引擎Lucene簡介
Lucene是Apache軟件基金會Jakarta項目組的一個子項目,是一個開放源代碼的全文檢索引擎工具包,作為一個優(yōu)秀的全文檢索引擎,其系統(tǒng)結(jié)構(gòu)具有強烈的面向?qū)ο筇卣?。首先是定義了一個與平臺無關(guān)的索引文件格式;其次通過抽象將系統(tǒng)的核心組成部分設(shè)計為抽象類.具體的平臺實現(xiàn)部分設(shè)計為抽象類的實現(xiàn);此外,與具體平臺相關(guān)的部分(比如文件存儲)也封裝為類,經(jīng)過層層的面向?qū)ο笫降奶幚恚罱K達成了一個低耦合高效率、容易二次開發(fā)的檢索引擎系統(tǒng)。因此.Lucene得到了非常廣泛的應(yīng)用。
4 系統(tǒng)的設(shè)計與實現(xiàn)
4.1 平臺和開發(fā)環(huán)境簡介
本系統(tǒng)的平臺和開發(fā)環(huán)境為:操作系統(tǒng):Windows NT/2O00/XP;開發(fā)語言:Java,JSP;全文檢索開發(fā)庫:Apache Lucene 2.2;Web服務(wù)器:ApacheTomcat 6.0:開發(fā)工具:IBM Eclipse 3.2.0。
4.2 總體架構(gòu)
不電子病歷全文檢索系統(tǒng)主要實現(xiàn)對電子病歷的表示、存儲、組織和訪問,即根據(jù)用戶的查詢要求,從電子病歷庫中檢索出相關(guān)信息資料。其中心環(huán)節(jié)是電子病歷內(nèi)容的表達、信息查詢的獲得以及相關(guān)信息的匹配。整個系統(tǒng)設(shè)計為4個功能模塊:數(shù)據(jù)預(yù)處理模塊、索引建立模塊、全文檢索模塊和用戶界面模塊。各個模塊的基本功能和模塊之間的邏輯和數(shù)據(jù)關(guān)系如圖1所示。
依圖l中的序號,整個系統(tǒng)的信息處理流程為:
A.?dāng)?shù)據(jù)預(yù)處理模塊讀入電子病歷的原始數(shù)據(jù)(一般以數(shù)據(jù)庫表的形式儲存在HIS系統(tǒng)中),將原始電子病歷加工為XML文件.然后儲存于XML電子病歷庫中;
B.索引建立模塊讀入XML電子病歷庫中儲存的XML文件.把建立好的全文索引儲存于全文索引庫中;
C.用戶通過用戶界面模塊提出檢索請求,用戶界面模塊調(diào)用全文檢索模塊使用電子病歷的全文索引進行檢索,將得到的檢索結(jié)果返回給用戶;
D.用戶查看了檢索結(jié)果中電子病歷的摘要后如果需要進一步查看電子病歷的全文,可以通過用戶界面模塊直接根據(jù)檢索結(jié)果中的文檔ID從XML電子病歷庫中獲取全文。
5 系統(tǒng)測試和評價
5,1 測試環(huán)境
(1)軟件環(huán)境
測試環(huán)境采用Sun公司的JDK1.5.0,操作系統(tǒng)采用的是微軟的Windows XP SP2。數(shù)據(jù)庫服務(wù)器采用的是Oracle8i及其自帶的JDBC驅(qū)動。
(2)硬件環(huán)境
運行服務(wù)器采用的CPU為Inter Pentium 3.0E,內(nèi)存2 GB.硬盤160GB。
5.2 測試結(jié)果
測試過程中一共選取了3個和疾病癥狀有關(guān)的關(guān)鍵詞“肥胖”、“腹痛”和“惡心”作為測試檢索條件數(shù)據(jù),測試結(jié)果經(jīng)過進一步分析計算后可以得到的數(shù)據(jù)見表1。
注:P@30指前30個檢索結(jié)果中符合條件的文檔數(shù)
由于測試數(shù)據(jù)集過大(共約26 000多篇),很難通過人工方式確定全部文檔集中符合條件的文檔數(shù),所以無法有效地計算查全率;檢索出的命中文檔數(shù)量也比較多,但和搜索引擎一樣,通常只有“First Page”的結(jié)果會被用戶關(guān)注,因此我們計算的查準(zhǔn)率只基于前30個檢索結(jié)果。通過上表可以看出,本系統(tǒng)的查準(zhǔn)率較高,基本達到了系統(tǒng)設(shè)計的性能要求。
6 小結(jié)
從測試結(jié)果可以看出系統(tǒng)滿足設(shè)計要求,符合功能需要。但是僅僅基于關(guān)鍵字檢索顯然是不夠的,下一步要實現(xiàn)“智能”全文檢索還需要對系統(tǒng)進行基于語義的檢索功能擴展,使檢索結(jié)果不僅僅滿足于與用戶提交的關(guān)鍵字進行字面上的匹配。而是檢索出與此概念有關(guān)的、用戶真正想要的信息,以進一步提高查全率[31。
【參考文獻】
【1] 1 王曉,羅二平,張健.基于語義的電子病歷智能全文檢索叨.醫(yī)療衛(wèi)生裝備,2008,29(4):45-46.
【2 】薛萬國.XML與電子病歷m.國外醫(yī)學(xué):醫(yī)院管理分冊,2002(1):33—34.
[3] 高少琛.基于查詢拓展和聚類技術(shù)的資源檢索系統(tǒng)的研究與應(yīng)用[D1.上海:上海交通大學(xué)碩士學(xué)位論文,2007:10一11.
- 1中醫(yī)運行電子病歷質(zhì)量的現(xiàn)狀分析
- 2cMS將在201 1年5月啟動有效應(yīng)用獎勵
- 3美醫(yī)療信息市場規(guī)模兩年內(nèi)預(yù)計將達500億美元
- 4護理電子病歷缺陷及對策
- 5在電子病歷網(wǎng)絡(luò)質(zhì)控系統(tǒng)的體會
- 6醫(yī)院建設(shè)區(qū)域醫(yī)療信息共享平臺
- 7電子病歷系統(tǒng)中XML數(shù)據(jù)調(diào)用的研究
- 8電子病歷應(yīng)對醫(yī)療糾紛中的方法
- 9談我院電子病歷一卡通系統(tǒng)的建設(shè)
- 10HIS系統(tǒng)與電子病歷系統(tǒng)的關(guān)系和數(shù)據(jù)共用
- 11電子病歷應(yīng)用有關(guān)問題的探討
- 12海洋社區(qū)衛(wèi)生管理平臺喜獲科技成果
- 13新一代卒中電子病歷系統(tǒng)的建立與應(yīng)用
- 14基于電子病歷系統(tǒng)的臨床路徑管理應(yīng)用研究
- 15惠東縣城區(qū)學(xué)齡前兒童HBsAg攜帶率調(diào)查分析
- 16電子病歷監(jiān)控數(shù)據(jù)失實原因分析及對策
- 17便攜式病歷管理系統(tǒng)的設(shè)計與開發(fā)
- 18衛(wèi)生部電子病歷試點工作方案
- 19提高電子病歷內(nèi)涵質(zhì)量的對策和做法
- 20運用電子病歷對其進行監(jiān)控
- 21淺談區(qū)域性大醫(yī)療企業(yè)的概念和應(yīng)用
- 22無線網(wǎng)絡(luò)的美麗新世界
- 23電子病歷存儲模式下的護理工作流程重組
- 24基于片段和標(biāo)簽的口腔??齐娮硬v模板的設(shè)計與應(yīng)用
- 25門診收費管理系統(tǒng)中電子病歷的安全性
- 26淺談電子病歷建設(shè)過程中的體會
- 27電子病歷中醫(yī)囑錄入界面及功能的優(yōu)化
- 28電子病歷管理淺議
- 29電子病歷在臨床教學(xué)的使用方法
- 30電子病歷的發(fā)展及展望
成都公司:成都市成華區(qū)建設(shè)南路160號1層9號
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓