當(dāng)前位置:工程項(xiàng)目OA系統(tǒng) > 領(lǐng)域應(yīng)用 > 醫(yī)院管理OA系統(tǒng) > 門診收費(fèi)管理系統(tǒng)
基于Lucene檢索引擎的電子病歷全文檢索系統(tǒng)
申請(qǐng)免費(fèi)試用、咨詢電話:400-8352-114
1 前言
隨著醫(yī)院信息化建設(shè)的進(jìn)行,電子病歷作為臨床醫(yī)療信息的基礎(chǔ)和醫(yī)院信息系統(tǒng)的核心構(gòu)成了業(yè)務(wù)管理、醫(yī)療衛(wèi)生決策系統(tǒng)的基礎(chǔ)6但國(guó)內(nèi)目前各大醫(yī)院通常并不把電子病歷管理視為一個(gè)獨(dú)立的單元, 電子病歷管理系統(tǒng)一般都是作為醫(yī)院信息系統(tǒng)的一個(gè)模塊存在。目前,對(duì)于病歷信息的查詢?yōu)g覽也只能通過(guò)查詢患者的一些結(jié)構(gòu)化的數(shù)據(jù)庫(kù)信息得到該患者的ID號(hào),然后通過(guò)病歷的存儲(chǔ)規(guī)則來(lái)找到相應(yīng)的病歷。每次得到的信息都是個(gè)別的,而且無(wú)法實(shí)現(xiàn)全文檢索.存在于病歷文本中的大量非結(jié)構(gòu)化的信息不能作為檢索條件,因而這些信息也不能為醫(yī)療工作者所利用。因此. 目前電子病歷管理系統(tǒng)的檢索查詢機(jī)制迫切需要向滿足醫(yī)生需求、科研輔助和采用全文檢索的方向轉(zhuǎn)變,為以后電子病歷管理正式成為醫(yī)院管理的一個(gè)獨(dú)立分支打下良好的基礎(chǔ)?;诖耍覀兲岢隽嘶贚ucene檢索引擎建立電子病歷全文檢索系統(tǒng),它以基于關(guān)鍵字的全文檢索技術(shù)為基礎(chǔ).能夠提供方便快捷的方式為臨床醫(yī)療、醫(yī)學(xué)科研工作及病歷管理提供支持。
2 電子病歷的前期預(yù)處理
病歷是患者在醫(yī)院診斷治療全過(guò)程的原始記錄,貫穿于患者在醫(yī)院就診的各個(gè)環(huán)節(jié)中。由于目前病歷信息的電子化大都附屬于傳統(tǒng)的HIS系統(tǒng),但HIS系統(tǒng)并不等于電子病歷系統(tǒng)。因?yàn)閺碾娮硬v的角度看患者信息應(yīng)該是完整的、集成的.電子病歷系統(tǒng)應(yīng)該能夠以統(tǒng)一的視圖向用戶提供患者的繼承信息;而從傳統(tǒng)的HIS每個(gè)子系統(tǒng)來(lái)看,患者信息卻是局部的、分散的。所以要對(duì)電子病歷進(jìn)行全文檢索,首先要建立一個(gè)規(guī)范的、合乎要求的電子病歷描述模型,將分散于HIS系統(tǒng)中的電子病歷信息讀出并轉(zhuǎn)換為統(tǒng)一形式的文件存儲(chǔ)于電子病歷庫(kù)中。XML(eXtensible Markup Language,即擴(kuò)展標(biāo)記語(yǔ)言)就是建立并實(shí)現(xiàn)該模型的一個(gè)有效手段。
XML是一種結(jié)構(gòu)化描述語(yǔ)言。其優(yōu)勢(shì)在于,它不僅是一種標(biāo)識(shí)語(yǔ)言,更是一種可以定義描述對(duì)象結(jié)構(gòu)的元語(yǔ)言。XML采用了層次化的面向?qū)ο蟮慕Y(jié)構(gòu)描述方法.非常適合于描述病歷這樣復(fù)雜的內(nèi)容.在表達(dá)能力方面優(yōu)于關(guān)系數(shù)據(jù)庫(kù)。
使用XML描述病歷內(nèi)容,要先定義病歷內(nèi)容的結(jié)構(gòu)。在此基礎(chǔ)上實(shí)現(xiàn)以數(shù)據(jù)庫(kù)形式存儲(chǔ)的患者信息到病歷結(jié)構(gòu)的轉(zhuǎn)換,從而實(shí)現(xiàn)由以支持日常業(yè)務(wù)管理為目的的數(shù)據(jù)庫(kù)描述到以患者為中心的描述。形成的XML文件是病歷存儲(chǔ)管理的基本單位。
3 全文檢索引擎Lucene簡(jiǎn)介
Lucene是Apache軟件基金會(huì)Jakarta項(xiàng)目組的一個(gè)子項(xiàng)目,是一個(gè)開放源代碼的全文檢索引擎工具包,作為一個(gè)優(yōu)秀的全文檢索引擎,其系統(tǒng)結(jié)構(gòu)具有強(qiáng)烈的面向?qū)ο筇卣?。首先是定義了一個(gè)與平臺(tái)無(wú)關(guān)的索引文件格式;其次通過(guò)抽象將系統(tǒng)的核心組成部分設(shè)計(jì)為抽象類.具體的平臺(tái)實(shí)現(xiàn)部分設(shè)計(jì)為抽象類的實(shí)現(xiàn);此外,與具體平臺(tái)相關(guān)的部分(比如文件存儲(chǔ))也封裝為類,經(jīng)過(guò)層層的面向?qū)ο笫降奶幚?,最終達(dá)成了一個(gè)低耦合高效率、容易二次開發(fā)的檢索引擎系統(tǒng)。因此.Lucene得到了非常廣泛的應(yīng)用。
4 系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
4.1 平臺(tái)和開發(fā)環(huán)境簡(jiǎn)介
本系統(tǒng)的平臺(tái)和開發(fā)環(huán)境為:操作系統(tǒng):Windows NT/2O00/XP;開發(fā)語(yǔ)言:Java,JSP;全文檢索開發(fā)庫(kù):Apache Lucene 2.2;Web服務(wù)器:ApacheTomcat 6.0:開發(fā)工具:IBM Eclipse 3.2.0。
4.2 總體架構(gòu)
不電子病歷全文檢索系統(tǒng)主要實(shí)現(xiàn)對(duì)電子病歷的表示、存儲(chǔ)、組織和訪問(wèn),即根據(jù)用戶的查詢要求,從電子病歷庫(kù)中檢索出相關(guān)信息資料。其中心環(huán)節(jié)是電子病歷內(nèi)容的表達(dá)、信息查詢的獲得以及相關(guān)信息的匹配。整個(gè)系統(tǒng)設(shè)計(jì)為4個(gè)功能模塊:數(shù)據(jù)預(yù)處理模塊、索引建立模塊、全文檢索模塊和用戶界面模塊。各個(gè)模塊的基本功能和模塊之間的邏輯和數(shù)據(jù)關(guān)系如圖1所示。
依圖l中的序號(hào),整個(gè)系統(tǒng)的信息處理流程為:
A.?dāng)?shù)據(jù)預(yù)處理模塊讀入電子病歷的原始數(shù)據(jù)(一般以數(shù)據(jù)庫(kù)表的形式儲(chǔ)存在HIS系統(tǒng)中),將原始電子病歷加工為XML文件.然后儲(chǔ)存于XML電子病歷庫(kù)中;
B.索引建立模塊讀入XML電子病歷庫(kù)中儲(chǔ)存的XML文件.把建立好的全文索引儲(chǔ)存于全文索引庫(kù)中;
C.用戶通過(guò)用戶界面模塊提出檢索請(qǐng)求,用戶界面模塊調(diào)用全文檢索模塊使用電子病歷的全文索引進(jìn)行檢索,將得到的檢索結(jié)果返回給用戶;
D.用戶查看了檢索結(jié)果中電子病歷的摘要后如果需要進(jìn)一步查看電子病歷的全文,可以通過(guò)用戶界面模塊直接根據(jù)檢索結(jié)果中的文檔ID從XML電子病歷庫(kù)中獲取全文。
5 系統(tǒng)測(cè)試和評(píng)價(jià)
5,1 測(cè)試環(huán)境
(1)軟件環(huán)境
測(cè)試環(huán)境采用Sun公司的JDK1.5.0,操作系統(tǒng)采用的是微軟的Windows XP SP2。數(shù)據(jù)庫(kù)服務(wù)器采用的是Oracle8i及其自帶的JDBC驅(qū)動(dòng)。
(2)硬件環(huán)境
運(yùn)行服務(wù)器采用的CPU為Inter Pentium 3.0E,內(nèi)存2 GB.硬盤160GB。
5.2 測(cè)試結(jié)果
測(cè)試過(guò)程中一共選取了3個(gè)和疾病癥狀有關(guān)的關(guān)鍵詞“肥胖”、“腹痛”和“惡心”作為測(cè)試檢索條件數(shù)據(jù),測(cè)試結(jié)果經(jīng)過(guò)進(jìn)一步分析計(jì)算后可以得到的數(shù)據(jù)見(jiàn)表1。
注:P@30指前30個(gè)檢索結(jié)果中符合條件的文檔數(shù)
由于測(cè)試數(shù)據(jù)集過(guò)大(共約26 000多篇),很難通過(guò)人工方式確定全部文檔集中符合條件的文檔數(shù),所以無(wú)法有效地計(jì)算查全率;檢索出的命中文檔數(shù)量也比較多,但和搜索引擎一樣,通常只有“First Page”的結(jié)果會(huì)被用戶關(guān)注,因此我們計(jì)算的查準(zhǔn)率只基于前30個(gè)檢索結(jié)果。通過(guò)上表可以看出,本系統(tǒng)的查準(zhǔn)率較高,基本達(dá)到了系統(tǒng)設(shè)計(jì)的性能要求。
6 小結(jié)
從測(cè)試結(jié)果可以看出系統(tǒng)滿足設(shè)計(jì)要求,符合功能需要。但是僅僅基于關(guān)鍵字檢索顯然是不夠的,下一步要實(shí)現(xiàn)“智能”全文檢索還需要對(duì)系統(tǒng)進(jìn)行基于語(yǔ)義的檢索功能擴(kuò)展,使檢索結(jié)果不僅僅滿足于與用戶提交的關(guān)鍵字進(jìn)行字面上的匹配。而是檢索出與此概念有關(guān)的、用戶真正想要的信息,以進(jìn)一步提高查全率[31。
【參考文獻(xiàn)】
【1] 1 王曉,羅二平,張健.基于語(yǔ)義的電子病歷智能全文檢索叨.醫(yī)療衛(wèi)生裝備,2008,29(4):45-46.
【2 】薛萬(wàn)國(guó).XML與電子病歷m.國(guó)外醫(yī)學(xué):醫(yī)院管理分冊(cè),2002(1):33—34.
[3] 高少琛.基于查詢拓展和聚類技術(shù)的資源檢索系統(tǒng)的研究與應(yīng)用[D1.上海:上海交通大學(xué)碩士學(xué)位論文,2007:10一11.
- 1中醫(yī)運(yùn)行電子病歷質(zhì)量的現(xiàn)狀分析
- 2cMS將在201 1年5月啟動(dòng)有效應(yīng)用獎(jiǎng)勵(lì)
- 3美醫(yī)療信息市場(chǎng)規(guī)模兩年內(nèi)預(yù)計(jì)將達(dá)500億美元
- 4護(hù)理電子病歷缺陷及對(duì)策
- 5在電子病歷網(wǎng)絡(luò)質(zhì)控系統(tǒng)的體會(huì)
- 6醫(yī)院建設(shè)區(qū)域醫(yī)療信息共享平臺(tái)
- 7電子病歷系統(tǒng)中XML數(shù)據(jù)調(diào)用的研究
- 8電子病歷應(yīng)對(duì)醫(yī)療糾紛中的方法
- 9談我院電子病歷一卡通系統(tǒng)的建設(shè)
- 10HIS系統(tǒng)與電子病歷系統(tǒng)的關(guān)系和數(shù)據(jù)共用
- 11電子病歷應(yīng)用有關(guān)問(wèn)題的探討
- 12海洋社區(qū)衛(wèi)生管理平臺(tái)喜獲科技成果
- 13新一代卒中電子病歷系統(tǒng)的建立與應(yīng)用
- 14基于電子病歷系統(tǒng)的臨床路徑管理應(yīng)用研究
- 15惠東縣城區(qū)學(xué)齡前兒童HBsAg攜帶率調(diào)查分析
- 16電子病歷監(jiān)控?cái)?shù)據(jù)失實(shí)原因分析及對(duì)策
- 17便攜式病歷管理系統(tǒng)的設(shè)計(jì)與開發(fā)
- 18衛(wèi)生部電子病歷試點(diǎn)工作方案
- 19提高電子病歷內(nèi)涵質(zhì)量的對(duì)策和做法
- 20運(yùn)用電子病歷對(duì)其進(jìn)行監(jiān)控
- 21淺談區(qū)域性大醫(yī)療企業(yè)的概念和應(yīng)用
- 22無(wú)線網(wǎng)絡(luò)的美麗新世界
- 23電子病歷存儲(chǔ)模式下的護(hù)理工作流程重組
- 24基于片段和標(biāo)簽的口腔??齐娮硬v模板的設(shè)計(jì)與應(yīng)用
- 25門診收費(fèi)管理系統(tǒng)中電子病歷的安全性
- 26淺談電子病歷建設(shè)過(guò)程中的體會(huì)
- 27電子病歷中醫(yī)囑錄入界面及功能的優(yōu)化
- 28電子病歷管理淺議
- 29電子病歷在臨床教學(xué)的使用方法
- 30電子病歷的發(fā)展及展望
成都公司:成都市成華區(qū)建設(shè)南路160號(hào)1層9號(hào)
重慶公司:重慶市江北區(qū)紅旗河溝華創(chuàng)商務(wù)大廈18樓