本站小編為你精心準備了循證醫學的移動診療技術研究參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
隨著社會的發展和人類的進步,各種各樣的疾病也隨之而來。由于人們生活水平的提高和健康意識的增強,醫療衛生條件直接影響著人們的生活質量。然而看病難看病貴成為當前中國社會的第一難題,制約著我國的經濟發展。目前在日常生活中,看病方式依舊以到醫院門診掛號問診為主,這種傳統的尋醫問診方式存在著缺點和不足。不僅看病過程不夠便捷,而且流程也復雜繁瑣。
當今醫學理論的不斷發展,在傳統醫學的基礎上誕生了循證醫學。循證醫學是慎重、準確地以當前研究為依據,結合醫生個人的經驗,考慮病人價值和愿望,將三者結合制定出的治療措施。另一方面,隨著移動設備的普及和推廣,移動應用的發展也越來越成熟。并且在中醫領域進行移動智能診療的研究也相對缺乏,使得該方面的研究十分具有價值。綜合以上因素,我們嘗試將看病的過程智能化,以軟件的形式實現便捷科學的診斷方法。筆者介紹了一種基于循證醫學理論,以臨床記錄以及病癥信息為診斷依據,經過信息抽取和文本分類兩步,將相關數據壓縮存儲至移動設備,最終在移動端實現尋醫診斷過程的智能軟件系統。
1診斷過程的智能化
1.1傳統診斷過程傳統的看病診斷流程分為兩大步。首先患者描述自己的癥狀,醫生在了解病人的情況后,根據醫學領域的辨癥方法并結合自己的行醫經驗,再對病人的其他癥狀進行進一步的觀測。在得到了足夠的信息后,醫生重點針對有識別性的癥狀進行病癥的判定。在這個過程中,分為辨癥和診斷兩步。辨癥的過程是從患者的臨床表現中獲取重要的癥狀信息,作為診斷的依據。診斷則是根據歸納的癥狀信息,以醫學理論為基礎,進行病癥類別的判斷,下定病癥名。在設計智能診療系統的過程中,我們對辨癥和診斷兩步進行抽象模擬,分別對應于信息抽取和文本分類兩步,見圖1。最終在移動設備上實現尋醫問診的過程,完成智能診斷系統。
1.2信息抽取過程信息抽取是指將用戶輸入的非結構化的人類自然語言,轉化為規范的文本信息,提供給系統進行信息識別所需的特征內容。由于用戶在進行癥狀描述時,使用的是自然語言。自然語言的特點是文字中摻雜著許多冗余的上下文信息。程序在進行癥狀的識別時,需要從上下文內容中收集有關病癥的描述信息。在完成了信息的抽取后,用戶輸入的自然語言描述分成了癥狀信息和上下文信息。
1.3文本分類過程文本分類是將提取出來的癥狀信息,用于病癥名判定的過程。系統根據不同的癥狀集合,劃分出不同的病癥類別,得出診斷結果。不同的病癥有自身的特點,表現出來的癥狀也不盡相同。通常一種疾病會呈現不同的癥狀,在診斷的過程中,需要結合多種癥狀因素進行病癥類型的確認。
2模型文件的生成及存儲工作
2.1隱馬爾科夫模型信息抽取采用的方法是隱馬爾科夫模型。隱馬爾科夫模型是一種有監督的學習方法,從可觀察的參數中確定該過程的隱含參數,應用于對內容的序列標注中,分為模型文件的訓練和序列的解碼。該模型的主要作用是進行序列標注,將用戶輸入的信息內容,通過模型的計算,得到文本單元對應的序列類標,再根據類標劃分成癥狀信息和上下文信息。首先將用于癥狀識別的樣本文件,經過隱馬爾科夫模型計算,學習得到用于信息抽取的模型文件。此處使用的樣本文件是帶有類標的文本集,每個字詞單元后面有一個對應的標簽,表明該單元的屬性成分。標簽的種類分為三類,B代表癥狀信息的開始位置,I代表癥狀信息的中間內容,標簽B和相鄰的標簽I組成了癥狀信息。O代表上下文單詞,相鄰的標簽O組合對應的上下文信息。隱馬爾科夫模型以提供的訓練文本集為基礎,經過學習得到用于癥狀識別的模型文件。模型文件主要包括初始狀態矩陣、狀態轉移矩陣和符號發射矩陣三部分,反映了字詞信息和類標之間的轉換關系。
2.2最大熵模型在文本分類階段,為了能根據不同癥狀診斷出不同的病癥類別,需要計算出各種癥狀針對不同病癥所占的權重,此處采用最大熵模型。最大熵模型指,當我們需要對一個隨機事件的概率分布進行預測時,預測需要滿足所有已知的條件,對未知的情況不做任何主觀假設,保證了預測風險最小。最大熵模型確保在對癥狀發生的概率進行統計時,癥狀概率數據是可靠的。將用于文本分類的樣本文件進行最大熵模型的計算,訓練得到用于病癥診斷的模型文件。此處的樣本文件是以類標為首部,癥狀描述為內容的文本集。在進行最大熵模型的學習過程中,根據訓練樣本集中首部類標和對應的癥狀,計算出各個癥狀信息在不同病癥類別下的權重值,并存儲為模型文件。權重值的大小代表癥狀的重要程度。
2.3模型文件的存儲信息抽取和文本分類兩步產生的模型文件,將用于癥狀信息的抽取和病癥類別的診斷中。在進行模型文件的訓練時,由于樣本數據集較大,而移動設備的處理能力有限,在模型生成過程中會占用大量的時間,造成長時間的等待。并且模型文件的生成與后續的抽取和分類是獨立進行的,因此為了提高系統的運行效率,將模型文件的生成工作放在PC電腦上完成。把訓練得到的隱馬爾科夫模型和最大熵模型進行序列化,以字節流的形式保存成模型文件。導入兩個模型文件至移動端文件系統中,在進行診斷時再將模型文件讀取到系統內存中,與用戶輸入的信息一起處理。考慮到移動設備的存儲空間以及系統運行內存的限制,在讀取過大的文件時會導致效率低下,甚至造成內存溢出的問題。為了避免這種問題的發生,存儲在移動設備的分類模型文件只保存常見的病癥信息,既降低了文件大小,也滿足了大部分的使用需求。當移動設備中的模型文件無法識別癥狀時,將輸入的信息傳遞到PC端,通過服務器進行診斷,再將結果反饋到移動設備。
3信息抽取和文本分類在移動設備上的實現
3.1維特比算法解碼過程從移動設備的文件系統中讀取出模型文件的三個參數矩陣,使用維特比算法進行解碼。解碼的過程是將用戶輸入的信息內容進行序列標注,以字或詞為單位,標注每一個單元對應的類別。維特比算法是一種動態規范算法,用于尋找可能產生的觀測事件序列和隱含狀態序列,計算出每個序列的狀態標簽。根據隱馬爾科夫模型的三個參數,計算出輸入內容相應序列的BIO標簽類別。將標簽組合成的癥狀信息提取出來作為辨證結果,用于病癥的診斷。癥狀的信息抽取過程。
3.2病癥的診斷以字節流形式讀取出移動端系統中的最大熵模型文件,將信息抽取產生的癥狀信息轉化成模型文件中對應的權重值。根據用戶癥狀的權重,計算出該癥狀集合在不同病癥下的概率值,將計算結果按概率值的大小進行排序,排名靠前或概率值大于指定閾值的病癥即為該癥狀集下最可能的病癥名。將篩選出的病癥結果集展示到移動端,供用戶參考。由于移動端的分類模型中只保存常見的病癥信息,并不能滿足所有癥狀的識別。當移動端系統無法識別時,系統將提示用戶聯網進行服務器診斷。服務器上的診斷與移動端方法相同,由于服務器上的病癥信息更加完整,能夠識別出更多類型的病癥。實現離線移動端診斷和聯網服務器端診斷相結合的兩種模式,兼顧了使用的便捷性和診斷的準確性。
4結語
對在移動設備上的智能診斷系統進行了分析,介紹了使用自然語言處理方法的信息抽取和文本分類步驟。通過使用隱馬爾科夫模型完成信息抽取,從用戶輸入的非結構化語言中提取出癥狀信息,再使用最大熵模型進行文本分類,將識別出的癥狀信息用于病癥的診斷,得到可能的患病種類,給定病癥名診斷結果。移動端的智能診斷應用改變了傳統的看病方式,為用戶提供了快速便捷的診斷環境。
作者:王琦琪 袁強 王亞強 文立玉 單位:成都信息工程學院 江西江塢稀有金屬新材料有限公司