在线观看国产区-在线观看国产欧美-在线观看国产免费高清不卡-在线观看国产久青草-久久国产精品久久久久久-久久国产精品久久久

美章網 資料文庫 醫學統計學課堂教學范文

醫學統計學課堂教學范文

本站小編為你精心準備了醫學統計學課堂教學參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。

醫學統計學課堂教學

摘要:生物信息學的蓬勃發展已使醫學研究由宏觀逐步探索到微觀。醫學統計學作為一門醫學院校的基礎課程,其理論和方法在醫學研究的新要求下其理論和方法也有了新的發展與應用。將生物信息學知識帶入醫學統計學課堂教學,介紹醫學統計學的新發展,不但能使學員了解到本學科的前沿研究內容,有效地激發學員的學習興趣,還能使他們掌握生物信息學研究的工具,提高今后從事醫學科研工作的能力。

關鍵詞:生物信息學醫學統計學課堂教學

生物信息學融合了生物技術、計算機技術、數學和統計學的大量方法,已逐漸成為發現生命過程中所蘊涵知識的一門重要學科。其基本問題主要包括:DNA分析、蛋白質結構分析、分子進化。醫學統計學作為醫科院校的基礎課程之一,長期以來其理論和方法就廣泛應用于臨床醫學、基礎醫學的各類研究中。隨著生物新技術的誕生,在推動生物信息學發展的同時,醫學研究對象也由宏觀的病人、生物組織拓展到微觀的基因領域,所面對的實驗數據在性質和結構上也都有所不同,這對醫學統計學的應用提出了新的更高的要求。

目前,醫學統計學的很多原理和方法已成功地應用于這些新研究之中,并在此基礎之上有了新的發展和改進。如概率分布的知識與序列相似性分析、蛋白質分類等技術密切相關;方差分析、非參數檢驗方法經改進和結合后在基因表達數據的前期分析中發揮了較好的作用;而聚類分析、判別分析、相關分析這些大家所熟知的統計學方法更是在基因分類和調控網絡的建立中得到了廣泛的應用。在進行醫學統計學課堂教學時加入生物信息學方面的應用實例,不僅可以使學員了解本學科研究的前沿和醫學、生物信息學研究的新發展,還可以提高學員對于醫學統計學理論學習的興趣,掌握先進的生物實驗數據分析方法,提高今后從事醫學科研的能力。下面,本文在回顧醫學統計學授課主要內容的基礎上,就醫學和生物信息學中的可能應用舉例如下:

一、概率分布

概率分布(probabilitydistribution)是醫學統計學中多種統計分析方法的理論基礎。授課內容一般包括:二項分布、Possion分布、正態分布、t分布、F分布等。

借助概率分布常常可以幫助我們了解生命指標的特征、醫學現象的發生規律等等。例如,臨床檢驗中計量實驗室指標的參考值范圍就是依據正態分布和t分布的原理計算得到;許多醫學試驗的“陽性”結果服從二項分布,因此它被廣泛用于化學毒性的生物鑒定、樣本中某疾病陽性率的區間估計等;而一定人群中諸如遺傳缺陷、癌癥等發病率很低的非傳染性疾病患病數或死亡數的分布,單位面積(或容積)內細菌數的分布等都服從Poisson分布,我們就可以借助Poisson分布的原理定量地對上述現象進行研究。

在生物信息學中概率分布也有一定應用。例如,Poisson分布可以用于基因(蛋白質)序列的相似性分析。被研究者廣泛使用的分析工具BLAST(BasicLocalAlignmentSearchTool)能迅速將研究者提交的蛋白質(或DNA)數據與公開數據庫進行相似性序列比對。對于序列a和b,BLAST發現的高得分匹配區稱為HSPs。而HSP得分超過閾值t的概率P(H(a,b)>t)可以依據Poisson分布的性質計算得到。

二、假設檢驗

假設檢驗(hypothesis)是醫學統計學中統計推斷部分的重要內容。假設檢驗根據反證法和小概率原理,首先依據資料性質和所需解決的問題,建立檢驗假設;在假設該檢驗假設成立的前提下,采用適當的檢驗方法,根據樣本算得相應的檢驗統計量;最后,依據概率分布的特點和算得的檢驗統計量的大小來判斷是否支持所建立的檢驗假設,進而推斷總體上該假設是否成立。其基本方法包括:u檢驗、t檢驗、方差分析(ANOVA)和非參數檢驗方法。

假設檢驗為醫學研究提供了一種很好的由樣本推斷總體的方法。例如,隨機抽取某市一定年齡段中100名兒童,將其平均身高(樣本均數)與該年齡段兒童應有的標準平均身高(總體均數)做u檢驗,其檢驗結果可以幫助我們推斷出該市該年齡段兒童身高是否與標準身高一致,為了解該市該年齡段兒童的生長發育水平提供參考。又如,醫學中常常可以采用t檢驗、秩和檢驗比較兩種藥物的療效有無差別;用2檢驗比較不同治療方法的有效率是否相同等等。

這些假設檢驗的方法在生物實驗資料的分析前期應用較多,但由于研究目的和資料性質不同,一般會對某些方法進行適當調整和結合。

例如,基于基因芯片實驗數據尋找差異表達基因的問題。基因芯片(genechip)是近年來實驗分子生物學的技術突破之一,它允許研究者在一次實驗中獲得成千上萬條基因在設定實驗條件下的表達數據。為了從這海量的數據中尋找有意義的信息,在對基因表達數據進行分析的過程中,找到那些在若干實驗組中表達水平有明顯差異的基因是比較基礎和前期的方法。這些基因常常被稱為“差異表達基因”,或者“顯著性基因”。如果將不同實驗條件下某條基因表達水平的重復測量數據看作一個樣本,尋找差異表達基因的問題其實就可以采用假設檢驗方法加以解決。

如果表達數據服從正態分布,可以采用t-檢驗(或者方差分析)比較兩樣本(或多樣本)平均表達水平的差異。

但是,由于表達數據很難滿足正態性假定,目前常用的方法基于非參數檢驗的思想,并對其進行了改進。該方法分為兩步:首先,選擇一個統計量對基因排秩,用秩代替表達值本身;其次,為排秩統計量選擇一個判別值,在其之上的值判定為差異顯著。常用的排秩統計量有:任一特定基因在重復序列中表達水平M值的均值;考慮到基因在不同序列上變異程度的統計量,其中,s是M的標準差;以及用經驗Bayes方法修正后的t-統計量:,修正值a由M的方差s2的均數和標準差估計得到。

三、一些高級統計方法在基因研究中的應用

(一)聚類分析

聚類分析(clusteringanalysis)是按照“物以類聚”的原則,根據聚類對象的某些性質與特征,運用統計分析的方法,將聚類對象比較相似或相近的歸并為同一類。使得各類內的差異相對較小,類與類間的差異相對較大1。聚類分析作為一種探索性的統計分析方法,其基本內容包括:相似性度量方法、系統聚類法(HierarchicalClustering)、K-means聚類法、SOM方法等。

聚類分析可以幫助我們解決醫學中諸如:人的體型分類,某種疾病從發生、發展到治愈不同階段的劃分,青少年生長發育分期的確定等問題。

近年來隨著基因表達譜數據的不斷積累,聚類分析已成為發掘基因信息的有效工具。在基因表達研究中,一項主要的任務是從基因表達數據中識別出基因的共同表達模式,由此將基因分成不同的種類,以便更為深入地了解其生物功能及關聯性。這種探索完全未知的數據特征的方法就是聚類分析,生物信息學中又稱為無監督的分析(UnsupervisedAnalysis)。常用方法是利用基因表達數據對基因(樣本)進行聚類,將具有相同表達模式的基因(樣本)聚為一類,根據聚類結果通過已知基因(樣本)的功能去認識那些未知功能的基因。對于基因表達數據而言,系統聚類法易于使用、應用廣泛,其結果——系統樹圖能提供一個可視化的數據結構,直觀具體,便于理解。而在幾種相似性的計算方法中,平均聯接法(AverageLinkageClustering)一般能給出較為合理的聚類結果2。

(二)判別分析

判別分析(discriminantanalysis)是根據觀測到的某些指標的數據對所研究的對象建立判別函數,并進行分類的一種多元統計分析方法。它與聚類分析都是研究分類問題,所不同的是判別分析是在已知分類的前提下,判定觀察對象的歸屬3。其基本方法包括:Fisher線性判別(FLD)、最鄰近分類法(k-NearestNeighborClassifiers)、分類樹算法(ClassificationTreeAlgorithm),人工神經網絡(ANNs)和支持向量機(SVMs)。

判別分析常用于臨床輔助鑒別診斷,計量診斷學就是以判別分析為主要基礎迅速發展起來的一門科學。如臨床醫生根據患者的主訴、體征及檢查結果作出診斷;根據各種癥狀的嚴重程度預測病人的預后或進行某些治療方法的療效評估;以及流行病學中某些疾病的早期預報,環境污染程度的堅定及環保措施、勞保措施的效果評估等。

在生物信息學針對基因的研究工作中,由于借助了精確的生物實驗,研究者通常能得到基因(樣本)的準確分類,如,基因的功能類、樣本歸結于疾病(正常)狀態等等。當利用了這些分類信息時,就可以采用判別分析的方法對基因進行分類,生物信息學中又稱為有監督的分析(SupervisedAnalysis)。例如,基因表達數據分析中,對于已經過濾的基因,前三種方法的應用較為簡單。而支持向量機(SVMs)和人工神經網絡(ANNs)是兩種較新,但很有應用前景的方法。

(三)相關分析

相關分析(correlationanalysis)是醫學統計學中研究兩變量間關系的重要方法。它借助相關系數來衡量兩變量之間的關系是否存在、關系的強弱,以及相互影響的方向。其基本內容包括:線性相關系數、秩相關系數、相關系數的檢驗、典型相關分析等。

我們常常可以借助相關分析判斷研究者所感興趣的兩個醫學現象之間是否存在聯系。例如,采用秩相關分析我們發現某種食物中黃曲霉毒素相對含量與肝癌死亡率間存在正相關關系;采用線性相關方法發現中年女性體重與血壓之間具有非常密切的正相關關系等等。

生物信息學中可以利用相關分析建立基因調控網絡。如果將兩個不同的基因在不同實驗條件下的表達看作是兩個變量,相關分析所研究的正是兩者之間的調控關系。如采用線性相關系數進行兩基因關系的分析時,其大小反應了基因調控關系的強弱,符號則反應了兩基因是協同關系(相關系數為正),還是抑制關系(相關系數為負)。

四、意義

生物信息學不僅是醫學統計學的研究前沿,更是醫學研究由宏觀向微觀拓展的重要領域,其研究內容已逐漸為多數醫學院校的學員了解和熟悉。而如何對新技術產生的生物實驗數據進行準確合理的分析,卻成為生物信息學研究的主要瓶頸之一。

在醫學統計學課堂教學中引入生物信息學實例,而不僅僅局限于常見的醫學、衛生領域的例子,將難以理解的統計理論和方法與前沿的生物實例相結合,拓寬了學員的視野,提高了學員的學習興趣,更可以加深對所學知識的理解;與此同時,使學員掌握了生物實驗數據的先進分析方法,擴大了學員的知識面,提高了他們今后開展醫學科研工作的能力。

主站蜘蛛池模板: 水蜜桃高清视频在线观看 | 中文字幕日韩高清 | 久久羞羞 | 国产原创麻豆 | 男人天堂亚洲 | 久久精品一区二区 | 综合婷婷丁香 | 亚洲片在线观看 | 亚洲爽视频 | 久久久久青草 | 国产第一福利 | 国产裸舞福利资源在线视频 | 久久国产精品最新一区 | 亚洲1区2区3区4区 | 一区二区三区不卡免费视频97 | 日韩精品在线观看视频 | 亚洲自拍偷拍视频 | 一区二区三区免费精品视频 | 永久免费毛片在线播放 | 亚洲永久免费网站 | 自拍视频网址 | 综合激情在线 | 亚州一区二区 | 中文字幕日本一区久久 | 亚洲国产精品成人综合久久久 | 亚洲国产一区二区三区a毛片 | 国色天香社区在线观看免费播放 | 亚洲水蜜桃久久综合网站 | 免费一级毛片在级播放 | 亚洲精品乱码久久久久久v 亚洲国内精品 | 国产亚洲精品国产 | 亚洲欧美自拍视频 | 欧美日韩在线视频 | 亚洲区与欧美区 | 激情六月婷婷开心丁香开心 | 国内精品久久久久久不卡影院 | 六月丁香伊人 | 欧美亚洲一区二区三区 | 亚洲第一福利视频 | 亚洲天堂成人网 | 波多结衣在线 |