本站小編為你精心準備了高通量測序的轉錄組學研究參考范文,愿這些范文能點燃您思維的火花,激發您的寫作靈感。歡迎深入閱讀并收藏。
《生物技術通報雜志》2014年第七期
1材料與方法
1.1材料本研究中遼東櫟的芽、花、葉與果(5個階段:開花后20、40、60、80和100d均采集)均采集于北京市門頭溝區小龍門國家森林公園(E11526’,N3959’),每份樣品至少取自10個單株。樣品采集后立即放入液氮中,后存放于-80℃冰箱備用。
1.2方法1.2.1總RNA的提取和Solexa測序總RNA的提取采用RNeasyPlantMiniKits(Qiagen,Inc.,Valen-cia,CA,USA)試劑盒按照實驗手冊操作步驟提取。來自芽、花、葉和果的等量RNA混合后,取10μg用于cDNA文庫構建,cDNA文庫的構建參考文獻[17]的方法。利用IlluminaSolexaHiseq2000的paired-end測序方法進行轉錄組測序。
1.2.2序列的處理與拼接鑒于Solexa數據錯誤率對結果的影響,對原始數據進行質量預處理。先利用滑動窗口法去除低質量片段:質量閾值20(錯誤率=1%),窗口大小5bp,長度閾值35bp;再切除reads中含N部分序列:長度閾值35bp;最后利用軟件Trinity對遼東櫟有效reads進行從頭拼接[18]。
1.2.3功能注釋使用BLASTx程序將拼接所得的unigene與核酸、蛋白質序列數據庫比對(E值<1e-5),并選取最佳注釋。蛋白質數據庫包括Swiss-Prot、GenBank非冗余蛋白數據庫(Nr)、蛋白質直系同源簇數據庫(ClustersofOrthologousGroupsofprot-eins,COGs)、京都基因和基因組百科全書(KyotoEncyclopediaofGenesandGenomes,KEGG)及GeneOntology(GO)。其中,unigene通過COG、GO和KEGG數據庫的分類的參考文獻[19]的方法。
1.2.4SSR位點的篩選利用MISA軟件在所有unigene中搜索SSR位點,參數設置如下:二核苷酸至少重復次數為6,三核苷酸、四核苷酸、五核苷酸和六核苷酸至少重復次數均為5。
2結果
2.1IlluminaSolexa測序和序列拼接采用IlluminaSolexaHiseq2000測序技術對遼東櫟的芽、花、葉和果實的混合樣進行轉錄組測序,共獲得46400862條原始序列,總長4.64Gb。經過預處理,最終得到了有效序列40621588條,數據量為3.8Gb,平均長度為94.95bp。使用軟件Trinity對有效reads進行從頭拼接最終得到了151339個長度大于200bp的contig,總長度約為130.92Mb,最大長度、平均長度以及N50分別為11284、865和1442bp。取每個contig下最長的轉錄本作為unigene,得到了95800個unigene,總長度約為73.57Mb,平均長度與N50分別為768bp和1373bp。其中,大于2000bp的序列共有7975條,占unigene總數的8.32%(圖1-A)。
2.2序列的比對、功能注釋及unigene的特征分析將所獲得的unigene與公共數據Nr和Swiss-Prot進行Blastx比對,通過gene的相似性進行功能注釋,共有57637條unigene獲得了基因注釋(hit),占總unigene總數的60.16%,而在其余未得到任何一個上述數據庫的注釋(no-hit)38163條unigene(39.84%)中,有37752條unigene(98.92%)小于或等于1000bp(圖1-B)。
2.3功能分類研究為進一步研究遼東櫟中unigene的功能分類,將所得到的95800條unigene在COG和GO數據庫中進行比對及功能注釋與分類。在COG分類中,共有36407條unigene(占unigene總數的38%)被注釋到24個COG類別中。其中,“一般功能基因”是最大類別,包含8330條unigene,占被注釋到unigene總數的22.88%;其次是“蛋白質翻譯后修飾與轉運,分子伴侶”,包含4128條unigene;而“核酸結構”是最小的類別,僅包含11條unigene。此外,有2491條unigene參與了碳水化合物運輸與代謝(圖2)。利用GO對獲得遼東櫟unigene進行功能分類,共有43766條unigene被注釋到生物學過程、細胞組分和分子功能3個大類別中。其中,36372條unigene歸入生物學過程,18876條unigene歸入細胞組分以及40358條unigene歸入分子功能。3個大的類別又被劃分為45個小的類別(圖3)。過程是生物學過程中的最大類別,包含31427條unigene;細胞是細胞組分中的最大類別,包含12764條unigene;蛋白結合是分子功能中的最大類別,包含28892條unigene。
2.4代謝途徑分析和淀粉合成基因的篩選將遼東櫟的unigene序列映射到KEGG數據庫的參考代謝通路中,共有11468條unigene參與到185個代謝通路中。其中包含unigene最多的是代謝通路是剪接體(ko03010),共有1161條unigene。其次是內質網上的蛋白加工(ko04141),包含630條unigene。而參與淀粉與蔗糖的代謝通路(ko00500)的unigene共有434條(表1)。的unigene,編碼9個關鍵酶,其中5個unigene編碼α-糖苷酶;17個unigene編碼β-呋喃果糖苷酶;9個unigene編碼己糖激酶;10個unigene編碼果糖激酶;4個unigene編碼葡萄糖-6-磷酸異構酶;4個unigene編碼葡萄糖磷酸變位酶;8個unigene編碼葡萄糖-1-磷酸腺苷酰基轉移酶;6個unigene編碼淀粉合成酶及4個unigene編碼1,4-α-葡聚糖分支酶(表2)。結合KEGG數據庫中參考pathway的關于淀粉與蔗糖代謝通路中發掘到的unigene及在其他公共數據庫中的注釋,共統計篩選出67條參與淀粉合成
2.5SSR分析利用MISA軟件在遼東櫟的13380條unigene中共搜索到15901個SSR位點,占unigene總序列數的13.97%,平均每1.28kb出現1個SSR,其中包含有兩個及兩個以上SSR的unigene共有2521條。二核苷酸和三核苷酸重復類型分別占SSR總數的60.07%和38.09%;四核苷酸重復類型占SSR總數的1.57%;而五核苷酸和六核苷酸重復類型在遼東櫟中轉錄組序列中含量較少,僅占SSR總數的0.19%和0.09%。除此之外,不同核苷酸的重復次數也有很大的變化(表3)。
3討論
基于高通量測序技術的轉錄組學研究是一種非常高效、可靠的發掘功能基因手段,且在淀粉的合成及代謝中也已得到廣泛應用[20,21]。目前,高通量測序技術主要是Roche公司的454測序技術、Illumina公司和ABI公司相繼推出的Solexa和SOLid測序技術。其中,Solexa測序技術相對于其他兩種技術在測序成本和數據量輸出方面更具優勢[22]。前人的研究表明,不同組織的混合取樣,可在節約試驗成本的基礎上發掘到更多的轉錄本[23]。因此,本研究采用遼東櫟的芽、花、葉和果實的混合樣品進行轉錄組測序。櫟屬植物的基因組大小約為539-921Mb[24],本研究共獲得3.8Gb的有效數據量,約覆蓋遼東櫟基因組的4.13-7.05倍。同時利用在對IlluminaSolexaHiseq2000測序數據進行拼接過程中表現非常優異的Trinity軟件[25]對本研究的數據進行拼接處理,共獲得95800條unigene,其中有38163條unigene未在Blastx同源性搜索中得到注釋,但大多數片段小于1000bp(37752條,占98.92%),因此這些片段可能是由于較短而未與公共數據庫中的序列比對上,也可能是短的非編碼序列或者是新的基因。COG和GO的功能分類對初步了解基因的功能起著重要作用,而KEGG數據庫中的參考pathway不僅可以推測基因的功能,而且可以研究基因在不同代謝通路中所在位置及作用,三者相輔相成,成為新物種中發掘功能基因的重要手段[19]。本研究通過KEGG數據庫中的pathway分析篩選與淀粉合成相關的基因,同時結合所篩選到的unigene在本研究中其他數據庫中的功能注釋,從而進一步確保了所獲得的基因的可靠性。鑒于分布廣泛和多態性較高的特性,SSR標記已被廣泛應用于分子標記輔助選擇育種(Molecularmarker-assistedselection,MAS)和利用分子標記通過關聯分析(Associationmapping)發掘與好的農藝性狀連鎖緊密的相關基因[26],尤其是對于多年生的植物,可大大縮短育種年限[27]。本研究在遼東櫟中發掘到15901個SSR位點,其中二核甘酸和三核苷酸的重復占到總數的98.16%,為了保證SSR位點的潛在多態性,我們在篩選過程中對于四、五和六核苷酸的最小重復次數同樣設置為5,一定程度上影響到了這3類核苷酸重復在總SSR位點中所占比例。本研究通過高通量的測序,獲得了大量的遼東櫟轉錄組序列,不僅豐富了遼東櫟的基因庫,而且為遼東櫟及其他櫟類淀粉合成基因的克隆與功能研究奠定了基礎。發掘到的SSR位點可通過進一步的開發為遼東櫟的進化與多樣性分析及遼東櫟的遺傳圖譜的構建和QTL(QuantitativeTraitLoci)的定位提供了數據支持。
4結論
本研究通過SolexaHiseq2000高通量測序,獲得3.8Gb的遼東櫟轉錄組序列,拼接獲得95800條unigene,發掘出67條參與淀粉合成的unigene以及15901個SSR位點。
作者:劉玉林李偉張志翔單位:北京林業大學生物科學與技術學院北京林業大學自然保護區學院