簡介

生物資訊設施提供高通量質譜及次世代基因定序資料分析、高等生物統計、資料探勘,大數據整合等電腦運算所需之解決方案。本設施備有處理大量資料及平行運算功能的伺服器並建立及安裝分析平台,分析流程及工具。因應生物資訊的科技不斷演進,本設施致力於測試與運用最新方法學以滿足本所研究人員的需求。此外,本設施也針對研究人員及學生提供各種生物資訊相關之諮詢服務及教育訓練。

fig2

1. 伺服器

本設施備有數種的伺服器以因應各類生物資訊分析之需。例如自建的Galaxy伺服器具有友善之操作介面及龐大的生物分析工具庫,適合處理小規模數據之網路數據分析平台。Linux 伺服器擁有強大的運算速度及記憶體空間,適合高通量數據分析,如次世代基因體定序分析及基因體組裝。Linux伺服器目前安裝的主要工具包括基因體組裝器SPAdes/MaSuRCA、 核醣核酸序列定量分析器 Salmon、基因體註解器Maker、蛋白質/核苷酸序列比對器Blast+、真菌/細菌類基因叢集分析器AntiSMASH、16S rRNA序列分析器Muther等。此外,網路伺服器支援自建的網路應用程式,而R/Shiny伺服器則支援內建網路應用程式所需之統計運算及互動式統計圖。

fig3

2. 進階資料分析

進階資料分析服務的項目包括蛋白質體或基因體表現量差異分析、存活率分析、多變數存活率分析,熱圖、群叢分析、蛋白質相關體分析、網路分析、功能差異分析、基因型與外顯型相關分析、圓形關連圖、有母數/無母數統計法、邏輯迴歸分析、時間序列分析、機器學習等。

fig4

3. 資料探勘及整合

本設施提供針對公開型資料庫之資料探勘服務,如來自Genomic Data Common (GDC)之人類癌症基因圖譜資料庫、美國生物資訊研究中心(NCBI)之基因表現資料庫(GEO)及定序資料庫(SRA)、體細胞突變資料庫(COSMIC)、歐洲生物資訊研究所之蛋白質體資料庫(PRIDE)、及轉譯後修飾資料庫(dbPTM)等。本設施並開發網路工具以協助資料視覺化及資訊整合。

fig5 1

4. 高效率之自動分析流程

本設施參與合作研究計畫,協助建立高效率的分析流程以處理複雜及運算密集之數據分析。例如泛癌症基因圖譜分析、微生物體分析、基因選擇性剪接之鑑定與定量分析、自動化基因體組裝與註解等。