細胞生物設施
生物資訊
委員會成員
位置
401室
管理者
梁素雲 syliang@gate.sinica.edu.tw +886-2-27855696,4015
簡介

生物資訊設施提供高通量質譜及次世代基因定序資料分析、高等生物統計、資料探勘、大數據整合、資料視覺化、應用程式開發等方案。本設施備有處理大量資料及平行運算功能的伺服器並建立及安裝分析平台,分析流程及工具。因應生物資訊的科技不斷演進,本設施致力於測試與運用最新方法學以滿足本所研究人員的需求。此外,本設施也針對研究人員及學生提供各種生物資訊相關之諮詢服務及教育訓練。

申請服務 
使用者指引 
收費標準

1. 伺服器

本設施備有數種的伺服器以因應各類生物資訊分析之需。Linux 伺服器擁有強大的運算速度及記憶體空間,配備兩個Intel Xeon Gold 5418Y 處理器(24 核心/48 執行緒),512GB 記憶體,960GB SSD × 2,以及 1.2TB HDD × 5,適合高通量數據分析,如次世代基因體定序分析及基因體組裝。Linux伺服器目前安裝的主要工具包括基因體組裝器SPAdes/MaSuRCA、 核醣核酸序列定量分析器Salmon、基因體註解器Maker、蛋白質/核苷酸序列比對器Blast+、真菌/細菌類基因叢集分析器AntiSMASH、16S rRNA序列分析器Muther等。

Linux 伺服器下建有Galaxy,具有友善之操作介面及龐大的生物分析工具庫,適合處理小規模數據之網路數據分析平台。R/Shiny伺服器則支援內部網路應用程式所需之統計運算及互動式統計圖。

本設施同時使用台灣高速運算中心(NCHC)提供的台灣杉三號高速運算伺服器及台灣雲端運算服務(TWCC)的AI開發工具,以利處理大數據分析及AI的應用。

AWS網路伺服器則是在亞馬遜雲端運算服務(Amazon Web Services)租用的主機,支援研究相關之應用程式,在網際網路部署。

 
2. 進階資料分析

進階資料分析服務的項目包括蛋白質體或基因體表現量差異分析、存活率分析、多變數存活率分析,熱圖、群叢分析、蛋白質相關體分析、網路分析、功能差異分析、基因型與外顯型相關分析、圓形關連圖、邏輯迴歸分析、時間序列分析、機器學習等。

 
3. 資料探勘及整合

本設施提供針對公開型資料庫之資料探勘服務,如來自Genomic Data Common (GDC)之人類癌症基因圖譜資料庫、美國生物資訊研究中心(NCBI)之基因表現資料庫(GEO)及定序資料庫(SRA)、體細胞突變資料庫(COSMIC)、歐洲生物資訊研究所之蛋白質體資料庫(PRIDE)、轉譯後修飾資料庫(dbPTM)及單細胞定序資料庫(Single Cell Portal)等。

 
4. 高效率之自動分析流程

本設施參與合作研究計畫,協助建立高效率的分析流程以處理複雜及運算密集之數據分析。例如泛癌症基因圖譜分析、微生物體分析、基因選擇性剪接之鑑定與定量分析、自動化基因體組裝與註解等。

 
5. 程式開發及網路部署

本設施開發應用程式以協助資料自動化分析、數據視覺化及資訊整合。針對自行開發的網路程式之部署,使用者選擇可依據需求選擇供內部網路或亞馬遜雲端伺服器。

 
6. 資料儲存

本設施提供數據儲存服務,採用高效能 3.5" SATA 硬碟,並具備 96 TB 儲存空間的網路附加儲存(NAS)伺服器。本設施使用者之數據皆備份儲存在 NAS 中。然而,對於高通量數據,如質譜或次世代測序的原始數據,將收取數據儲存年費。