[MSnbase] 質譜儀 R, Python 指令的整理
一般在研究質譜儀產生出來的資訊會使用 R 的 package,從質譜儀出來的資料格式主要是 RAW 的檔案,根據連結的介紹,一般會經過一些轉檔變成 MS1/MS2, MGF 或者是 mzXML. 本篇想要紀錄在使用 library MSnbase 的時候一些實用的指令!
利用 R 讀取 Mgf 檔案
mgf = readMgfData("/home/xxx/R/rawTest/Alz_P11_H03_884_15Jul12_Roc_12-03-30.mgf")
mzID = mzID("/home/xxx/R/rawTest/Alz_P11_H03_884_15Jul12_Roc_12-03-30_msgfplus.mzid")
利用 Python 讀取 Mgf 檔案
以下的指令參考來源:
from pyteomics import mgf, auxiliary
with mgf.read('22Jan2016_Plasma_TBI_1.mgf') as reader:
auxiliary.print_tree(next(reader))
執行以上的程式之後,首先輸出 print_tree:
params
-> title
-> scans
-> rtinseconds
-> charge
-> pepmass
m/z array
intensity array
charge array
檔案分成幾個部分,params 是 MGF 檔案的基本資料,在 python library 提供的範例裡面可以包含更多的資訊,例如以下:
params -> username -> useremail -> mods -> pepmass -> title -> itol -> charge -> mass -> itolu -> it_mods -> com