[MSnbase] 質譜儀 R, Python 指令的整理

一般在研究質譜儀產生出來的資訊會使用 R 的 package,從質譜儀出來的資料格式主要是 RAW 的檔案,根據連結的介紹,一般會經過一些轉檔變成 MS1/MS2, MGF 或者是 mzXML. 本篇想要紀錄在使用 library MSnbase 的時候一些實用的指令!

利用 R 讀取 Mgf 檔案
mgf = readMgfData("/home/xxx/R/rawTest/Alz_P11_H03_884_15Jul12_Roc_12-03-30.mgf")
mzID = mzID("/home/xxx/R/rawTest/Alz_P11_H03_884_15Jul12_Roc_12-03-30_msgfplus.mzid")
利用  Python 讀取 Mgf 檔案

以下的指令參考來源

from pyteomics import mgf, auxiliary
with mgf.read('22Jan2016_Plasma_TBI_1.mgf') as reader:
    auxiliary.print_tree(next(reader))

執行以上的程式之後,首先輸出 print_tree:

params
 -> title
 -> scans
 -> rtinseconds
 -> charge
 -> pepmass
m/z array
intensity array
charge array

檔案分成幾個部分,params 是 MGF 檔案的基本資料,在 python library 提供的範例裡面可以包含更多的資訊,例如以下:

params
 -> username
 -> useremail
 -> mods
 -> pepmass
 -> title
 -> itol
 -> charge
 -> mass
 -> itolu
 -> it_mods
 -> com