看過三體嗎?代謝組學解決方案也能那麼科幻

生物學霸賽默飛2018-01-12 16:02:46

時維深冬,蒹葭仍蒼,想到詩經中的意境,小編禁不住要為我們的產品賦一首屬於這個季節的古風歌。


彼組學之華兮,在水一方。求之不得兮,寤寐思服。爰賽默飛解決方案之厥功兮,大功可期。


——吳澤明


賽默飛代謝組學解決方案之蒙太奇——三體艦隊來襲!


列位客官也看出來了小編是個玩質譜的文青。今天小編我就用電影鏡頭語言來重現賽默飛代謝組學解決方案的三個應用場景。小編愛質譜也愛科幻,近期在二刷偶像大劉的《三體》。想著 Thermo 質譜名叫 Orbitrap(Orbit+Trap)也瀰漫著星辰的氣息,所以靈機一動,代謝組學三體艦隊來襲!



艦隊諜圖:中軍 Orbitrap 質譜、右翼代謝組學軟件 Compound Discoverer、左翼組學數據處理雲平臺 iOmics Cloud、前鋒脂質組學軟件 LipidSearch


前情提要


HMDB 數據庫創始人 David S. Wishart 曾經有過這樣精到的論述「代謝組學實踐業已揭示代謝物在疾病進程、細胞信號轉導與生理調控中發揮著遠超我們之前認知的、更加中心化的角色」[1]。2-羥基戊二酸[2]、肌氨酸 [3]、延胡索酸[4] 等致癌代謝物的發現及其分子作用機制的揭示,氧化三甲胺 TMAO[5-7] 等誘發心血管疾病的分子作用機理探討,支鏈氨基酸 [8]、羥基脂肪酸衍生物[9] 與糖尿病間建立的分子關聯,種種新知蓬勃湧現,不斷刷新我們的知識體系,這其中發揮了重要的貢獻。


質譜代謝組學研究,按技術形態來分,大致具備三種策略:非靶向代謝組學(Untargeted Metabolomics)、靶標代謝物分析(Targeted Metabolites analysis)與脂質組學(Lipidomics)。運用之妙,存乎一心。實踐中,可以依託不同質譜技術的適宜性,靈活組合。而近來不同策略的融聚一體,尤為引人關注。


圖片源引自 Anal. Chem. 2016, 88, 524-545

鏡頭 1

Untargeted Metabolomics 應用場景


非靶向代謝組學是 Discovery-driven 的研究,其立意是發現分析樣本中的差異表達代謝物。以賽默飛的技術路線為例,其流程大致為:分析之,明辨之,差異之,鑑定之,關聯之。



在此工作流中,質譜數據質量與高效智能的信息處理至關重要。賽默飛 Orbitrap 質譜諸多領先的技術要素使它天然地契合小分子代謝物非靶向分析的科學需求,克服複雜生物樣品的化學複雜性,真實還原其中代謝物的定性與定量信息,做到「亂物雖欲迷人眼,銳辨卻能顯真實」。在通向認識代謝物真實世界的征途上,Orbitrap(軌道離子阱) 小井井會給我們最大的護佑!謝謝小井井!


Q Exactive 質譜分析血漿中 TMAO 時實際分辨率與連續測定的質量軸穩定性


為了給集萬般寵愛於一身的小井井尋覓到一起玩耍、共同進步的小夥伴,賽默飛的科學家們可謂自力更生、苦心孤詣、永不滿足。Dang,dang,dang, Orbitrap 的小迷弟——小 CD 終於來了。


小 CD,大名 Compound Discoverer,是如彗星般崛起、肩負重任的年青一代,它為質譜小分子定性研究而來。從藥物代謝(drug metabolism)到代謝組學,小 CD 統統搞得定。為什麼小編會有這樣的迷之自信?且聽我娓娓道來。


理念決定道路,思辨決定高度。在小 CD 孕育的日日夜夜裡,研發團隊們有過無數次頭腦風暴,爭鳴如何滿足花樣繁多、要求多元的小分子研究的行業需要。後來,馬雲爸爸的偶像風清揚「以無招勝有招」的理念修成正果。科學家們決定不是給小 CD 一個拘囿的 Wizards 玩具,而是給它一套豪華的樂高(小編按:幾十種質譜數據分析功能模塊 node)。


臨機而斷,不決於軟件而絕於各位小主,只要你想做,drag-drop,小 CD 都能按照你編排的工作流來執行。當然了,有的小主歡喜直截了當的風格,沒問題,小 CD 還預置了很多方法模板,也可以實現一步到位。行文至此,小編不得不為小 CD 的開發者們點贊。Smart guys! Genius design!



小 CD 不單戰略上超邁群倫,在戰術上更是有獨步武林的絕技。下面請看小井井與小 CD 間的悄悄話。噓!


小井井:CD,很多小主關心你峰提取(peak detection)的功能,來講講你是怎麼做的?


小 CD:精闢的問題!看來小主們都是勤敏好學啊。程序猿叔叔們給我寫了很長代碼的組分提取算法(CE,component extraction),讓我能超越簡單的峰提取。通過精準質量數、色譜評估、電荷數、同位素模式識別等信息,將加合離子、源內碎裂碎片離子、同位素峰等繁多的 peaks 解析簡化為代謝組分(metabolic components),歸屬於同一個組分的全部質譜響應值相加就是你測定的值。這會幫助小主們大大簡化後期數據處理的難度呢!怎樣算法智能吧(一臉傲嬌)。


小井井:聽起來不錯啊。那你會不會漏峰?(要是你不爭氣,豈不是辜負了我的絕世好數據)


小 CD怎麼會!程序猿叔叔們還給我了另外一項技能(估計是跟中紀委學的),叫回頭看 Fill Gaps。在 CE 之後,如果還有「0」的存在,我會回到原始數據中重新積分。就算是真沒有峰,哪怕是段基線,程序猿叔叔們都讓我積分出來個面積值,簡直了!所以,我小 CD 給各位小主的 peaklist 是沒有缺失值的,歐耶 。


小井井:小樣,看把你得意的。那你來說說你怎麼鑑定 component 的?這可是真正有挑戰的問題。


小 CD:一來呢,我會根據大哥你測定的無敵精準質量數(拍馬屁)、精細同位素分佈相對比以及 MS/MS 二級譜圖來計算分子式,準確度超讚,我的算法牛氣吧(小編按:CD 的元素組成解析算法智能利用了高分辨質譜採集的全部信息,質量與算法交相輝映,行業領先)。然後,看小主的意思嘍,我可以:


  1. 在線檢索 ChemSpider 旗下的各種數據庫(如 HMDB,KEGG,BioCyc 等);


  2. 檢索程序猿叔叔們預置的包含 4400 個內源性代謝物的本地數據庫;


  3. MS/MS 譜自動在線檢索 mzCloud 譜圖庫;


  4. MS/MS 譜檢索比對 mzCloud 本地譜圖庫進行結構鑑定。此外,我還可以根據小主們的指示,智能地指定代謝物結構鑑定的層級,多管齊下。我還能……


CD 典型的代謝組學數據處理工作流與各種豐富的代謝物結構鑑定策略


小井井:打住打住。什麼一二三四的,我都聽煩了。哪像我,離子到我肚子裡後,我說「讓離子飛一會」,然後就沒有然後,多簡單明瞭。那你還能幹什麼?說的簡單些啊。


小 CD(掰著手指頭)我還能做 PCA,PLS-DA,繪製 Volcano plot、S-plot、trend plot,計算 adjusted P-value,我還可以把鑑定的結果投射到 KEGG 和 BioCyc 代謝通路上,用 Heatmap 的風格展示代謝物定量信息,我還能利用 Nature Protocol 上報道的 QC-based Normalization 算法進行峰面積校正,我還能定向精準識別地提取具備特定同位素特徵的代謝物(pattern scoring),還能自動濾除 artifacts(mark background compounds),還能……


小井井:這麼炫酷!看來有你在,小主們用我採集的優質數據就不怕變不成寶貝了。你辦事,我放心啊!


小 CD:謝大哥鼓勵,其實倫家也有兩個小夥伴啦。他們一個叫 LipidSearch,一個叫 iOmics Cloud 雲。他們也是賽默飛老媽送來和我們一起愉快玩耍的。


小井井:要不你來說說他們的特長?


小 CD:(傲嬌著)區區一期內容,怎麼能容納下我們哥仨的傳奇!小編,未完待續吧(別怪小編我)。


參考文獻:


[1] Nature Review Drug Discovery, 2016

[2] Nature Reviews Cancer, 2012

[3] Nature, 2009

[4] Nature, 2016

[5] Nature, 2011

[6] The New England Journal of Medicine,2013

[7] Cell, 2015

[8] Nature, 2016

[9] Cell, 2014


福利時間


點擊閱讀原文,說說您在組學研究中遇到的問題,將有機會獲取賽默飛提供一對一的幫助,並可獲贈精美禮品(限代謝組學相關客戶參與)。


電子筆筒(陽光普照獎)  


  

樂心智能體脂秤 Melody (季度抽獎禮品




文章來源:賽默飛

圖片來源:賽默飛

題圖來源:賽默飛

閱讀原文

TAGS: