不同檢測中心的納米粒子表面蛋白冠檢測差異性分析——重復(fù)性分析
Gharibi, H., Ashkarran, A.A., Jafari, M. et al. A uniform data processing pipeline enables harmonized nanoparticle protein corona analysis across proteomics core facilities. Nat Commun 15, 342 (2024). https://doi.org/10.1038/s41467-023-44678-x
摘要 蛋白冠是在生物體液中的納米顆粒上動(dòng)態(tài)形成的一層主要由蛋白質(zhì)組成的生物分子層,對于預(yù)測納米藥物的安全性和有效性至關(guān)重要。蛋白冠的蛋白質(zhì)組成通常使用液相色譜-質(zhì)譜法 (LC-MS/MS) 進(jìn)行分析。我們最近的研究涉及由 17 個(gè)蛋白質(zhì)組學(xué)機(jī)構(gòu)分析的相同樣本,強(qiáng)調(diào)了顯著的數(shù)據(jù)變異性,在這些中心中只有 1.8% 的蛋白質(zhì)被一致鑒定出來。在這里,我們實(shí)施了一個(gè)聚合數(shù)據(jù)庫搜索,統(tǒng)一了可變修飾、酶特異性、允許的漏診切割次數(shù)以及蛋白質(zhì)和肽水平上嚴(yán)格的 1% 錯(cuò)誤發(fā)現(xiàn)率等參數(shù)。這種統(tǒng)一的搜索極大地協(xié)調(diào)了蛋白質(zhì)組學(xué)數(shù)據(jù),提高了可重復(fù)性和不同核心中一致性鑒定的獨(dú)特蛋白質(zhì)的百分比。具體來說,在 717 種定量蛋白質(zhì)中,253 種 (35.3%) 在前 5 家檢測中心共享(16.2% 在前 11 家檢測中共享)。此外,我們注意到還原和烷基化是蛋白冠樣品處理中的重要步驟,正如預(yù)期的那樣,省略這些步驟可將總定量肽的數(shù)量減少約 20%。這些發(fā)現(xiàn)強(qiáng)調(diào)了蛋白冠分析中標(biāo)準(zhǔn)化程序的必要性,這對于推進(jìn)納米級生物技術(shù)的臨床應(yīng)用至關(guān)重要。
簡介
納米顆粒一旦暴露于生物體液中,其表面就會(huì)迅速被一層離子和各種類型的生物分子的層覆蓋,稱為生物分子/蛋白冠。蛋白冠的組成,就參與蛋白質(zhì)的類型、豐度和修飾而言,決定了生物系統(tǒng)(例如細(xì)胞)如何感知納米顆粒并對其做出反應(yīng)。最近對蛋白冠領(lǐng)域 2,134 篇已發(fā)表的論文進(jìn)行的聚類分析揭示了納米顆粒蛋白冠的蛋白質(zhì)組學(xué)分析存在很大異質(zhì)性(例如,就已鑒定的獨(dú)特蛋白質(zhì)的數(shù)量而言);因此,非常需要開發(fā)標(biāo)準(zhǔn)化方法/方案,以改善各種實(shí)驗(yàn)室/核心中納米顆粒蛋白電暈的蛋白質(zhì)組學(xué)表征。基于質(zhì)譜的蛋白質(zhì)組學(xué)通常會(huì)產(chǎn)生可重復(fù)的數(shù)據(jù)(reproducible data),在不同實(shí)驗(yàn)室進(jìn)行的類似實(shí)驗(yàn)之間的主要區(qū)別在于給定樣品中定量的蛋白質(zhì)數(shù)量(即蛋白質(zhì)組覆蓋率)。因此,在蛋白質(zhì)組覆蓋率低的情況下,缺乏對低豐度真實(shí)靶標(biāo)的檢測可能會(huì)產(chǎn)生偏倚,因此可能會(huì)選擇不太重要的靶標(biāo)候選者進(jìn)行后續(xù)分析。生物體液(例如血漿/血清)的蛋白質(zhì)組學(xué)分析以及(血漿/血清)蛋白冠的分析都說明了這個(gè)問題,因?yàn)榈鞍坠趯又械鞍踪|(zhì)的存在與否會(huì)導(dǎo)致數(shù)據(jù)誤解或缺少生物標(biāo)志物。蛋白冠的分析面臨與血漿蛋白質(zhì)組學(xué)類似的挑戰(zhàn),主要包括寬動(dòng)態(tài)范圍,即 22 種蛋白質(zhì)占血漿蛋白質(zhì)重量的 99%,來自此類蛋白質(zhì)的肽擠滿了質(zhì)譜,阻礙了蛋白質(zhì)組的深入分析,特別是對于豐度相當(dāng)?shù)偷牡鞍踪|(zhì)。此外,另一個(gè)分析難點(diǎn)是血漿中存在不同的蛋白質(zhì)亞型。事實(shí)上,已經(jīng)開發(fā)了使用納米顆粒蛋白冠的新興技術(shù),用于降低生物標(biāo)志物發(fā)現(xiàn)中給定生物體液的生物學(xué)復(fù)雜性。盡管存在這些挑戰(zhàn),科學(xué)家們還是定量了血漿中數(shù)千種蛋白質(zhì),從而發(fā)現(xiàn)了不同的基于疾病的生物標(biāo)志物。
雖然血漿蛋白質(zhì)組學(xué)在不斷改進(jìn),但在樣品制備以及數(shù)據(jù)提取、清潔和處理方面,不同蛋白質(zhì)組學(xué)研究的標(biāo)準(zhǔn)化嘗試有限。然而,已經(jīng)討論了有關(guān)研究設(shè)計(jì)、血漿樣品采集、質(zhì)量保證、樣品制備、MS 數(shù)據(jù)采集、數(shù)據(jù)處理和生物信息學(xué)以及蛋白質(zhì)組學(xué)實(shí)驗(yàn)的最低報(bào)告要求的注意事項(xiàng)和建議。
給定核心測試機(jī)構(gòu)報(bào)告的蛋白冠的質(zhì)量和蛋白質(zhì)組覆蓋率可能會(huì)受到樣品制備方案、分析柱、液相色譜 (LC) 系統(tǒng)和質(zhì)譜 (MS) 儀器以及方法參數(shù)和分析持續(xù)時(shí)間的影響。其他變異來源包括原始文件的數(shù)據(jù)庫搜索平臺、搜索設(shè)置、錯(cuò)誤發(fā)現(xiàn)率 (FDR) 的控制、翻譯后修飾的包含以及使用的序列數(shù)據(jù)庫。
為了研究從不同測試中心獲得的蛋白冠數(shù)據(jù)的異質(zhì)性程度和來源,我們將相同的蛋白冠樣品發(fā)送到不同的液相色譜-質(zhì)譜 (LC-MS/MS) 核心測試設(shè)施,并分析其報(bào)告的結(jié)果。更具體地說,哈佛大學(xué)、斯坦福大學(xué)、麻省理工學(xué)院 (MIT)、凱斯西儲(chǔ)大學(xué)、韋恩大學(xué)、伊利諾伊大學(xué)、康奈爾大學(xué)、田納西大學(xué)、內(nèi)布拉斯加大學(xué)林肯分校 (UNL)、密蘇里大學(xué)、辛辛那提大學(xué)、佛羅里達(dá)大學(xué)、堪薩斯大學(xué)醫(yī)學(xué)核心 (KUMC) 的中心分析了 17 個(gè)相同的蛋白冠樣品等分試樣, 德克薩斯大學(xué)圣安東尼奧分校 (UTSA)、密歇根州立大學(xué) (MSU)、加州大學(xué)圣地亞哥分校 (UCSD) 和內(nèi)華達(dá)大學(xué)里諾分校 (UNR)。分析分 3 個(gè)技術(shù)重復(fù)進(jìn)行。沒有提供或要求標(biāo)準(zhǔn)操作程序;相反,要求核心設(shè)施按照通常的做法分析樣品。此后,我們用隨機(jī)數(shù)(與之前的研究4 中的數(shù)字相同)對核心設(shè)施名稱進(jìn)行盲法,以防止任何潛在的利益沖突。實(shí)驗(yàn)方案的基本詳細(xì)信息可在補(bǔ)充表 1 中找到。我們已經(jīng)向所有中心索取了詳細(xì)的方案,這些方案可以在我們原始研究4 的補(bǔ)充信息中找到。
在這項(xiàng)研究中,我們探討了數(shù)據(jù)庫搜索、數(shù)據(jù)提取、處理和分析對觀察到的數(shù)據(jù)異質(zhì)性的影響。具體來說,我們研究了采用具有統(tǒng)一參數(shù)(包括受控 FDR)的聚合數(shù)據(jù)庫搜索是否有助于標(biāo)準(zhǔn)化和協(xié)調(diào)結(jié)果。
結(jié)果
我們對來自 15 個(gè)使用 Orbitrap 檢測器的中心的 LC-MS/MS 原始文件進(jìn)行了統(tǒng)一的數(shù)據(jù)庫搜索(整個(gè)工作流程如圖 2 所示)。中心 6 被排除在搜索之外,因?yàn)闃悠肥峭ㄟ^ Bruker timsTOF-PRO 儀器分析的。中心 8 也被排除在外,因?yàn)楸0酚糜诎腚装彼?(Cys) 殘基的烷基化,而其他中心使用碘乙酰胺 (IAA) 或跳過烷基化步驟。由于幾個(gè)中心沒有說明是否進(jìn)行了蛋白質(zhì)的還原和烷基化,我們將 Cys 氨基甲基化作為可變修飾,并在蛋白質(zhì)定量中使用氨基甲基化肽。雖然一些中心在其單獨(dú)的數(shù)據(jù)庫搜索中包括了其他修飾,例如脫酰胺化和磷酸化,但我們只將蛋白質(zhì) N 末端的常規(guī)蛋氨酸氧化和乙酰化作為可變修飾,因此結(jié)果在中心之間具有可比性。在蛋白質(zhì)和肽水平上應(yīng)用 1% 的 FDR,類似于以前的研究。如補(bǔ)充表 1 所示,不同的中心在蛋白質(zhì)和/或肽水平上使用 1-10% 的 FDR,而一些中心沒有說明 FDR 信息。以前一些中心使用半特異性檢索,而這里我們只檢索特異性胰蛋白酶肽。我們也最多只允許兩次漏診,這是相當(dāng)標(biāo)準(zhǔn)的,并且在社區(qū)中被廣泛接受。而以前幾個(gè)中心在他們的個(gè)人搜索中允許多達(dá) 3-5 個(gè)遺漏的卵裂。值得注意的是,我們只強(qiáng)調(diào)參數(shù)中的這些變化是異質(zhì)性的來源,并且只應(yīng)用社區(qū)廣泛接受的參數(shù)(例如,不超過 1% 的 FDR。這不會(huì)破壞由不同核心測試中心單獨(dú)執(zhí)行的先前數(shù)據(jù)庫搜索的有效性。整個(gè)工作流程如圖 1 所示。

統(tǒng)一數(shù)據(jù)庫搜索顯著提高了不同測試中心數(shù)據(jù)的均一性
去除污染物后,統(tǒng)一數(shù)據(jù)庫搜索確定了 1,335 種蛋白質(zhì)(補(bǔ)充數(shù)據(jù) 1)。與此同時(shí),從不同核心設(shè)施中單獨(dú)搜索的數(shù)據(jù)集的匯編導(dǎo)致鑒定了 4022 種蛋白質(zhì)。我們認(rèn)為,在之前的研究中鑒定出的蛋白質(zhì)數(shù)量明顯增加,部分原因是缺乏在蛋白質(zhì)和肽水平上應(yīng)用嚴(yán)格的 FDR,以及使用不同的搜索引擎、序列數(shù)據(jù)庫和其他搜索參數(shù),例如可變的翻譯后修飾、酶特異性和允許的遺漏切割的數(shù)量。每個(gè)核心設(shè)施定量的蛋白質(zhì)數(shù)量如圖 2 所示。2a 并與之前研究中檢測到的蛋白質(zhì)進(jìn)行了比較。正如預(yù)期的那樣,由于統(tǒng)一搜索,所有中心的蛋白質(zhì)數(shù)量都減少了。與我們的統(tǒng)一搜索相比,應(yīng)用不太嚴(yán)格的 FDR、半特異性數(shù)據(jù)庫搜索、包含具有兩個(gè)以上缺失切割的肽以及包含非常規(guī)修飾(如磷酸化)預(yù)計(jì)將產(chǎn)生更多的蛋白質(zhì)。因此,與單個(gè)數(shù)據(jù)庫搜索中檢測到的蛋白質(zhì)數(shù)量相比,在統(tǒng)一搜索中,使用上述四個(gè)參數(shù)執(zhí)行數(shù)據(jù)庫搜索的中心定量蛋白質(zhì)的數(shù)量減少了更多。

總體而言,定量了 717 種蛋白質(zhì),其中 51 種 (7.1%) 在所有中心之間共享(補(bǔ)充數(shù)據(jù) 2),在所有重復(fù)中發(fā)現(xiàn)了 31 種 (4.3%) 蛋白質(zhì)(補(bǔ)充數(shù)據(jù) 2 中蛋白質(zhì)的NA_count_all_replicates為零)(圖 2)。在之前的研究中,只有 1.8% 的蛋白質(zhì)組在 12 個(gè)核心設(shè)施之間共享。正如預(yù)期的那樣,所有中心之間共享的大多數(shù)蛋白質(zhì)具有相對較高的豐度、更高的檢測到的肽數(shù)量和更高的序列覆蓋率(圖 D)。2c;例如,紅色和黃色圓圈表示 100% 和 80% 的核心設(shè)施定量的蛋白質(zhì))。15 個(gè)核心的蛋白質(zhì)水平強(qiáng)度分布如圖 1 所示。我們還將所有核心設(shè)施中的 51 種共享蛋白質(zhì)映射到 KEGG 通路,富集的通路如圖 2 所示。


a 在 15 個(gè)核心設(shè)施的相同納米顆粒蛋白電暈中定量的 717 種蛋白質(zhì)的歸一化強(qiáng)度的分層聚類。b 由 15 個(gè)核心設(shè)施定量的蛋白質(zhì)組的 PCA 分析。c 在數(shù)據(jù)集的分層聚類和 PCA 分析中確定的不同簇中共享蛋白質(zhì)的數(shù)量。面板 a-c 中的紅色、藍(lán)色和綠色是指中心簇。d 蛋白質(zhì)強(qiáng)度在不同簇中的分布。箱線圖:中心線,中位數(shù);箱子限制包含 50%;上四分位數(shù)和下四分位數(shù),75% 和 25%;maximum, 最大值(不包括異常值);最小值,最小值,不包括異常值;異常值,是上四分位數(shù)和下四分位數(shù)的 1.5 倍以上。e 在面板 a 中觀察到的不同參數(shù)對聚類的影響。f 從每個(gè)核心設(shè)施獲得的數(shù)據(jù)中至少包含一個(gè) Cys 殘基的肽的百分比(每個(gè)條形頂部的數(shù)字表示含 Cys 的肽的實(shí)際數(shù)量)。g 含 Cys 的肽數(shù)與總肽數(shù)的關(guān)系。h 含有 His 殘基的肽數(shù)與肽總數(shù)的關(guān)系。所有分析均基于平均 3 個(gè)技術(shù)重復(fù)。
共享蛋白質(zhì)在每個(gè)簇的核心設(shè)施之間的蛋白質(zhì)水平強(qiáng)度分布如圖 2 所示。4d,表明簇 C 的核心設(shè)施主要定量了樣品中最豐富的蛋白質(zhì)(簇 C 中共享蛋白質(zhì)的平均蛋白質(zhì)強(qiáng)度高于 B,反過來,B 的平均蛋白質(zhì)強(qiáng)度高于簇 A)。這些結(jié)果表明,某些核心設(shè)施在定量低豐度蛋白質(zhì)和達(dá)到更高的蛋白質(zhì)組覆蓋率方面優(yōu)于其他設(shè)施。與我們之前的研究相比,這些發(fā)現(xiàn)表明,統(tǒng)一的數(shù)據(jù)庫搜索極大地增加了不同核心設(shè)施之間共享蛋白質(zhì)的數(shù)量,并且可以以無偏倚的方式比較每個(gè)中心的性能。假設(shè),如果應(yīng)用其他統(tǒng)一搜索參數(shù),共享蛋白質(zhì)也會(huì)增加。
為了進(jìn)一步檢查可能導(dǎo)致圖 1 中觀察到的聚類的其他因素。4a 中,我們調(diào)查了每個(gè)集群中內(nèi)核使用參數(shù)的次數(shù)。如圖 1 所示。4e 中,所用 MS 系統(tǒng)、消解模式以及包含還原和烷基化步驟方面存在聚類趨勢??傮w而言,高端(最近推出的)質(zhì)譜儀在提供最高的蛋白質(zhì)組覆蓋率方面表現(xiàn)出色,但也有一些例外。意料之中,由于樣品損失較低,磁珠上消化(盡管并非在所有情況下)總體上提供了比溶液內(nèi)或凝膠內(nèi)消化更高的蛋白質(zhì)組覆蓋率,這可能解釋了為什么更多的核心機(jī)構(gòu)根據(jù)他們的經(jīng)驗(yàn)選擇磁珠上消化。我們還研究了其他參數(shù)(包括梯度持續(xù)時(shí)間、變量修飾、液相色譜系統(tǒng)和 FDR)對圖 1 中聚類的影響。4a. 但是,這些參數(shù)都沒有對聚類產(chǎn)生明顯影響。Cys 殘基占蛋白質(zhì)組中氨基酸的 2.3%,因此,≈20% 的所有胰蛋白酶肽至少包含一個(gè) Cys21。在沒有還原和烷基化的情況下,這些肽在消化過程中或消化后交聯(lián),并且大多數(shù)在清潔過程中被消除和/或通過常規(guī)數(shù)據(jù)庫搜索未找到。因此,這些肽無法通過常規(guī) LC-MS/MS 分析進(jìn)行鑒定/定量。由于 6 個(gè)核心設(shè)施在提供的方案中未顯示 Cys 還原和烷基化(中心 1、2、4、5、13 和 17),我們還計(jì)算了不同中心的定量含 Cys 肽的數(shù)量。如圖 1 所示。4f 中,在其方案中包括還原和烷基化步驟的中心圍繞預(yù)期的含 ~20% Cys 的肽進(jìn)行定量。另一方面,上述 6 個(gè)中心未能量化此類肽。預(yù)計(jì)含 Cys 的肽數(shù)與總肽計(jì)數(shù)之間具有良好的相關(guān)性。在執(zhí)行 Cys 殘基還原和烷基化的中心中觀察到這種相關(guān)性,但在跳過此步驟的 6 個(gè)中心中未觀察到這種相關(guān)性(圖 D)。作為對照,我們繪制了含組氨酸 (His) 的肽的數(shù)量與肽總計(jì)數(shù)的關(guān)系,證明了近乎完美的相關(guān)性(圖 D)。4h)。我們選擇了 His,因?yàn)?His 在蛋白質(zhì)組中的頻率非常接近 Cys 殘基21。有趣的是,跳過還原和烷基化步驟的 4 個(gè)中心屬于圖 A 中的簇 A。4a 中,它量化了最多的蛋白質(zhì)。然而,即使在這些情況下,數(shù)據(jù)質(zhì)量(每個(gè)蛋白質(zhì)的肽數(shù)和序列覆蓋率)以及蛋白質(zhì)組覆蓋率也可以通過納入含 Cys 的肽來進(jìn)一步提高??偟膩碚f,這一發(fā)現(xiàn)表明,在LC-MS/MS工作流程中包括Cys還原和烷基化步驟以防止數(shù)據(jù)丟失是必要的。
不同檢測中心蛋白質(zhì)組學(xué)數(shù)據(jù)的全局相似性
然后,我們計(jì)算了 15 個(gè)中心共享的 51 種蛋白質(zhì)之間的相關(guān)性(圖 D)。5). 這種無偏分析表明,對于一致定量的蛋白質(zhì),所有核心都報(bào)告了高度可比的數(shù)據(jù)。大多數(shù)核心設(shè)施的數(shù)據(jù)通常顯示與其他設(shè)施的相關(guān)系數(shù)高于 0.7。只有來自 11 個(gè)核心的數(shù)據(jù)通常與其他設(shè)施的數(shù)據(jù)顯示出低于 0.7 的相關(guān)性,我們無法將其歸因于單個(gè)參數(shù),例如消解時(shí)間、儀器類型、數(shù)據(jù)庫搜索等??山邮艿南嚓P(guān)水平表明,來自每個(gè)核心的數(shù)據(jù)可以在給定的蛋白質(zhì)組覆蓋度內(nèi)進(jìn)行驗(yàn)證,并且數(shù)據(jù)的可變性主要源于不同的蛋白質(zhì)組覆蓋度。雖然LC-MS/MS方案和工作流程也可能產(chǎn)生差異,但本文表明,在蛋白質(zhì)和肽水平上執(zhí)行統(tǒng)一和標(biāo)準(zhǔn)的數(shù)據(jù)庫搜索并嚴(yán)格控制FDR,可以顯著協(xié)調(diào)不同核心設(shè)施的數(shù)據(jù)。

討論
本研究的結(jié)果表明,使用統(tǒng)一且更標(biāo)準(zhǔn)的數(shù)據(jù)庫搜索有助于在不同核心設(shè)施中均勻化蛋白冠分析的結(jié)果??缰行臋z測到的蛋白質(zhì)從 4,022 個(gè)減少到 1,335 個(gè)(定量)蛋白質(zhì),這表明數(shù)據(jù)庫搜索參數(shù)設(shè)置對搜索結(jié)果有顯著影響。統(tǒng)一的數(shù)據(jù)處理和分析增加了不同中心之間共享蛋白質(zhì)的數(shù)量,并通過統(tǒng)一序列數(shù)據(jù)庫、搜索參數(shù)和數(shù)據(jù)清理來提高數(shù)據(jù)可重復(fù)性。我們還表明,雖然共享蛋白質(zhì)的豐度在不同中心之間通常具有良好的相關(guān)性,但變異性的主要來源來自不同程度的蛋白質(zhì)組覆蓋。在這種情況下,蛋白質(zhì)組覆蓋率在很大程度上取決于 LC-MS/MS 方案、工作流程、LC 和 MS 儀器、數(shù)據(jù)提取和處理。我們進(jìn)一步證明,還原和烷基化是樣品制備中必不可少的步驟,跳過此步驟會(huì)導(dǎo)致肽水平數(shù)據(jù)丟失 20%。缺乏對含 Cys 肽的檢測會(huì)影響蛋白質(zhì)序列覆蓋率和每種蛋白質(zhì)肽數(shù)方面的蛋白冠分析質(zhì)量。我們進(jìn)一步證實(shí),提供較低蛋白質(zhì)組覆蓋率的中心主要量化了蛋白冠中更豐富的蛋白質(zhì)。蛋白質(zhì)組覆蓋度在蛋白冠研究中非常重要,因?yàn)槊糠N蛋白質(zhì)的存在與否最終都會(huì)影響生物標(biāo)志物的選擇。分析表明,LC-MS/MS方案、工作流程、LC和MS儀器、數(shù)據(jù)提取和處理中的多個(gè)變量可以解釋給定中心優(yōu)于其他中心的原因。MS 儀器、消化模式以及包含還原和烷基化步驟是當(dāng)前研究中影響蛋白質(zhì)組覆蓋率的變量之一。然而,有時(shí),即使是幾個(gè)跳過 Cys 還原和烷基化步驟的中心也優(yōu)于執(zhí)行這些步驟的其他中心。蛋白質(zhì)組覆蓋率似乎在很大程度上取決于工作流程、科學(xué)家以及總體上執(zhí)行實(shí)驗(yàn)的中心。這強(qiáng)調(diào)了 LC-MS/MS 樣品制備中良好實(shí)踐的重要性,并強(qiáng)調(diào)了用戶專業(yè)知識作為另一個(gè)有影響力的參數(shù)的重要性,正如之前所強(qiáng)調(diào)的那樣。
有幾項(xiàng)研究側(cè)重于技術(shù)和工具方面,這些方面可以在從不同中心檢索的數(shù)據(jù)中引入異質(zhì)性,包括其他高通量技術(shù),例如 RNA 測序和微陣列(盡管不是納米顆粒蛋白冠)。其他研究調(diào)查了分析前樣品處理和儲(chǔ)存對血漿蛋白質(zhì)組學(xué)的影響。我們已經(jīng)在之前的報(bào)告中討論了幾項(xiàng)研究。
數(shù)據(jù)庫搜索中的某些參數(shù)可能會(huì)對數(shù)據(jù)輸出產(chǎn)生中度或顯著影響。我們認(rèn)為,搜索引擎(軟件)的選擇、使用的序列數(shù)據(jù)庫、包含幾個(gè)變量修改以及分配特定或半特異性搜索可以適度地影響數(shù)據(jù)輸出,而 FDR 率可能會(huì)產(chǎn)生最大的影響。雖然不同的搜索引擎可能會(huì)產(chǎn)生略有不同的輸出,但一旦它們經(jīng)過測試,它們就會(huì)定期更新,并且它們的輸出是可信的。包含其他修飾或進(jìn)行半特異性搜索會(huì)增加定量肽的數(shù)量(因此,蛋白質(zhì)的數(shù)量),但代價(jià)是假陽性發(fā)現(xiàn)率較高。選擇較高的 FDR 臨界值通常會(huì)導(dǎo)致鑒定出更多的蛋白質(zhì),但與此同時(shí),假陽性命中的數(shù)量也會(huì)增加。肽水平上較高的 FDR 將允許大量錯(cuò)誤識別的肽,這可能會(huì)在以后損害基于肽水平鑒定的蛋白質(zhì)水平推斷38。高 FDR 對于由少數(shù)肽檢測到的低豐度蛋白質(zhì)尤其有害。因此,這里我們將主要討論 FDR 控制的重要性。
一些研究調(diào)查了 FDR 控制對不同中心蛋白質(zhì)組學(xué)分析的影響。例如,Collins 等人5 對全球 11 個(gè)地點(diǎn)的所有理論碎片離子譜 (SWATH) MS 數(shù)據(jù)采集進(jìn)行了順序窗口采集的比較重現(xiàn)性分析。將一組連續(xù)稀釋的標(biāo)準(zhǔn)肽加標(biāo)到 HEK293 細(xì)胞裂解物中。雖然所有站點(diǎn)都使用了 SCIEX TripleTOF 5600/5600+ 質(zhì)譜儀,但納離子色譜系統(tǒng)具有不同的型號,但來自同一供應(yīng)商 SCIEX。該研究檢測到一組核心 4,077 種蛋白質(zhì),這些蛋白質(zhì)在 >80% 的樣品中被一致檢測到。與我們研究的結(jié)果類似,當(dāng)數(shù)據(jù)分析和 FDR 控制在逐個(gè)站點(diǎn)的基礎(chǔ)上獨(dú)立進(jìn)行時(shí),注意到站點(diǎn)之間一致檢測到的蛋白質(zhì)減少。但是,應(yīng)該注意的是,沒有進(jìn)行樣品制備,因此工作流程的變化仍然很小。上述示例表明,通過集中樣品制備和數(shù)據(jù)分析,以及最大限度地減少儀器參數(shù)的變化,可以實(shí)現(xiàn)復(fù)雜樣品中大多數(shù)蛋白質(zhì)的重現(xiàn)性。
與上述研究相比,相同的蛋白冠樣品被運(yùn)送到不同的中心,隨后的樣品制備和 LC-MS/MS 分析由中心自行決定進(jìn)行,沒有要求/提供標(biāo)準(zhǔn)化的儀器參數(shù)或方案。因此,當(dāng)前研究中唯一的匯總步驟是蛋白質(zhì)樣品的制備、數(shù)據(jù)提取、處理和分析。此外,我們研究中的中心必須執(zhí)行數(shù)據(jù)依賴性采集 (DDA)。與 SWATH 不同,DDA 采集涉及隨機(jī)碎片離子 (MS2) 采樣,因此肽采樣的可重復(fù)性較低; 即,當(dāng)母離子的數(shù)量超過母離子選擇周期的數(shù)量時(shí),母離子選擇變?yōu)殡S機(jī)。
人類蛋白質(zhì)組組織 (HuPO) 測試樣品工作組將 20 種高度純化的重組蛋白的等摩爾混合物分發(fā)給 27 個(gè)不同的實(shí)驗(yàn)室,這些實(shí)驗(yàn)室依次根據(jù)自己的常規(guī)和方案分析樣品,沒有任何限制。在 27 個(gè)實(shí)驗(yàn)室中,只有 7 個(gè)實(shí)驗(yàn)室正確報(bào)告了所有 20 種蛋白質(zhì)。對原始數(shù)據(jù)的集中分析表明,在所有 20 個(gè)實(shí)驗(yàn)室中都檢測到了所有 27 種蛋白質(zhì)。漏診鑒定或假陰性、環(huán)境污染、數(shù)據(jù)庫匹配問題以及蛋白質(zhì)鑒定的管理被發(fā)現(xiàn)是異質(zhì)性的來源。研究表明,在肽鑒定和蛋白質(zhì)分配中觀察到的主要變異性是由數(shù)據(jù)處理和分析的差異引起的,而不是由數(shù)據(jù)收集的差異引起的。
在這里,我們證明,通過在蛋白質(zhì)和肽水平上應(yīng)用嚴(yán)格的 FDR 臨界值并統(tǒng)一其他搜索參數(shù),例如酶特異性、可變翻譯后修飾和考慮遺漏切割的肽,與在每個(gè)位點(diǎn)進(jìn)行單獨(dú)數(shù)據(jù)庫搜索相比,一致定量蛋白質(zhì)的百分比增加了 9 倍。與我們之前的研究相比,由不同的核心機(jī)構(gòu)進(jìn)行獨(dú)立的數(shù)據(jù)庫搜索,鑒定出 4022 種蛋白質(zhì),而我們在這里鑒定了 1429 種蛋白質(zhì),僅量化了 717 種蛋白質(zhì)。
我們認(rèn)為,與其他類型的蛋白質(zhì)組學(xué)分析(例如細(xì)胞和組織)相比,血漿蛋白質(zhì)組學(xué)通常具有挑戰(zhàn)性,這是蛋白冠層中一致檢測到蛋白質(zhì)的比率較低的主要原因之一。同樣,在之前的研究中,作者重新分析了 2005-2017 年的 178 項(xiàng)實(shí)驗(yàn)數(shù)據(jù),表明只有 50% 的研究報(bào)告了 500 種最豐富的血漿蛋白。
總之,我們揭示了使用統(tǒng)一的數(shù)據(jù)庫搜索為使用 LC-MS/MS 在蛋白冠研究中采取措施和質(zhì)量控制提供了機(jī)會(huì)。這種方法為協(xié)調(diào)蛋白冠結(jié)果的數(shù)據(jù)分析鋪平了道路,使利益相關(guān)者能夠?qū)ΜF(xiàn)有文獻(xiàn)中的蛋白質(zhì)組學(xué)數(shù)據(jù)進(jìn)行薈萃分析。它旨在最大限度地減少由于不同實(shí)驗(yàn)室的樣品制備和工作流程差異而引起的沖突和差異。提高蛋白冠研究中的可重復(fù)性和蛋白質(zhì)組覆蓋率可以加速納米醫(yī)學(xué)技術(shù)在診斷和治療應(yīng)用中的成功臨床轉(zhuǎn)化。
PuriMag?蛋白冠前處理磁珠試劑盒|高深度蛋白質(zhì)組學(xué)(http://www.tools.7z1ocr.cn/Product/8096211554.html)
- 上一篇:質(zhì)譜指紋圖譜專家共識 | 蛋白/多肽指紋圖譜在腫瘤中的臨床應(yīng) 2025/1/7
- 下一篇:血液蛋白質(zhì)組的檢測深度——如何看待不同的策略方案? 2024/12/22