各種蛋白質計畫的不同

包含 Folding@home、Malariacontrol.net、POEM@HOME、Predictor@home、Proteins@Home、PS3GRID、Ralph@home、Rosetta@home、SciLINC@Home、SIMAP、Superlink@Technion、TANPAKU 這些專案
回覆文章
BOINC
分散式首腦
分散式首腦
文章: 639
註冊時間: 2006-03-17 23:42
聯繫:

各種蛋白質計畫的不同

文章 BOINC » 2007-05-22 18:11

我們從各計畫的描述和目的來區分它們的不同之處。 (by davidash & BOINC)

Folding@Home:
-蛋白質摺疊
計畫資訊摘自: Scientific Background
引用:
為了解決蛋白質摺疊問題,我們必須打破“百萬分之一秒障礙”。
我們團隊已經發展出許多可以打破“百萬分之一秒障礙”的蛋白質摺疊的新模擬方法,而這個方法是把工作分給許多的處理器,且速度的成長倍數與處理器的數目呈現近似線性的關係。
因此,以Folding@Home的力量(超過100,000個處理器),我們已經成功地打破“百萬分之一秒障礙”,模擬千分之一秒的摺疊時間,並幫助解開蛋白質如何摺疊的秘密。

Predictor@Home
-預言者
計畫資訊摘自: The Predictor Plan:
引用:
Preditor@Home的短程目標是測試和評估蛋白質結構預測的新演算法及方法。近程來說,我們會把P@H對一些已知結構的處理方式做校準。遠程來說,我們希望將P@H開放成為幫助預測蛋白質結構的資源。
另外,參考Chahm
Predictor@Home 與Rosetta@Home這兩個計畫的一般目標有許多相似之處:兩者目的都是使用由BOINC社群所計算出的結果去改進使用於蛋白質結構預測的演算法及參數,並改進這些最先進的方法以處理研究目標的生物化學問題。而這兩個計化的最大差異處在於他們所研究的特定目標不同:Rosetta@Home著重於蛋白質設計,而Predictor@Home目標是對蛋白質系統搜集大量的平衡分子動力學資料。
不同之處在於這兩個計畫所使用的結構預測方法。不同建構方法的兩個差異點是(1)對構造空間的取樣方法,及(2)能量評估的的潛能函數。Predictor@Home現今使用的是一種兩階段多重比例的結構預測方法。
第一步,Mfold,使用一種低解析度的蛋白質鍊表示法,而每種氨基酸都被表示成三維網格中的一個點。許多可能的蛋白質幾何是以重覆的Monte Carlo Method來取樣。蛋白質鍊漸漸從高溫展開狀態冷卻至生理學上的溫度,能量是以一種知識基礎潛能函數來評估。Mfold產生了大量的低能量、類蛋白質的結構,並被轉換成有三個接觸的全原子蛋白質表示法。
第二步,CHARMM精製化,使用在第一步中所產生的低能量結構來模擬分子動力學。CHARMM使用一種以物理學為基礎的潛能函數,包含了一種隱性的模型來決定粒子間的交互作用能量,以及能量評估。在分子動力學的模擬中,蛋白質的動作是根據牛頓運動定律,以一種時間相依的方式來得到。第二步可把從第一步中得到的低解析度的蛋白質鍊精煉成更像蛋白質的高解析度結構,同時也可得到更精確的能量估計函數來選擇最佳架構。
也許Predictor@Home與Rosetta@Home這兩者用的方法最大的不同處在於他們對構造空間的取樣方式。Mfold是以一種更真實的、從頭開始的方法對所有幾何上可能的區域構造做取樣;而Rosetta@Home則是從先前已知結構的資料庫中使用區域結構的片段。


Rosetta@Home
-蘿西塔
計畫資訊摘自Research Overview
引用:
我們目前的研究目標是發展一種改良的[分子內]與[分子和分子間]互動模型,進而使用這種模型來預測及設計大分子結構與互動。預測與設計的應用,除了在生物學上有重大意義之外,也提供了可以改進此模型與增進基本了解的客觀、令人信服的方法。
我們用一個叫做Rosetta的電腦程式來實現蛋白質設計計算。Rosetta的核心是計算大分子內、及分子與分子間互動能量的潛能函數,以及尋找氨基酸序列或蛋白質複合物之最低能量結構(此為蛋白質結構預測),以及尋找單一蛋白質或蛋白質複合物的最低能量氨基酸序列(此為蛋白質設計)。預測與設計測試的回饋結果被用來持續地改進潛能函數和搜尋演算法。發展一個可以處理如此多樣化的問題的電腦程式有許多好處:首先,不同的應用提供了底層的物理模型(基礎物理或物理化學)的互補測試;其次,許多目前受重視的問題,像是彈性骨架的蛋白質設計,及蛋白質間的彈性骨架結合,關係到許多不同最佳化方法的組合。
研究團隊投入在基礎方法的發展研究,並嘗試更直接地對抗疾病。在這個網站中,大部分資訊主要集中在基本的研究內容,但我認為使用者們可能會對我們在疾病相關的研究內容感到興趣。
*瘧疾:我們參加了一項由倫敦大學帝國學院的Austin Burt所領導的合作計畫,這個計畫也是蓋茲基金會“Grand Challenge Projects in Global Health”其中的一個。瘧疾的成因是寄生在蚊子上的瘧疾原蟲,並經由蚊子叮咬後傳染給人類。這項計畫的想法是要消除蚊子身上的某些特殊基因,使得蚊子對瘧疾原蟲有抵抗能力,讓瘧疾原蟲不能寄生。我們參與此計畫的部分是利用電腦設計方法(Rosetta)來創造新酵素,這些酵素會以那些特別的基因為目標,並使它們失去活性。
*炭疽熱:我們幫助哈佛大學的一個研究團隊建構炭疽毒素的模型,這將對治療法的發展有幫助。使用者可以從這篇論文的摘要中獲得一些資訊。
*人體免疫缺損病毒(愛滋病病毒):愛滋病會致命的原因之一是因為它已經發展出欺騙人體免疫系統的手段。我們與西雅圖的研究人員以及美國國家衛生研究院合作,試著發展愛滋病的疫苗。我們在這個計畫中扮演中心角色─我們使用Rosetta設計一些小的蛋白質,這些蛋白質可以顯示出HIV coat protein的一些關鍵區域,而讓人類免疫系統可以輕易地識別出它並製造抗體。我們的目標是創造出小的、穩定的蛋白質疫苗,而這些疫苗的製作費用非常低且可以運到世界各地。
您可能會好奇,蛋白質結構預測和設計新的蛋白質這兩者之間有什麼關係,事實上他們關係密切。因為您的參與,將對我們製造新酵素與疫苗的方法有直接的改進。


SIMAP@Home
-蛋白質相似矩陣
計畫資訊摘自About SIMAP
引用:
SIMAP是什麼?
SIMAP(Similarity Matrix of Proteins)是一個“蛋白質相似性”的資料庫。它幾乎包含了現今所有已公開的蛋白質序列,並持續更新中。蛋白質相似性經由FASTA演算法計算而得,提供了最佳的速度及敏感度。SIMAP是我們所知唯一一個能廣泛地涵蓋所有已知蛋白質資訊,並且有更新能力的計畫。
SIMAP用來做什麼?
因為在公開資料庫中,已知的蛋白質序列數量非常龐大,所以決大多數不能在短期內以實驗的方法來認定其特性。然而,從一個共同的根源所演化出來的不同蛋白質,常有一些相同的功能(所謂的“同源基因”,orthologs)。因此,我們也許可以從某個已知的功能,藉由同源基因的關係去推論出另一個尚未被認定特性之蛋白質的功能。一個著名的例子是關於老鼠的基因和蛋白質的研究。這些結果和他們同源的人類基因與蛋白質在許多方面都是正確的。蛋白質相似性提供了蛋白質間關係的資訊,此外,對同源基因預測而言也是必須的。許多生物資訊方法需要仰賴蛋白質相似性資訊。我們的蛋白質相似性資料庫提供了預先計算過的相似性資料,也代表了已知的蛋白質空間。與一般的方法(重覆地再計算這些資料)來比較的話,這個方法開啟了一個全新的觀點。SIMAP有定期的更新。相似性矩陣會隨著新序列的發現而逐漸擴大。在教育及公開研究用途上使用SIMAP是完全免費的。
為什麼需要以分散運算的方式來實現SIMAP?
計算相似性資料所需的計算成本是跟它所含的序列數量的平方有關,所以為了讓這個矩陣保持在最新狀態所需的計算量也一直在增加。我們從幾年前開始用來執行SIMAP運算的內部資源,也變得不足以應付所有新的序列。這就是我們在BOINC平台上實做了SIMAP客戶端程式的原因。它是一個以FASTA演算法為基礎,用來偵測序列相似性的程式。我們現在正在做最後的測試,並且將在近期內啟動一個對SIMAP相似性計算有貢獻的BOINC計畫。
簡言之, Folding@Home/Predictor@Home/Rosetta@Home/World Community Grid/ 這些計畫用來測試蛋白質摺疊(最佳化學結構);而SIMAP則是分析這些已存在的資料庫(基於FASTA演算法),來偵測序列的相似性。有著相似氨基酸序列的蛋白質可能會展現出相同或相關的功用。FASTA查詢包含了四個部份:雜湊(Hashing),計分(Scoring)1 + 2,及排列(Alignment),(詳情如下)。序列排列的目的是為了找出的種系發生及蛋白質功用相似性。
(引用)
FASTA動畫及資訊
FASTA動畫swf檔
FASTA
FASTA格式,為FASTA演算法的輸入資料,也是許多其他生物資訊應用上的輸入資料,描述如下:
FASTA格式描述

(以上by davidash)

World Community Grid-IBM世界社群網格
的人類蛋白質摺疊計畫將利用網格結合數百萬電腦的運算力;幫助科學家了解人類基因如何摺疊。它透過網格來分擔這項重大工作,預計完成的速度會比使用一般超級電腦快上許多。我們對基因結構有更透徹的了解之後,科學家就能知道疾病如何作用,最終發現解藥。此網格軟體運行時以不同的方法摺疊一條氨基酸鏈;並且評估氨基酸每一次的摺疊是否符合特定的摺疊法則而妥善的鏈結在一塊。電腦嘗試數百萬種氨基酸鏈的摺疊方法;試圖使摺疊結果與人體的實際情形一致。在每一個蛋白質中被認定為最好的形狀將回傳給科學家做更進一步的研究。這個程式的名字叫羅西塔。它計算"羅西塔績分"根據許多評分法則來計算績分,可以評估基因折疊的正確性。績分越低的結果越可能被排除,越高則反是。
蛋白質是建構起所有生命作用的基本建材,它是一串串名為「氨基酸」的長長分子鏈。酵素(酶)是加速生物化學作用的特定蛋白質。蛋白質分解酶是一種能切割蛋白質的酵素。例如,當你食用含蛋白質的食物,這些蛋白質分子就在你的胃裡被蛋白質分解酶給切割開來,然後你的身體就能利用這些氨基酸來製造它所需的蛋白質。雖然生物所擁有的蛋白質分解酶只佔所有蛋白質的一小部分,但它們對生命過程的正確運作卻至關重要。
你的電腦將幫助模擬許多使用在HIV-1蛋白脢的配體的結合過程。這個軟體叫AutoDock。最有希望的配體將由科學家作更進一步的研究,應當能藉此製造出更好的蛋白脢抑制劑來控制HIV,最終避免AIDS的發病。



TANPAKU
-蛋白質です
藉電腦預測蛋白質結構有相當實益,但涉及的計算量太過龎大,儘管電腦的計算能力大幅的增長,但即使用最尖端的電腦也無法在合理的時間內完成計算。
研究人員提出許多方法試圖克服這個難題。本實驗室以”布朗運動”模擬而發展出的”布朗動力學(Brownian Dynamics-BD)方法”從事研究,已經有少許成果。與一般慣用的方法相比,BD讓我們在更少的計算時間內得到較長時間的模擬成果。
(以上by BOINC)


討論本文翻譯請至

回覆文章

誰在線上

正在瀏覽這個版面的使用者:Baidu [Spider] 和 1 位訪客