要点
-
Google 所有の研究所 DeepMind による「深層学習」ソフトウェア プログラムが、生物学の最大の課題の 1 つ、タンパク質の折り畳みを理解する上で大きな進展を見せてくれました。
-
タンパク質の折り畳みは、タンパク質が積み木の列から最終的な三次元構造へと形を変え、その機能を決定するプロセスです。
-
タンパク質がその構造を取る、つまり「折り畳む」方法をよりよく予測することにより、科学者は例えば重要なウイルス性タンパク質の働きを阻害する薬などをより迅速に開発することができるのです。
生物学者が「タンパク質折り畳み問題」と呼ぶものを解決することは、大変なことです。 タンパク質は細胞の主力であり、すべての生物に存在します。 アミノ酸の長い鎖でできており、細胞の構造や細胞間のコミュニケーションに不可欠であるだけでなく、体内のすべての化学反応を制御しています。
今週、Google傘下の人工知能企業DeepMindは、AlphaFold2というディープラーニングプログラムを実演し、専門家は、タンパク質折り畳みの壮大な課題の解決に向けたブレークスルーであると述べています。
タンパク質は、アミノ酸の長い鎖が、糸の上のビーズのようにつながっているものです。 しかし、タンパク質が細胞内で仕事をするためには、「折りたたむ」必要があります。これは、分子をねじったり曲げたりして、細胞内のターゲットと相互作用できる複雑な三次元構造に変換するプロセスです。 フォールディングが崩れると、タンパク質は正しい形を作れなくなり、体内で役割を果たせなくなる。
ディープラーニングは、膨大なデータセットに含まれる、しばしば隠れた情報を利用して、関心のある問題を解決する計算技術です。
ディープラーニングは、膨大なデータセットに含まれる隠れた情報を利用して、興味のある問題を解決する計算技術で、ゲーム、音声認識、自律走行車、科学、医療などの分野で広く使われています。
私は、アルファフォールド2のようなツールが、例えば、プラスチック分解や将来のウイルス流行や病気と戦うための新しいタイプのタンパク質を設計する上で、科学者を助けてくれると思います。
私は計算化学者であり、「The State of Science」という本の著者でもあります。 学生と私は、古典物理学に基づいたタンパク質折り畳みコンピュータプログラムを使って、蛍光タンパク質の構造と特性を研究しています。
何千もの研究グループによる数十年にわたる研究の結果、これらのタンパク質折り畳み予測プログラムは、既知の分子に小さな変更を加えたときに起こる構造変化を計算するのに非常に優れています。
しかし、タンパク質がゼロからどのように折り畳まれるかを予測することは、まだ十分にできていません。
Protein folding
DNAにコードされているアミノ酸配列はタンパク質の立体形状を規定します。 その形状が機能を決定するのです。 もし、タンパク質の構造が変わってしまうと、その機能を発揮することができなくなります。 アミノ酸配列に基づいてタンパク質の折り畳み構造を正しく予測できれば、創薬設計に革命をもたらし、新旧の病気の原因を説明することができる。
アミノ酸の構成要素が同じ配列のタンパク質はすべて、アミノ酸間の相互作用を最適化した、同じ三次元の形に折りたたまれています。
アミノ酸の並びが同じであるタンパク質は、すべて同じ立体構造に折り畳まれます。 この膨大な数ゆえに、タンパク質を作るアミノ酸の全塩基配列がわかっていても、タンパク質の折り畳み方を予測することは困難なのです。 以前は、アミノ酸の配列からタンパク質の構造を予測することは不可能でした。 タンパク質の構造は、時間と費用のかかる実験によって決定されていたのだ。
タンパク質がどのように折り畳まれるかをより正確に予測できるようになれば、細胞がどのように機能し、どのように誤った折り畳みをしたタンパク質が病気を引き起こすのかをより理解できるようになるでしょう。 また、より優れたタンパク質予測ツールは、化学反応が起こるタンパク質の特定のトポロジー領域をターゲットにできる薬剤の設計にも役立ちます。
AlphaFold is born from deep-learning chess, Go and poker games
AlphaFoldというDeepMindのタンパク質折りたたみ予測プログラムの成功は予想外ではないでしょうか。 DeepMindが書いた他のディープラーニングプログラムは、世界最高のチェス、囲碁、ポーカープレイヤーを打ち破ってきました
2016年には、オープンソースのチェスエンジンであるStockfish-8が、世界のコンピュータチェスのチャンピオンに輝きました。 毎秒7000万のチェスポジションを評価し、何世紀にもわたって蓄積された人間のチェス戦略と、何十年にもわたるコンピュータの経験が活かされていました。 効率的かつ残忍にプレイし、繊細さのかけらもなく、人間の挑戦者たちを容赦なく打ち負かした。 ディープラーニングの登場だ。
2017年12月7日、GoogleのディープラーニングチェスプログラムAlphaZeroは、Stockfish-8を打ちのめしました。 チェス エンジンは 100 ゲームをプレイし、AlphaZero は 28 勝、72 同点となりました。 1局も負けなかった。 AlphaZeroは、Stockfish-8の1秒間に7000万回の計算に対し、わずか8万回の計算しか行わず、数百万回対戦して経験から学びながらニューラルネットワークを最適化し、ゼロからチェスを学習するのにわずか4時間しかかからなかったという。
AlphaZeroは、人間や人間がプレイしたチェスゲームからは何も学びませんでした。 自分自身で学習し、その過程で、これまでにない戦略を導き出したのです。 サイエンス誌の解説で、チェスの元世界チャンピオン、ガルリ・カスパロフ氏は、AlphaZero は自分自身のプレイから学習することにより、プログラマーの「優先順位と偏見」を反映するのではなく、チェスの「真実を反映」した戦略を開発したと書いています。 “一生懸命ではなく、賢く働く “という決まり文句を体現しているのです。
CASP – the Olympics for molecular modelers
2年ごとに、世界トップの計算化学者は、タンパク質の折り畳みを予測するプログラムの能力をテストし、Critical Assessment of Structure Prediction (CASP) 競技会で競い合います。
このコンペティションでは、チームは、3D形状はわかっているがまだ公表されていない約100のタンパク質のアミノ酸の直鎖配列を与えられ、これらの配列がどのように折り畳まれるかを計算する必要があります。 2018年、このコンペティションに参加したディープラーニングの新人AlphaFoldは、従来のプログラムをすべて打ち負かしました–ただし、かろうじてです。
2年後の月曜日、Alphafold2が2020年のコンペティションで大差で優勝したことが発表されました。 競合他社を圧倒し、その予測は、X 線回折結晶学やクライオ電子顕微鏡などのゴールド スタンダードな技術によって決定された既存の実験結果に匹敵するものでした。
AlphaFold2の成功の理由の1つは、17万以上の実験的に決定された3次元構造を持つProtein Databaseを使用して、タンパク質の正しい折り畳み構造を計算するように自身を訓練できたことです。
発表されたすべてのタンパク質構造の数である約17万個と、Universal Protein Databaseに寄託されている1億8千万のDNAおよびタンパク質配列とを比較すれば、AlphaFoldの潜在的なインパクトは理解できるはずです。
AlphaFold は、ユニークな構造と機能を持つ新しいタンパク質を探すために、宝のような DNA 配列を分類するのに役立ちます。
AlphaFoldは、分子モデラーである私を冗長にしたのでしょうか
チェスと囲碁のプログラム (AlphaZero と AlphaGo) と同様、AlphaFold2アルゴリズムは何をしていて、なぜ特定の相関関係を使用しているかはよくわかりませんが、それが機能しているということはわかっています。
重要なタンパク質の構造を予測するのに役立つだけでなく、AlphaFoldの「思考」を理解することは、タンパク質の折り畳みのメカニズムに関する新しい洞察を得るのに役立ちます。
AIについて表明される最も一般的な懸念の1つは、それが大規模失業につながるということです。
AIで最も懸念されることのひとつに、大規模な失業者が出るということがありますが、AlphaFoldがタンパク質の折り畳みを安定して予測できるようになるには、まだかなりの時間がかかります。
しかし、いったん成熟し、プログラムがタンパク質の折り畳みをシミュレートできるようになれば、計算化学者は、プログラムの改良、使用される基本的な相関関係の理解、およびアルツハイマー病、パーキンソン病、嚢胞性線維症、ハンチントン病など多くの病気に関連するタンパク質のミスフォールドなどの重要問題を解くためのプログラムの適用に一体的に関与することになるのです。
AlphaFoldとその子孫は、確かに計算化学者の仕事のやり方を変えるでしょうが、彼らを冗長にすることはないでしょう。
アルファフォールドとその仲間たちは、確かに計算化学者の仕事のやり方を変えますが、彼らを余剰人員にすることはありません。 過去には、ロボットが手作業をする人間を置き換えることができましたが、AIによって、私たちの認知能力も挑戦されているのです。