今年のノーベル化学賞は、生命を構成する重要な部品「タンパク質」のコンピューターによる設計と、タンパク質の立体構造を高精度で予測する人工知能(AI)の開発で、米英の研究者3人に決まりました。特に、タンパク質の立体構造予測は、世界中の科学者が50年以上立ち向かってきた難関でした。そこに多くの人が積み上げた実験データを機械学習したAIが登場、難関を突破したといいます。 (増井のぞみ)

◆立体構造決定に数年→3分で予測

 タンパク質の立体構造予測でノーベル化学賞を受けるのは、ともに英国を拠点とするAI開発企業「グーグル・ディープマインド」の最高経営責任者(CEO)のデミス・ハサビス氏(48)、ディレクターのジョン・ジャンパー氏(39)。  タンパク質は、20種類のアミノ酸が平均300個、数珠つなぎに並んだひもです。自動的に折り畳まり、らせんやひだなどの立体構造を作り初めて機能を発揮するのです。  立体構造を知るためには、タンパク質の結晶を作ってエックス線を当てる、極低温電子顕微鏡や核磁気共鳴装置を使うなどの手法がありますが、労力やお金がかかります。結晶を作るのも職人技です。以前は構造を決めるのにしばしば数年かかりました。このため、タンパク質の動きを物理法則に基づいて計算し、折り畳まれた形を予測する研究が進んできましたが、精度は低かったのです。

◇精度は9割

AF3が3分で予測したタンパク質の立体構造を紹介する伏信進矢教授=東京都文京区の東京大で

 ハサビス氏とジャンパー氏らのチームは2018年、タンパク質の立体構造を予測するAI「アルファフォールド(AF)」を開発し、精度は約6割でした。20年に精度を約9割に高めた「AF2」を発表し、21年に一般に無料で公開したことが、ノーベル賞の対象になりました。現在、190カ国200万人以上が利用しています。ノーベル賞の選考委員会は「構造予測の精度約90%は、構造を決めるときに誤差を伴う実験の正確さと同等」と評価しました。  伏信(ふしのぶ)進矢・東京大教授(酵素学)は「6年間解けなかったタンパク質の構造が、AF2を使って数時間で解けた」と証言します。今年公開された最新版のAF3を実演してもらいました。ホームページにアミノ酸約270個が並んだ配列を表す文字列を貼り付け、キーをたたいて3分。画面に予測したタンパク質の立体構造が出てきました。伏信氏は「構造を探るため何通りもしていた予備実験を省いて、予測構造を基に本実験ができる」と話します。

◇英知の結集

 AF2はどのように開発されたのでしょうか。新井宗仁・東京大教授(生物物理学)は「世界中の研究者が70年以上かけて集めた22億のアミノ酸配列と17万のタンパク質構造のデータを、最新の計算技法で1週間ほど学習してできたAI」と解説します。機械学習には、言語を翻訳するソフトウエアの計算手法を使いました。さまざまな生物のアミノ酸配列を比べて一緒に進化する二つのアミノ酸を見つけ、この二つは立体構造では近い所にあると推測しました。  ハサビス氏は、AI囲碁ソフト「アルファ碁」の開発者でもあり、AF開発を率いてきました。ジャンパー氏は、機械学習によるタンパク質の折り畳み研究で博士号を持ち、AF2開発に貢献しました。

◇過程は不明

 一方、AIには課題もあります。新井氏は「ひも状のタンパク質が折り畳まれる反応過程は分からず、ブラックボックスとなる」と強調します。「AIは正解を出すけど理解しているわけではない」と言うのは大阪大の古賀信康教授(タンパク質の人工設計)。「構造を精度良く予測できないものもあり、実験による構造決定は必要」と説きます。  AF2の機械学習で教師データとして、世界中の研究者が実験で取得したタンパク質の立体構造データベース「プロテインデータバンク(PDB)」が使われました。古賀氏は「日本でも多くの研究者がPDBに貢献してきたが、AF2のようなソフトウエアを生み出せなかった。それはなぜか、反省が必要」と指摘します。

◆コンピューター使いゼロから設計

ベーカー氏が設計したタンパク質「トップ7」の立体構造(右)を指し示す新井宗仁教授=東京都目黒区の東京大で

 タンパク質の設計でノーベル化学賞を受けるのは、米ワシントン大教授のデービッド・ベーカー氏(62)です。コンピューターを使い、狙った構造を持つ新たなタンパク質「トップ7」をゼロから設計し、実際に微生物を使って合成し正しく設計できていることも確認した2003年の論文が評価されました。  1990年代にタンパク質の立体構造予測をするコンピュータープログラム「ロゼッタ」を開発。それを改良して、構造から逆算してアミノ酸93個の配列を導きました。立体構造予測と逆の向きの「逆折り畳み問題」の解決に道を開いたのです。  立体構造予測でも長年世界をリードしてきました。16年時点の予測精度は4割で世界最高。18年にハサビス氏らに首位を奪われ、べーカー氏は立体構造予測をするAI「ロゼッタフォールド(RF)」を開発し21年6月に発表。翌月、RFとハサビス氏らのAI「アルファフォールド(AF)2」のプログラムがほぼ同時に公開されました。  分子科学研究所(愛知県岡崎市)の小杉貴洋助教(生物物理学)は「企業が大事な情報を公開するメリットは少ない。ベーカー氏らが頑張ってRFを開発したおかげで、AF2の公開が促され、自由に使えるようになったのではないか」とみます。

◆医薬品開発などの加速に期待

 タンパク質は、生命の体の筋肉をつくるほか、体の中で化学反応を促す酵素や体の働きを調節するホルモン、病原体を除去する抗体などとして働きます。  タンパク質の設計と立体構造予測は、医薬品の開発などを加速すると期待されます。薬学博士の生長(おいさき)幸之助氏は「ヒトの体を構成する物質のうちタンパク質は最多の水60%に次ぐ15~20%。医薬品の9割がタンパク質をターゲットにしている」と語ります。  ディープマインド社が開発したAIは、精度良くタンパク質の立体構造を予測するため、タンパク質に結合して働きを阻害する医薬品候補の物質を効率良く探す助けになります。  ベーカー氏は人工的なタンパク質の設計手法を開発しました。既にインフルエンザウイルスの変異に対応できるワクチンが開発されて動物実験は成功。環境中の有害物質を検出するタンパク質も開発されています。


鄭重声明:本文の著作権は原作者に帰属します。記事の転載は情報の伝達のみを目的としており、投資の助言を構成するものではありません。もし侵害行為があれば、すぐにご連絡ください。修正または削除いたします。ありがとうございます。