自然界に存在しない人工たんぱく質を、機械学習技術を用いてデザインすることで、新たな抗体や酵素などの治療薬を作り出すことを目指すバイオベンチャー
背景とテクノロジー:
・核たんぱく質、膜たんぱく質、ヘムたんぱく質、リポたんぱく質、熱ショックたんぱく質、収縮たんぱく質など、多種多様な天然たんぱく質は、極めて高い効率、経済性、精密な動作、合成時の自己組織化など、人工機械と比較して驚くほど優れた特性を示している。その膨大な量と素晴らしい品質、そして多能性を考慮すると、たんぱく質材料は、多くの深刻な社会的課題に対する解決策を提供できる可能性があるため、大きな注目を集めている。
・しかし、ネイティブなたんぱく質は、使用環境が厳しく制限され、寿命も比較的短いため、人間の旺盛な要求に十分に応えることはできない。また、天然たんぱく質は数百万年の進化を経て、自然の選択圧のもとで徐々に最適化されてきたものであるため、数百年以内に人間社会で生じる課題に対応できる可能性は原理的に低い。そこで、人工的にたんぱく質を改変し、さらに一歩進んで、ゼロから新しいたんぱく質をデザインすることが、時代の要請として浮上してきた。幸いなことに、これまでのたんぱく質の生化学的、生物物理学的研究の蓄積により、たんぱく質設計が技術的に可能になってきている。
・従来のたんぱく質の立体構造予測プログラムは、ペプチドの長さが長くなるにつれて(特にペプチドの長さが20残基以上の場合)、アルゴリズムの性能は低下する。しかし、一次たんぱく質配列データのみを入力として与えたコンピュータープログラムAlphaFoldが、この配列が折り畳まれる三次元配置を決定する際の実験精度とほぼ一致すると発表している。AlphaFoldは短いペプチドだけでなく、数百アミノ酸の長さのたんぱく質配列や、たんぱく質の折り畳まれる三次元配置をもこの精度で予測可能である。
・しかし、非正規アミノ酸(天然に存在しないアミノ酸を含む)を構成するたんぱく質に関しては、AlphaFoldは他のテンプレートベースのアプローチと同様に、生物進化によって生成されたたんぱく質のサブセットから学習して予測を行うため、あまり役に立たない。配列と構造の関係のあるライブラリでトレーニングされた機械学習は、そのライブラリ内のものからかけ離れた配列まで予測を拡張することはできない。相同性に基づくテンプレートモデリングの限界は、たんぱく質フォールド空間の「暗黒物質」を扱う人々にとって、すでに現実のものとなっている。
・一方で、その逆問題、つまり、特定の形に折り畳まれる残基の配列をどのように設計するかという問題もある。この問題を解決するため、GAN(Generative Adversarial Networks)などの生成モデルを用いて、新しいバックボーンを設計することが試みられている。GANは、既知のたんぱく質のバックボーンを用いて、自然界に存在しない形状のバックボーンを生成することを試みる。また、逆たんぱく質折りたたみ問題に対する手法として、現在最先端の性能を発揮しているTIMED(Three-dimensional Inference Method for Efficient Design)を改良することも試みられている。
・この2つの問題に成功すれば、de novoたんぱく質の設計に必要なすべてのツールを手に入れることができる。そして、この方法を用いて、触媒効率の向上や安定性の向上など、特定の用途を念頭に置いたたんぱく質の設計や再設計を行うことができるようになることが期待される。
・今回紹介するGenerate Biomedicinesは、機械学習アルゴリズムによって、自然界では見たこともないようなたんぱく質の新しい配列を生成することで、まったく新しいたんぱく質や治療法を生み出し、病気の治療や複雑な生物学的課題の解決を目指すバイオベンチャーである。
・Generate Biomedicinesの機械学習アルゴリズムは、何億もの既知のたんぱく質を分析し、アミノ酸配列、構造、機能を結びつける統計的パターンを探す。この統計的パターンを利用して、短いペプチドから複雑な抗体、酵素、遺伝子治療薬、そしてまだ解明されていないたんぱく質組成物に至るまで、カスタムたんぱく質治療薬を生成している。
・技術の詳細は未開示。モノクローナル抗体、バイスペシフィック、細胞療法など、モダリティにとらわれないアプローチを行っている。自社で製造するタンパク質の構造を決定するためにクライオ電子顕微鏡に投資し、そのデータを自社のプラットフォームにフィードバックして性能を向上させることを目指している。
パイプライン:未開示
重点領域は、がん、免疫、感染症。社内パイプラインは、昨年末にオミクロンが出現したときに着手したSARS-CoV-2のスパイクたんぱく質の保存領域に対する広範な中和抗体の研究が中心になっている。すべてのSARS-CoVウイルスに高度に保存されているS2ドメインの中和剤を見出している。来年初めまでにFDAに臨床試験の開始を申請できることが期待される。
最近のニュース:
複数の治療領域と複数の治療法にわたる5つの臨床標的に対するたんぱく質治療薬の発見と創出に関する共同研究契約をAmgenと締結
コメント:
・Modernaの創業を主導したFlagship PioneeringのパートナーCEOであるMike NallyがGenerate BiomedicinesのCEOを務めている。
・サイトカインの中には強い免疫調節作用を持つものが報告されているが、その多くは複数のシグナルを流してしまうために副作用が問題となっている。Generate Biomedicinesのような合成生物学的アプローチで、有益なシグナルだけを誘導する人工サイトカインなどの開発が進められている。機械学習技術を用いた人工たんぱく質デザインは知見が集まるほど成功確率が上がっていく可能性が高い。いずれ非常に強力なプラットフォーム技術になるかもしれない。
キーワード:
・de novoたんぱく質
・合成生物学
・人工知能(AI)創薬
・感染症
・免疫
免責事項:
正確な情報提供を心がけていますが、本内容に基づいた如何なるアクションに対してもケンは責任をとれません。よろしくお願いします。
Comments