logo_w
logo_w
  1. TOP
  2. メディア
  3. 分子モデリングソフト
  4. バーチャルスクリーニング

バーチャルスクリーニングで候補化合物を絞り込む|手法と成功のポイント

バーチャルスクリーニングは、コンピュータを用いて大規模な化合物ライブラリから創薬候補を効率的に選別する手法です。標的タンパク質との結合性や既知活性化合物との類似性を計算で評価し、実験に進める化合物を事前に絞り込むことで、創薬の成功確率を高めながら時間とコストを削減できます。

本記事では、バーチャルスクリーニングの基本概念と手法分類(SBVS・LBVS)、HTSとの違い、実施の流れと注意点、そしてAI・機械学習を活用した最新のアプローチまでを解説します。

この記事で分かること

  • バーチャルスクリーニングの基本概念と創薬における位置づけがわかる。
  • 構造ベース(SBVS)とリガンドベース(LBVS)の手法の違いと使い分けが理解できる。
  • HTSとの比較から、バーチャルスクリーニングの優位性と相互補完的な活用法がわかる。
  • 準備からスクリーニング実行、結果評価までの実施フローとポイントを把握できる。
  • AI・機械学習や超大規模ライブラリ対応など、最新のアプローチを理解できる。

バーチャルスクリーニングとは

バーチャルスクリーニングとは、コンピュータを用いて大規模な化合物ライブラリから創薬候補となる化合物を選別する手法です。標的タンパク質との結合性や、既知活性化合物との類似性などを計算によって評価し、有望な候補を絞り込みます。この手法により、数百万から数十億規模の化合物を短時間で評価することが可能になりました。

実験に進める化合物を事前に選別することで、創薬の成功確率を高めながら、時間とコストを大幅に削減できます。バーチャルスクリーニングは、インシリコ創薬の中核を担う技術として位置づけられています。

創薬ターゲットが決定した後、ヒット化合物を探索する段階で特に威力を発揮します。

HTSとの違い

バーチャルスクリーニングと比較されることが多いのが、ハイスループットスクリーニング(HTS)です。両者の特徴を理解することで、それぞれの適切な活用場面が見えてきます。

ハイスループットスクリーニング(HTS)の特徴

HTSは、ロボットや自動化システムを用いて、数万から数十万の化合物を実験的に評価する手法です。実際の生物学的アッセイを用いるため、得られる結果の信頼性は高いといえます。

一方で、評価できる化合物数には物理的な限界があり、すべての化合物を合成・保管する必要があります。アッセイの開発や実施には相応の時間とコストがかかる点も考慮が必要です。

バーチャルスクリーニングの優位性

バーチャルスクリーニングでは、化合物を実際に合成することなく、構造情報のみで評価を行います。そのため、評価できる化合物数に事実上の制限がなく、市販されていない仮想化合物も含めて探索できます。

計算機の性能向上により、HTSと比較して大幅に短い時間で結果が得られるようになっています。コスト面でも、計算資源の費用は実験コストと比べて一般的に低く抑えられます。

相互補完的な活用

バーチャルスクリーニングとHTSは、どちらか一方を選ぶというよりも、相互補完的に活用されることが多くなっています。バーチャルスクリーニングで候補を絞り込んだ後、選ばれた化合物に対してHTSや個別のアッセイを実施するという流れが一般的です。

このアプローチにより、HTSの規模を縮小しながらも、ヒット率を向上させることができます。探索空間を広くカバーしつつ実験コストを抑える、効率的なスクリーニング戦略を構築できます。

バーチャルスクリーニングの種類

バーチャルスクリーニングは、利用する情報や手法によっていくつかの種類に分類されます。目的や利用可能なデータに応じて、適切な手法を選択することが重要です。

構造ベースバーチャルスクリーニング(SBVS)

構造ベースバーチャルスクリーニング(Structure-Based Virtual Screening、SBVS)は、標的タンパク質の立体構造情報を活用する手法です。分子ドッキングを用いて、各化合物が標的タンパク質の結合部位にどのように結合するかを予測し、結合親和性をスコアとして評価します。

SBVSを実施するには、標的タンパク質の高精度な立体構造が必要です。X線結晶構造解析やクライオ電子顕微鏡で決定された構造、あるいはホモロジーモデリングで構築したモデルが用いられます。

リガンドベースバーチャルスクリーニング(LBVS)

リガンドベースバーチャルスクリーニング(Ligand-Based Virtual Screening、LBVS)は、既知の活性化合物の情報を活用する手法です。標的タンパク質の構造が不明な場合でも適用できるのが特長です。LBVSでは、主に以下のようなアプローチが用いられます。

類似性検索では、既知の活性化合物と構造的に類似した化合物をライブラリから検索します。分子フィンガープリントと呼ばれる構造の特徴を数値化した指標を用いて、類似度を計算します。ファーマコフォアスクリーニングでは、活性化合物群から抽出した薬理活性に必要な特徴(ファーマコフォア)をモデル化し、そのモデルに適合する化合物を検索します。

機械学習モデルでは、既知の活性・不活性化合物のデータを学習させたモデルを構築し、新規化合物の活性を予測します。近年はディープラーニングの導入により、予測精度が向上しています。

両手法の使い分け

SBVSとLBVSは、それぞれ異なる強みを持っています。標的タンパク質の構造が既知で、結合部位が明確な場合はSBVSが有効です。一方、構造情報がない場合や、活性化合物のデータが豊富にある場合はLBVSが適しています。

両手法を組み合わせて使用することで、より信頼性の高い結果を得られる場合もあります。SBVSで得られた候補をLBVSでフィルタリングする、あるいはその逆のアプローチも有効です。

化合物ライブラリの選定

バーチャルスクリーニングの結果は、スクリーニング対象となる化合物ライブラリの質と規模に大きく左右されます。目的に応じて適切なライブラリを選定することが、ヒット率向上の鍵となります。

市販化合物データベース

市販化合物データベースは、試薬メーカーから購入可能な化合物を収録したものです。ヒット化合物が見つかった場合にすぐ購入して実験検証に進められるため、迅速なフォローアップが可能です。

代表的なものとして、ZINC(無料公開)やEnamine REAL(合成可能な化合物を網羅的に収録)などがあります。これらのデータベースは三次元構造が付与された形で提供されており、スクリーニングの前処理を効率化できます。

バーチャルライブラリ

バーチャルライブラリは、合成可能と推定される仮想化合物を列挙したものです。実際にはまだ合成されていないものの、既知の合成反応の組み合わせによって合成できると予測される化合物を含みます。

バーチャルライブラリの規模は数十億から数百億化合物に達する場合があり、市販化合物データベースでは探索できない広大な化学空間をカバーできます。ただし、ヒット化合物を実験検証するには合成が必要となるため、合成の実現可能性を事前に考慮しておくことが重要です。

自社化合物ライブラリ

製薬企業が保有する自社化合物ライブラリも、バーチャルスクリーニングの対象として活用されます。過去のプロジェクトで合成された化合物を新しい標的に対して再評価することで、既存資産を有効活用できます。

自社ライブラリは化合物がすでに手元にあるため、ヒットの実験検証が迅速に行える利点があります。一方、化学的多様性に偏りがある場合があるため、外部データベースと組み合わせて使用することが推奨されます。

実施の流れと注意点

バーチャルスクリーニングを成功させるためには、適切な準備と各ステップでの注意が必要です。ここでは、一般的な実施の流れと各段階でのポイントを解説します。

準備段階:標的とライブラリの設定

標的タンパク質の準備(SBVSの場合)では、立体構造データの取得と前処理を行います。水分子や共結晶化リガンドの処理、水素原子の付加、プロトン化状態の設定などが含まれます。結合部位の定義も重要なステップです。

参照化合物の準備(LBVSの場合)では、既知の活性化合物を収集し、必要に応じて三次元構造を生成します。活性値のばらつきや測定条件の違いにも注意が必要です。

化合物ライブラリの準備では、目的に応じたデータベースを選定し、化合物の三次元構造生成やフィルタリング(薬物らしさの基準による絞り込み)を事前に行います。ライブラリの規模と計算資源のバランスも考慮します。

スクリーニングの実行

準備が整ったら、選択した手法でスクリーニングを実行します。SBVSでは、ライブラリ内の各化合物に対してドッキング計算を行い、スコアを算出します。計算時間は化合物数とドッキングの精度設定に依存するため、計算資源と精度のバランスを考慮して設定を決定します。

LBVSでは、類似性計算やファーマコフォアマッチングを実行します。一般的にSBVSよりも計算時間は短くなります。

超大規模ライブラリを対象とする場合は、段階的なフィルタリング戦略が有効です。まず簡易的なフィルタで候補を絞り込み、通過した化合物に対してより精密な計算を適用するという多段階アプローチにより、計算コストを抑えつつ広い化学空間を探索できます。

結果の評価と候補の選定

スコアによるランキングでは、計算されたスコアに基づいて化合物を順位付けします。ただし、スコアの絶対値よりも相対的な順位を重視することが一般的です。視覚的な確認も重要であり、特にSBVSでは上位にランクされた化合物の結合ポーズを目視で確認し、化学的に妥当かどうかを判断します。

多様性の確保も考慮すべき点です。スコア上位の化合物だけを選ぶと、構造的に類似した化合物に偏る可能性があります。異なる骨格を持つ化合物を意図的に含めることで、ヒットの多様性を確保できます。

ADMET特性の考慮も選定段階で重要です。活性が期待できても、薬物動態や毒性に問題がある化合物は後の段階で脱落します。ADMET予測を併用して、早期にリスクのある化合物を除外することが推奨されます。

AI・機械学習を活用したバーチャルスクリーニング

近年、AI・機械学習技術の進展に伴い、バーチャルスクリーニングの手法にも大きな変化が生じています。従来の物理ベースのアプローチに加え、データ駆動型の手法が創薬現場で活用され始めています。

機械学習ベースのスコアリング関数

従来のドッキングスコアリング関数は、物理化学的なエネルギー項の線形結合で結合親和性を近似するものが主流でした。しかし、これらの関数は溶媒効果やエントロピー変化の扱いに限界があり、予測精度に課題がありました。

機械学習ベースのスコアリング関数(MLSF)は、タンパク質-リガンド複合体の構造的特徴を入力として学習し、結合親和性をより高い精度で予測します。グラフニューラルネットワーク(GNN)や三次元畳み込みニューラルネットワーク(3D-CNN)などの深層学習アーキテクチャが活用されています。

ただし、MLSFの汎化性能(学習データに含まれない標的に対する予測精度)には課題が残っており、適用範囲の見極めが重要です。

能動学習による効率的なスクリーニング

能動学習(Active Learning)は、超大規模ライブラリのスクリーニングを効率化するアプローチです。ライブラリ全体にドッキング計算を行う代わりに、一部の化合物のみを計算し、その結果から機械学習モデルを逐次的に更新しながら有望な化合物を探索します。

このアプローチにより、計算量をライブラリ全体の一部に抑えながら、高スコア化合物の大半を効率的に発見できます。数十億規模のバーチャルライブラリに対するスクリーニングを実用的な計算コストで実現する手法として注目されています。

GPU・クラウドコンピューティングの活用

超大規模バーチャルスクリーニングを支える基盤技術として、GPU計算やクラウドコンピューティングの活用が進んでいます。GPUの並列計算能力を活用することで、ドッキング計算の速度が大幅に向上しました。

クラウド環境では、必要なときに大量の計算資源を柔軟に確保できるため、オンプレミス環境では困難だった規模のスクリーニングが実施可能になります。これにより、数十億規模の化合物ライブラリを対象としたドッキングスクリーニングが現実的な時間とコストで実行できるようになっています。

実験による検証

バーチャルスクリーニングで選定された候補化合物は、実験による活性評価へと進みます。計算による予測と実験結果を照合することで、スクリーニング手法の有効性を検証し、次回以降のプロセス改善に役立てることが重要です。

実験でヒットが確認された場合は、その化合物を起点としたリード最適化へと進みます。ヒット率が低い場合は、スクリーニング条件の見直しや別の手法の適用を検討します。

バーチャルスクリーニングは一度の実施で完結するものではなく、計算と実験のフィードバックサイクルを回すことで、探索の精度と効率を継続的に向上させることができます。

[バーチャルスクリーニング]に関連するFAQ

バーチャルスクリーニングとHTSはどちらを先に行うべきですか?

一般的には、バーチャルスクリーニングで候補を絞り込んだ後にHTSや個別のアッセイを実施する流れが効率的です。バーチャルスクリーニングを前段に置くことで、HTSの規模を縮小しながらヒット率を向上させることができます。

SBVSとLBVSはどのように使い分けますか?

標的タンパク質の立体構造が既知で結合部位が明確な場合はSBVSが有効です。構造情報がない場合や、既知活性化合物のデータが豊富にある場合はLBVSが適しています。両手法を組み合わせることで、より信頼性の高い結果を得られる場合もあります。

バーチャルスクリーニングにおけるAI・機械学習の役割は何ですか?

機械学習ベースのスコアリング関数による結合親和性予測の精度向上や、能動学習による超大規模ライブラリの効率的探索が主な役割です。これにより、従来の物理ベースのアプローチでは困難だった規模と精度のスクリーニングが実現できるようになっています。

化合物ライブラリはどのように選べばよいですか?

実験検証の迅速さを重視する場合は市販化合物データベース、広い化学空間を探索したい場合はバーチャルライブラリが適しています。自社化合物ライブラリの再活用も有効な選択肢です。目的に応じて複数のライブラリを組み合わせることが推奨されます。

バーチャルスクリーニングの結果はどの程度信頼できますか?

スコアの絶対値による結合親和性の定量的予測には限界がありますが、相対的な順位付けによる候補の絞り込みには有効です。視覚的な結合ポーズの確認や多様性の確保、ADMET予測との併用により、選定精度を高めることが重要です。

この記事のまとめ

  • バーチャルスクリーニングは、コンピュータを用いて大規模な化合物ライブラリから創薬候補を効率的に選別する手法である。
  • 手法はSBVS(標的タンパク質の構造を活用)とLBVS(既知活性化合物の情報を活用)に大別され、目的や利用可能なデータに応じて使い分ける。
  • 化合物ライブラリの選定(市販化合物DB、バーチャルライブラリ、自社ライブラリ)はヒット率に大きく影響する。
  • AI・機械学習の導入により、スコアリング精度の向上や能動学習による超大規模ライブラリの効率的探索が可能になっている。
  • 計算と実験のフィードバックサイクルを回すことで、スクリーニングの精度と効率を継続的に向上させることが重要である。

分子モデリングソフト関連製品・サービス

分子モデリングソフト関連記事