実臨床データと表現学習を用いた新たな適応症探索アプローチ
核心概念
本稿では、実臨床データと表現学習を用いることで、既存および新規の作用機序(MoA)に対して、有効性の高い適応症を網羅的に特定し、優先順位付けを行う新しいアプローチを紹介する。
要約
実臨床データと表現学習を用いた新たな適応症探索: アンチIL-17Aのケーススタディ
本稿は、実臨床データ(RWD)と表現学習を用いた、新たな医薬品適応症探索アプローチを提案する研究論文である。創薬プロセスにおいて、新規の作用機序(MoA)を持つ治療薬や、既に複数の適応症で承認されている治療薬のライフサイクルマネジメントにおいて、どの適応症を追求するかの優先順位付けは極めて重要である。しかし、従来の創薬における適応症探索は、専門家の意見や文献データに頼ることが多く、成功率が低いという課題があった。
本研究では、RWDから臨床イベントの埋め込み表現を取得するために表現学習を用いる新しいアプローチを提案する。このアプローチは、確立されたMoAと新規MoAの両方に適用できる。確立されたMoAの場合、承認された適応症や第II相/第III相臨床試験で成功した適応症に基づいて参照疾患が選択される。新規MoAの場合、初期の試験データ、オミクス、文献、分子知識グラフなどから参照疾患が導き出される。
本研究では、確立されたMoAであるアンチIL-17Aを対象に、このアプローチの有効性を検証した。アンチIL-17Aは、複数のダウンストリームプロセスに影響を与える炎症性シグナルタンパク質であるインターロイキン17Aを阻害する抗体ベースの治療薬である。このMoAには、承認された適応症がいくつかあり、さらに様々な結果が得られている第II相または第III相臨床試験もいくつか実施されており、定量的な評価のための検証が可能である。
Indication Finding: a novel use case for representation learning
適応症探索のパフォーマンス評価
ランク付けされたリストの定量的評価
臨床試験のエビデンスは、計算機による創薬の取り組みから得られた結果を検証するためによく用いられる。本研究では、MoAが有効であることが実証されている診断を陽性検証、MoAが有効ではないことが示されている診断を陰性検証と定義した。得られたリストにおけるそれらの絶対順位と相対順位を用いて、本アプローチを評価した。その結果、陽性検証が陰性検証よりも上位にランク付けされた場合、このアプローチは成功確率の高い適応症と低い適応症を区別する上で価値を提供できることを示している。
ランク付けされたリストの定性的評価
文献レビューは、計算論的アプローチによって生成された適応症選択の結果を裏付けるためによく用いられる。アンチIL-17Aのケーススタディでは、疾患の病理にIL-17Aの増加が関与していることを示す査読付き論文が特定できた場合、その適応症は臨床的に妥当であるとみなした。
アンチIL-17A MoAの埋め込みの質の評価
予測タスクにおけるパフォーマンス
埋め込みを定量的に評価するために、様々な二値分類タスクにおける特徴量としての予測力を評価した。その結果、埋め込みは、元の臨床イベントと同様のレベルでタスクを正常に実行するために必要な情報をエンコードし、次元数はほんの一部であることが期待される。
埋め込みの解釈可能性:ICD-10カテゴリとの比較
臨床的な解釈可能性を評価するために、Uniform Manifold Approximation and Projection(UMAP)を用いて、診断埋め込みの表現が2次元空間にどのようにマッピングされるかを視覚的に調べた。各診断は、それが属するICD-10カテゴリに従って色分けされた。その結果、生成された表現は、同じカテゴリの診断が一緒にグループを形成することによって示されるように、臨床的に受け入れられている類似性を広く捉えていることがわかった(図3参照)。詳細に調べると、同じカテゴリのグループが2次元空間の異なる領域にマッピングされ、より広範なICD-10カテゴリ内のサブカテゴリを表している。
新しい治療用MoAの適応症の選択は、創薬における重要な課題であり続けている。RWDの深度と多様性は、疾患の生物学的理解を深めるためにますます探求されており、製品ライフサイクル全体にわたる用途がある。本稿で紹介する研究は、RWDに適用された表現学習が、特定のMoAに適した診断を特定し、ランク付けできることを示している。
本稿では、確立されたMoAに適応症探索アプローチを適用し、複数の承認された適応症と、参照の定義と検証のための臨床試験における肯定的および否定的な結果を示した。このアプローチは、承認された適応症や臨床試験での検証がない新規MoAにも適用できる。このような場合、参照の選択は、オミクス、文献、知識グラフなど、より広範な情報源からのエビデンスに基づく。参照は、新規MoAが作用する標的に対する関連性が最も強い疾患として定義される。時間の経過とともに、対象となるMoAに関するより広範なエビデンスベースが確立されるにつれて、参照として選択された疾患を絞り込み/更新して、利用可能な最新のエビデンスに基づいてランク付けされたリストを再生成することができる。
広範な特徴量空間を活用することは、患者の表現型を特徴付け、広範な検索を可能にするために重要なステップである。アンチIL-17Aのケーススタディでは、診断、処方、診断手技の特徴量を定義し、特定の臨床検査がオーダーされたかどうかを含めた。可能であれば、臨床検査の結果は、高/低/正常または正常/異常の結果を記録することで組み込むことができる。臨床検査は一部の診断において重要な要素を形成するため、臨床医はこれを望むかもしれない。しかし、多くのRWDでは、臨床検査の結果にアクセスできない(または限られたアクセスしかない)。検査結果が患者にとって臨床的に重要なものであれば、患者の治療経過に変化が生じ、それが他の利用可能な特徴量にわたって検出される可能性があると主張する人もいるかもしれない。
各適応症の全体的なランキングは、個々の参照との近接性の結果を集約したものである。すべての参照疾患と類似している診断(したがって、上位にランク付けされる)は、参照疾患と同じ基礎となる経路を、その病因に関連して、共有している可能性が高い。ケーススタディでは、MoAの有効性についてすべての参照において均等な信頼性を持ち、したがってIL-17A経路がそれらにとって重要であると考えたが、参照によって信頼性が異なる場合は、最終的な集約において重み付けを行うことでこれを組み込むことができる。さらに、参照全体の結果を集約するために、異なる方法を用いることができる。本稿では、順位の中央値を用いたが、参照全体で近接度スコアを直接合計するのも有効な集約方法である。
この方法は、大規模な患者コホート(例:IL-17Aのケーススタディでは1,780万人)を活用することができる。検索空間を広げ、使用されるエビデンスを最大化するためには、幅広いコホートを持つことが有益であるが、他のRWDソースでは、コホートが小さくなる可能性がある。コホートサイズが結果に与える影響を定量化するために、アブレーションスタディを実施した。その結果、コホートサイズを3分の1に減らしても、上位100位以内にランクインする陽性検証は変化しなかったが、コホートサイズを6分の1に減らすと、一部の実行において、上位100位以内にランクインする陽性検証が33%減少することがわかった。これは、このアプローチがより小さなコホートサイズでも有効であることを示している。
本稿で説明する適応症探索のアプローチは、臨床イベントの表現を導き出すための特定の方法に縛られていない。今後の課題としては、EHRの分野に適応した言語モデル、例えばBEHRT[39]から導き出された埋め込みの探求が有望な方向性である。これらのタイプのモデルを用いて導き出された埋め込みは、再入院予測[15]や死亡率予測[27]など、臨床タスクにおいても堅牢なパフォーマンスを発揮することが証明されている。
結論として、本稿では、データ駆動型の定量的な適応症探索アプローチと、体系的な評価フレームワークを紹介した。また、アンチIL-17Aに対するこのアプローチの適用が成功したことを実証した。このアプローチは、従来の適応症探索方法と併用することで、臨床試験の成功確率を高めることができる。
深掘り質問
臨床試験の成功確率を高めるためには、今回紹介されたアプローチ以外にも、どのような方法が考えられるでしょうか?
臨床試験の成功確率を高めるためには、実臨床データとAI技術を活用した今回のアプローチ以外にも、多角的な戦略と最新技術の統合が求められます。以下に、その代表的な方法と、本アプローチとの関連性を示します。
バイオマーカーを用いた患者層別化:
従来の臨床試験では、疾患の診断基準に基づいて患者が選抜されてきましたが、疾患の生物学的特性は患者ごとに異なり、治療効果にもばらつきが生じることが課題でした。
バイオマーカーを用いることで、疾患のサブタイプや患者の反応性を予測し、より効果が見込める患者層に絞った臨床試験のデザインが可能になります。
今回のアプローチで特定された疾患と、その疾患におけるバイオマーカー研究を組み合わせることで、より精密な患者層別化が可能となり、臨床試験の成功確率を高めることが期待されます。
オルガノイドや臓器チップを用いた試験:
動物実験に代わる、ヒト細胞を用いた試験系として、オルガノイドや臓器チップが注目されています。
これらの技術を用いることで、生体内の複雑な環境を模倣した条件下で薬剤の効果や毒性を評価することが可能となり、臨床試験の予測精度向上に貢献します。
今回のアプローチで特定された疾患のオルガノイドや臓器チップを開発し、薬剤の効果を事前に検証することで、臨床試験の成功確率を高めることが期待されます。
リアルワールドデータの更なる活用:
電子カルテ情報だけでなく、ウェアラブルデバイスやモバイルヘルスアプリから得られるデータなど、より多様な実臨床データを統合することで、患者の状態をより詳細に把握し、臨床試験のデザインやエンドポイントの設定に活用できます。
今回のアプローチは診断、処方、検査データを用いていましたが、これらのデータに加え、患者の行動や生活習慣、遺伝情報などを統合することで、より個別化された適応症探索が可能となり、臨床試験の成功確率の向上に繋がると考えられます。
これらの方法を組み合わせることで、より効率的かつ効果的な創薬プロセスを構築し、新薬開発の成功確率を高めることが期待されます。
患者データのプライバシー保護の観点から、実臨床データを用いた適応症探索はどのような課題を抱えているでしょうか?
実臨床データを用いた適応症探索は、創薬プロセスに革新をもたらす可能性を秘めている一方で、患者データのプライバシー保護という重要な課題を抱えています。
個人情報の匿名化:
実臨床データには、氏名、住所、生年月日など、個人を特定できる情報が含まれている場合があり、これらの情報は厳重に保護する必要があります。
匿名化技術を用いて個人情報を削除または変換する必要がありますが、完全に匿名化することは難しく、データの有用性を維持しながらプライバシーを保護するバランスが求められます。
データセキュリティ:
実臨床データは、サイバー攻撃や情報漏洩の標的となる可能性があり、不正アクセスやデータの改ざんを防ぐための強固なセキュリティ対策が不可欠です。
データの暗号化、アクセス制御、セキュリティ監査など、多層的なセキュリティ対策を講じる必要があります。
データガバナンス:
実臨床データの利用目的、利用方法、責任の所在などを明確化し、適切なデータガバナンス体制を構築する必要があります。
データの利用に関する透明性を確保し、患者からの信頼を得ることが重要です。
法規制への準拠:
個人情報保護法や医療情報保護法など、実臨床データの取り扱いに関する法規制を遵守する必要があります。
各国の法規制は異なるため、国際的なデータ共有や共同研究を行う際には、特に注意が必要です。
これらの課題を解決するために、技術的な対策だけでなく、倫理的な観点からの議論や法整備なども必要となります。患者からの信頼を得ながら、実臨床データを有効活用していくことが、今後の創薬プロセスにおいて重要となります。
AI技術の進化は、今後、創薬プロセスをどのように変えていくと考えられるでしょうか?
AI技術の進化は、創薬プロセス全体を大きく変革し、より効率的かつ効果的なものへと導くと考えられます。
創薬ターゲットの発見・検証の加速化:
AIは、膨大な量の論文データや遺伝子情報、臨床データなどを解析し、疾患と関連性の高い遺伝子やタンパク質を特定することで、新たな創薬ターゲットの発見を加速します。
また、シミュレーション技術と組み合わせることで、ターゲット候補の絞り込みや検証を効率的に行うことが可能になります。
新規化合物の設計・合成の効率化:
AIは、化合物の構造と活性の関係性を学習し、目的の活性を持つ化合物を設計することができます。
これにより、従来の経験や勘に頼った方法よりも効率的に、新規化合物を創出することが可能になります。
また、ロボット技術と組み合わせることで、化合物の合成やスクリーニングを自動化し、さらに効率化を図ることも期待されます。
臨床試験のデザイン最適化と予測精度向上:
AIは、患者の臨床データや遺伝子情報などを分析し、最適な臨床試験のデザインを支援します。
効果的な患者層別化やエンドポイントの設定が可能となり、臨床試験の成功確率を高めることが期待されます。
また、臨床試験の進捗状況をリアルタイムに予測し、リスク管理や意思決定を支援することも可能になります。
これらの変化により、創薬にかかる時間とコストを大幅に削減し、より多くの患者に、より早く新薬を届けることが可能になると期待されます。
しかし、AI技術の進化は、倫理的な課題や雇用への影響など、新たな課題も提起しています。AI技術のメリットを最大限に活かしながら、これらの課題にも適切に対処していくことが、今後の創薬プロセスにおいて重要となります。