1. 予測モデル構築のための方法論

Y先生は、着任日に前任の先生と焼き鳥を食べました。ふわふわの焼き鳥とサッポロクラシックで舌を楽しませましたが、翌日残念なことに二人ともお腹を壊してしまいました。前任の先生はすぐに快復しましたが、Y先生は4日間発熱が続き、とても苦しみました。

リスクとベネフィットのバランスを基に人は行動します。焼きすぎてパサパサになってしまった焼き鳥はおいしさが損なわれると感じるでしょう。しかし十分に加熱されていないお肉を食べることは、人によっては最悪死に至る危険性があります。リスクとベネフィットは人によって変化します。もし、Y先生は、(1)自身が食あたりで苦しむリスクを、(2)自身の健康状態をもとに理解し、(3)焼き具合に応じた味とリスクのバランスを知って、適切な判断をできていたらもう少ししっかりと焼いてもらうようお願いしていたかもしれません。

生物統計学には、ある結果 (outcome) をもたらす原因を調べる「因果」と結果がどうなるかをなるべく精確に調べる「予測」という考え方があり、互いにモデルの構築手順が異なります。ここでの「予測」には、食あたりにあう確率のようなイベント発生予測だけでなく、どの程度重症化するかや、何日間苦しむかのような情報を当てることまで含まれます。

(1) のようなリスクを予測するための統計モデルを構築する上で、イベント発生予測モデルに関する方法論研究は盛んですが、重症度や疾病で苦しむ期間をどう加味するかという方法論はこれから展開されていくでしょう。

予測モデルを構築するため利用する(2)自身の健康状態データは、研究開始時に測定したならばベースライン (baseline) データ、後者のように時間経過ともに値が変わるならば経時 (longitudinal) データと呼びます。実はベースラインデータをモデルに組み入れることは、通常の回帰分析という手法でできますが、経時データはある種の結果でもあるために単純な回帰分析では正しくリスク予測ができないという問題が生じます。このことへの対処法は生物統計学の hot topics のひとつです。

(3)のリスクとベネフィットのバランスを活用することはとても難しい課題です。なぜなら、人によって判断する基準が異なるからです。例えば、2,3日寝込んでも構わないからできるだけレアでお肉を食べたい人もいれば(注:おすすめしません)、絶対に食あたりには遭いたくないし、食事はただの栄養補給にすぎないからよく焼いたお肉を食べたい人だっているでしょう(注:食事に興味がないのなら肉を食べる必要はないかもしれませんが)。判断基準に応じたリスクとベネフィットのバランスを表現するために、usefulness という概念が導入され、今後盛り上がりをみせるであろう生物統計学の研究分野のひとつになるでしょう。

焼き鳥の話は例えで、実際には同じような疾患でもその後の経過が人によって異なる場合に、予測モデルを構築・利用します。すると、重症化しやすい患者さんには治療を強化し、比較的軽症な患者さんには副作用の問題があるので治療を弱めるといった、その患者さんにとってふさわしい治療を選び、医療資源を最適に配分することができるようになります。例えば、北米において前立腺がんを治療した人は、後の検診で測定するPSAという前立腺がんの健康状態マーカーの値を入力することで、将来どの程度の再発確率となるかを知ることができ、患者さんが治療方針に関する情報収集をする上で大いに役立つのです(https://psacalc.sph.umich.edu/)。

当教室では、予測モデルの構築に関する方法論を日々考えています。

最後にですが、お肉は十分に加熱して頂きましょう。

2. 臨床試験デザインの開発

お薬や医療機器、最近では再生医療等製品といった新たな治療法の開発を行う上で、ヒトに対して新たな治療法を行い、その結果を評価する、臨床試験 (clinical trial) が行われます。

臨床試験では、統計的仮説検定を用いて、有意 (significant) な結果が得られた場合に「治療効果があった」と結論づけます。
臨床試験を計画する上で、何人に研究参加をお願いするかを定めます(サンプルサイズといいます)。サンプルサイズの決め方は、想定される治療効果の大きさで臨床試験を仮に100回行えたら、80回有意な結果が得られるくらいの人数とします。さらにサンプルサイズを大きくと、より有意な結果が得られやすくなりますが、そういったことは通常しません。理由のひとつに、新治療が効かない場合に危険に晒す人を増やしてしまうので、仮説を示すために最小限の人数にすべき、という倫理的なものがあります。
そこで、なるべく小さなサンプルサイズで仮説を示すために臨床試験のデザインを提案する研究を行います。

中間解析 (interim analysis) は、計画時に考えていたよりも大きな治療効果がみられた場合に早く世に治療法を公表するため、もしくは全く治療効果がみられない・むしろ悪化させるという場合に早く開発を止めるために臨床試験を中止するための方法論です。少し似ていますが、治療効果が計画時より少し小さいものの医学的には十分に意義のある大きさであれば、きちんと有意な結果を引き出すためにサンプルサイズを少し増やす、サンプルサイズ再設計法 (sample size re-estimation) というのもあります。開発早期におけるヒトへの安全性や薬理作用をみるための臨床試験では多くの用量を試すので、有効性に関する検討もついでに行ってしまおうというデザインもあります。さらに有効そうな用量がわかったら、その用量のサンプルサイズを大幅に増やして試験を継続し、あれこれ調べようというデザインまで最近では提案されています。

がんの分子標的薬や本庶先生が2018年ノーベル生理学・医学賞を受賞された免疫チェックポイント阻害剤のように、同じ臓器にがんができた患者さんでも、一部の人にだけ抜群に効いて、他の人にはほとんど効かないような薬剤が最近続々と登場しています。そこで、効くか効かないかを判別しそうな特定の遺伝子やタンパクといったバイオマーカーを用いた臨床試験デザインの提案が盛んです。バイオマーカーは確固たるものではない場合には、バイオマーカーの陽性/陰性で分けて臨床試験を行うものの、結果に応じて最適な解析法を選ぶようなデザインがあります。また、同じ薬剤でいくつかの部位に効くことがあるため、開発途中では様々な部位にできたがんに薬剤を試します。同時並行で試験を行い、結果が似るようであれば併せて解析をすることで、合計のサンプルサイズを減らす basket 試験というデザインがあり、この方法論の開発をすすめています。

他にも希少疾患に関する臨床試験は、どうしてもサンプルサイズを小さくせざるを得ないので、これまでの臨床経験をデータにして臨床試験で役立てるデザイン開発も行っています。ベイズ流統計学がうまく合う分野なので、我々含め、世界中でベイズ流の臨床試験デザインの提案が盛んです。

3. 生物統計学の実践

臨床試験への統計家としての参画や統計コンサルテーションを通して、多くの共同研究を実施しています。古典的方法から最新の方法まで、医学的仮説を示すためにできるだけふさわしい方法を検討しています。