研究紹介 - 北海道大学大学院医学研究院社会医学分野医学統計学教室

1. 予測モデル構築のための方法論

Y先生は、着任日に前任の先生と焼き鳥を食べました。ふわふわの焼き鳥とサッポロクラシックで舌を楽しませましたが、翌日残念なことに二人ともお腹を壊してしまいました。前任の先生はすぐに快復しましたが、Y先生は4日間発熱が続き、とても苦しみました。

リスクとベネフィットのバランスを基に人は行動します。焼きすぎてパサパサになってしまった焼き鳥はおいしさが損なわれると感じるでしょう。しかし十分に加熱されていないお肉を食べることは、人によっては最悪死に至る危険性があります。リスクとベネフィットは人によって変化します。もし、Y先生は、(1)自身が食あたりで苦しむリスクを、(2)自身の健康状態をもとに理解し、(3)焼き具合に応じた味とリスクのバランスを知って、適切な判断をできていたらもう少ししっかりと焼いてもらうようお願いしていたかもしれません。

生物統計学には、ある結果 (outcome) をもたらす原因を調べる「因果」と結果がどうなるかをなるべく精確に調べる「予測」という考え方があり、互いにモデルの構築手順が異なります。ここでの「予測」には、食あたりにあう確率のようなイベント発生予測だけでなく、どの程度重症化するかや、何日間苦しむかのような情報を当てることまで含まれます。

(1) のようなリスクを予測するための統計モデルを構築する上で、イベント発生予測モデルに関する方法論研究は盛んですが、重症度や疾病で苦しむ期間をどう加味するかという方法論はこれから展開されていくでしょう。

予測モデルを構築するため利用する(2)自身の健康状態データは、研究開始時に測定したならばベースライン (baseline) データ、後者のように時間経過ともに値が変わるならば経時 (longitudinal) データと呼びます。実はベースラインデータをモデルに組み入れることは、通常の回帰分析という手法でできますが、経時データはある種の結果でもあるために単純な回帰分析では正しくリスク予測ができないという問題が生じます。このことへの対処法は生物統計学の hot topics のひとつです。

(3)のリスクとベネフィットのバランスを活用することはとても難しい課題です。なぜなら、人によって判断する基準が異なるからです。例えば、2,3日寝込んでも構わないからできるだけレアでお肉を食べたい人もいれば（注：おすすめしません）、絶対に食あたりには遭いたくないし、食事はただの栄養補給にすぎないからよく焼いたお肉を食べたい人だっているでしょう（注：食事に興味がないのなら肉を食べる必要はないかもしれませんが）。判断基準に応じたリスクとベネフィットのバランスを表現するために、usefulness という概念が導入され、今後盛り上がりをみせるであろう生物統計学の研究分野のひとつになるでしょう。

焼き鳥の話は例えで、実際には同じような疾患でもその後の経過が人によって異なる場合に、予測モデルを構築・利用します。すると、重症化しやすい患者さんには治療を強化し、比較的軽症な患者さんには副作用の問題があるので治療を弱めるといった、その患者さんにとってふさわしい治療を選び、医療資源を最適に配分することができるようになります。例えば、北米において前立腺がんを治療した人は、後の検診で測定するPSAという前立腺がんの健康状態マーカーの値を入力することで、将来どの程度の再発確率となるかを知ることができ、患者さんが治療方針に関する情報収集をする上で大いに役立つのです（https://psacalc.sph.umich.edu/）。

当教室では、予測モデルの構築に関する方法論を日々考えています。

最後にですが、お肉は十分に加熱して頂きましょう。

Inao T, Okada K, Yang Y, Yokota I. Simulation studies on the estimation of sensitivity and specificity in the absence of a gold standard and with rare positive frequencies. Commun Stat Simul Comput. 2024; 53: 5742–5751.
Yokota I, Matsuyama Y. Dynamic prediction of repeated events data based on landmarking model: application to colorectal liver metastases data. BMC Med Res Methodol. 2019;30:31.

2. 臨床試験デザインの開発

お薬や医療機器、最近では再生医療等製品といった新たな治療法の開発を行う上で、ヒトに対して新たな治療法を行い、その結果を評価する、臨床試験 (clinical trial) が行われます。

臨床試験では、統計的仮説検定を用いて、有意 (significant) な結果が得られた場合に「治療効果があった」と結論づけます。
臨床試験を計画する上で、何人に研究参加をお願いするかを定めます（サンプルサイズといいます）。サンプルサイズの決め方は、想定される治療効果の大きさで臨床試験を仮に100回行えたら、80回有意な結果が得られるくらいの人数とします。さらにサンプルサイズを大きくと、より有意な結果が得られやすくなりますが、そういったことは通常しません。理由のひとつに、新治療が効かない場合に危険に晒す人を増やしてしまうので、仮説を示すために最小限の人数にすべき、という倫理的なものがあります。
そこで、なるべく小さなサンプルサイズで仮説を示すために臨床試験のデザインを提案する研究を行います。

中間解析 (interim analysis) は、計画時に考えていたよりも大きな治療効果がみられた場合に早く世に治療法を公表するため、もしくは全く治療効果がみられない・むしろ悪化させるという場合に早く開発を止めるために臨床試験を中止するための方法論です。少し似ていますが、治療効果が計画時より少し小さいものの医学的には十分に意義のある大きさであれば、きちんと有意な結果を引き出すためにサンプルサイズを少し増やす、サンプルサイズ再設計法 (sample size re-estimation) というのもあります。開発早期におけるヒトへの安全性や薬理作用をみるための臨床試験では多くの用量を試すので、有効性に関する検討もついでに行ってしまおうというデザインもあります。さらに有効そうな用量がわかったら、その用量のサンプルサイズを大幅に増やして試験を継続し、あれこれ調べようというデザインまで最近では提案されています。

がんの分子標的薬や本庶先生が2018年ノーベル生理学・医学賞を受賞された免疫チェックポイント阻害剤のように、同じ臓器にがんができた患者さんでも、一部の人にだけ抜群に効いて、他の人にはほとんど効かないような薬剤が最近続々と登場しています。そこで、効くか効かないかを判別しそうな特定の遺伝子やタンパクといったバイオマーカーを用いた臨床試験デザインの提案が盛んです。バイオマーカーは確固たるものではない場合には、バイオマーカーの陽性／陰性で分けて臨床試験を行うものの、結果に応じて最適な解析法を選ぶようなデザインがあります。また、同じ薬剤でいくつかの部位に効くことがあるため、開発途中では様々な部位にできたがんに薬剤を試します。同時並行で試験を行い、結果が似るようであれば併せて解析をすることで、合計のサンプルサイズを減らす basket 試験というデザインや、臓器と薬剤の両者を並行的に比べるplatform試験があり、この方法論の開発をすすめています。

他にも希少疾患に関する臨床試験は、どうしてもサンプルサイズを小さくせざるを得ないので、これまでの臨床経験をデータにして臨床試験で役立てるデザイン開発も行っています。ベイズ流統計学がうまく合う分野なので、我々含め、世界中でベイズ流の臨床試験デザインの提案が盛んです。

Fuyama K, Sakamaki K, Uemura K, Yokota I. Impact of correlation structure on sample size requirements of statistical methods for multiple binary outcomes: A simulation study. Clin Trials. [Epub ahead of print]
Okada K, Tanaka S, Matsubayashi J, Takahashi K, Yokota I. Decoupling power and type I error rate considerations when incorporating historical control data using a test-then-pool approach. Biom J. 2024; 66: 2200312.
Fujikawa K, Teramukai S, Yokota I, Daimon T. A Bayesian basket trial design that borrows information across strata based on the similarity between the posterior distributions of the response probability. Biom J. 2020; 62: 330–338.

3. 生物統計学の実践

臨床研究への統計家としての参画や統計コンサルテーションを通して、多くの共同研究を実施しています。古典的方法から最新の方法まで、医学的仮説を示すためにできるだけふさわしい方法を検討しています。

Kuribara T, Asai Y, Ohmagari N, Yokota I. Status of COVID-19 patients treated with extracorporeal membrane oxygenation in Japan: nationwide database analysis. Cureus. 2024; 16: e60202.
Yang Y, Kimura H, Yokota I, Makita H, Takimoto-Sato M, Matsumoto-Sasaki M, Matsumoto M, Oguma A, Abe Y, Takei N, Goudarzi H, Shimizu K, Suzuki M, Nishimura M, Konno S; Hi-CARAT investigators. Applicable predictive factors extracted from peak flow trajectory for the prediction of asthma exacerbation. Ann Allergy Asthma Immunol. 2024; 132: 469-476.
Unoki Y, Ono S, Sasabuchi Y, Hashimoto Y, Yasunaga H, Yokota I. Exploring the influence of a financial incentive scheme on early mobilization and rehabilitation in ICU patients: an interrupted time-series analysis. BMC Health Serv Res. 2024; 24: 242.
Mori H, Koyama D, Sato Y, Kataoka Y, Taito S, Ishio T, Teshima T, Yokota I. Prognostic value of hematogones in patients with hematopoietic disorders after allogeneic hematopoietic stem cell transplantation: a systematic review and meta-analysis. Cureus. 2023; 15: e47184.
Yokota I, Shane PY, Okada K, Unoki Y, Yang Y, Iwasaki S, Fujisawa S, Nishida M, Teshima T. A novel strategy for SARS-CoV-2 mass screening with quantitative antigen testing of saliva: a diagnostic accuracy study. Lancet Microbe. 2021; 2: e397-e404.
Yokota I, Shane PY, Okada K, Unoki Y, Yang Y, Inao T, Sakamaki K, Iwasaki S, Hayasaka K, Sugita J, Nishida M, Fujisawa S, Teshima T. Mass screening of asymptomatic persons for SARS-CoV-2 using saliva. Clin Infect Dis. 2021; 73: e559-e565.

これまでの学位研究

生物統計方法論

Development of Exacerbation Prediction Model for Patients with Refractory Asthma Based on Peak Flow Monitoring data (ピークフローモニタリングデータに基づいた難治性喘息患者における増悪予測モデルの開発)（2024年度・博士論文）
コントロール選択に対するネスティッドケースコントロール型解析手法の性能比較（2024年度・修士論文）
ドラッグ・リポジショニングを利用したがん第I相臨床試験における安全性と最大耐用量を検証可能にする最適な試験デザインの研究（2024年度・特定課題論文）
臨床試験において既存対照データを利用するための検定併合法の研究（2023年度・博士論文）
割付因子を考慮したaugmented log-rank testの性能評価（2023年度・修士論文）
抗原濃度に関する陽性・陰性者の混合分布に対するBox-Cox変換パラメータ推定の頑健性（2022年度・修士論文）
二値エンドポイントに対する早期中止を行う正確な単群逐次試験デザインの提案（2021年度・修士論文）
中点代入法を用いた区間打ち切りデータに対するRMST推定（2021年度・卒業論文）

臨床疫学・実践研究

小児麻酔における気管チューブサイズの予測モデル作成に関する研究計画（2024年度・特定課題論文）
地域在住高齢者におけるフレイル重症度の経時的変化パターンと健康関連Quality of Lifeの関連（2023年度・修士論文）
人口構造を用いた必要産婦人科医師数の推定（2023年度・修士論文）
感染性大動脈炎の診断における全身MRI(DWIBS)検査の有用性に関する研究（2023年度・修士論文）
血液・造血器疾患における同種造血幹細胞移植後のHematogonesの予後的価値：システマティックレビュー・メタアナリシス（2023年度・特定課題論文）
早期離床・リハビリテーション加算による患者アウトカムの変化（2021年度・修士論文）
JMDCを用いた観察研究の実態調査（2021年度・修士論文）
COVID-19流行に伴う外出自粛による妊婦への影響（2020年度・特定課題論文）