原稿作成日: 2024年3月29日
最終修正日: 2024年3月29日
介入研究チェックリスト
<教材提供>
一般財団法人公正研究推進協会(APRIN)
目次
介入研究
研究デザインに関する検討事項
対照群のないワン・アームの介入研究
前後比較研究
過去のデータ(historical control)と比較する研究
薬物動態や安全性を目的とする研究
クロスオーバーデザイン(群内に介入と比較対照がある。)
対照群のある介入研究
非ランダム化比較試験
ランダム化(無作為化)比較試験
介入研究を計画する場合の検討事項
被験者選択基準
組み入れ基準
除外基準
インフォームド・コンセント
症例登録・割付
介入の内容
評価項目とスケジュール
解析対象集団
症例設定数と臨床的意義
エンドポイント
主要エンドポイント
副次エンドポイント
中止基準
介入の中止基準
試験の中止基準
報告事項
モニタリングと監査
データマネジメント
統計解析
中間解析
独立データモニタリング委員会などの設置
利益相反
欠損データへの対処
補償と賠償
用語集
チェックリストの使い方
  • 文字に下線: 当該の場所に飛びます(ページ内リンク)
  • 赤太文字: クリックすると用語解説が出てきます(ポップアップ)
    ※赤太文字を再度クリックするか、×を押すとポップアップは消えます
    ※用語集は目次の「用語集」をクリックすると開くページにもまとめて掲載しています
  • 緑太文字(クリックして表示): クリックするとその下に解説が表示されます
    ※再度クリックすると解説が畳まれます
  • チェックボックス: チェックを入れる/外すことが出来ます
    ※チェック状態になるのみです
介入研究チェックリスト
介入研究
P 1/35
臨床研究のうち、介入のあるものを介入研究あるいは臨床試験(clinical trial)と呼ぶ。介入研究とは「研究対象となる要因(特定の治療法など)を誰がどの程度受けるかという判断に、研究者が関与しているかどうか」ということに拠って分類されるのが一般的であるが、わが国の「人を対象とする生命科学・医学系研究に関する倫理指針」では、介入は「研究目的で、人の健康に関する様々な事象に影響を与える要因(予防、診断又は治療のための投薬、検査等)の有無又は程度を制御する行為」と定義されている。しかし、その解釈は一定ではなく、判断に迷う場合は、倫理審査委員会/臨床研究審査委員会事務局や規制当局または専門家等に確認する必要がある。ここでは、対象群のないワン・アームの介入研究と対象群のある介入研究に分類する。論文のエビデンスレベルは、観察研究や非ランダム化比較試験より、ランダム化比較試験が高いため、多くの治験や臨床研究法遵守の臨床試験は、早期臨床試験以外はランダム化比較試験として実施されることが多い。しかし、従来のランダム化比較試験では、理想的な対象集団を対象とするなど、その結果を一般化できないことから、より実臨床に近いプラグマティックトライアル(Pragmatic Trial)の考え方を取り入れた臨床試験も増えている。

(必須)研究デザインに関する検討事項
(必須)介入研究を計画する場合の検討事項
チェック項目
介入研究チェックリスト
研究デザインに関する検討事項
P 2/35
ここでは、介入の研究デザインを3つに分ける。

対照群のないワン・アームの介入研究
クロスオーバーデザイン(群内に介入と比較対照がある。)
対照群のある介入研究
チェック項目
介入研究チェックリスト
P 3/35
対照群のないワン・アームの介入研究
対象群のないワン・アーム研究の介入研究は、対象群のある介入研究より実施が容易である等の理由で立案される場合も多いが、その科学的妥当性は慎重に検討されていなければならない。前後比較研究、過去のデータと比較する研究、薬物動態や安全性を目的とする試験が含まれる。

前後比較研究
過去のデータ(historical control)と比較する研究
薬物動態や安全性を目的する研究
チェック項目
介入研究チェックリスト
P 4/35
前後比較研究
介入の前後で、薬剤や医療機器等の効果を評価し比較する研究。対照群を置かない限りその変化が薬剤や医療機器等によるものか、自然な経過によるものか判定できない。しかし、進行性で予後が著しく悪い疾患、希少疾病、他に治療法がないなどの理由で実施されることがある。特殊な例を除き厳密な薬効評価試験には用いられない。特定の薬剤をワン・アームで前後比較し、「観察研究」と称して申請する誤った研究も存在するので、注意が必要である。その中には、販売促進を目的とするseeding trialがある。
ワン・アームのデザインが妥当と考えられた臨床試験

慢性リンパ性白血病(CLL)では、フルダラビン(ヌクレオチド系抗腫瘍性代謝拮抗剤)およびアレムツズマブ(ヒト化抗CD52モノクロナール抗体)不応性患者、あるいはフルダラビン不応性で5 cmを超える大きさのためアレムツズマブ治療に適さない患者に対する新規治療が望まれていた。そこで、これらの患者を対象とし、オファツムマブ(ヒト型抗CD20モノクロナール抗体)を単剤で投与するワン・アームの臨床試験が実施され、その中間結果が報告された。主要エンドポイントは、全奏効率で、客観的な1996 NCI-WG criteriaが使用され、そのデータは独立した委員会(独立データモニタリング委員会)で検討された。138名の患者データが解析され、全奏効率は前者では58%、後者では47%と高い値を示しかつ安全性も想定されたものであった。

当該臨床試験は、予後が著しく悪く、薬剤不応性の極めて少ない患者を対象とするものであり、ワン・アームのデザインは妥当と考えられる。なお、FDA(アメリカ食品医薬品局)は、CLLにおいてこのオファツムマブを迅速承認している。

William G. Wierda, et al., Ofatumumab As Single-Agent CD20 Immunotherapy in Fludarabine-Refractory Chronic Lymphocytic Leukemia. Journal of Clinical Oncology 2010 28:10, 1749-1755.
チェック項目
介入研究チェックリスト
P 5/35
過去のデータ(historical control)と比較する研究
対象群を置かないかわりに、過去のデータ(historical control)を使う研究。非介入や特定の治療あるいは標準治療を実施した患者の過去のデータが使われる。
リアルワールドデータを対照群とした治験の例

FGFR遺伝子変化を保有する切除不能な尿路上皮がん患者に対するエルダフィチニブ治験例

2019年4月、FDAは、感受性線維芽細胞増殖因子受容体(FGFR)遺伝子変化を有する局所進行または転移性尿路上皮がん患者でプラチナ製剤を含む化学療法後に病勢進行が認められる患者に対するエルダフィチニブの迅速承認を付与した。本試験は単群多施設共同試験である(NCT02365597)。対象患者が限られており、対照群を研究内で置くことが難しかったため、米国の地域がんクリニックから得られたカルテデータをもとに外部対照が作成され、申請書に含まれた。このようにリアルワールドデータのような外部データを対照とした事例も近年増加傾向にあるが、外部対照は未調整交絡、アウトカムデータの欠損、選択バイアス等、多くの問題がある点に留意することが重要である。

FDA “NDA Multi-disciplinary Review and Evaluation of BALVERSA (erdafitinib)”.
https://www.accessdata.fda.gov/drugsatfda_docs/nda/2019/212018Orig1s000MultidisciplineR.pdf
Jacob J. Mandel, et al., External Control Arms and Data Analysis Methods in Nonrandomized Trial of Patients With Glioblastoma. JAMA Oncol. 2023;9(7):1006.
チェック項目
介入研究チェックリスト
P 6/35
薬物動態や安全性を目的とする研究
新薬の健康人を対象とする第I相試験や、患者を対象とする第II相試験等として実施される。目的により研究デザインは異なる。単一あるいは複数の用量の決定、特殊な病態下での薬物動態試験、併用薬や食事などの影響を評価する試験などが含まれる。
チェック項目
介入研究チェックリスト
P 7/35
クロスオーバーデザイン(群内に介入と比較対照がある。)
同一個体に比較したい薬剤や医療機器を作用させ比較する研究。個体間のヴァリエーションを考えなくて良いため比較的少数での試験が可能である。しかし(carry-over effect)の問題、の問題、評価項目が限定される(機能的なものに限られる)、の問題など困難な点も多い。
降圧薬の服用タイミングと24時間血圧についてのクロスオーバーデザインによる比較試験

通常の降圧薬の服薬が朝(6-11時)か夕(18-23時)かで、血圧指標に変化があるかを調べたランダム化クロスオーバーデザインによる臨床試験。前半の12週間に、朝服薬するか夕服薬するかは、ランダム化される。後半の12週間は、前半とは異なる服用方法を行う。ベースラインと12週目、24週目にABPM(Ambulatory Blood Pressure Monitoring, 24時間自由行動下血圧測定)にてデータを取得する。血圧の測定方法や機種は詳細に決められている。

クロスオーバーデザインは、個体間のヴァリエーションを考えなくて良いため比較的少数での試験が可能である。検討点として、測定が服用方法を変えてから12週後なので、持ち越し効果はないものと考えてよいだろう。また。評価方法も主治医による血圧測定ではなくABPMなので、客観的な測定といえよう。

Poulter, Neil R., et al. Randomized crossover trial of the impact of morning or evening dosing of antihypertensive agents on 24-hour ambulatory blood pressure: the HARMONY trial. Hypertension 2018 72.4, 870-873.
チェック項目
介入研究チェックリスト
P 8/35
対照群のある介入研究
対照群のある介入研究は、非ランダム化比較試験とランダム化比較試験に分類される。対象群としては、群、群、標準治療群等がある。既存の有効な治療法がある場合は、プラセボ対照試験を行うことは倫理的に許容されない場合がある。プラセボ対照試験を行うことが妥当であるかどうかは、介入の作用機序や臨床的重要性、プラセボ効果の大きさなどを考慮する必要がある。

非ランダム化比較試験
ランダム化(無作為化)比較試験
チェック項目

(プラセボを使う場合)

(標準治療群を使う場合)
介入研究チェックリスト
P 9/35
非ランダム化比較試験
比較試験は、様々なが生じる可能性があり、真の介入効果を正しく反映しない結果をもたらす恐れがある。非ランダム化比較試験で生じるバイアスには、、事前規定されていない評価項目を後から追加で解析することなどがあり、これらのバイアスを特定し、可能であれば定量化した上で調整することが推奨されている。
非ランダム化比較試験における対照群として、同施設の当該治療を受けなかった患者を対照群とする試験や、他の施設の無治療の患者を対照群とする試験等がある。いずれにせよ、研究者の都合で恣意的に割付けられていないことが重要である。
チェック項目
介入研究チェックリスト
P 10/35
ランダム化(無作為化)比較試験
比較試験とは、各群を無作為に振り分けた試験のこと。例えば、新薬群とプラセボ群、新薬群と標準治療群等がある。ランダム化することにより、性別、年齢等の背景因子を群間での偏りを減らすあるいは揃えることができる。通常、乱数表や乱数発生ソフトが使われる。二重が望ましい。
研究者主導単施設ランダム化非盲検試験の一例

心房細動および心不全を伴う患者に対するカテーテルアブレーションの効果は示されてきたが、これまでの試験では末期心不全患者は除外されていたので、この患者グループでの効果は不明だった。当該臨床試験は、症候性心房細動のある末期心不全の患者を対象に、カテーテルアブレーションとガイドラインに基づく薬物療法を行う群97名と、薬物療法のみを行う群97名に無作為に割り付けた研究者主導単施設非盲検試験。主要エンドポイントは、全死因死亡、または左心補助人工心臓の植込み、または緊急心臓移植である。開始から1年後に、カテーテルアブレーションとガイドラインに基づく薬物療法を行う群の優位性が示され、データ安全性モニタリング委員会から研究の中止が勧告された。ディスカッションでは、当該臨床試験の限界として、単施設で実施されたものであったこと、勧告により途中で中止したため、長期予後は明確ではないこと、盲検化していないのでエンドポイントに係る治療選択に影響した可能性を挙げている。

当該試験ではカテーテルアブレーションが片方の群で実施されるので、盲検化は困難であろう。また、この臨床試験で無作為化を行なっていなかったら、New England Journal of Medicineに採用されるのが困難であっただろう。

Sohns, Christian, et al. Catheter Ablation in End-Stage Heart Failure with Atrial Fibrillation. New England Journal of Medicine 2023. DOI: 10.1056/NEJMoa2306037
チェック項目
チェック項目(

(盲検化する場合)

(盲検化しない場合)
介入研究チェックリスト
介入研究チェックリスト
P 12/35
被験者選択基準
選択基準および組み入れ基準の用語の使い方は、研究者によって異なる場合があるが、ここでは、被験者選択基準を、組み入れ基準と除外基準からなるものとして扱う。研究に携わる者の間で、解釈がずれないように明確に記載されていなければならない。また、組み入れ基準と除外基準はその意図が異なるので、除外基準の否定形が組み入れ基準ではないことに留意すること。
チェック項目
介入研究チェックリスト
P 13/35
組み入れ基準
組み入れ基準は、研究の目的や仮説に沿って、組み入れる被験者を明確にする要件のこと。設定根拠は、説明できなければならない。必要最小限にすることが望ましい。厳しい基準を設けると、試験の実施が困難になったり、試験結果を一般化できなくなる恐れがある。
チェック項目
介入研究チェックリスト
P 14/35
除外基準
除外基準は、研究の安全性や有効性に影響を与える可能性がある被験者を除くための要件のこと。設定根拠は、説明できなければならない。
チェック項目
介入研究チェックリスト
P 15/35
インフォームド・コンセント
介入研究においては、インフォームド・コンセントを文書で取得することが原則である。「人を対象とする生命科学・医学系研究に関する倫理指針」に準拠する侵襲を伴わない介入を行う研究では口頭によるインフォームド・コンセントも認められている。詳細は当該倫理指針を参照のこと。被験者が、未成年者や認知症患者等、インフォームド・コンセントを与えることができる能力を欠くと客観的に判断される場合には、代諾者からインフォームド・コンセントを取得する。未成年者には、わかりやすいことばで記載されたアセント文書を使って説明される。インフォームド・コンセントのための説明文書には、記載されるべき項目が、遵守すべき規制により決まっているので、該当規制を参照のこと。
チェック項目
介入研究チェックリスト
P 16/35
症例登録・割付
症例登録は、一般的には、症例登録基準(組み入れ基準と除外基準)が記載され1つ1つ確認のチェックを入れる登録票(電子入力を含む)を用いて行われる。研究者まかせにすると、基準に抵触する対象者を登録するケースが起こりうるので、二人以上で登録時に再度確認することが推奨される。その後、あらかじめ決められた規則により割付けが行われる。介入研究においては、されることが多い。割り付けは、割り付け担当者あるいは多施設共同研究においては、中央登録方式が採用されることが多い。これらの手順は、被験者の安全性の確保、研究の質に関係し、研究計画書に記載される。割り付け比率は、専門家に相談することが望ましい。
チェック項目
介入研究チェックリスト
P 17/35
介入の内容
介入の内容(質、量、時期)は、誰が見ても同じ見解になるように、明確に記載されていなければならない。シェーマを使って記載されていると理解しやすい。
チェック項目
介入研究チェックリスト
P 18/35
評価項目とスケジュール
通常、一目で理解できるように、縦軸に評価項目(採血、画像検査、診察を含む)やイベント(同意取得等)、横軸に経過を示す日数や週数からなる表で示される。研究の目的を達成するために、最小限の項目から構成されていることが望ましい。介入前の基準となるデータおよび主要エンドポイント副次エンドポイントに関わるデータが適切に取得できるように組まれていることが求められる。不要に多いと、煩雑になりデータの欠落をまねくと同時に、検査費用がかさむ要因になる。また、被験者保護の観点から、検査や評価が適切な時期に実施されるよう計画されている必要がある。さらに、被験者の来院日の猶予期間(アロワンス)は適切であることが求められる。極端に短いと、逸脱が発生しやすくなるので、注意が必要である。
チェック項目
介入研究チェックリスト
P 19/35
解析対象集団

無作為化比較試験では、原則「実際に治療したかどうか」ではなく、その被験者を「治療しようとしたかどうか」が重要であり、無作為化されたすべての症例を解析に用いることが推奨されている。無作為化されたすべての被験者を「治療しようとした集団、Intention to Treat、ITT集団」と呼ぶ。解析はITT集団を対象に、無作為化された群により比較を行う。無作為化試験の科学的な信頼性は、無作為化によって裏付けられるため、実際に使用した薬剤で群を分けると、ランダム化によって得られた比較群間の均衡が崩れてしまう可能性があるからである。

ITT集団の中から一度もプロトコル治療を受けていない被験者や、有効性を評価するデータが一つもない症例を除いた集団を「最大の解析集団、Full Analysis Set、FAS」と呼ぶ。一般的に無作為化比較試験ではFASを主解析で用いることは許容されている。

FASからプロトコルに準拠しなかった被験者を除いた集団を、「プロトコルに準拠した集団、Per Protocol Set、PPS集団」と呼ぶ。プロトコル不準拠症例を用いることで、ITTやFASでは治療効果は出にくくなると考えられるが、PPSでは、無作為化による比較群間の均衡が崩れ、結果にバイアスを生じることがある、またPPSを用いた解析では、より偏った集団を対象にすることで結果の一般化がより困難となることがある。

ITTやFASによる解析では実際の治療効果が過小評価されることがあるため、実際に得られた結果の頑健性を確認するために、副次的な解析としてPPSを用いた解析を行うことがある。

安全性の評価には、割り付けられた群によらず、実際に被験治療を受けた被験者のみを対象とした、Safety Analysis Set, SAS(安全性集団)を用いる。非劣性を目的とした試験では、PPSを主解析、FASを副次解析に用いることもある。どの解析に用いるのはどの集団のデータなのかをあらかじめ決めておく必要がある。

チェック項目
介入研究チェックリスト
P 20/35
症例設定数と臨床的意義

介入等前向き研究では、できる限り、統計学的手法を用いて必要最低限の症例数をあらかじめ計算する。症例数が少な過ぎれば、臨床的に意義がある結果であっても、統計的に有意な結果を出せる見込みは小さい。多すぎれば、不必要に多くの被験者をリスクを伴う研究に参加させる等倫理的な問題や、研究期間が長くなる、コストが必要以上にかかる等の問題が生じる。一方、症例数が確保できない希少疾患対象等の臨床試験や先行試験のない早期臨床試験では、実施可能症例数を設定することがある。優越性、同等性、非劣性を目的とする場合、各目的において症例数計算の方法が異なるので留意すること。

「先行研究では対照薬では死亡を含む心血管イベントが20%である、被験薬では10%と想定すると、有意水準を両側の5%とおき、統計的検出力を80%担保するためには、最低限各群199名必要である。途中抜け落ちや欠損値等で解析不能例を10%考慮すると少なくとも約442例の登録が必要である。」
ここで有意水準とは、最終的な解析で有意差を両側のP値(通常のP値)が5%未満で判定するので、5%と設定する。統計的検出力とは、被験薬に本当に効果がある時に、有意差を検出できる確率であり、通常80%と置く。
チェック項目
介入研究チェックリスト
P 21/35
エンドポイント

介入研究においては、仮説を評価するための指標として使われる。アウトカムや評価項目とほぼ同じ意味である。通常、主要エンドポントと副次エンドポイントを置く。

死亡など、だれが評価してもぶれないハードエンドポイントと、主観を伴うソフトエンドポイントがある。真のエンドポイント(例えば心血管死亡率の低下)のデータを取得するのに、試験期間が長くなる場合等に、サロゲートエンドポイント(例えば、血圧や脂質の低下)を置くことがある。理に適いかつ客観的なエンドポイントが望ましい。

チェック項目
介入研究チェックリスト
P 22/35
主要エンドポイント
研究の主目的に直結したエンドポイントのこと。通常1つであり、当該研究の意義を示す重要な評価指標であり、これを基に、必要症例数が計算される。希に、2つ以上定めることもあるが、多重性(multiplicity)の観点から勧められない。(丹後俊郎・上坂浩之編集 臨床試験ハンドブック 朝倉書店 第27章 多重性の評価 参照)。複数の項目を主要エンドポイントにする場合は、有意水準の階層化や分配等統計的に注意が必要である。
チェック項目
介入研究チェックリスト
P 23/35
副次エンドポイント
研究の主目的に関連した補足的なエンドポイントのこと。
チェック項目
介入研究チェックリスト
P 24/35
中止基準
中止基準には、被験者個人個人に対する中止基準と、試験全体の中止基準がある。それぞれ、研究計画書に明確に書かれていなければならない。
介入研究チェックリスト
P 25/35
介入の中止基準
介入による有害事象あるいは原疾患の進行等により研究の継続が不適切であると判断する基準のこと。研究者間で見解が異ならないように、研究計画書に明確に記載されている必要がある。また、被験者の不利益が最小限に抑えられるように設定されていなければならない。介入途中で、被験者が同意を撤回する場合を含む。
チェック項目
介入研究チェックリスト
P 26/35
試験の中止基準
研究実施後、登録症例数が予定数に達しない時点で、研究全体を中止する基準のこと。その他、試験薬等の安全性、有効性に関する重大な情報が得られた場合、中間解析等で試験の目的が達成されたあるいは完遂することが困難と判断された場合等がある。
チェック項目
介入研究チェックリスト
P 27/35
報告事項
規制(治験、臨床研究法、再生医療法、人を対象とする生命科学・医学系研究に関する倫理指針)により、規制当局、IRB/CRB/倫理審査委員会等、機関の長への報告事項・報告手順・報告期限が異なるので、各規制を参照の上、研究計画書に記載する。
チェック項目
介入研究チェックリスト
P 28/35
モニタリングと監査
は、研究の信頼性を確保するための手法である。臨床研究法では、モニタリングは必須、監査は必要に応じて求められる。人を対象とする生命科学・医学系研究に関する倫理指針においては、軽微な侵襲を除く侵襲を伴う介入研究では、モニタリングは必須、監査は必要に応じて求められる。
チェック項目
介入研究チェックリスト
P 29/35
データマネジメント
データ集積システムの構築、収集したデータを整理・確認する等、データの信頼性を確保するための一連の業務を示す。統計解析手法に従い、収集するデータ項目をリストアップし、すべてのデータについてどのように収集すべきか等を研究計画書及び症例報告書に記載する。症例報告書は長くは紙ベースで収集されていたが、近年ではインターネットに接続可能なコンピュータ上で直接入力できる電子データ集積システム(Electronic Data Capture, EDC)等が多く用いられている。収集されたデータは定期的に整理し整合性を確認し、必要であれば各研究施設に問い合わせ等を行う。個人情報の取り扱いや、バックアップ体制や研究終了後のデータの取り扱い等、研究開始前に検討し計画する必要がある。
データの信頼性を確保するため、例えば血圧値を収集する場合、収縮期血圧か拡張期血圧か、平均血圧なのか、その計算式はどのようなものか、どの時点の血圧なのか、臥位あるいは座位で測定するのか、左右どちらの腕で測定するのか、追跡を伴う研究の場合は、登録時のみの測定か毎回の受診時の測定かなど、事前に取り決めが必要である。
チェック項目
介入研究チェックリスト
P 30/35
統計解析
治療法の有効性や安全性を評価するためには統計的なデータ解析が必要である。データ解析に用いられる検定や手法はデータの性質や解析の目的に応じて適切に選択することが重要である。解析の目的には大きく分けて、記述統計と検定があり、各検定はデータや比較の種類によって最適なものを選択する。検定の目的は大きく分けて①優越性②同等性③非劣性の3通りに分類できる。通常の検定は優越性を示すことを目的とするが、ジェネリック薬の開発等では、評価中の治療法は対照治療に比べ薬理作用など生物学的に同等であることを示す。一方、評価中の治療法には副作用が少ないなどの対照治療よりも利点があるといった場合、標準治療法に対し有効性において優越性が証明できなくても、劣っていないという非劣性を証明する。P値を用いた検定は優越性のみであり、同等性や非劣性を示す場合は信頼区間を用いて評価する。

無作為化等比較群間の背景が無作為化等により揃っていると考えられる場合は、統計解析の種類は、単変量解析等比較的シンプルなものが用いられるが、無作為化が行われず比較群間の背景にズレが生じている場合は、多変量解析等を用い背景の違いを解析で考慮する必要がある(多変量解析に関しては、観察研究で詳細を説明している)。研究計画書には、できるだけ網羅的に、どの項目に対してどの検定(又は記述統計量)を用いるか詳細に記載する必要がある。研究計画書にすべて記載できない場合は、別途統計解析計画書を作成する。

検定の種類
例)血圧などの連続値を独立の2群間で比較する場合は、スチューデントのT検定、独立の3群間での比較は分散分析等が用いられるが、データが正規分布に従わない場合は、マンホイットニーU検定や、クラスカルワリス検定等を用いる

例)イベントの有無をエンドポイントとした研究では、研究途中でのデータの抜け落ちを考慮できる生存率解析等が用いられる。そのためには、イベントの起こった時間、最終追跡時点等時間の情報が必要である

チェック項目
介入研究チェックリスト
P 31/35
中間解析

前向きの介入研究では原則、研究計画時に見積もられた症例数に到達するまで試験を継続し、研究終了時に初めてデータ解析を行うが、長期に及ぶ研究では、研究途中で結果を評価する中間解析が行われることがある。

中間解析の目的は、①評価中の治療法が対照治療に比べより効果があることを見る(有益性)②逆に害になっていることを見る(安全性)③結果に差がなくこれ以上研究を続けても意味のあるエビデンスが得られない(無益性)の3つがあげられる。

中間解析では、何度も解析を行うことで、擬陽性の確率が上がるといった多重検定の問題を防ぐために、有意差を評価する基準をより厳しく設定するなど注意が必要である。

中間解析を行う場合は、いつ、どのようにして行い、何を基準にしてどういうアクションをとるのかという詳細を前もって決めておく必要がある。事前に設定されたルールもなく、研究途中で解析を行い、その結果研究デザイン等が変更された場合、研究者が良い結果を出すために作為的に操作したと批判されることも多く、研究の信頼性を揺るがすことになりかねないので、中間解析については慎重に議論される必要がある。

がんの第3相試験等において中間解析は予想されるイベント数の約半数(第1回目)4分の3(第2回目)が得られた時点で行われた。主要評価項目である無増悪生存の群間差は最終解析においてP<0.05で評価されるが、中間解析ではより厳しいP<0.001の基準が用いられた。
チェック項目
介入研究チェックリスト
P 32/35
独立データモニタリング委員会などの設置
臨床研究の進捗状況、安全性データおよび重要な有効性評価項目を適切な間隔で評価し、研究の継続、修正または中止を提言する委員会。通常は、当該研究と独立した2名以上の委員で構成される。
チェック項目
介入研究チェックリスト
P 33/35
利益相反
研究における利益相反とは、研究者が、資金提供を受けていたり、株式・特許等を有する研究において、その利益と、研究の公正性や被験者保護が衝突・相反している状況のことで、適切な利益相反マネジメントが求められる。利益相反のある場合は、研究計画書や説明文書にその説明が求められる。臨床研究法においては、利益相反書式により、必ず確認される。
チェック項目
介入研究チェックリスト
P 34/35
欠損データへの対処
研究途中で被験者が研究から辞退した場合など、臨床研究では常にデータの欠損の問題が起こる。エンドポイントがイベントの有無等2値変数の場合は、生存率解析を用いることで、抜け落ち例は抜け落ちの時間を考慮に入れた解析が可能。連続変数がエンドポイントとして使用される場合、例えば12か月後の血圧を主要評価項目と定めた場合に、12か月目のデータがない場合はその直近のデータを用いるというLast Observation Carried Forward(LOCF法)が良く用いられる。研究参加以降全くアウトカムが評価されていない場合は、治療効果が反映できないベースラインの値を用いなければならないので、アウトカムは、3か月時点、6か月時点など研究途中にできるだけ多く評価することが重要である。データの欠損の頻度やタイミングが比較群間で異なる場合は、LOCF法はバイアスのある結果を生むことがあるので、最近では、混合効果モデルを用いた手法や多重補完法など統計的により複雑な方法が用いられることがある。
例)ベースラインから研究終了時までのQOLの変化量をエンドポイントとした解析では、どちらか一方のデータが欠損すると、通常の解析では欠損値が生じた症例を解析に入れることはできない。この場合、混交効果モデルを用いる方法や、変化量ではなく、12か月後のエンドポイントを従属変数とし、ベースラインのデータは多重補完する等、統計的に考慮が必要である。

例)欠損値を考慮しない解析は、欠損のない症例(コンプリートケース)のみを用いているため、コンプリートケースを用いて、比較群間に背景の偏りがないか確かめることが重要である。例えば、被験薬は副作用を伴い、副作用のある人は研究から辞退している場合、コンプリートケースのみを用いた解析では、無作為化が機能せず背景のずれが生じることがある。

チェック項目
介入研究チェックリスト
P 35/35
補償と賠償

研究対象者になんらかの健康被害が発生した場合、違法性(過失)がない場合は補償、違法性(過失)がある場合は賠償の対象となる。規制上、補償措置を講じることが求められる研究については、国大協サービスの「臨床研究、人を対象とする研究と保険について」が詳しい。
https://www.janu-s.co.jp/human_research_insurance.html

一般診療における補償制度としては、医薬品副作用被害救済制度があり、臨床研究の一般診療部分については、この制度が使える場合がある。補償の内容については、補償しない場合を含め、研究計画書、説明同意文書にその旨記載し、倫理委員会の承認を得る必要がある。

チェック項目



本単元は、APRINの研究者コミュニティの協力を得て、日本の法律・指針その他に沿って作成された教材です。作成・査読に参加した専門家の方々の氏名は別に記載させていただきました

© 2024 Association for the Promotion of Research Integrity