介入研究チェックリスト

原稿作成日：　2024年3月29日
最終修正日：　2024年3月29日

介入研究チェックリスト

＜教材提供＞
一般財団法人公正研究推進協会(APRIN)

目次

介入研究

研究デザインに関する検討事項

対照群のないワン・アームの介入研究

前後比較研究

過去のデータ（historical control）と比較する研究

薬物動態や安全性を目的とする研究

クロスオーバーデザイン（群内に介入と比較対照がある。）

対照群のある介入研究

非ランダム化比較試験

ランダム化（無作為化）比較試験

介入研究を計画する場合の検討事項

被験者選択基準

組み入れ基準

インフォームド・コンセント

症例登録・割付

介入の内容

評価項目とスケジュール

解析対象集団

症例設定数と臨床的意義

エンドポイント

主要エンドポイント

副次エンドポイント

介入の中止基準

試験の中止基準

モニタリングと監査

データマネジメント

独立データモニタリング委員会などの設置

欠損データへの対処

補償と賠償

チェックリストの使い方

文字に下線：当該の場所に飛びます（ページ内リンク）
赤太文字：クリックすると用語解説が出てきます（ポップアップ）
※赤太文字を再度クリックするか、×を押すとポップアップは消えます
※用語集は目次の「用語集」をクリックすると開くページにもまとめて掲載しています
緑太文字（クリックして表示）：クリックするとその下に解説が表示されます
※再度クリックすると解説が畳まれます
チェックボックス：チェックを入れる／外すことが出来ます
※チェック状態になるのみです

介入研究チェックリスト

介入研究

P 1/35

臨床研究のうち、介入のあるものを介入研究あるいは臨床試験（clinical trial）と呼ぶ。介入研究とは「研究対象となる要因（特定の治療法など）を誰がどの程度受けるかという判断に、研究者が関与しているかどうか」ということに拠って分類されるのが一般的であるが、わが国の「人を対象とする生命科学・医学系研究に関する倫理指針」では、介入は「研究目的で、人の健康に関する様々な事象に影響を与える要因（予防、診断又は治療のための投薬、検査等）の有無又は程度を制御する行為」と定義されている。しかし、その解釈は一定ではなく、判断に迷う場合は、倫理審査委員会／臨床研究審査委員会事務局や規制当局または専門家等に確認する必要がある。ここでは、対象群のないワン・アームの介入研究と対象群のある介入研究に分類する。論文のエビデンスレベルは、観察研究や非ランダム化比較試験より、ランダム化比較試験が高いため、多くの治験や臨床研究法遵守の臨床試験は、早期臨床試験以外はランダム化比較試験として実施されることが多い。しかし、従来のランダム化比較試験では、理想的な対象集団を対象とするなど、その結果を一般化できないことから、より実臨床に近いプラグマティックトライアル（Pragmatic Trial）の考え方を取り入れた臨床試験も増えている。

（必須）研究デザインに関する検討事項
（必須）介入研究を計画する場合の検討事項

チェック項目

当該研究の目的を観察研究では達成できない。

介入研究チェックリスト

研究デザインに関する検討事項

P 2/35

ここでは、介入の研究デザインを3つに分ける。

対照群のないワン・アームの介入研究
クロスオーバーデザイン（群内に介入と比較対照がある。）
対照群のある介入研究

チェック項目

目的が当該研究で達成できるよう適正にデザインされている。

最初の章に戻る

介入研究チェックリスト

P 3/35

対照群のないワン・アームの介入研究

対象群のないワン・アーム研究の介入研究は、対象群のある介入研究より実施が容易である等の理由で立案される場合も多いが、その科学的妥当性は慎重に検討されていなければならない。前後比較研究、過去のデータと比較する研究、薬物動態や安全性を目的とする試験が含まれる。

前後比較研究
過去のデータ（historical control）と比較する研究
薬物動態や安全性を目的する研究

チェック項目

シングルアーム研究で実施しなければならない妥当性がある。

研究の科学的妥当性がある。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 4/35

前後比較研究

介入の前後で、薬剤や医療機器等の効果を評価し比較する研究。対照群を置かない限りその変化が薬剤や医療機器等によるものか、自然な経過によるものか判定できない。しかし、進行性で予後が著しく悪い疾患、希少疾病、他に治療法がないなどの理由で実施されることがある。特殊な例を除き厳密な薬効評価試験には用いられない。特定の薬剤をワン・アームで前後比較し、「観察研究」と称して申請する誤った研究も存在するので、注意が必要である。その中には、販売促進を目的とするseeding trialがある。

‡事例（クリックして表示）

ワン・アームのデザインが妥当と考えられた臨床試験

慢性リンパ性白血病（CLL）では、フルダラビン（ヌクレオチド系抗腫瘍性代謝拮抗剤）およびアレムツズマブ（ヒト化抗CD52モノクロナール抗体）不応性患者、あるいはフルダラビン不応性で5 cmを超える大きさのためアレムツズマブ治療に適さない患者に対する新規治療が望まれていた。そこで、これらの患者を対象とし、オファツムマブ（ヒト型抗CD20モノクロナール抗体）を単剤で投与するワン・アームの臨床試験が実施され、その中間結果が報告された。主要エンドポイントは、全奏効率で、客観的な1996 NCI-WG criteriaが使用され、そのデータは独立した委員会（独立データモニタリング委員会）で検討された。138名の患者データが解析され、全奏効率は前者では58％、後者では47％と高い値を示しかつ安全性も想定されたものであった。

当該臨床試験は、予後が著しく悪く、薬剤不応性の極めて少ない患者を対象とするものであり、ワン・アームのデザインは妥当と考えられる。なお、FDA（アメリカ食品医薬品局）は、CLLにおいてこのオファツムマブを迅速承認している。

William G. Wierda, et al., Ofatumumab As Single-Agent CD20 Immunotherapy in Fludarabine-Refractory Chronic Lymphocytic Leukemia. Journal of Clinical Oncology 2010 28:10, 1749-1755.

チェック項目

前後比較研究で実施しなければならない妥当性（疾患の重篤性、MTD：Maximum Tolerated Doseを求める等探索的試験である、標準治療がない等）がある。

介入前後の評価の精度、評価指標の時間的安定性、再現性（客観性）が担保されている。

研究の科学性が十分に担保されており、研究結果は信頼できるようデザインされている。

販売促進を目的とするseeding trialではない。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 5/35

過去のデータ（historical control）と比較する研究

対象群を置かないかわりに、過去のデータ（historical control）を使う研究。非介入や特定の治療あるいは標準治療を実施した患者の過去のデータが使われる。

‡事例（クリックして表示）

リアルワールドデータを対照群とした治験の例

FGFR遺伝子変化を保有する切除不能な尿路上皮がん患者に対するエルダフィチニブ治験例

2019年4月、FDAは、感受性線維芽細胞増殖因子受容体（FGFR）遺伝子変化を有する局所進行または転移性尿路上皮がん患者でプラチナ製剤を含む化学療法後に病勢進行が認められる患者に対するエルダフィチニブの迅速承認を付与した。本試験は単群多施設共同試験である（NCT02365597）。対象患者が限られており、対照群を研究内で置くことが難しかったため、米国の地域がんクリニックから得られたカルテデータをもとに外部対照が作成され、申請書に含まれた。このようにリアルワールドデータのような外部データを対照とした事例も近年増加傾向にあるが、外部対照は未調整交絡、アウトカムデータの欠損、選択バイアス等、多くの問題がある点に留意することが重要である。

FDA “NDA Multi-disciplinary Review and Evaluation of BALVERSA (erdafitinib)”.
https://www.accessdata.fda.gov/drugsatfda_docs/nda/2019/212018Orig1s000MultidisciplineR.pdf
Jacob J. Mandel, et al., External Control Arms and Data Analysis Methods in Nonrandomized Trial of Patients With Glioblastoma. JAMA Oncol. 2023;9(7):1006.

チェック項目

比較試験を実施しない理由に妥当性がある。

過去のデータの品質が当該研究の目的に鑑みて適切である。

治療成績は療養環境や新しい治療法によって変化する可能性が高い点には留意が必要。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 6/35

薬物動態や安全性を目的とする研究

新薬の健康人を対象とする第I相試験や、患者を対象とする第II相試験等として実施される。目的により研究デザインは異なる。単一あるいは複数の用量の決定、特殊な病態下での薬物動態試験、併用薬や食事などの影響を評価する試験などが含まれる。

チェック項目

薬物動態や安全性を目的とする試験である。

用法用量設定の根拠が妥当である。

評価方法が適切であり、再現性が期待できる。

採血量を含む侵襲性が最小化されている。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 7/35

クロスオーバーデザイン（群内に介入と比較対照がある。）

同一個体に比較したい薬剤や医療機器を作用させ比較する研究。個体間のヴァリエーションを考えなくて良いため比較的少数での試験が可能である。しかし持ち越し効果（carry-over effect）の問題、時期効果の問題、評価項目が限定される（機能的なものに限られる）、アドヒアランスの問題など困難な点も多い。

‡事例（クリックして表示）

降圧薬の服用タイミングと24時間血圧についてのクロスオーバーデザインによる比較試験

通常の降圧薬の服薬が朝（6-11時）か夕（18-23時）かで、血圧指標に変化があるかを調べたランダム化クロスオーバーデザインによる臨床試験。前半の12週間に、朝服薬するか夕服薬するかは、ランダム化される。後半の12週間は、前半とは異なる服用方法を行う。ベースラインと12週目、24週目にABPM（Ambulatory Blood Pressure Monitoring, 24時間自由行動下血圧測定）にてデータを取得する。血圧の測定方法や機種は詳細に決められている。

クロスオーバーデザインは、個体間のヴァリエーションを考えなくて良いため比較的少数での試験が可能である。検討点として、測定が服用方法を変えてから12週後なので、持ち越し効果はないものと考えてよいだろう。また。評価方法も主治医による血圧測定ではなくABPMなので、客観的な測定といえよう。

Poulter, Neil R., et al. Randomized crossover trial of the impact of morning or evening dosing of antihypertensive agents on 24-hour ambulatory blood pressure: the HARMONY trial. Hypertension 2018 72.4, 870-873.

チェック項目

ウォッシュアウト期間の妥当性が説明でき、かつ十分とられている。

当該試験からの脱落例を踏まえても完遂可能である。

評価者の客観性が検討されている。

1回目の介入の持ち越し効果がない。

介入の時期効果がない。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 8/35

対照群のある介入研究

対照群のある介入研究は、非ランダム化比較試験とランダム化比較試験に分類される。対象群としては、プラセボ群、シャムオペレーション群、標準治療群等がある。既存の有効な治療法がある場合は、プラセボ対照試験を行うことは倫理的に許容されない場合がある。プラセボ対照試験を行うことが妥当であるかどうかは、介入の作用機序や臨床的重要性、プラセボ効果の大きさなどを考慮する必要がある。

非ランダム化比較試験
ランダム化（無作為化）比較試験

チェック項目

対照群が適切に設定されている。

統計学的に症例数を計算するに必要な基礎的なデータがある。

（プラセボを使う場合）

倫理的に許容される。

プラセボが、真の治療効果の判断に与える影響について、検討されている。

（標準治療群を使う場合）

研究者間で、標準治療群の解釈にぶれがない。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 9/35

非ランダム化比較試験

非ランダム化比較試験は、様々なバイアスが生じる可能性があり、真の介入効果を正しく反映しない結果をもたらす恐れがある。非ランダム化比較試験で生じるバイアスには、交絡、非盲検バイアス、不完全な追跡バイアス、事前規定されていない評価項目を後から追加で解析することなどがあり、これらのバイアスを特定し、可能であれば定量化した上で調整することが推奨されている。

‡事例（クリックして表示）

非ランダム化比較試験における対照群として、同施設の当該治療を受けなかった患者を対照群とする試験や、他の施設の無治療の患者を対照群とする試験等がある。いずれにせよ、研究者の都合で恣意的に割付けられていないことが重要である。

チェック項目

バイアスを特定し調整している。

研究者の都合で恣意的に割り付けられていない。

評価者の客観性が担保されている。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

介入研究チェックリスト

介入研究を計画する場合の検討事項

P 11/35

介入研究を計画する場合、以下の点について検討が必要である。

被験者選択基準
インフォームド・コンセント
症例登録・割付
介入の内容
評価項目とスケジュール
解析対象集団
症例設定数と臨床的意義
エンドポイント
中止基準
報告事項
モニタリングと監査
データマネジメント
統計解析
中間解析
独立データモニタリング委員会などの設置
利益相反
欠損データへの対処
補償と賠償

最初の章に戻る

介入研究チェックリスト

P 12/35

被験者選択基準

選択基準および組み入れ基準の用語の使い方は、研究者によって異なる場合があるが、ここでは、被験者選択基準を、組み入れ基準と除外基準からなるものとして扱う。研究に携わる者の間で、解釈がずれないように明確に記載されていなければならない。また、組み入れ基準と除外基準はその意図が異なるので、除外基準の否定形が組み入れ基準ではないことに留意すること。

チェック項目

研究の目的に鑑みて、被験者が適切に選択される記載である。

研究に携わる者の間で、解釈がずれない明確な記載である。

基準が厳しくて、研究がすすまないという懸念がない。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 13/35

組み入れ基準

組み入れ基準は、研究の目的や仮説に沿って、組み入れる被験者を明確にする要件のこと。設定根拠は、説明できなければならない。必要最小限にすることが望ましい。厳しい基準を設けると、試験の実施が困難になったり、試験結果を一般化できなくなる恐れがある。

チェック項目

研究の目的や仮説に沿って、組み入れる被験者を明確にする要件が記載されている。

設定根拠は明確で、合理的かつ科学的である。

研究完遂が期待できる必要最小限である。

最初の章に戻る

介入研究チェックリスト

P 14/35

除外基準

除外基準は、研究の安全性や有効性に影響を与える可能性がある被験者を除くための要件のこと。設定根拠は、説明できなければならない。

チェック項目

研究の安全性や有効性に影響を与える可能性がある被験者を除くための要件が記載されている。

設定根拠は明確で合理的である。

最初の章に戻る

介入研究チェックリスト

P 15/35

インフォームド・コンセント

介入研究においては、インフォームド・コンセントを文書で取得することが原則である。「人を対象とする生命科学・医学系研究に関する倫理指針」に準拠する侵襲を伴わない介入を行う研究では口頭によるインフォームド・コンセントも認められている。詳細は当該倫理指針を参照のこと。被験者が、未成年者や認知症患者等、インフォームド・コンセントを与えることができる能力を欠くと客観的に判断される場合には、代諾者からインフォームド・コンセントを取得する。未成年者には、わかりやすいことばで記載されたアセント文書を使って説明される。インフォームド・コンセントのための説明文書には、記載されるべき項目が、遵守すべき規制により決まっているので、該当規制を参照のこと。

チェック項目

研究計画書には、同意の取得方法が記載されている。

介入試験では、原則、研究対象者から、文書によるインフォームド・コンセントを取得する。

研究対象者が、インフォームド・コンセントを与えることができる能力を欠くと客観的に判断される場合には、代諾者からインフォームド・コンセントを取得する。

インフォームド・コンセントを与えることができる能力を欠くと客観的に判断される被験者には、必要に応じてアセント文書が準備される。

説明文書には、遵守すべき規制で求められる項目が記載される。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 16/35

症例登録・割付

症例登録は、一般的には、症例登録基準（組み入れ基準と除外基準）が記載され1つ1つ確認のチェックを入れる登録票（電子入力を含む）を用いて行われる。研究者まかせにすると、基準に抵触する対象者を登録するケースが起こりうるので、二人以上で登録時に再度確認することが推奨される。その後、あらかじめ決められた規則により割付けが行われる。介入研究においては、ランダム化（無作為化）されることが多い。割り付けは、割り付け担当者あるいは多施設共同研究においては、中央登録方式が採用されることが多い。これらの手順は、被験者の安全性の確保、研究の質に関係し、研究計画書に記載される。割り付け比率は、専門家に相談することが望ましい。

チェック項目

登録内容の確認が適切に実施される手順になっている。

割り付けの手法・手順は妥当であり、手順書が準備されている。

割り付け結果は、それを知っておくべき者以外には漏れることはなく、堅牢性が維持される。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 17/35

介入の内容

介入の内容（質、量、時期）は、誰が見ても同じ見解になるように、明確に記載されていなければならない。シェーマを使って記載されていると理解しやすい。

チェック項目

一般診療部分と介入部分が明確に区別されている。

介入の質、量、時期は臨床的意義の上でも適切である。

介入の内容は、誰がみても同じ見解になり、異なる介入が行われるリスクがない。

薬剤の適応外使用の場合、その用法用量の設定根拠は適切である。

機器の適応外使用の場合、その使用方法等の設定根拠が適切である。

対照群のある場合は、その設定は適切である。

標準的治療をしないで介入する場合、それは臨床試験として倫理的に妥当である。

介入内容は、研究目的と一致している。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 18/35

評価項目とスケジュール

通常、一目で理解できるように、縦軸に評価項目（採血、画像検査、診察を含む）やイベント（同意取得等）、横軸に経過を示す日数や週数からなる表で示される。研究の目的を達成するために、最小限の項目から構成されていることが望ましい。介入前の基準となるデータおよび主要エンドポイント・副次エンドポイントに関わるデータが適切に取得できるように組まれていることが求められる。不要に多いと、煩雑になりデータの欠落をまねくと同時に、検査費用がかさむ要因になる。また、被験者保護の観点から、検査や評価が適切な時期に実施されるよう計画されている必要がある。さらに、被験者の来院日の猶予期間（アロワンス）は適切であることが求められる。極端に短いと、逸脱が発生しやすくなるので、注意が必要である。

チェック項目

一目で理解できるように表を使うなど、工夫されている。

研究の目的を達成するために、最小限の項目から構成されている。

介入前の基準となるデータが適切に取得できるように組まれている。

主要および副次エンドポイントに関わるデータが適切に取得できるように組まれている。

被験者保護の観点から、検査や評価が適切な時期に実施されるよう計画されている。

当該研究内容と関係がない項目がない。ある場合は、削除するか、プロトコル内で説明が必要である。

被験者の来院日の猶予期間（アロワンス）は適切である。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 19/35

解析対象集団

無作為化比較試験では、原則「実際に治療したかどうか」ではなく、その被験者を「治療しようとしたかどうか」が重要であり、無作為化されたすべての症例を解析に用いることが推奨されている。無作為化されたすべての被験者を「治療しようとした集団、Intention to Treat、ITT集団」と呼ぶ。解析はITT集団を対象に、無作為化された群により比較を行う。無作為化試験の科学的な信頼性は、無作為化によって裏付けられるため、実際に使用した薬剤で群を分けると、ランダム化によって得られた比較群間の均衡が崩れてしまう可能性があるからである。

ITT集団の中から一度もプロトコル治療を受けていない被験者や、有効性を評価するデータが一つもない症例を除いた集団を「最大の解析集団、Full Analysis Set、FAS」と呼ぶ。一般的に無作為化比較試験ではFASを主解析で用いることは許容されている。

FASからプロトコルに準拠しなかった被験者を除いた集団を、「プロトコルに準拠した集団、Per Protocol Set、PPS集団」と呼ぶ。プロトコル不準拠症例を用いることで、ITTやFASでは治療効果は出にくくなると考えられるが、PPSでは、無作為化による比較群間の均衡が崩れ、結果にバイアスを生じることがある、またPPSを用いた解析では、より偏った集団を対象にすることで結果の一般化がより困難となることがある。

ITTやFASによる解析では実際の治療効果が過小評価されることがあるため、実際に得られた結果の頑健性を確認するために、副次的な解析としてPPSを用いた解析を行うことがある。

安全性の評価には、割り付けられた群によらず、実際に被験治療を受けた被験者のみを対象とした、Safety Analysis Set, SAS（安全性集団）を用いる。非劣性を目的とした試験では、PPSを主解析、FASを副次解析に用いることもある。どの解析に用いるのはどの集団のデータなのかをあらかじめ決めておく必要がある。

チェック項目

各解析（主解析、副次解析を含む）について用いられる対象集団が決まっている。

FAS、ITTの原則が守られているか、そうでない場合はその理由は妥当である。

安全性の解析には、対象治療を受けたすべての被験者が含まれている。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 20/35

症例設定数と臨床的意義

介入等前向き研究では、できる限り、統計学的手法を用いて必要最低限の症例数をあらかじめ計算する。症例数が少な過ぎれば、臨床的に意義がある結果であっても、統計的に有意な結果を出せる見込みは小さい。多すぎれば、不必要に多くの被験者をリスクを伴う研究に参加させる等倫理的な問題や、研究期間が長くなる、コストが必要以上にかかる等の問題が生じる。一方、症例数が確保できない希少疾患対象等の臨床試験や先行試験のない早期臨床試験では、実施可能症例数を設定することがある。優越性、同等性、非劣性を目的とする場合、各目的において症例数計算の方法が異なるので留意すること。

‡事例（クリックして表示）

「先行研究では対照薬では死亡を含む心血管イベントが20％である、被験薬では10％と想定すると、有意水準を両側の5％とおき、統計的検出力を80％担保するためには、最低限各群199名必要である。途中抜け落ちや欠損値等で解析不能例を10％考慮すると少なくとも約442例の登録が必要である。」
ここで有意水準とは、最終的な解析で有意差を両側のP値（通常のP値）が5％未満で判定するので、5％と設定する。統計的検出力とは、被験薬に本当に効果がある時に、有意差を検出できる確率であり、通常80％と置く。

チェック項目

例数設計に用いた論文やデータが適切である。

用いられる統計手法が適切である。

臨床的な意義としての結果解釈の妥当性が考慮されている。

計算に用いられた予想される治療効果に対し根拠がある。

介入が臨床的に有効であると結論する際の明確な基準が設けられている。

有意水準は原則両側の5％、検出力は最低80～90％に保たれる。それ以外の数値が用いられる場合は、その根拠が明確である。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 21/35

エンドポイント

介入研究においては、仮説を評価するための指標として使われる。アウトカムや評価項目とほぼ同じ意味である。通常、主要エンドポントと副次エンドポイントを置く。

死亡など、だれが評価してもぶれないハードエンドポイントと、主観を伴うソフトエンドポイントがある。真のエンドポイント（例えば心血管死亡率の低下）のデータを取得するのに、試験期間が長くなる場合等に、サロゲートエンドポイント（例えば、血圧や脂質の低下）を置くことがある。理に適いかつ客観的なエンドポイントが望ましい。

チェック項目

エンドポイントは、客観的指標を採用している。

主観的エンドポイントを使う場合は、その妥当性を検討している。

サロゲートエンドポイントを使う場合は、その妥当性を示すことができる。

スケール（例えば、痛みのスケールや認知症のスケール）を用いる場合には、その妥当性が示されている。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 22/35

主要エンドポイント

研究の主目的に直結したエンドポイントのこと。通常1つであり、当該研究の意義を示す重要な評価指標であり、これを基に、必要症例数が計算される。希に、2つ以上定めることもあるが、多重性（multiplicity）の観点から勧められない。（丹後俊郎・上坂浩之編集　臨床試験ハンドブック　朝倉書店　第27章　多重性の評価　参照）。複数の項目を主要エンドポイントにする場合は、有意水準の階層化や分配等統計的に注意が必要である。

チェック項目

研究の主目的に直結した主要エンドポイントが1つ選択されている。

2つ以上定める場合には、専門家と相談するのが望ましい。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 23/35

副次エンドポイント

研究の主目的に関連した補足的なエンドポイントのこと。

チェック項目

研究の主目的に直結したものではなく、関連した補足的なエンドポイントが設定されている。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 24/35

中止基準

中止基準には、被験者個人個人に対する中止基準と、試験全体の中止基準がある。それぞれ、研究計画書に明確に書かれていなければならない。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 25/35

介入の中止基準

介入による有害事象あるいは原疾患の進行等により研究の継続が不適切であると判断する基準のこと。研究者間で見解が異ならないように、研究計画書に明確に記載されている必要がある。また、被験者の不利益が最小限に抑えられるように設定されていなければならない。介入途中で、被験者が同意を撤回する場合を含む。

チェック項目

被験者個人に対する中止基準が、研究者間で見解が異ならないように、明確に記載されている。

被験者の不利益が最小限に抑えられるように設定されている。

中止後のデータの扱いについて記載されている。

中止後、必要に応じて、被験者のフォロー体制が記載されている。

最初の章に戻る

介入研究チェックリスト

P 26/35

試験の中止基準

研究実施後、登録症例数が予定数に達しない時点で、研究全体を中止する基準のこと。その他、試験薬等の安全性、有効性に関する重大な情報が得られた場合、中間解析等で試験の目的が達成されたあるいは完遂することが困難と判断された場合等がある。

チェック項目

試験全体の中止基準が、明確に記載されている。

被験者の不利益が最小限に抑えられるように設定されている。

中止後のデータの扱いについて記載されている。

中止後、必要に応じて、被験者のフォロー体制が記載されている。

最初の章に戻る

介入研究チェックリスト

P 27/35

報告事項

規制（治験、臨床研究法、再生医療法、人を対象とする生命科学・医学系研究に関する倫理指針）により、規制当局、IRB/CRB/倫理審査委員会等、機関の長への報告事項・報告手順・報告期限が異なるので、各規制を参照の上、研究計画書に記載する。

チェック項目

規制を遵守した報告事項、報告手順、報告先、報告期限が研究計画書に記載されている。

報告事項が研究者間で、解釈がぶれないように研究計画書に記載されている。

臨床研究法では、疾病等報告、不具合報告、不適合報告、定期報告があることが、研究計画書に記載されている。

人を対象とする生命科学・医学系研究に関する倫理指針においては、（予測できない）重篤な有害事象報告、不適合報告、進捗状況の報告義務があることが、研究計画書に記載されている。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 28/35

モニタリングと監査

モニタリングと監査は、研究の信頼性を確保するための手法である。臨床研究法では、モニタリングは必須、監査は必要に応じて求められる。人を対象とする生命科学・医学系研究に関する倫理指針においては、軽微な侵襲を除く侵襲を伴う介入研究では、モニタリングは必須、監査は必要に応じて求められる。

チェック項目

規制を遵守したモニタリングが計画されている。

規制に応じて監査が計画されている。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 29/35

データマネジメント

データ集積システムの構築、収集したデータを整理・確認する等、データの信頼性を確保するための一連の業務を示す。統計解析手法に従い、収集するデータ項目をリストアップし、すべてのデータについてどのように収集すべきか等を研究計画書及び症例報告書に記載する。症例報告書は長くは紙ベースで収集されていたが、近年ではインターネットに接続可能なコンピュータ上で直接入力できる電子データ集積システム（Electronic Data Capture, EDC）等が多く用いられている。収集されたデータは定期的に整理し整合性を確認し、必要であれば各研究施設に問い合わせ等を行う。個人情報の取り扱いや、バックアップ体制や研究終了後のデータの取り扱い等、研究開始前に検討し計画する必要がある。

‡事例（クリックして表示）

データの信頼性を確保するため、例えば血圧値を収集する場合、収縮期血圧か拡張期血圧か、平均血圧なのか、その計算式はどのようなものか、どの時点の血圧なのか、臥位あるいは座位で測定するのか、左右どちらの腕で測定するのか、追跡を伴う研究の場合は、登録時のみの測定か毎回の受診時の測定かなど、事前に取り決めが必要である。

チェック項目

収集するすべての項目が選択され記載されている。

収集するすべての項目についての詳細や収集タイミングは明確である。（誰が見ても同じデータを収集可能か）

収集する項目は統計解析手法に対して適切である。

紙で収集するのかEDCを用いるのか決定している。

個人情報の管理は適切である。

データの独立性が担保されている。

収集されたデータの整合性チェックが行われる。

整合性チェック後のデータの修正の方法が決められている。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

介入研究チェックリスト

P 31/35

中間解析

前向きの介入研究では原則、研究計画時に見積もられた症例数に到達するまで試験を継続し、研究終了時に初めてデータ解析を行うが、長期に及ぶ研究では、研究途中で結果を評価する中間解析が行われることがある。

中間解析の目的は、①評価中の治療法が対照治療に比べより効果があることを見る（有益性）②逆に害になっていることを見る（安全性）③結果に差がなくこれ以上研究を続けても意味のあるエビデンスが得られない（無益性）の3つがあげられる。

中間解析では、何度も解析を行うことで、擬陽性の確率が上がるといった多重検定の問題を防ぐために、有意差を評価する基準をより厳しく設定するなど注意が必要である。

中間解析を行う場合は、いつ、どのようにして行い、何を基準にしてどういうアクションをとるのかという詳細を前もって決めておく必要がある。事前に設定されたルールもなく、研究途中で解析を行い、その結果研究デザイン等が変更された場合、研究者が良い結果を出すために作為的に操作したと批判されることも多く、研究の信頼性を揺るがすことになりかねないので、中間解析については慎重に議論される必要がある。

‡事例（クリックして表示）

がんの第3相試験等において中間解析は予想されるイベント数の約半数（第1回目）4分の3（第2回目）が得られた時点で行われた。主要評価項目である無増悪生存の群間差は最終解析においてP＜0.05で評価されるが、中間解析ではより厳しいP＜0.001の基準が用いられた。

チェック項目

中間解析を行わない場合その旨を研究計画書で明記している。

中間解析を行う場合、その目的と意思決定の基準を明記している。

中間解析で有効性を評価する場合、有意水準はより厳しく定めている。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 32/35

独立データモニタリング委員会などの設置

臨床研究の進捗状況、安全性データおよび重要な有効性評価項目を適切な間隔で評価し、研究の継続、修正または中止を提言する委員会。通常は、当該研究と独立した2名以上の委員で構成される。

チェック項目

必要に応じて独立データモニタリング委員会の設置が検討される。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 33/35

利益相反

研究における利益相反とは、研究者が、資金提供を受けていたり、株式・特許等を有する研究において、その利益と、研究の公正性や被験者保護が衝突・相反している状況のことで、適切な利益相反マネジメントが求められる。利益相反のある場合は、研究計画書や説明文書にその説明が求められる。臨床研究法においては、利益相反書式により、必ず確認される。

チェック項目

利益相反に関する状況について研究計画書に記載されており、必要に応じて説明文書にて説明されている。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト

P 34/35

欠損データへの対処

研究途中で被験者が研究から辞退した場合など、臨床研究では常にデータの欠損の問題が起こる。エンドポイントがイベントの有無等2値変数の場合は、生存率解析を用いることで、抜け落ち例は抜け落ちの時間を考慮に入れた解析が可能。連続変数がエンドポイントとして使用される場合、例えば12か月後の血圧を主要評価項目と定めた場合に、12か月目のデータがない場合はその直近のデータを用いるというLast Observation Carried Forward（LOCF法）が良く用いられる。研究参加以降全くアウトカムが評価されていない場合は、治療効果が反映できないベースラインの値を用いなければならないので、アウトカムは、3か月時点、6か月時点など研究途中にできるだけ多く評価することが重要である。データの欠損の頻度やタイミングが比較群間で異なる場合は、LOCF法はバイアスのある結果を生むことがあるので、最近では、混合効果モデルを用いた手法や多重補完法など統計的により複雑な方法が用いられることがある。

‡事例（クリックして表示）

例）ベースラインから研究終了時までのQOLの変化量をエンドポイントとした解析では、どちらか一方のデータが欠損すると、通常の解析では欠損値が生じた症例を解析に入れることはできない。この場合、混交効果モデルを用いる方法や、変化量ではなく、12か月後のエンドポイントを従属変数とし、ベースラインのデータは多重補完する等、統計的に考慮が必要である。

例）欠損値を考慮しない解析は、欠損のない症例（コンプリートケース）のみを用いているため、コンプリートケースを用いて、比較群間に背景の偏りがないか確かめることが重要である。例えば、被験薬は副作用を伴い、副作用のある人は研究から辞退している場合、コンプリートケースのみを用いた解析では、無作為化が機能せず背景のずれが生じることがある。

チェック項目

欠損値の集計について記述されている。

研究デザインにおいて、欠損を減らすための方法を適切に検討している。

欠損によって起こりうる影響（結果）と、それに対処するための戦略を事前に考慮している。

十分な数のデータが欠損している場合、感度分析が行われる。

欠損のないデータのみを扱うコンプリートケース解析やLOCF解析の使用には十分な正当性がある。

欠損値補完を行う場合には、その手法について説明されている。

１つ前に戻る

最初の章に戻る

介入研究チェックリスト