観察研究チェックリスト
用語集
重み付け/逆数重み付け(Inverse Probability of Weighting; IPW法)
  • 傾向スコアとは、研究対象となる治療(医療行為)を受ける確率、受けなかったものは治療を受けない確率である。統計手法における重みづけとは、研究対象者一人一人のデータの重みを変えて解析に利用するということである。重みが2の研究対象者のデータは2人分、重み3の研究対象者のデータは3人分として扱う。傾向スコアの逆数による重み付け法とは、各研究対象者が傾向スコアの逆数を重みとして利用することにより、背景のずれをそろえる方法である。治療を受ける可能性が少ないにもかかわらず治療を受けた研究対象者、一方治療が必要であったにもかかわらず治療を受けなかった研究対象者の重みがより大きくなる。一般的に、マッチングよりは逆数重み法のほうが、解析に用いられる症例数が多くなると考えられる。重みづけを行った後に症例数をもとの症例数に戻すStable法が推奨される。治療を受ける可能性が少ない患者ほど治療の効果が小さいなど、治療効果が患者背景で異なる場合、傾向スコアマッチング法と、逆数重み法で解析結果が異なる場合があるので、結果の解釈には注意が必要である。
回帰分析
  • 交絡因子を説明変数に含めることでその影響を制御し、変数間の因果関係を示す推定値を求める方法。通常、観察研究では複数の交絡因子が存在するため、層別解析のみで交絡を調整することは難しい。回帰分析では、複数の変数により同時に起こる交絡を制御することが可能で、交絡の影響を補正する手段として一般的な方法である。
  • アウトカムの種類及び分布が正規分布か、アウトカムの測定に繰り返しなどの対応があるか等のポイントから、適切な回帰分析モデルを選択する(参考資料2)。
傾向スコア(propensity score)
  • 傾向スコアとは、治療など特定の医療行為(処置)の効果を調べる際に用いられる手法であり、対象となる医療行為を患者が受ける確率を、背景情報をもとに計算したもの。複数の背景因子を一つのスコアに集約することができ、そのスコアを用いて、曝露群と非曝露群間において背景因子の分布を均衡にするための統計学的な手法。
     (例)高齢で重症なほど特定の治療を受ける(又は受けない)確率が上がる。
  • 傾向スコアが類似する研究参加者を比較群間でマッチすることによって、傾向スコアの計算時に使用した背景因子の分布を比較群間でそろえることができ、これを擬似ランダム化と呼ぶ。ただし、バランシングが保証されるのはスコアの推定に用いた背景因子についてのみである。
  • 傾向スコアの推定には、曝露因子の種類によって2値ロジスティック回帰分析や多項ロジスティック回帰等を用いた様々な方法が提案されており、最近では機械学習を用いた手法等も提案されている。一方、マッチング後のデータ数は元データ数よりも必ず小さくなる。マッチング後のデータ数が少なくなるという問題を改善する一つの方法として、逆数重み付け(Inverse Probability of Weighting; IPW法)が行われることがある。
  • マッチングでは、アウトカムを起こしやすいため薬剤の投与等の曝露の必然性が高く(傾向スコアが大きく)かつ実際に薬剤の投与等が選択された患者集団や、傾向スコアが極めて低くかつ曝露をうけていない(薬剤非投与)患者群はマッチできず、曝露、被曝露両群で、傾向スコアが同程度の言わば中間的なグループが解析の対象になる。したがって、どの集団がマッチングで選択されたかによって、結果の一般化が難しくなることがある。これらの点を踏まえて、解析にはマッチングのほかに層別化、逆数重み付けなども利用されることがある。
事例1
心臓病ハイリスク患者において薬剤Aの心血管疾患発症予防効果を調べるため、年齢、性別、BMI、喫煙状態、心疾患の既往、合併症(糖尿病、高血圧、脂質異常症)の有無などから、既に薬剤Aを使用している確率(傾向スコア)を算出し、曝露群(薬剤A使用)一人一人に対し、傾向スコアが同程度と共用できる範囲内で薬剤A非使用者のマッチングを行い非曝露群とした。
(⇒傾向スコアを用いたマッチング)
交絡
  • 薬や治療法など研究対象因子の効果が、研究対象外の要因と絡み合って正しく評価できないこと。
  • 治療群ほど重篤者が多いなど、比較群間で背景が異なる場合起こる。
  • 交絡をおこす要因(因子)を交絡因子と呼ぶ。
  • 統計解析である程度は対応可能である。
誤分類(誤分類バイアス)
  • 情報バイアスの一種で、アウトカムまたは曝露に関する情報が誤って分類されることによって生ずるバイアスのこと。
  • ケースとコントロール、または治療群と非治療群で誤分類の程度が異なる場合(差異的誤分類、differential misclassification)は、関連性を過小評価することも、過大評価することもある。これに対し、それぞれのグループで同じ割合だけ(ランダムに)誤分類が起こっている場合(非差異的誤分類、non-differential misclassification)では、関連性は通常過小評価されることが多い。
  • 差異的誤分類(ケースとコントロール、または治療群と非治療群で誤分類の程度が異なる)の中でよく見られるのが想起バイアスである。
事例1
無症候性心筋虚血の発生と喫煙の関連を検討する後ろ向きコホート研究において、非喫煙者と比較して喫煙者の方がより積極的に心筋虚血評価の検査を実施されていた。
(⇒アウトカムの差異的誤分類によって、曝露の影響が過大評価された)
事例2
脂質摂取量と閉塞性肺疾患発症との関連を検討する研究で、観察期間中平均して摂取総カロリーの30%以上が脂質による対象者を多量摂取群、30%未満を少量摂取群とした。食事中の脂質量や総カロリーの測定には一定の誤差が生ずるが、脂質摂取量と閉塞性肺疾患の診断検査の実施のされ方には一般的に差は無いと考えられる。
(⇒二値的な曝露の誤分類が疾病に関して非差異的である場合、効果の推定値はbias toward the null、すなわち「効果なし」の方向に働く)
コホート
  • ある特定の対象集団のこと。コホート研究とは、ある要因を持つ集団(曝露群)と持たない集団(非曝露群)を追跡し、その要因と疾病や治療効果を比較検討する研究のこと。
情報バイアス
  • データの取り違いや測定方法が不十分であるために、収集されたデータに偏りが生じること。特にアウトカムに関連する情報の誤分類が比較群で異なる場合にバイアスを生じる。
事例1
飲酒歴や喫煙歴の自己申告は、過少申告の可能性がある。
事例2
質問者が対象者の疾病状況を知っている場合、要因への曝露について繰り返し質問したり、回答を誘導することにより、あたかも疾病群で要因への曝露が多いようなデータが得られる。
事例3
家庭血圧を測定する際、対象者が指定された血圧測定法を遵守せず、真の値より血圧値が高く(または低く)測定された。
事例4
電子カルテデータ等データベースを用いた研究において、転院後にアウトカムが発生した患者の情報が収集できず、アウトカムが発生しないと誤分類された。
STROBE声明
  • The Strengthening the Reporting of Observational Studies in Epidemiology (STROBE) statement: guidelines for reporting observational studies:疫学における観察研究の報告の強化(STROBE声明):観察研究の報告に関するガイドライン(https://www.equator-network.org/wp-content/uploads/2015/10/STROBE-Japanese.pdf)
  • 観察研究用チェックリスト(https://www.jspe.jp/publication/img/STROBE%20checklist-J.pdf)
選択バイアス
  • 研究対象者の選択方法に偏りがある場合に起こる。特に比較群間で研究対象者の選択方法が異なり、それがアウトカムに影響を及ぼす場合にバイアスを生じる。
  • 研究を行う場所、対象者を集める方法、研究参加後の脱落など、様々な場面で生じうる。
  • 解析では対応できない。
  • 研究計画段階で目的とする母集団を正しく代表する調査対象集団を選択することが重要である。また、調査対象集団の研究参加率を高めることも有効である。
  • 研究対象者の中で治療A、治療Bが選択される理由によるバイアス(治療選択バイアス。例えば重症者に治療Bが選択される傾向があった場合)は交絡バイアスに含まれるものであり、選択バイアスとは異なる。
事例1
従来治療Aと新規治療Bを後ろ向きコホート研究としてレジストリーデータを用いて比較した際、治療Aは日常診療として幅広い患者が対象に含まれていたが、治療Bについては全身状態が非常に悪い患者さんは除外されていたためにバイアスがかかった。
事例2
世帯所得と肥満の関係を調べる目的でアンケート調査を行った。世帯所得と肥満には関連性は見られなかったが、それは低所得世帯または高所得世帯ほどアンケートに答えていないことが原因であったと考えられる。
事例3
生活習慣と認知症発症の関連を見る研究で、認知症の人は、食生活や生活習慣等特定の危険因子を覚えていない可能性がある。このような場合、関連性を誤って評価する可能性がある。
事例4
末期腎不全に対する維持透析導入のタイミングが予後に影響するか検討する研究で、早期導入群(eGFR 10-14 mL/min/1.73m2)と後期導入群(eGFR 5-7 mL/min/1.73m2)では死亡率に差が無かった。早期導入群より、遅く透析導入をした群に、全身状態が良く比較的健康な患者が多かったのかもしれない。
(⇒初めてeGFR 10-20mL/min/1.73m2を観測した時点を観察開始時点とし、血圧や併存疾患等の交絡因子を調整することで、選択バイアスの影響を回避することができる)
想起バイアス
  • 情報バイアスの1つで、研究対象者が過去の出来事や経験を想起する際、その正確性の差に由来するバイアス。反応バイアス、報告バイアス、思い出しバイアスとも言う。
事例
妊娠中の薬剤曝露が乳幼児のアトピー性皮膚炎発症に影響するかについて症例対照研究を行った場合、アトピー性皮膚炎の子を持つ母親の方が、市販薬を含めた妊娠中の服薬歴の詳細について正確に記憶していることが予測される。
(⇒母性想起バイアス)。
層別解析
  • 交絡因子によってデータを層に分けることでその影響を制御し、それぞれの層において関連を推定し、各層の推定値から全体の効果の推定値を求める方法。
  • 一方、サブグループ解析とは、研究参加者のうち、ある特定の属性を持った集団に注目しその集団を対象として解析を行うことであり、効果の群間差がどのサブグループでもほぼ一様であることを確認する目的で行われる。効果に大きな差がみられた場合には、そのサブグループ化因子が交互作用を及ぼしている可能性がある。全体解析で差が出なかった時など、サブグループ解析が多用される向きがあるが、サブグループでは症例数が少なく検出力が低下すること、繰り返し検定による多重性の問題も生じるため、サブグループ解析は事前に計画してあることが望ましい。結果の解釈は慎重になるべきである。
多重代入法/多重補完法
  • 観測データを事前情報とし、欠損に係わるデータをできるだけ多く考慮しながら欠測データを統計的に補完(代入)する方法。欠損データが多いほど、補完後のデータは不確実性を伴うため、統計的に不確実性を作り出す方法として欠損データの事後分布を構築し、この事後分布からの無作為抽出を行う。欠損値を補完した完全なデータセットを複数作成し、それぞれのデータセット毎に解析を行い、得られた複数の解析結果を平均化(統合)する統計学的手法。
多変量解析
  • RCTのように介入の有無以外の背景因子が比較群間でそろっている場合、比較群間でアウトカムを直接比較しても交絡によるバイアスは生じない。
  • 多変量解析とは、一つのアウトカムに対して寄与する複数の因子の影響を考慮した上で、それぞれの因子がアウトカムに及ぼす関連性を分析する統計手法の総称である。
  • 観察研究では、無作為化が行えないことにより、比較群間で背景因子にずれが生じ、交絡が起こる。その交絡を補正する手段として、曝露(研究対象の治療等)の効果を解析する際に、背景因子がアウトカムに及ぼす影響を考慮し、数学的に背景因子のずれから起こるアウトカムへの影響を考慮した上で、研究対象となる曝露因子の影響を解析する目的で多変量回帰分析が一般的に利用される。
  • 一方、多変量回帰分析で調整可能な因子は、説明変数として解析で考慮された因子に限られるため、未知あるいは未測定の因子を含め比較群間で背景をそろえることができる無作為化に置き換えられるものではない。
  • 多くの説明変数を回帰分析に加える場合、それに伴い十分な症例数を担保するべきである。多変量解析で考慮する説明変数を選択する際に、単変量解析等解析結果によって選別する方法は避けるべきである。原則は、解析を始める前に、交絡になりえる因子、つまりアウトカムに対して因果関係を持つと臨床的に考えられる変数のうち、関連性の高いものから順に選択するべきである。
  • 説明変数を回帰モデルに多く入れ過ぎてしまうと結果が不安定になるため、考慮できる(モデルに加えられる)変数の数は症例数によって限られている。目安として、アウトカムが連続変数の時に用いる線形回帰モデルでは症例数/15個、アウトカムがイベントの有無のような2値変数の時に用いるロジスティック回帰分析の場合は、イベント有り無しの少ない方の数を10で割った個数、アウトカムがイベント発生までの時に用いるコックス比例ハザードモデルでは、イベント数/10が目安となる(参考資料2)。
バイアス
  • 調査方法などによるデータの偏りのこと。データを正しく解釈するためには、「バイアス」を考慮することが必要である。
不死身時間バイアス(不死身バイアス)
  • 観察開始の後、一定期間を経て曝露が初めて発生する場合、曝露が初めて発生する以前の期間においてアウトカムが起き得ない期間が存在することによるバイアス。例えば、糖尿病罹患後3年目に初めて新規治療を開始した。この治療を開始する前3年間を当該治療により生存できた期間として解析をしてしまうと、治療効果が過大評価されてしまう。観察開始後、曝露が発生するには一定期間追跡され続ける必要があり、追跡されるには生存していなければならない(不死身でなければならない)ことから命名された。
  • 不死身時間バイアスを回避する方法として、観察開始からの一定期間(ランドマーク時点までの期間)を曝露を定義する時間(すなわち、ランドマーク時点前に要因や介入が発生した場合のみ「曝露あり」と判定する)、それ以降の期間をアウトカムについて比較する期間とするランドマーク解析や、曝露が発生する前の時間は曝露なしとし、発生した時点以降のみを曝露ありとして解析を行う時間依存型共変量を考慮した生存時間解析などが提案されている(参考資料3参考資料5)。
事例1
心房細動の患者を対象に、ワルファリンの生命予後への影響と直接経口抗凝固薬(DOAC)の生命予後への影響とを比較する研究で、心房細動と診断された時点ではワルファリンを使用していたが、ワルファリン開始半年後にDOACに変更した。診断時点をベースラインとする場合、この研究対象者はワルファリン群に分類されてしまう。この場合、途中からDOACを用いた症例を追跡開始時点からDOAC群に分類し解析すると、ワルファリン投薬期間(DOACの投与が開始される前の時間)をDOACにより生存できた期間と誤分類するため、DOACにより生存できたかのようなバイアスが生じる。こうした時、DOACにより生命予後が良くなったのではなくて、ただ単にDOACによる治療を受けるためにはそもそも生存していなければならなかったという意味を込めて、不死身時間バイアスと呼ばれる。
事例2
電子カルテデータ等既存情報を用いた研究で、肺がん患者を対象に複数の抗がん剤で治療を行ったほうが、単剤による治療を受けた患者より生命予後が良いという結果となった。この場合、曝露の状態(複数か単剤か)をベースライン時点(追跡開始時点)で定義せず、追跡開始以降の時点(結果としてどうなったか)で定義している。複数の薬剤を使用するためには生存していなければならず、複数の薬剤で治療したから生命予後が良くなったのか、長生きしたから複数の薬剤で治療できたのかが分からない。複数の薬剤を使用したことにより生命予後が良くなったのではなくて、ただ単に複数の薬剤で治療を受けるためには生存していなければならなかったというバイアスであり、これを不死身時間バイアスという。
マッチング
  • 症例対照研究(ケース・コントロール研究)やコホート研究等で用いられ、症例と対照の間で年齢、性別、祖先系集団の違い(人種)等の特性が類似するように対照を選択することで、選択バイアスや交絡因子の影響を最小限にする研究デザイン上の手法。全体として構成比率が同じになるように選択することをグループマッチング(頻度マッチング、度数マッチング)、症例と特質が対応する対照(個人)を選択することを個別マッチングという。
  • 症例対照研究においては、曝露と関連し、アウトカムに影響を及ぼす可能性のある因子(中間因子)を用いてマッチングを行うと(オーバー・マッチング)、検出力が低下する可能性がある。
事例1
心筋梗塞と経口避妊薬の関連を見るケース・コントロール研究で、心血管リスク因子でマッチングを行った場合、心筋梗塞は高齢で発症しやすいため、選択されたコントロール群は、本来経口避妊薬を用いている集団(源泉集団)よりも高齢となる。
(⇒解決策として、マッチングを考慮した層別解析や、層別サンプリングやカウンターマッチングなどのコントロール選択時のオプションがある)
事例2
人工授精は多胎児や早産のリスクを高めることから、周産期死亡や出生児体重に影響することが想定される。ケース・コントロール研究で、妊娠期間や胎児数でコントロールをマッチすることで、人工授精のアウトカムへの影響を除くことができる。
観察研究チェックリスト
参考資料
  1. 令和3年度厚生労働科学特別研究事業(堀田班)「臨床研究法見直し審議における新たな課題・論点への対応策の確立のための研究」
    資料2「欧米での観察研究(非介入研究)の規制上の取り扱いに関する調査結果」
    https://mhlw-grants.niph.go.jp/system/files/report_pdf/202106010A-sonota2.pdf(最終閲覧日2024年3月8日)
  2. 新谷 歩、『今日から使える医療統計』医学書院、2015年。(「回帰分析」に戻る)(「多変量解析」に戻る
  3. AMED研究公正高度化モデル開発支援事業「医系国際誌が規範とする研究の信頼性にかかる倫理教育プログラム」
    https://www.amed.go.jp/page_000001_00542.html(最終閲覧日2024年3月8日)(「不死身時間バイアス(不死身バイアス)」に戻る
  4. 高橋 将宜他、「様々な多重代入法アルゴリズムの比較―大規模経済系データを用いた分析―」『統計研究彙報』第71号、2014年、pp39-82。
  5. Washino S, et al. Association between immune-related adverse events and survival in patients with renal cell carcinoma treated with nivolumab plus ipilimumab: immortal time bias-corrected analysis. Int J Clin Oncol 28, 1651–1658 (2023).
    https://doi.org/10.1007/s10147-023-02406-x「不死身時間バイアス(不死身バイアス)」に戻る


本単元は、APRINの研究者コミュニティの協力を得て、日本の法律・指針その他に沿って作成された教材です。作成・査読に参加した専門家の方々の氏名は別に記載させていただきました

© 2024 Association for the Promotion of Research Integrity