臨床研究の方法

倫理

ニュルンベルク条項 (1947年):「許可できる医学実験」

  1. 自発的な同意(法的能力、強制がない、自由な意志、実験内容の理解)
  2. 他の方法では得られない、社会に有益な成果
  3. 動物実験と自然の経過に関する知識に基づく
  4. 不必要な身体的・心理的苦痛を避ける
  5. 死や障害が予測される実験はしない
  6. リスクが利益を上回らない
  7. 適切な準備と設備
  8. 科学的に資格がある実験者
  9. 被験者は自由に実験を中断できる
  10. 傷害が予測される場合、実験者は実験を中断する

ヘルシンキ宣言 (1964、世界医師会)

  1. 自己決定権
  2. 脆弱で保護の必要な対象者に対する配慮
  3. 研究計画書の作成
  4. 承諾なき計画変更は不可
  5. 保護責任は医師にある
  6. データベースへの登録
  7. 消極的結果も公表されるべき
  8. 参加者が結果を知る権利

GCP (Good clinical practice):正しく治験を実施するためのルール

  1. ICHによる:International Conference on Harmonization: 日米EU医薬品規制調和国際会議
  2. 厚生労働省令(法律を補う規則)による:医薬品の臨床試験の実施の基準に関する省令(平成九年三月二十七日厚生省令第二十八号、改正平成二六年七月三〇日厚生労働省令第八七号)

倫理指針

  1. 臨床研究の倫理指針(厚生労働省、平成15年)
  2. 人を対象とする医学系研究に関する倫理指針(文部科学省、厚生労働省、平成26年12月22日告示)

報告のガイドライン

臨床研究の分類

症例報告、症例集積研究

コホート研究

横断研究(クロスセクショナル研究)

症例対照研究(ケースコントロール研究)

比較試験

無比較試験

アウトカム(エンドポイント)

① True EndpointとSurrogate Endpoint(真性変数と代替変数)

② Primary EndpointとSecondary Endpoint(主要評価項目と副次的評価項目)

アウトカム変数の属性とよく利用される統計手法

目的変数 単変量解析 多変量解析
連続 ①t検定
②分散分析
③Wilcoxon順位和検定
⑧多重線形回帰分析(重回帰)
二値 ④独立性検定
⑤リスク比・オッズ比
⑥割合の検定
⑨ロジスティック回帰分析
時間依存性 ⑦ログランク検定 ⑩コックス比例ハザードモデル
2つの連続変数の関連
⑪相関係数(Pearson, Spearman, Kendall)
その他の多変量解析
主成分分析、判別分析、クラスター分析、パーティション解析など

サンプルサイズ(N)の設定

(例)平均値の比較におけるサンプルサイズの設定

先行研究において、A群: 8.8±3.2、B群: 12.2±3.2であり、効果の大きさΔ=12.2-8.8=3.4、共通SD=3.2。検定の条件を、α=0.05(有意水準5%)、1-β=0.80(検出力80%)と設定。

サンプルサイズの公式より、群あたり15例となる。
N=2(Zα+Zβ)2 / (Δ/SD)2 + Zα2/4
=2(1.96+0.842)2/(3.4/3.2)2 + 1.962/4 =14.9

(例)割合の比較におけるサンプルサイズの設定の例

α=0.05(有意水準5%)、1-β=0.80(検出力80%)において、2群の割合の比較での必要症例数(群あたり)は以下のとおり。

70% 50% 30% 10%
90% 61 19 10 6
70% 94 23 10
50% 94 19
30% 61

統計解析の例

①t検定による2群の平均値の比較

要約
A 100, 110, 120, 120, 130, 130, 130, 140, 140, 150, 160 130±5.2, n=11
B 80, 90, 100, 100, 110, 110, 110, 120, 120, 130, 140 110±5.2, n=11

推定:平均値の差、20 [4.5, 36] (点推定と区間推定)
検定:p値は0.014(t検定、両側)
解釈:差があるとみなす

①' 対応のあるt検定(1群の平均値が0と異なるか否か)
1 2 3 4 5 6 7 要約
63 55 42 42 50 62 42
41 43 44 42 38 44 50
Δ -22 -12 2 0 -12 -18 8 -7.7±11.2, n=7

推定:Δの平均値、-7.7 [-18.1, 2.6]
検定:p=0.12(t検定、両側)
解釈:差があるとはいえない

②分散分析による3群以上の平均値の比較

要約
A 100, 110, 120, 120, 130, 130, 130, 140, 140, 150, 160 130±5.2, n=11
B 80, 90, 100, 100, 110, 110, 110, 120, 120, 130, 140 110±5.2, n=11
C 90, 100, 110, 110, 120, 120, 120, 130, 130, 140, 150 120±5.2, n=11

検定:p=は0.038(分散分析、自由度調整R2乗 0.14)
解釈:3群の平均値に差があるとみなす

②' 多重比較の調整(チューキー法)

検定:p=0.029(AvsB), 0.38(AvsC), 0.38(BvsC)
解釈:A-B群の平均値に差があるとみなす

②'' 多重比較の調整(ボンフェローニ法)

検定:調整なしp=0.011(AvsB), 0.19(AvsC), 0.19(BvsC)、検定数(3)を乗じ
   調整ありp=0.033(AvsB), 0.57(AvsC), 0.57(BvsC)
解釈:A-B群の平均値に差があるとみなす

③Wilcoxon順位和検定による比較

要約(中央値・四分位範囲)
A 20, 20, 28, 30, 32, 34, 40, 40, 50, 60, 70 34 [28, 50], n=11
B 20, 30, 40, 50, 50, 58, 60, 62, 64, 70, 80 58 [40, 64], n=11

(箱ひげ図、ボックスプロット)

検定:p=0.065(Wilcoxon順位和検定)
解釈:差があるとはいえない

③’Wilcoxon順位和検定による比較(例数を倍にとった場合)

要約
A 20, 20, 28, 30, 32, 34, 40, 40, 50, 60, 70 34 [28, 50], n=22
A追加 20, 20, 28, 30, 32, 34, 40, 40, 50, 60, 70
B 20, 30, 40, 50, 50, 58, 60, 62, 64, 70, 80 58 [40, 64], n=22
B追加 20, 30, 40, 50, 50, 58, 60, 62, 64, 70, 80

検定:p=0.008(Wilcoxon順位和検定)
解釈:差があるとみなす

③と③’は同じ要約値であるが、例数が多いと統計学的有意になる。実質的に意味のある差かどうか、意味のある差に対して適切なサンプル数が用いられているかをよく考える必要がある。

④独立性検定(χ2乗近似・Fisher正確確率)

(2x2クロス表・分割表)
因子 イベントあり イベントなし
A 45 55
B 30 70

検定:p=0.028(χ2乗近似による独立性検定)
   p=0.041(Fisher正確確率法)
解釈:因子とイベントは独立でない(因子とイベント発生は関連があるとみなす)

⑤リスク比・オッズ比

(2x2クロス表・分割表)
因子 イベントあり イベントなし リスク オッズ リスク比 オッズ比
A 45 55 0.45 0.82 1.5 1.9
B 30 70 0.30 0.43

リスク(発症率/罹患率/Incidence):45/100=0.45(A群)、30/100=0.30(B群)
オッズ:45/55=0.82(A群)、30/70=0.43(B群)
推定:リスク比(RR: relative risk)1.5 [1.03, 2.18]
   オッズ比(OR: odds ratio)1.9 [1.06, 3.42]
解釈:AはBに比してイベントのリスクが高い、またはイベントのオッズが高いとみなす

⑥割合の検定

因子 事象数 観察数 割合
A 45 100 0.45
B 30 100 0.30

推定:割合の差 0.15 [0.016, 0.28]
検定:p=0.028
解釈:2群の割合に差があるとみなす

⑦ログランク検定

(生存率表)
ID 時間 打切 N 故障率 生存率 累積
A 1 5 0 8 0.125 0.875 0.875
2 15 1 7
3 20 1 6
4 25 0 5 0.200 0.800 0.700
5 30 1 4
6 35 1 3
7 40 1 2
8 40 1 1
ID 時間 打切 N 故障率 生存率 累積
B 9 5 0 8 0.125 0.875 0.875
10 10 0 7 0.286 0.714 0.625
11 10 0 7
12 15 0 5 0.200 0.800 0.500
13 20 0 4 0.250 0.750 0.375
14 25 0 3 0.333 0.667 0.250
15 30 0 2 0.500 0.500 0.125
16 40 1 1

(累積生存率曲線:カプランマイヤー法)

検定:p=0.030(ログランク検定)
解釈:2群の生存時間に差があるとみなす

⑧多重線形回帰分析

Y(目的変数) A B C C'(ダミー変数)
100 40 4 1
90 60 3 1
60 55 7 1
70 40 5 0
40 25 9 0
90 70 2 1
50 40 4 0
110 65 1 1
60 40 7 1
70 50 5 1
70 45 3 0
50 40 4 0
推定値 p値
切片 117.3 0.004
A -0.56 0.30
B -7.96 0.008
C' 29.2 0.014

予測式:Y=117.3-0.56×A-7.96×B+29.2×C'(自由度調整R2乗 0.76、p=0.002)
解釈:アウトカムYに対して、因子Bと因子Cが影響する。Yは、Bが1単位増えると7.96減少し、C'が1であると(Cが大であると)29.2増える。

⑧’多重線形回帰分析(2)(②の分散分析のデータ)

Y X1ダミー X2ダミー
100, 110, 120, 120, 130, 130, 130, 140, 140, 150, 160 A 0 0
80, 90, 100, 100, 110, 110, 110, 120, 120, 130, 140 B 1 0
90, 100, 110, 110, 120, 120, 120, 130, 130, 140, 150 C 0 1
推定値 p値
切片 130 0.0001
X1 -20 0.01
X2 -10 0.19

予測式:Y=130-20×X1-10×X2(自由度調整R2乗 0.14、p=0.038)
解釈:分散分析のp値、R2乗値と一致する(②を参照)
   係数(推定値)は各群の平均の差となる
   A群に比し、B群は20低く(p=0.01)、C群は10低い(p=0.19)

⑧''多重線形回帰分析(3)(説明変数X3の追加、共分散分析)

Y X1 X2 X3共変量
100, 110, 120, 120, 130, 130, 130, 140, 140, 150, 160 A 0 0 4, 5, 4, 6, 7, 4, 8, 10, 9, 10, 11
80, 90, 100, 100, 110, 110, 110, 120, 120, 130, 140 B 1 0 4, 5, 7, 4, 6, 8, 4, 9, 8, 9, 10
90, 100, 110, 110, 120, 120, 120, 130, 130, 140, 150 C 0 1 12, 10, 8, 11, 13, 10, 12, 14, 11, 12, 16
推定値 p値
切片 90.2 0.0001
X1 -18 0.0009
X2 -36 0.0001
X3 5.6 0.0001

予測式:Y=90.2-18×X1-36×X2+5.6×X3(自由度調整R2乗 0.63、p=0.0001)
解釈:Yに対して影響をもつ共変量X3によって補正
   X1、X2のいずれもが有意となる
   A群に比し、B群は18低く、C群は36低い(C群の方がより低下する結果になる)

⑨ロジスティック回帰分析

Event X1ダミー X2ダミー X3
0, 1, 1, 1, 1, 0, 1, 1, 0, 1, 1 A 0 0 4.5 / 5.5 / 6 / 7 / 6.5 / 6.5 / 6.5 / 7 / 7 / 7.5 / 8
0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 0 B 1 0 4 / 4.5 / 5 / 5 / 5.5 / 5.5 / 4.5 / 6 / 6 / 6.5 / 7
0, 0, 1, 0, 1, 1, 1, 0, 1, 1, 1 C 0 1 4.5/ 5 / 5.5 / 5.5 / 6 / 6.5 / 6 / 6.5 / 7.5 / 7 / 9
推定値 p値
切片 -6.04 0.09
X1 -2.57 0.054
X2 -0.075 0.94
X3 1.10 0.047

尤度比検定では各パラメータのp値は、X1: 0.03, X2: 0.94, X3: 0.021

イベントの発生率をpとすると、
予測式:log(p/(1-p))= -6.04-2.57×X1-0.075×X2+1.10×X3
解釈:イベント生起にX1(AvsB)、X3が影響しているとみなす
   さらに、
   e -2.57=0.076は、X1が1単位増加したときのオッズ比
   e -0.075=0.92は、X2が1単位増加したときのオッズ比
   e 1.10=3.00は、X3が1単位増加したときのオッズ比

統計ソフトに説明変数として”群”と”X3”をそのまま入れた場合、
予測式:log(p/(1-p))= -6.93 +(B:-1.69,C: 0.807,A: 0.882) +1.10×X3となり、値は上記に一致する。
B群: -8.61+1.10×X3と-8.62+1.10×X3
C群: -6.11+1.10×X3と-6.12+1.10×X3
A群: -6.04+1.10×X3と-6.05+1.10×X3

⑨’ロジスティック回帰分析

X3だけでロジスティック回帰を行いROC曲線をかくと、

矢印のところで、感度1.0、特異度0.47を与えるX3のカットオフ値5.5、
矢頭のところで、感度0.5、特異度0.88を与えるカットオフ値6.7が定まる。
(感度を優先すべきか(スクリーニングなど)、特異度を優先すべきか(確定診断など)による)

⑩コックス比例ハザードモデル

参考文献

2017/Jan, 2016/Aug, 2014/Dec, 2012/