Do the observational studies using propensity score analysis agree with randomized controlled trials in the area of sepsis?
Journal of Critical Care 29 (2014) 886.e9–886.e15
やっぱり普通の論文を選べないブログ担当者です.普通のRCTくらいみんな当然読むよねってことで.
PSを使った論文(特にPS matching)は増えてきていますが,やはり胡散臭いところありますが実際の所どうなの?という話.
結論は,なんとも言えないところの多い論文でしたが,effect sizeを過大評価する傾向があったと言うもの.
他にも,
ACSに関しては,かなり過大評価しているという話(European Heart Journal (2012) 33, 1893–1901)や,
集中治療領域では逆に過小評価するといった話(J Clin Epidemiol. 2014 Aug;67(8):932-9),
外科手技では一致した(Ann Surg. 2014 Jan;259(1):18-25.)という話も.
結局のところ,わりと一致するけど,異なることももちろんあってそれは予測できない(Crit Care Med. 2015 Sep;43(9):1870-9.)という感じでしょうか.
つまり,RCT組める,あるいは組むべきテーマなら,RCTの結果を待つべきということになるのだろうと思います.
もちろん,real worldを反映していない,設備がととのった病院での研究がほとんどである等RCTにも問題はあります.
方法.
Sepsisに関連したPSを用いた論文を検索.
Pubmed, Scopus, EBSCOから,言語の限定なし.
EMBASEは入っていない.
exclusion criteria:
①リスク要因,診断モデルのvalidationなどは除外.
②死亡率を評価していないものも除外.
選ばれたPS論文に対応するRCT or systematic reviewを検索し評価.
論文の質も検討している.
結局14個のPSの論文が引っかかった.それを8つの分野に分けて複数ある場合はrandom effect modelでmeta-analysis.
中身はこんな感じ.ただ,matchingやstratificationではなく,adjustmentが多いので,なんだかなぁと思う部分がある.特にlow dose steroidは全てadjustment.
adjustmentをPSでやっても良さがないと思う.
RCTの質はこんな感じです.
結果
赤がPS, 黒がRCT.必ずしもではあるが,半分くらいで,PSの方がeffect sizeが大きい.
差だけで見るとこんな感じ.meta-analysisをすると,PSが良い結果.不均一すぎる.
I square=99%
nが5以上のものだけで,Funnel plotをみると,steroidだけ有意にpublication biasが疑われた.
質の良いPS論文だけでSensitivity analysisを行っても似たような結果.
PSを利用した論文は,所詮retrospectiveがほとんどなので,publication biasは生じる.また,交絡因子も,実際の所どこまで除去できているかわからない.PSとはいえ,matchingじゃないadjustmentなんて,ただの観察研究に毛が生えた程度でpseudo-RCTではない.
冒頭でも書いた様に,結局のところPS matchingの結果とRCTの結果には,ある程度解離が生じるものなので,鵜呑みにし過ぎないというのが妥当.
特に,個人的に思うのは,PSの共変量が適切に選ばれていなかったり(著者がMDだけの時が多い気がする),そもそも,性善説に従っているので,matchingをいい結果が出るまで繰り返していないかという疑念がわく.
あと,個人的には,replacementを行っているものやIPTWは信用出来ないと感じている.そんな事出来るなら,RCTで全員nを2倍しているのと本質的に変わらないのではと思ったりもする.
少し前に,誤嚥患者の絶食と食べさせ続けるというものを比較したIPTWを使用したPS matchingの論文(Clin Nutr. 2015 Oct 9. pii: S0261-5614(15)00245-9.)が出て,話題になっていたが,違和感しか無い.
PS matching後にnが増えるなどというのは,数学的に正しかろうと,結果を鵜呑みに出来るようなものでは全く無い.飽くまでもRCTを組んで良いという程度の論文に過ぎない.