<Meta-analysis> #1. Article Review

Career/연구|2023. 1. 5. 12:22

지난 글에서 문헌 조사에 대하여 간단히 공부해 보았다. 

 

문헌 조사에서 가장 첫 단계는 해당 주제의 meta-analysis나 systematic review에 대하여 검토하는 것인데,

이러한 article들은 그 자체로 문헌 조사의 좋은 예에 해당하기 때문에 실제로 meta-analysis article을 가지고

RevMan이라는 소프트웨어를 다뤄보며 어떤 식으로 논리가 전개되는지 확인해 보자.

 

RevMan을 다루는 방법에 대하여는 김지형선생님의 저서를 활용하였으며, 오늘 글에서 자세히 다루지는 않을 것이다.

 

 

Systematic review vs. Meta-analysis

개념을 먼저 정리해 보자.

original research가 아닌, 기존의 다른 문헌들을 탐색해가며 주제에 대해 정리하는 article을 Review article이라고 한다.

크게 Narrative reviewsystematic review로 나눌 수 있다. 

 

다만, 근거 수준을 높이기 위해서는 Narrative review보다는 특정 "체계" 안에서

  • 관련 주제의 문헌들을 최대한 빠짐없이 수집하고
  • 수집한 연구들이 신뢰할 만한지 질적 평가를 하고
  • 결과들을 수학적으로 문제없도록 통합하는

Systematic review가 많이 시행되고 있다. 

 

그러나, 해당 주제를 다룬 연구 논문들의 결과들이 이질적일 수 있는데

예를 들면

연구 #1 : 견관절 관절염 치료법 A와 B를 시행하여 functional outcome을 비교

연구 #2 : 견관절 관절염 치료법 A를 시행하여 치료 전후의 functional outcome을 비교

 

위의 두 연구는 주제는 유사하나 통합하기는 쉽지 않다. 

 

따라서 비교 가능한 연구들의 데이터를 종합하여 요약하는 systematic review의 한 가지 통계적 방법론을 Meta-analysis라고 이해하면 된다.

 

 

 

Sample study

이번에 예시로서 공부해 볼 article은 2020년 JAMA Open에 게재된 다음의 논문이다. 

 

2020년 2월에 MEDLINE, Embase, Scopus, CINAHL을 검색하였고, frozen shoulder을 치료하는 여러 modality, no treatment, placebo 등을 비교한 Randomized study를 수집하였다. 

 

PRISMA protocol을 따랐으며 PICO는 다음과 같았다. 

  • participant : patients with frozen shoulder of any etiology, duration, and severity;
  • intervention : any treatment modality for frozen shoulder;
  • comparison : any other treatment modality, placebo, or no treatment;
  • outcome : pain and function (primary outcomes) and external rotation range of movement (ER ROM) (secondary outcome) in the short term, midterm, or long term

 

다만 Frozen shoulder의 정확한 진단 criteria가 없기 때문에 이를 risk-of-bias assessment에서 다뤘다고 기술하고 있다.

 

검색어

(adhesive capsulitis OR frozen shoulder OR shoulder periarthritis) AND (treatment OR management OR therapy) AND randomi*)

 

 

Flow diagram

 

Risk-of-Bias assessment

연구들의 internal validityCochrane Collaboration's tool for assessing risk of bias in randomized trials를 활용하여 평가되었는데, PROM인 pain, function과 그렇지 않은 ROM(range of motion)을 각각 평가하였고, 

 

이를 통해 2개 이하의 영역에서 bias risk가 높으면 low,

2개 이상의 영역에서 risk가 높으면 high, unclear overall risk of bias로 나누어졌다. 

 

 

근거 수준은 GRADE(Grading of Recommendations, Assessment, Development and Evaluations)을 사용하였다.

 

 

★Data extraction

해당 section에는 메타 분석을 하면서 실질적으로 맞닥뜨리는 문제들을 어떻게 해결했는지 엿볼 수 있었다.

 

missing data :연구자 중 2명이 참여하여, word 파일에 각 연구들의 특징을 정리하였고, missing data의 경우에는 저자에게 연락을 시도하였다고 한다.

 

연구 별 결과보고의 시점의 차이 : 자체적인 기준으로 세워 <12주는 단기, 12주~12개월은 중기, 12개월 이상은 장기로 분류하였고, 충분한 자료가 있는 연구의 경우 단기를 2~6주의 초기 단기와 8~12주의 후기 단기로 세분화하였다. 

 

적은 연구에서만 다룬 intervention : 3개 미만의 연구에서만 다룬 intervention의 경우 supplement에만 추가하였고 분석에는 제외하였다. 

 

paired study: 비슷한 시기에 outcome measure을 한 3개 이상의 연구가 있다면 이를 pairwise meta-analysis로 분석하였다.

 

측정 방법의 차이 : ER ROM의 경우 측정 방법이 동일하였기 때문에 raw mean difference와 95% 신뢰구간을 사용하였고, functional score의 경우 다른 점수를 사용하였기 때문에 standardized MD(SMDs)를 사용하였다.

 

연구 세팅의 차이 : 휴식 중, 야간, 활동 시처럼 다양한 세팅에서 pain을 보고한 경우, 휴식 중 통증만 분석하였다. 마찬가지로 능동, 수동 ROM 중에서는 동질성을 높이기 위해 passive ROM만 분석하였다. 

 

1형 오류의 문제 : p < 0.05로 유의미한 결과를 도출한 연구는 1형 오류를 줄이기 위해 TSA(Trial sequential analysis)를 거쳤다. TSA는 마치 메타분석의 interim test와 유사하다.

 

네트워크 메타분석 : 이 또한 생소한데, 다음 그림과 같은 결과를 준다.

 

** TSA 그래프의 해석

대략적으로만 알아보자. 

 

4개의 빨간 선이 있는데,

통계적 유의성에 대해 기존 임계값을 나타내는 2개의 수평선이 그려져 있고,

필요한 정보의 크기를 나타내는 1개의 수직선이 그려져 있다. 

사선은 TSA 경계로서 통계적 유의성에 대한 임계값을 뜻하고

파란 선은 연구가 추가될 때마다 생기는 누적 정보량을 뜻한다.

뭐 1형 오류를 줄이기 위해 이런 걸 사용한다~ 정도만 알고 넘어가자. 

 

 

 

Statistical analysis

RevMan 5pairwise MA forest plot, 이질성 검사(Χ제곱, I제곱)를 시행하였다. 

TSA softwareTSA를 시행하였고, 1종오류 확률 5%, power 20%로 O'Brien-Fleeming α-spending function을 사용하였다. 

Stata 및 mvmeta librarynetwork MA를 시행하였다. 

 

 

평균이나 SD가 정확히 보고되지 않은 연구는 그래프에서 대략적인 값을 도출하였고, 

사분위수만 보고된 경우 SD를 IQR을 1.35로 나누어 계산하였다. 

Median만 보고된 경우 평균이라고 가정하였고, 

등등 연구들의 결과를 동일하게 처리할 수 있도록 가공하였다.

 

 

Results

34개의 연구가 포함되었고, 총 2402명의 데이터가 있었다.

 

Table 1에서 연구들의 특징을 쭉 정리하여 나열하였다. 

 

 

Table 2에서는 risk-of-bias assessment 결과를 표시하였다. 

PROM과 non-PROM을 따로 보고하였다. 

 

 

적은 수의(3개 미만) 연구에서만 다룬 intervention 방법들은 분석에 포함하지 않고 따로 기재하였고

 

 

GRADE tool로 근거 수준을 평가한 것도 표기하였다.

EST, LST, MT 이런 것들은 f/u term을 약자로 표시한 것이다.

 

 

I squred table도 따로 표시하고 있다. 이는 이질성의 지표로, 이 분석으로 제외한 study들을 적어두었다.

 

Pairwise meta-analyses

term 별로 short term(early 2~6주, late 8~12주), mid term(4~6 months), long term(>12 months)로 나누어 같은 기간에 outcome을 낸 연구들을 pairwise meta-analysis 하였다.

비교 대상 별로도 stratify 하여 다음과 같은 forest plot을 보고하였다.

하나만 자세히 보면,

ealry short term f/u에서 IA corticostreoid와 placebo/No Tx. 를 비교했을 때

IA steroid에서 통증이 유의미하게 감소한 것을 볼 수 있다.

MD : -1.4 VAS score, 95% CI : -1.8 ~ -0.9

p <0.001로 p value도 보고하였다. 

 

반면 mid-term에서는

MD -0.01, 95% CI -0.71 ~ 0.7로 유의하지 않았다.

 

 

 

위와 같이, term별로, 비교군 별로, outcome 별로 매우 많은 결과가 있었기 때문에

유의미한 결과만 본문에 싣고, 나머지는 supplement에만 plot을 실은 것을 볼 수 있었다.

 

층화가 너무 다양하다 보니(여러 연구들의 이질성 때문에 어쩔 수 없겠지만)

결과가 굉장히 일목요연하지는 못하였다. 

 

유의미한 결과만 뽑아보면,

IA steroid : short term에서 pain, ROM, function이 호전되었고, mid term에서는 function만 호전되었다. 

physiotherapy : early short term에서 ROM 호전을 보였다. 

IAS + Physio : early short term에서 ROM 호전을 보였다. 

 

IAS vs. Physio : IAS가 early short term function과 late short term pain, mid term ER ROM에서만 superior 했다. 나머지는 차이가 없었다. 

 

IAS + Physio vs. IAS only : early short-term ER ROM에서만 조합군이 우월했고 나머지는 차이가 없었다. 

 

IAS + Physio vs. physio only : early short term function에서만 조합군이 우월했고 나머지는 차이가 없었다. 

 

A/S distension + IAS vs. IAS only : short term pain에서 조합군이 우월하였다. 

 

Acupuncture + Physio vs. Physio only : 차이 없었다. 

 

느낌적인 느낌으로..

Intra-articular steroid는 단기적으로 pain, ROM, function에 효과가 있으나 f/u이 길어질수록 큰 차이가 없으며, A/S distension을 함께 시행할 경우에도 단기적 효과만 있다. 

 

physiotherapy는 단기적으로 ROM 호전에 도움을 준다. 그마저 f/u이 길어지면 IAS보다 ROM 호전에 효과가 적다. 

IAS와 physio 조합은 단기적으로 ROM, function 면에서 효과가 있으나, f/u이 길어지면 큰 효과가 없다. 

 

Acupuncture는 큰 의미가 없다. 

 

임상적인 중요성을 함께 고려해 보면,

Frozen shoulder는 보통 3 stage로 진행하는데, 

pain(2~9개월 지속) -> stiffness(4~12개월 지속) -> recovery(5~24개월 지속) 되는 병태를 가지고 있다. 

따라서 위의 MA에서 나눈 최소 midterm까지는 pain의 관리가 QOL과 연관이 크겠고, 

long term stiffness, function 관리에 중점을 둬야 하는데

 

early short-term(~6주)까지

소위 뭔 짓(IAS, physio, 조합)을 해도 pain의 감소가 보이나, 특이한 점은 IAS + physio보다 physio 단독군이 결과가 좋았던 것이 조금이질적이고, 

 

late short-term(~12주, 즉 3개월)까지는 IAS가 좋았다. 

 

Midterm부터는 pain에는 뭔 짓을 해도 큰 차이가 없었는데, 이는 pain자체가 줄어서 그럴 수도 있으며, 

ROM의 경우 IVS나 physio나 조합이나 모두 효과가 있었다. 

 

 

 

TSA

유의미하게 나온 결과들만을 바탕으로, 1종 오류를 줄이기 위해 TSA를 시행하였다. 

TSA에 대해서는 아직 잘 모르지만 본문을 읽어보면, 

 

유의미한 결과는 

IAS vs no(placebo) : early & late short term pain, function

physio ± IAS vs no(placebo) : early short term ER ROM

IAS vs. physio : early short term function, late short term pain

IAS+physio vs. IAS : early short term ROM

IAS + physio vs. physio : early short term function

 

근데 그중 아래 두 개의 그림과 같이 diagonal red line과 blue line이 교차하는 결과는

IAS vs no Tx. 의 early & late short term pain만 있었다. 

 

 

Network meta-analysis

이 또한 처음 보는 그림이다. 

본문의 설명에 따르면, network map에서 원의 크기는 각 intervention을 시행했던 환자의 수이며, 원을 연결하는 선의 굵기는 두 요인을 비교한 연구의 수와 비례한다. 

 

즉 연구가 많이 된 intervention일수록 원이 크고, 비교가 많이 된 intervention 끼리는 선이 두껍다. 

옆의 bar chart는 intervention 별로 ranking의 확률을 뜻한다.

 

즉 late short-term에서는 A/S distension + IAS가 pain을 가장 잘 조절할 가능성이 있고,

mid-term에서는 physiotherapy가 가장 좋을 가능성이 있다. 

 

-> 다양한 조합의 연구를 일목 요연하게 표현할 수 있는 아주 좋은 figure 및 test가 되겠다. 

 

 

 

Subgroup analyses

(1) IA corticosteroid plus a home exercise program vs IA corticosteroid without home exercise
(2) no treatment or placebo plus home exercise vs no treatment/placebo without home exercise. 

 

를 다룬 연구들을 비교함으로써 home exercise의 잠재적 장점을 평가하였으며

 

비슷한 방법으로 IA placebo의 효과도 평가하였다. 

 

 

 

Conclusion

  • 1년 미만의 frozen shoulder -> IA steroid를 권장하며, ~6개월까지도 이를 사용할 수 있다. 
  • home ROM exercise를 권장한다.
  • 전기치료 기기 등을 이용한 physiotherapy의 추가는 mid term advantage가 있기 때문에, 특히 steroid가 금기인 경우 고려될 수 있다. 
  • MUA, ACR, 특정 전기치료 및 mobilization 등은 대규모 RCT로 평가되어야 한다.

 

 

 

 

Wrap up

이렇게 Meta-analysis 한 편을 읽어보며, 메타분석을 어떻게 하는지에 대한 큰 그림을 그려봤다. 

  • 자료 수집
  • risk-of-bias assessment
  • 근거 수준 평가
  • Meta-analysis
  • 추가적인 분석들 - TSA, Network meta-analysis, subgroup analysis
  • 결과의 임상적 해석, 통합

 

사용한 도구로는

RevMan 5, TSA software(O'Brien-Fleeming α-spending function), Stata, Cochrane Collaboration's tool for assessing risk of bias in randomized trials, GRADE 등이 있었다. 

 

다음 글에서는 이러한 과정들을 실제로 어떻게 진행하게 되는지, RevMan을 이용하여 알아보도록 하자. 

댓글()