국민체력100 참여 강도가 비만 및 의료비 지표에 미치는 영향: 유사 패널(Pseudo-panel) 기반 연속형 DID 분석

The Impact of the National Fitness Award 100 (NFA100) Participation Intensity on Obesity and Healthcare Expenditure: Evidence from a Pseudo-Panel Continuous DID Approach

Abstract

PURPOSE This study examined whether the intensity of participation in the National Fitness Award 100 (NFA100) program is associated with reductions in obesity prevalence and healthcare expenditure in South Korea. A continuoustreatment difference-in-differences (DID) framework with a pseudopanel structure was employed to address the absence of a natural control group. METHODS A pseudopanel defined by sex, age group, and month was constructed using administrative NFA100 records linked with external national statistics on obesity prevalence and healthcare expenditure covering the period from 2022 to 2024. Monthly counts of fitness measurements served as a continuous treatment indicator of participation intensity. To support causal interpretation, stringent diagnostics for the parallel trends assumption were conducted. Average treatment effects were estimated using two-way fixed effects (TWFE) models, and effect heterogeneity was examined through unit-specific interaction terms and a supplementary threecategory age-group specification. RESULTS Greater participation intensity in the NFA100 program was associated with statistically significant reductions in obesity prevalence. The magnitude of these effects was largest among adults in their 20s and 30s, whereas attenuated responses were observed among older adults. Healthcare expenditure also declined, although the estimated effects were modest in size. Substantial heterogeneity across age and sex groups was consistently identified. CONCLUSIONS Higher participation intensity in the NFA100 program contributes to meaningful reductions in obesity prevalence and modest decreases in healthcare expenditure, although program effectiveness varies considerably by age and gender. These findings underscore the importance of tailoring intervention strategies, particularly for older adults, and demonstrate the value of large-scale national health promotion programs.

keyword
National Fitness Award 100Pseudo-panelcontinuous DIDObesityHealthcare expenditureHeterogeneous treatment effect

초록

[목적] 본 연구는 국민체력100(NFA100) 참여 강도가 인구집단의 비만환자수와 의료비 지표에 미치는 인과적 영향을 분석하여 성별·연령대별 정책효과를 정밀하게 추정하는 데 목적이 있다.

[방법] 국민체력100 측정데이터와 비만·요양급여·보험자부담금 통계를 성별×연령대×월 단위의 유사 패널(pseudo-panel)로 재구성하였다. 센터별 측정건수를 정책 강도의 연속형 처치변수로 사용하였으며, baseline 구간의 기울기 비교를 통한 강한 평행추세 검증을 실시하였다. 전체 인과효과는 TWFE 모형으로 추정하였으며, unit별 코호트항을 활용해 성별·연령대별 이질적 효과를 산출하였다.

[결과] 국민체력100 측정 참여 강도는 비만환자수를 유의하게 감소시키는 효과를 보였으며, 이 효과는 특히 10~20대 청소년·청년층에서 가장 강하게 나타났다. 중년·노년층에서는 효과가 제한적이거나 방향성이 혼재하였다. 의료비 지표 역시 참여 강도 증가에 따라 완만하지만 유의미한 감소 효과가 확인되었다. 개별 unit 분석에서는 연령·성별에 따른 이질성이 뚜렷하게 나타났고, 연령 3분류 보조 분석은 추정 안정성을 향상시키며 생애주기별 정책효과 차이를 보다 명확히 드러냈다.

[결론] 국민체력100 참여 강도 증가는 비만 감소와 의료비 완화에 기여하는 것으로 나타났으며, 그 효과는 연령·성별에 따라 크게 달라진다. 특히 청년층에게서 가장 강한 정책효과가 확인되었으며, 중년·노년층은 별도의 맞춤형 지원전략이 필요할 것으로 보인다. 대조군 부재 상황에서 유사 패널 기반 연속형 DID가 실효성 있는 평가방법임을 확인한 본 연구는 국민체력100의 향후 개선과 건강정책 설계에 중요한 실증적 근거를 제공한다.

주요 용어
국민체력100pseudo-panel연속형 DID비만의료비이질적 처치효과

서 론

비만은 현대 한국 사회에서 가장 빠르게 확산되는 만성질환 위험요인 중 하나로, 고혈압·당뇨병·심혈관질환 등 주요 만성질환의 발병 가능성을 크게 증가시키며 국민 건강과 사회경제적 부담을 심화시키고 있다(Haslam & James, 2005). 지표누리 통계에 따르면 국내 비만율은 2007년 31.7%에서 2020년 38.3%까지 증가하였으며, 최근 2023년에도 37.2%로 높은 수준을 유지하고 있다. 특히 남성은 45.6%로 여성(27.8%) 대비 매우 높은 비만율을 보이고, 연령별로는 50대가 약 40%로 가장 높게 나타나는 등 특정 성·연령집단의 비만 위험이 구조적으로 확대되고 있다(Swift et al., 2014). 이러한 상황은 단순한 개인의 건강 문제가 아니라 의료비 지출 증가, 생산성 하락 등 국가적 차원의 부담으로 이어지며, 과학적이고 체계적인 건강관리 프로그램의 필요성을 크게 높이고 있다(Trogdon et al., 2008).

국민체력100 사업은 이러한 사회적 요구에 대응하기 위해 문화체육관광부와 국민체육진흥공단이 2011년부터 추진해온 국가 단위 체력관리 프로그램으로, 전국 체력인증센터를 기반으로 국민의 체력수준을 측정·평가하고 맞춤형 운동 처방을 제공하는 종합적 건강관리 플랫폼이다. 체성분·심폐지구력·근력 등 다양한 측정지표를 기반으로 개인의 신체 특성을 정량적으로 파악하고, 이를 통해 비만 예방·관리 효과를 제공하는 것을 목표로 한다(Lee & Kim, 2015). 체력 측정 결과는 개인에게 직접 피드백될 뿐 아니라 지역별·연령별 건강지표 데이터로 축적되어 공공 건강정책 수립에 활용될 수 있다는 점에서도 중요한 정책적 의의를 갖는다.

그러나 국민체력100 사업이 10년 이상 운영되어 왔음에도 불구하고, 이 프로그램이 실제로 국민의 비만 개선에 어떠한 인과적 효과를 가져왔는지에 대해서는 실증적 연구가 매우 부족하다. 지금까지의 선행연구는 주로 체력 인증센터 설치 효과 또는 체력 변화의 단기적 기술통계 분석에 국한되어 있으며 DID, PSM 등을 활용한 연구도 있긴 하나, 체계적 인과추론 기반의 정책효과 분석은 충분히 이루어지지 않았다.

예를 들어, Kim(2019)는 국민체력100 사업의 정책적 필요성을 이론적으로 제시하였으나 실증 자료를 활용한 인과적 효과 분석은 제공하지 않았다. Park and Lee(2019)은 체력인증 프로그램 참여가 운동 빈도·강도·시간 증가에 미치는 효과를 DID와 성향점수매칭으로 분석하였으나, 분석이 2010년과 2017년 두 시점 비교에 한정되어 있어 평행추세 가정 검증이나 장기 추세 분석이 어려웠고, 다양한 인구집단별 효과를 식별하기에도 한계가 있었다. 또한 이러한 연구들은 대부분 패널데이터가 존재하지 않아 단면자료나 반복횡단면을 기반으로 단기 추세만을 비교했다는 공통된 한계를 공유한다.

최근 DID 연구의 방법론적 발전은 이러한 한계를 더욱 분명하게 지적하고 있다. Goodman-Bacon(2021)은 시차적 정책 도입 환경에서 기존 이원고정효과(Two-Way Fixed Effects, TWFE) DID가 크게 왜곡될 수 있음을 보였으며, Callaway and Sant'Anna(2021)는 group-time average treatment effect(GTATE) 및 event-study DID와 같은 정교한 식별전략을 제시하였다. 이러한 논의는 국민체력100처럼 전국 모든 지역에서 시행되는 정책의 효과를 분석할 때, 전통적 "처치군–대조군" 프레임이 실질적으로 불가능하다는 점을 보여준다.

또한 Deaton(1985)은 반복적 횡단면을 유사 패널(pseudo-panel) 형태로 재구성하여 분석할 수 있는 가능성을 제시하였고, D'Haultfœuille et al.(2023)는 정책 강도를 연속형으로 활용하는 continuous DID 전략을 제안하였다. 이는 "개인이 아니라 집단 단위(예: 연령×성별×지역)"로 재구성한 패널이 완전한 패널데이터가 없는 환경에서도 장기 정책효과 분석에 강력한 대안이 될 수 있음을 시사한다.

본 연구는 이러한 방법론적 발전을 바탕으로 기존 국민체력100 연구들의 주요 한계, 즉

  • ① 패널데이터 부재

  • ② 대조군 부재

  • ③ 정책 강도 차이 활용 부족

  • ④ 하위집단 이질적 효과 분석 미비

  • 를 동시에 해결하기 위한 연구 설계를 도입하였다.

이러한 한계를 보완한 본 연구의 궁극적 목표는 국민체력100 참여 강도(월별 측정건수)의 변화가 비만 관련 건강지표와 의료비 지표에 미치는 인과적 영향을 정밀하게 규명하는 것이다. 특히 측정건수 증가가 비만 환자수 및 요양급여비용·보험자부담금을 실제로 감소시키는지, 그리고 이러한 효과가 연령대·성별 등 하위집단에 따라 어떻게 달라지는지를 분석하여 정책의 이질적 효과를 식별하고자 한다.

이를 위해 연속형 처치의 변이를 활용한 TWFE 모형을 설계하고, 처치 강도 차이에서 기인할 수 있는 선택편향(selection bias)을 통제하기 위해 강한 평행추세(Strong Parallel Trends) 검증 절차를 병행하였다. 최종적으로는 전체 평균 효과뿐 아니라 unit별·세대별 이질효과까지 체계적으로 추정함으로써, 국민체력100 정책의 실제 작동 메커니즘과 효과가 가장 크게 나타나는 타깃 집단을 명확히 도출하는 데 연구의 초점을 둔다.

연구방법

연구대상

본 연구에 사용된 데이터는 국민체육진흥공단이 제공한 체력측정 및 운동처방 종합데이터와 보건의료빅데이터시스템에서 제공한 국민관심질병통계중 비만의 성별/연령10세구간별 데이터를 2022년 1월부터 24년 12월까지 3개년분을 사용하였다.

연구 설계

1. 성별×연령대×월 단위 유사 패널 구축

국민체력100 원자료는 동일 개인을 장기적으로 추적할 수 없는 반복 횡단면 구조이기 때문에, 전통적 DID 분석에서 요구되는 패널 형태를 직접적으로 충족시키기 어렵다. 이에 본 연구는 Deaton(1985), Verbeek and Nijman(1993)의 유사 패널 접근법을 적용하여 성별과 연령대를 기준으로 고정된 코호트(unit)를 구성하고, 각 코호트에 대해 월별 관측치를 연결하는 방식으로 사실상의 패널데이터를 구축하였다. 분석단위는 성별(남·여)과 연령대(10대~70대 이상)의 조합으로 총 14개의 코호트이며, 각 코호트에 대해 2022년 1월부터 2024년 12월까지의 36개월 관측치를 확보하였다. 이에 따라 각 unit은 동일한 집단을 반복 관측한 형태를 갖추게 되며, DID 분석에 필요한 고정효과 모형 적용이 가능해졌다.

2. 전국적 프로그램으로 인한 대조군 부재 문제 해결을 위한 연속형 처치 DID 도입

국민체력100은 전국 모든 체력인증센터에서 동일하게 시행되는 프로그램으로, 지역 또는 집단별로 뚜렷한 "미처치(control) 지역"이나 비참여 대상이 존재하지 않는다. 이러한 상황에서는 전통적인 이분형 DID 모형을 적용하기 어렵고, 일반적인 대조군 설정 또한 불가능하다. 이를 해결하기 위해 본 연구는 정책 강도를 반영하는 연속형 처치변수(continuous treatment)를 활용하였다(Imbens & Wooldridge, 2009). 구체적으로, 각 코호트의 월별 국민체력100 측정건수를 정책 강도 변수 D u , t 로 정의하였다. 이는 특정 집단이 해당 월에 어떤 정도로 정책에 노출되었는지를 정량적으로 나타내며, Goodman-Bacon(2021), Callaway and Sant'Anna(2021) 등 연속형 처치 DID 문헌의 접근과 일치한다. 이러한 설계를 통해 전국적 개입 구조로 인해 대조군이 부재한 상황에서도 시간적 변화와 정책강도의 변동성을 이용해 정책 강도와 비만 환자수 및 관련 의료비 지표 간 인과효과 추정이 가능해졌다.

3. 처치 및 인과효과 가설 설정

본 연구는 정책 강도와 비만 관련 건강지표 간의 인과관계를 확인하기 위해 다음과 같은 가설을 설정하였다. 첫째, 국민체력100 측정건수 증가가 비만환자수 감소에 유의한 효과를 가져올 것이라는 가설이다. 둘째, 측정건수가 증가할수록 의료비 관련 지표(보험자부담금, 요양급여비용총액)가 감소할 것이라는 가설이다. 셋째, 이러한 효과는 연령대 및 성별에 따라 상이한 크기를 나타낼 것이라는 이질효과 가설이다. 이를 검증하기 위해 기본적으로 성별×연령대(unit) 및 월(month) 고정효과를 포함한 TWFE 모형을 설정하여 전체 평균 정책효과 계수 β를 추정하였다.

4. 연속처치 DID의 selection bias를 완화하기 위한 강한 평행추세 검증

Causal estimand = E [ A C R T ( d j d j ) ] = E [ A T T ( d j d j ) - A T T ( d j - 1 d j ) ]
TWFE estimate = E [ A T T ( d j d j ) - A T T ( d j - 1 d j ) ]

연속형 처치(continuous treatment) DID 모형에서는 처치 강도가 높은 집단이 정책 도입 이전부터 더 가파른 개선 추세를 보였을 가능성이 존재한다. 이는 단순한 이분형 처치 DID보다 더 심각한 내생성(selection bias)을 유발한다. Callaway and Sant'Anna(2021)에 따르면, 연속형 처치에서는 처치강도 수준을 d 0 < d 1 < d 2 < 와 같이 구간화할 수 있으며, 특정 강도 수준에서의 절대적 정책효과는 평균처치효과(ATT)로, 강도가 d j - 1 로 증가할 때의 순수 증가효과는 A C R T ( d j d j ) = A T T ( d j d j ) + A T T ( d j - 1 d j ) 로 정의된다. 여기서 A T T ( d j - 1 d j ) 는 처치강도가 d j 였던 집단이 만약 한 단계 낮은 강도 d j - 1 수준에 머물렀을 경우, 이들의 결과변수(Y)가 어떻게 달라졌을지를 나타내는 반실현적 평균처치효과로 해석된다. 반대로 A T T ( d j d j ) 는 실제로 해당 집단이 경험한 강도 수준 d j 에서의 평균적 효과를 의미하며, 이는 동일 강도에서의 '관측된 실현효과(observed realized effect)'에 해당한다. 연구자가 실제로 식별하고자 하는 인과효과는 바로 이러한 ACRT(기울기 효과)의 평균이다.

그러나 전통적인 TWFE 추정식은 다음과 같이 E [ A T T ( d j d j ) - A T T ( d j - 1 d j ) + A T T ( d j - 1 d j ) - A T T ( d j - 1 d j - 1 ) ] 로 분해될 수 있다. 첫 번째 항은 연구자가 원하는 순수한 증가효과(ACRT)이지만, 두 번째 항은 높은 강도 집단과 낮은 강도 집단의 사전적 추세 차이가 반영된 선택편향(selection bias)이다. 이 때문에 연속형 처치 DID에서는 기존 DID에서 요구되는 표준 평행추세(Standard Parallel Trends)보다 더 강한 형태의 반사실적 가정이 요구된다(Bilinski & Hatfield, 2018; Rambachan & Roth, 2023). 강한 평행추세란, 모든 처치강도 수준의 집단이 정책 개입 이전에 동일한 시간추세를 가져야 한다는 가정으로, 이를 위반하면 TWFE 추정값은 ACRT와 선택편향의 가중결합 구조가 되어 인과적 해석이 왜곡될 수 있다.

이에 본 연구는 연속형 처치 DID에서 발생할 수 있는 selection bias를 완화하기 위해, 정책 개입 영향이 가장 미미한 구간을 baseline(저강도) 구간으로 설정하였다. 구체적으로 unit(성별·연령 집단)별 처치강도 D u , t 가 하위 25%에 해당하는 월을 baseline으로 정의하고, 이 구간에서 결과변수의 시간 기울기(선형추세)를 추정하였다. 이후 baseline 기울기의 전체 분포에서의 이탈 정도를 z-score로 산출하여 |z| > 1.5를 기준으로 사전적 추세가 과도하게 다른 unit을 분석에서 제외하였다. 이는 강한 평행추세 가정의 실증적 검증 절차에 해당하며, 처치강도와 무관한 고유한 추세 차이를 사전에 제거함으로써 연속형 처치 강도 증가가 야기하는 순수한 기울기 효과(ACRT)를 보다 정합적으로 식별하는 데 기여한다.

1.5라는 기준은 1.0 ~ 2.0의 후보값을 비교한 grid 진단 결과, 1.0에서는 필요 이상의 unit이 제거되어 정보 손실이 컸고, 1.75 이상에서는 위반 unit이 거의 제거되지 않아 selection bias 위험이 높아지는 등 양극단적 문제가 확인되었기 때문이다. 반면 1.25와 1.5 구간은 전체 인과효과의 안정성이 동일하게 유지되었으며, 불필요한 unit 제거를 최소화하면서도 평행추세 위반 unit을 적절히 배제할 수 있었다. 이러한 진단적 기준과 함께 기존 DID 문헌에서 slope-screening에 1.5~2 SD를 주로 채택해 온 관행(Bai & Ng, 2002; Bertrand et al., 2004)을 참고하여 본 연구에서는 최종적으로 1.5를 기준으로 사용하였다.

5. 강한 평행추세 위반 unit 제거 여부에 따른 전체 인과효과 비교

Y u , t = α u + λ t + β D u , t + ε u , t

평행추세 검증을 통과한 후에는 전체 인과효과 추정에 착수하였다. 위 모형에서 종속변수 Y u , t 는 연령·성별 조합으로 정의된 unit u가 시점 t에 나타낸 비만 관련 건강지표 또는 의료비 지표를 의미한다. 핵심 설명변수인 D u , t 는 해당 unit의 월별 체력측정건수를 연속형 처치강도로 사용한 것으로, 국민체력100 프로그램의 활용 수준이 단기간에 얼마나 강화되었는지를 나타낸다. 회귀계수 β는 이 처치강도가 한 단위 증가했을 때 결과변수가 얼마나 변화하는지를 나타내는 인과적 기울기 효과로, 연속형 DID 이론에서 정의되는 평균증분효과(ACRT)에 가장 가까운 정책효과 해석을 제공한다.

또한 α u 는 unit별로 고정되어 존재하는 관측 불가능한 특성—예를 들어 연령대·성별에 따라 고유하게 나타나는 건강수준, 의료이용 성향, 또는 지역적 요인—을 통제하기 위한 고정효과이다. 반면 λ t 는 모든 unit에 동시에 영향을 미치는 월별 외생적 충격을 통제하는 시간 고정효과로, 계절 변화, 코로나19 같은 전국적 사건, 물가·보험수가 조정 등 전체 집단에 공통으로 작용하는 요인을 제거한다. 마지막으로 ε u , t 는 이러한 요인들로 설명되지 않는 단기적 변동이나 미관측 요인을 포함하는 오차항이다.

여기서 하첨자 u는 성별과 연령대로 구분된 개별 분석 단위(cohort unit)를 의미하며, 본 연구에서는 총 14개의 단위(u=1, ... , 14)로 구성된다.

결과적으로 본 모형은 unit 간 고유 차이와 전체적 시간 추세를 모두 제거한 상태에서, 국민체력100 참여 강도의 변화가 실제로 비만지표 및 의료비 지표에 어떤 인과적 영향을 미치는지 순수하게 추정하도록 구성되어 있다. 이를 통해 관측된 참여 강도의 증가가 환자수 감소 또는 의료비 절감으로 이어지는지, 그리고 그 효과가 집단별로 어떻게 달라지는지를 정밀하게 검증할 수 있다. 먼저 전체 모형(All)은 14개 단위의 전체 집합( U a l l )을 모두 식에 포함하여 평균적인 정책효과 계수 β a l l 를 추정한 기본 모형이다. 이어 제외 모형(Drop) 모델은 앞선 강한 평행추세 검증에서 baseline 기울기가 기준(|z|>1.5)을 초과하여 위반으로 판정된 unit들을 제외하고, 검증을 통과한 나머지 unit들의 집합에 대해서만 식을 적용하여 β d r o p 를 재추정한 모형이다. 결과적으로 두 모형에서 도출된 β 의 추정치를 비교함으로써, 잠재적 편의(bias)를 야기할 수 있는 특정 u를 제거했을 때 정책효과가 얼마나 안정적으로 유지되는지 검증하였다. 이는 통계적 타당성을 확보하고 selection bias를 통제한 후의 인과효과 견고성을 확인하는 필수적인 단계이다.

6. unit별 이질적 인과효과 추정

Y u , t = α u + λ t + β u D u , t + ε u , t

전체 인과효과는 평균적인 정책효과를 제공하지만, 정책효과가 모든 집단에서 동일하다고 가정하기에는 현실적 한계가 존재한다. 특히 비만 관련 정책효과는 성별 및 연령대에 따라 다르게 나타날 가능성이 크다. 따라서 본 연구는 앞선 전체 인과효과의 TWFE 모형에 unit별 상호작용항 β u D u , t 을 추가하여 개별 인과효과를 추정하였다. 즉, 각 unit마다 처치 변수 D u , t 에 대해 별도의 계수 β u 를 추정함으로써 정책효과의 이질성을 파악하였다. 이러한 방식은 국민체력100의 효과가 특정 집단(예: 여성·고연령층·청년층 등)에서 더 강하게 나타나는지, 또는 특정 집단에서는 효과가 미미하거나 없는지를 정교하게 식별할 수 있게 한다.

다만 일부 성별·연령대 조합에서는 표본 수가 적거나 결과변수의 월별 변동성이 크게 나타나 계수의 추정 오차가 다소 크게 나타나는 문제가 확인되었다. 이에 따라 개별 단위를 3개 그룹으로 재정의함으로써 분석을 진행하였다.

7. 연령대를 3개 그룹(청년·중년·노년)으로 통합한 보조적 이질성 분석

개별 unit 단위 분석 과정에서 특정 연령대의 표본 수 부족 및 변동성 문제로 추정의 안정성이 다소 저하된 점을 보완하기 위해, 본 연구는 연령대를 보다 큰 3개 그룹으로 재분류하는 보조 분석을 수행하였다. 구체적으로 10·20·30대를 청년, 40·50대를 중년, 60대 이상을 노년으로 통합하고, 여기에 성별을 결합하여 총 6개 unit을 구성하였다. 이후 동일한 TWFE 모형을 적용하여 연령집단별 정책효과를 재추정하였다. 이는 개별 unit 수준의 지나치게 미세한 변동에 좌우되지 않고, 정책효과의 주요 이질성이 어떤 연령·성별 축에서 구조적으로 발생하는지를 보다 명확하게 파악하기 위한 분석 단계이다. 보다 거시적인 기준으로 단위를 재정의함으로써, 정책효과의 큰 흐름과 패턴을 선명하게 식별하는 데 기여하였다. 특히 청년·중년·노년이라는 생애주기적 관점을 바탕으로 정책효과를 비교할 수 있게 되어, 국민체력100의 실질적 타깃 집단 설정에 대한 정책적 함의 도출이 가능해졌다.

통계 처리

통계 분석은 R 통계 프로그램을 이용하여 수행하였다. 인과효과 추정을 위해 TWFE 모형을 적용하였고, 추정치는 일반 최소제곱(OLS) 기반으로 산출하였다.

전체 평균 효과(TWFE) 추정에서는 성별×연령대(unit) 및 월(month) 수준에서 이원 군집화(clustering) 표준오차를 사용하였으며, 집단별 이질효과 분석에서는 월(month) 기준 군집화 표준오차를 적용하였다.

각 계수에 대해 표준오차(SE), p-value, 95% 신뢰구간(CI)은 해당 군집화 분산–공분산 행렬을 기반으로 계산하였다. 집단 간 이질성 분석 시에는 상호작용 항을 사용하였으며, 모든 유의성 검정은 양측검정(two-tailed)으로 수행하고 유의수준은 p<0.05로 설정하였다.

연구결과

본 장에서는 유사 패널 기반의 연속형 처치 DID 분석을 통해 도출된 국민체력100의 비만 개선 효과 및 의료비 절감 효과를 단계적으로 제시한다. 분석은 우선 baseline(저강도) 구간을 활용한 강한 평행추세 검증을 통해 계량적 타당성을 확보한 후, 전체 인과효과(TWFE 모형), 개별 집단별 이질효과, 그리고 연령대를 3개 그룹으로 통합한 보조 분석 순으로 구성하였다.

강한 평행추세 검증 결과

연속형 처치를 사용하는 DID 구조에서는 처치 강도의 변화가 잠재적으로 시간추세와 상관될 가능성이 존재하기 때문에, 전통적인 이진형 DID보다 더욱 엄격한 형태의 평행추세 가정 검증이 요구된다. 이에 본 연구는 각 연령×성별 unit별로 측정건수 분포의 하위 25%에 해당하는 기간을 baseline(저강도) 구간으로 정의하고, 이 기간에서 결과변수의 시간 기울기를 단순 선형회귀를 통해 추정하였다. 이후 전체 unit 기울기 분포의 평균 대비 편차를 표준화하여 z-score를 산출하고, 이를 기준으로 과도하게 이탈한 unit을 식별하였다.

기울기 분포는 비만환자수와 요양급여비용총액, 보험자부담금 모두에서 평균치 대비 일정 수준의 이질성을 보였으나, k-threshold(1, 1.25, 1.5, 1.75, 2)를 비교한 결과 k=1.5가 가장 균형적인 기준으로 나타났다. k=1.5는 baseline 추세가 유달리 특이한 집단을 제거할 수 있으면서도, 지나치게 많은 unit을 탈락시키지 않아 전체 추정의 안정성과 일반성을 동시에 확보해주는 수준이었다. 특히 k=1.25와 비교했을 때 전체 인과효과의 추정값이 거의 동일하게 나타났으며, k=1에서는 불필요하게 많은 집단이 제거되어 표본 손실이 커지는 문제가 발생하였다. 반대로 k≥1.75에서는 unit 제거가 사실상 이루어지지 않아 selection bias의 가능성이 확대되었다.

이와 같은 진단을 종합하여 본 연구는 baseline 기울기 검증에서 |z|>1.5를 위반한 unit만을 Drop 기준으로 설정하였으며, 이후 모든 분석에서 All 모델과 Drop 모델을 병행하여 계수의 안정성을 평가하였다.

<Table 1>은 강한 평행추세 진단 과정에서 산출된 주요 지표를 요약한 것이다.

View original
Table 1
Strong parallel trends diagnostics by outcome (Y)
Item Number of patients with obesity Total healthcare expenditure Insurer-paid amount
baseline sample size 126 126 126
baseline mean slope -0.5479 1034.75 648.16
baseline slope SD 1.363 1528.26 1074.66
Units violating the parallel trends assumption unit M, 10-19, M, 30-39, M, 40-49 F, 60-69 M, 20-29 F, 60-69, M, 20-29

각 결과변수(Y)별로 baseline(저강도) 구간에 해당하는 관측치 수, baseline 기간에서 추정된 시간 기울기의 평균(mean)과 표준편차(SD)를 제시하며, 마지막 행의 "평행추세 위반 unit"은 기울기 분포에서 |z|>1.5 기준을 위반하여 baseline 추세가 전체 분포에서 과도하게 벗어난 것으로 식별된 연령×성별 조합(unit)을 의미한다. 예컨대 "60대 F", "20대 M"은 각각 60대 여성 집단, 20대 남성 집단이 baseline 추세에서 이탈한 것으로 판정되었음을 나타내며, 이러한 집단은 Drop 모델에서 제외된다. baseline 기울기 평균과 SD는 각 Y별로 baseline 기간의 평균적 추세 수준과 변동성을 보여주며, 해당 값 대비 얼마나 벗어난 unit이 있는지를 파악하기 위한 기준점 역할을 한다.

전체 인과효과

1. 측정건수 증가가 비만환자수에 미치는 전체 인과효과

우선 측정건수(D_rate)가 비만환자수(Y_pat)에 미치는 평균적 인과효과를 TWFE 모형을 통해 추정하였다. <Table 2>에서 전체 unit을 포함한 All 모델에서는 측정건수 증가가 비만환자수 감소와 유의하게 연결되는 음(-)의 효과가 확인되었으며, 강한 평행추세 가정을 위반한 unit을 제외한 Drop 모델에서도 거의 동일한 방향과 규모의 결과가 도출되었다. 이는 baseline 추세에서 일부 집단의 기울기가 다소 이탈하더라도 국민체력100의 전체 효과는 비교적 강건하며, 처치변수의 연속적 변동이 비만 관련 건강지표 개선에 실질적인 기여를 한다는 점을 시사한다.

View original
Table 2
Overall causal effects: Number of obese patients
β SE 95% CI p
AG All -0.0036 0.0009 [-0.0053, -0.0019] 0.00127
AG Drop -0.0028 0.0007 [-0.0042, -0.0014] 0.00327

구체적으로 All 모델의 추정계수(β=−0.0036)는 연령·성별 전체 집단(unit)에 대해 국민체력100 측정건수가 1건 증가할 때 비만환자수가 평균적으로 약 0.0036명 감소한다는 의미이다. 이는 대규모 패널에서 집계된 평균 단위(unit) 기준의 변화량으로, 측정건수 증가가 미세하지만 누적적으로 유의한 비만 감소 효과를 가져온다는 점을 보여준다. Drop 모델에서도 β는 −0.0028로 매우 유사한 크기의 감소 효과가 관측되어, baseline 기울기가 이탈한 일부 unit을 제외하더라도 결과의 방향성과 정책효과 크기 모두가 안정적으로 유지됨을 확인할 수 있다.

특히 All 모델 대비 Drop 모델에서 표준오차가 소폭 감소하는 양상이 확인되었는데, 이는 baseline 기울기에서 과도한 변동을 보이는 unit을 제외함으로써 오차 구조의 안정성이 제고된 결과로 해석할 수 있다. 전반적으로 비만환자수 분석에서는 연령과 성별에 관계없이 측정건수 증가가 체계적인 비만 감소로 이어지는 일관적이고 통계적으로 유의한 인과효과가 확인되었다.

2. 측정건수 증가가 요양급여비용총액에 미치는 전체 인과효과

두 번째 결과변수인 요양급여비용총액(Y_cost)에 대한 분석에서도 측정건수 증가는 의료비 절감 효과를 가져오는 것으로 추정되었다. <Table 3>에서 All 모델에서는 측정건수 증가가 월별 의료비 감소와 연결되는 유의한 음(-)의 계수가 확인되었고, Drop 모델에서도 유사한 결과가 재현되었다. 요양급여비용총액의 단위가 천 원(1=1,000원)임을 감안하면, All 모델에서 추정된 계수 β=−1.1484는 연령·성별 전체 unit을 평균할 때 국민체력100 측정건수가 1건 증가할 경우 해당 집단의 월별 요양급여비용총액이 약 1.15천 원, 즉 약 1,150원 감소함을 의미한다. Drop 모델에서도 β=−1.1144로 유사한 크기의 비용 감소 효과가 관측되어, 강한 평행추세 위반 unit을 제외하더라도 의료비 절감 효과의 방향과 규모가 안정적으로 유지됨을 보여준다. 이는 국민체력100 참여 강화가 비만 관련 질병 치료비용을 장기적으로 감소시킬 수 있는 잠재력이 있음을 보여준다.

View original
Table 3
Overall causal effects: Total medical expenditure (Reimbursed Cost)
β SE 95% CI p
AG All -1.1484 0.3869 [-1.9067, -0.3900] 0.0109
AG Drop -1.1144 0.4474 [-1.9913, -0.2375] 0.0300

다만 의료비 지표는 변동성이 크고 단기적 외생 요인의 영향이 강하게 작용할 수 있기 때문에, 개별 집단 수준의 분석에서는 통계적 유의성이 다소 약화되는 경향을 보인다. 그럼에도 불구하고 전체효과 차원에서는 일관된 감소효과가 관찰되었다는 점은 국민체력100이 건강지표뿐 아니라 의료재정 측면에서도 긍정적 외부효과를 창출하고 있다는 근거로 해석할 수 있다.

3. 측정건수 증가가 보험자부담금에 미치는 전체 인과효과

보험자부담금(건강보험공단 부담 의료비)을 결과변수로 분석한 TWFE 모형 추정 결과인 <Table 4>에서, 측정건수 증가는 보험자부담금 감소와 유의한 관련성을 가지는 것으로 나타났다. All 모델에서는 측정건수가 1건 증가할 때 보험자부담금이 유의하게 감소하는 음(-)의 계수가 도출되었으며, Drop 모델에서도 추정 방향과 효과의 크기가 일관되게 유지되었다. 보험자부담금 역시 단위가 천 원이므로, All 모델의 계수 β=−0.7825는 측정건수가 1건 증가할 때 연령·성별 전체 unit을 평균한 월별 보험자부담금이 약 0.78천 원, 즉 약 780원 감소함을 의미한다. Drop 모델에서의 β=−0.7499 역시 비슷한 수준의 감소 효과를 보여, 강한 평행추세 위반 unit을 제외하더라도 건강보험 재정 부담 완화 효과가 크게 달라지지 않음을 시사한다. 이는 국민체력100 참여가 증가할수록 건강보험 재정 측면에서 비용 절감 효과가 나타날 수 있음을 시사한다(Cawley et al., 2007).

View original
Table 4
Overall causal effects: Insurer’s payment (Health Insurance Contribution)
β SE 95% CI p
AG All -0.7825 0.3189 [-1.4075, -0.1575] 0.029
AG Drop -0.7499 0.3619 [-1.4592, -0.0406] 0.0625
View original
Table 5
Unit-Level heterogeneous treatment effects: Number of obese patients
AGE SEX β SE 95% CI p sig
10-19 M -0.004648 0.0012 [-0.0069, -0.0024] 3.39e-04 ***
F -0.003193 0.001 [-0.0042, -0.0022] 2.65e-07 ***
20-29 M -0.015426 0.0056 [-0.0263, -0.0045] 0.0088 **
F -0.016278 0.0041 [-0.0244, -0.0082] 3.71e-04 ***
30-39 M -0.015199 0.0073 [-0.0295, -0.0009] 0.0439 *
F 0.003769 0.0543 [-0.1026, 0.1102] 0.9450
40-49 M -0.008727 0.0128 [-0.3389, 0.0164] 0.5011
F 0.138754 0.0351 [0.0700, 0.2075] 3.53e-04 ***
50-59 M 0.008881 0.0239 [-0.0380, 0.0557] 0.7124
F 0.067487 0.0232 [0.0220, 0.1130] 0.0063 **
60-69 M 0.031140 0.0073 [0.0167, 0.0455] 1.55e-04 ***
F 0.053310 0.0121 [0.0296, 0.0770] 9.38e-05 ***
70-79 M 0.058811 0.0128 [0.0338, 0.0838] 5.21e-05 ***
F 0.033076 0.0109 [0.0117, 0.0544] 0.0045 **

* * * p<0.001, ** p<0.01, * p<0.05

View original
Table 6
Heterogeneous effects by age-group cluster: Total medical expenditure
Age group SEX β SE 95% CI p sig
Young adults M -12.1494 1.5968 [-15.27902, -9.0197] 6.3702e-09 ***
F -29.5074 3.9404 [-37.2306, -21.7841] 9.05e-09 ***
Middle-aged adults M -23.3121 16.1438 [-56.9540, 6.3298] 0.1259
F -335.6184 56.7265 [-446.8022, -224.4345] 9.9485e-07 ***
Older adults M 16.9857 8.0093 [1.2875, 32.6839] 0.0411 *
F 0.2028 14.4716 [-28.1616, 28.56723] 0.9889

* * * p<0.001, ** p<0.01, * p<0.05

View original
Table 7
Heterogeneous effects by age-group cluster: Insurer's payment
Age group SEX β SE 95% CI p sig
Young adults M -8.7500 1.1687 [-11.0406, -6.4594] 9.08e-09 ***
F -21.5250 2.8948 [-27.1988, -15.8513] 1.06e-08 ***
Middle-aged adults M -18.7076 11.8532 [-41.9399, 4.5247] 0.1235 -
F -248.0604 41.9122 [-330.2083, -165.9126] 9.88e-07 ***
Older adults M 12.7435 5.8215 [1.3334, 24.1536] 0.0354 *
F 2.4529 10.4144 [-17.9594, 22.8652] 0.8152 -

* * * p<0.001, ** p<0.01, * p<0.05

보험자부담금 지표는 요양급여비용총액과 마찬가지로 변동성이 크고, 단기적 질병 유행·의료 이용량 변화 등 외생적 요인의 영향을 크게 받을 수 있다. 이러한 특성 때문에 일부 개별 집단 단위에서는 통계적 유의성이 약화되었으나, 전체 수준에서는 유의한 비용 감소 효과가 안정적으로 확인되었다. 이는 국민체력100의 참여 확대가 건강지표 개선뿐 아니라 건강보험 재정 부담 완화에도 긍정적 기여를 할 수 있음을 보여주는 실증적 근거로 해석될 수 있다.

연령×성별 unit 단위의 이질적 인과효과 분석

본 연구는 개별 집단별 반응 차이를 확인하기 위해 TWFE 모형에 상호작용 항을 도입하여 집단별 이질적 정책효과를 추정하였다. 그 결과 비만환자수에서는 뚜렷한 이질성과 체계적 패턴이 나타났다. 20-30대 남녀는 측정건수 증가에 매우 민감하게 반응하여 비만환자수 감소폭이 가장 크게 나타났으며, 이는 해당 연령층이 운동처방을 실제로 실행하기 쉽고 체력개선 효과가 빠르게 나타나는 생애주기적 특성과 관련될 수 있다. 반면 고령층 일부 집단에서는 오히려 비만환자수가 증가하는 양상이 관찰되었는데, 이는 측정건수 증가는 높지만 실제 운동실천이나 생활습관 개선 정도가 상대적으로 낮을 수 있다는 점에서 정책적 해석이 필요하다.

요양급여비용총액과 보험자부담금의 개별효과는 전반적으로 표준오차가 커 통계적 유의성이 낮았지만, 40대·30대 여성 집단 등 일부 그룹에서는 의료비 절감 방향의 효과가 관찰되었다. 이는 의료비 지표가 질병 발생 시점 및 의료기관 이용패턴에 의해 크게 좌우된다는 특성 때문이며, 보다 장기적인 데이터를 확보할 경우 효과가 명확하게 드러날 가능성이 있다.

1. 연령대를 3개 그룹(청년·중년·노년)으로 통합한 보조 분석

개별 unit 단위에서 표본수 불균형, 연령대별 월별 변동성 확대 등의 문제를 완화하기 위해 본 연구는 연령대를 청년(10-30대), 중년(40-50대), 노년(60대 이상)으로 통합하고, 성별을 결합하여 총 6개 unit을 구성한 보조적 이질성 분석을 수행하였다. 이 분석은 개별 분석보다 추정의 안정성이 개선되었으며, 국민체력100의 정책효과가 어떤 생애주기 집단에서 가장 강하게 나타나는지 보다 구조적으로 파악할 수 있었다.

분석 결과 비만환자수에서는 청년·중년 집단이 측정건수 증가에 가장 민감하게 반응하여 비만 감소 효과가 크게 나타났으며, 이러한 경향은 성별에 관계없이 일관되었다. 반면 노년층은 효과가 비교적 약하거나 방향성이 불명확하여 고령층을 대상으로 하는 별도의 정책적 지원 또는 맞춤형 프로그램 설계의 필요성을 시사한다. 의료비 지표의 경우 청년·중년 여성에서 비용 감소 경향이 관찰되었으나, 노년층은 여전히 변동성이 크게 나타났다.

이와 같은 보조 분석은 국민체력100의 정책효과가 단순히 평균적 효과에 머무르지 않고, 연령생애주기별로 구조적 이질성이 존재한다는 사실을 보다 명확하게 보여주었다.

논 의

본 연구는 국민체력100 참여 강도(센터별 월별 측정건수)가 연령·성별 집단의 비만환자수 및 의료비 지표에 미치는 인과적 영향을 연속형 처치 기반의 DID 설계를 통해 규명하였다. 특히 유사 패널 데이터 구축을 통해 개별 참여자의 패널자료가 존재하지 않는 현실적 제약을 극복하면서, 반복적 횡단면 자료를 준패널 구조로 변환하여 시간·집단 단위의 변동성을 포착할 수 있게 하였다는 점에서 분석적 의의가 크다. 이러한 방법론적 기반 위에서 도출된 실증 결과는 국민체력100의 정책적 효과와 그 작동 메커니즘에 대해 여러 중요한 시사점을 제공한다.

가장 먼저, 국민체력100의 측정건수 확대가 비만환자수 감소와 유의하게 연결되었다는 점은 이 프로그램이 단순한 신체활동 장려 차원을 넘어 실제 건강지표 개선에 기여하고 있음을 실증적으로 확인한 결과이다(Ross et al., 2020). 특히 월별 측정 건수의 증가를 정책강도의 연속적 변화로 해석하였을 때, 강도가 높아질수록 비만 수준이 감소하는 패턴이 일관적으로 나타난 것은 국민체력100의 핵심 구조인 '측정–평가–운동처방–모니터링' 체계가 실질적 행동변화로 이어질 수 있음을 보여준다(Dishman & Buckworth, 2001). 기존 연구들은 특정 연도 간 단절적 변화나 프로그램 도입 여부 수준의 이진형 비교에 그친 반면, 본 연구는 정책의 강도(intensity)를 직접 반영하는 연속형 처치 변수를 도입함으로써 프로그램의 실제 작동방식을 훨씬 더 정밀하게 파악할 수 있었다.

비만환자수에 대한 전체 효과와 개별효과 분석에서 공통적으로 드러난 연령·성별에 따른 이질성 또한 중요한 발견이다(Cawley & Meyerhoefer, 2012; Bauman et al., 2012). 청년층은 측정건수 증가에 가장 민감하게 반응하여 비만 감소 효과가 뚜렷하게 나타났으며, 특히 10·20대 남녀에서 효과가 가장 강하게 추정되었다. 이는 해당 연령대가 운동처방을 실제 일상활동에 반영할 수 있는 신체적·시간적 여건이 상대적으로 양호하며, 운동 적응력과 회복탄력성이 높은 생애주기적 특성과도 관련되었을 가능성이 있다. 반면, 중년·노년층에서는 비만환자수의 변화 방향이 집단 간 다소 상이하거나 효과 자체가 제한적으로 나타났는데, 이는 고령자가 운동 실행이나 지속성 측면에서 갖는 제약, 질병 이력의 개입, 또는 근골격계·대사기능의 생리적 차이 등으로 설명될 수 있다. 이러한 차이는 국민체력100이 단일 설계체계로 모든 연령층에서 동일한 성과를 거두기 어렵다는 점을 시사하며, 연령집단별 맞춤형 지원전략이 필요함을 보여준다.

요양급여비용총액의 경우, 비만환자수만큼 강한 인과효과가 나타나지는 않았지만 전체 TWFE 추정에서는 비용 절감 방향의 유의한 효과가 발견되었다는 점에서 정책적 함의가 크다. 의료비 지표는 단기 변동성이 크고, 진료 시점의 우연적 요인이나 질환 중증도 차이, 비계절적 병원 이용 증가 등 다양한 외생적 요인의 영향을 받기 때문에 단위(unit) 수준의 개별효과에서는 통계적 유의성이 약화될 수 있다. 그럼에도 전체효과가 일관되게 음(-)의 방향으로 추정되었다는 결과는 국민체력100 참여 확대가 중장기적으로 의료비 지출을 감소시키고 건강보험 재정 부담 완화에 기여할 수 있음을 시사한다. 다만 이러한 효과가 보다 명확하게 드러나기 위해서는 더 장기적인 관찰 기간과 개인 수준의 건강보험 청구정보 연계가 필요하므로, 이를 기반으로 한 후속 연구가 적극적으로 이루어질 필요가 있다.

보험자부담금 분석에서도 유사한 패턴이 확인되었다. 전체 TWFE 모형(All 모델)에서는 측정건수 증가가 보험자부담금 감소와 통계적으로 유의한 음(-)의 효과를 보였으며, 강한 평행 추세 위반 집단을 제외한 Drop 모델에서도 효과의 방향성과 크기가 안정적으로 유지되었다. 보험자부담금 역시 의료비 지표와 마찬가지로 단기 변동성이 크고 개인의 질병 발생 특성이나 진료 유형에 따라 표본 내 이질성이 크게 나타나는 지표이므로 개별 unit 수준에서는 유의성이 약화될 수 있다. 그러나 전체적 관점에서 비용 감소 효과가 반복적으로 관찰되었다는 점은 국민체력100 참여 확대가 건강보험 재정 절감 측면에서 실질적 외부효과를 가져올 수 있음을 의미한다. 향후 개인 단위의 보험 청구 자료와 연계된 장기 패널 분석을 통해 이러한 효과를 더욱 정교하게 검증할 필요가 있다.

또한 본 연구는 연속형 처치 기반 DID에서 필연적으로 발생할 수 있는 선택편의를 최소화하기 위해 baseline(저강도) 구간의 기울기 비교를 바탕으로 한 강한 평행추세 검증 절차를 적용하였다. 대조군이 존재하지 않는 전국사업의 특성상 전통적인 DID의 '처치 vs 대조군' 구조를 그대로 활용할 수 없기 때문에, baseline 기울기의 동질성을 사전검증하여 연속처치의 내생성을 통제하는 전략은 실증적 설계의 필수적인 요소였다. k-표준편차 기준을 단계적으로 변화시키며 Drop 여부와 TWFE 추정결과의 안정성을 검증한 결과, k=1.5 수준이 가장 균형적인 기준임이 확인되었다. 이 기준은 기울기 분포의 양극단을 제거함으로써 baseline의 과도한 이질성으로 인한 선택편의를 제거하면서도 전체표본 축소에 따른 정보 손실을 최소화하였다는 점에서 의미가 있다.

마지막으로, 유사 패널 기반 연속형 DID 설계는 국민체력100과 같이 전국 단위에서 시행되는 공공정책의 효과를 식별하는 데 매우 높은 적합성을 가지며, 향후 건강·체육·복지정책 평가 전반에 적용될 수 있는 방법론적 확장성을 보여준다. 실제로 Alyakoob and Rahman(2022)이 제시한 반복적 횡단면 기반 정책효과 분석틀과 본 연구의 접근은 구조적으로 유사한데, 이러한 방법론적 접목을 통해 국민체력100이 비만 감소 및 의료비 완화라는 주요 정책목표를 달성하고 있음을 계량적으로 확인할 수 있었다는 점에서 학술적·정책적 기여가 크다.

결론 및 제언

본 연구는 국민체력100 참여강도가 연령·성별 집단의 비만환자수와 의료비 지표에 미치는 인과적 영향을 유사 패널 기반 연속형 DID 모형을 통해 실증적으로 분석하였다. 전통적 DID가 요구하는 대조군의 부재, 프로그램의 전국적 시행으로 인한 외생적 처치변동 부족, 반복적 횡단면 구조라는 자료의 제약 등 기존 연구들이 직면해온 실증적 한계를 극복하기 위해, 본 연구는 유사 패널 구축과 연속형 처치 도입이라는 새로운 분석 틀을 제시하였다. 분석 결과 국민체력100의 측정건수 증가는 비만환자수 감소에 일관되고 통계적으로 유의한 효과를 나타냈으며, 의료비 절감과도 일정한 음의 상관성을 보였다. 이 효과는 연령·성별에 따라 두드러진 이질성을 보였다는 점에서 정책 설계와 지원전략에 중요한 함의를 제공한다.

무엇보다 국민체력100의 정책효과가 최고조에 이르는 집단은 청소년·청년층으로, 특히 10–20대 남녀에서 비만 감소 효과가 구조적으로 안정적으로 나타났다. 이는 생애주기적 신체특성, 운동 반응성, 처방 실행의 용이성 등이 복합적으로 작용한 결과로 보이며, 향후 국민체력100의 운영전략이 해당 연령대의 참여와 지속성을 더욱 높일 수 있는 방향으로 설계될 필요가 있음을 시사한다. 반대로 중년·노년층은 측정 건수 증가가 직접적인 건강지표 개선으로 이어지지 않는 경향이 확인되었는데, 이는 단순 측정 위주의 참여 방식으로는 충분한 효과를 기대하기 어렵다는 점을 보여준다. 따라서 중년·노년층을 위한 별도 프로그램 설계, 예를 들어 방문형 운동지도, 장기 모니터링 프로그램, 질환관리 중심의 운동처방 강화 등을 도입할 필요가 있다.

의료비 지표의 경우 비만 지표에 비해 단기 변동성이 컸음에도 불구하고 전체효과는 일관적으로 비용 절감 방향을 나타냈다. 이는 국민체력100 참여 확대가 장기적으로 의료비 지출 억제에 기여할 가능성을 보여주는 중요한 결과이며, 향후 건강보험공단 자료와 연계된 장기 패널 구축이 가능해질 경우 훨씬 더 명확한 비용효과 분석이 가능할 것이다. 더 나아가 국민체력100 체력측정 자료가 의료이용, 건강행태, 만성질환 이력 등 다양한 보건·의료 데이터와 폭넓게 연계될 수 있다면, 운동 기반 개입이 건강성과 및 의료비 절감으로 이어지는 구체적 경로를 보다 정밀하게 규명할 수 있으며, 예방 중심의 공공정책 설계에도 중요한 근거를 제공할 수 있을 것이다. 장기적인 정책효과를 확인하기 위한 데이터 인프라 구축은 국가적 과제로 고려될 필요가 있다.

방법론적 측면에서도 본 연구는 기존 DID 연구가 가진 구조적 한계를 극복했다는 점에서 기여가 크다. 대조군이 존재하지 않는 환경에서 연속형 처치를 기반으로 한 TWFE 모형을 적용하고, baseline 기울기 비교를 통한 강한 평행추세 검증 절차를 도입함으로써 정책효과의 내생성 문제를 최소화하였다. 또한 k-threshold 기반의 선택기준 진단을 통해 분석 안정성을 확보하였고, 개별 단위의 이질성을 식별하기 위해 unit-specific coefficient를 추정한 뒤 표본 불균형 문제를 해결하기 위해 연령대를 3개 그룹으로 통합한 보조분석까지 수행하였다. 이러한 절차는 국민체력100을 분석한 기존 연구에서 찾아보기 어려운 엄밀한 계량경제학적 접근이며, 향후 유사한 전국 단위의 공공정책 평가에 유용하게 적용될 수 있다.

종합적으로 볼 때, 국민체력100은 비만 예방·관리 측면에서 실질적인 효과를 보유한 프로그램이며, 특히 생산연령층을 중심으로 그 효과가 두드러진다는 점에서 정책적 효용이 높다. 동시에 노년층의 체력관리와 건강증진을 위한 별도 전략의 필요성, 의료비 절감을 위해 건강보험 연계 프로그램의 강화 필요성, 지역 간 맞춤형 센터 운영 등 다양한 정책적 개선 방향도 확인되었다. 향후 연구는 개인수준 건강보험 자료와의 연계를 통한 장기적 건강성과 분석, 지역 단위의 불평등 해소 전략 평가, Causal Forest 등 머신러닝 접근을 활용한 미세한 이질성 구조 탐색 등 방향으로 확장될 수 있을 것이다.

References

1. 

Alyakoob, M., & Rahman, M. S (2022). Shared Prosperity (or Lack Thereof) in the Sharing Economy. Information Systems Research, 33(2), 638-658.

2. 

Bai, J., & Ng, S (2002). Determining the number of factors in approximate factor models. Econometrica, 70(1), 191-221.

3. 

Bauman, A. E., Reis, R. S., Sallis, J. F., Wells, J., Loos, R. J., & Martin, B. W (2012). Correlates of physical activity: Why are some people physically active and others not?. The Lancet, 380(9838), 258-271. pubmed id:PubMed ID

4. 

Bertrand, M., Duflo, E., & Mullainathan, S (2004). How much should we trust differences-in-differences estimates?. Quarterly Journal of Economics, 119(1), 249-275. PMC8105046

5. 

Bilinski, A., & Hatfield, L. A (2018). Nothing to see here? Noninferiority approaches to parallel trends.. https://arxiv.org/abs/1805.03273 .

6. 

Callaway, B., & Sant’Anna, P. H (2021). DID with multiple time periods. Journal of Econometrics, 225(2), 200-230. PMC12885278

7. 

Cawley, J., & Meyerhoefer, C (2012). The medical care costs of obesity: An instrumental variables approach. Journal of Health Economics, 31(1), 219-230. pubmed id:PubMed ID

8. 

Cawley, J., Rizzo, J. A., & Haas, K (2007). Occupation-specific absenteeism costs associated with obesity. Journal of Occupational and Environmental Medicine, 49(12), 1317-1324. pubmed id:PubMed ID

9. 

Deaton, A (1985). Panel data from time series of cross-sections. Journal of Econometrics, 30(1-2), 109-126.

10. 

D’Haultfoeuille, X., Hoderlein, S., & Sasaki, Y (2023). Nonparametric difference-in-differences in repeated cross-sections with continuous treatments. Journal of Econometrics, 234(2), 664-690.

11. 

Dishman, R. K., & Buckworth, J (2001). Exercise psychology. Human Kinetics.

12. 

Goodman-Bacon, A (2021). Difference-in-differences with variation in treatment timing. Journal of Econometrics, 225(2), 254-277. PMC10121039

13. 

Haslam, D. W., & James, W. P (2005). Obesity. The Lancet, 366(9492), 1197-1209. pubmed id:PubMed ID

14. 

Imbens, G., & Wooldridge, J (2009). Recent developments in the econometrics of program evaluation. Journal of Economic Literature, 47(1), 5-86.

15. 

Kim, Y. R (2019). A study on the necessity and policy direction of the National Fitness 100 program. Korean Journal of Sports Science, 28(1), 1-13.

16. 

Lee, S., & Kim, J (2015). Effects of the National Fitness 100 program on physical fitness indicators. Korean Journal of Sports Medicine, 33(2), 87-96.

17. 

Park, S. J., & Lee, Y. I (2019). Effects of participation in national fitness certification on physical activity: A DID–PSM analysis. Korean Journal of Sports Science, 28(6), 123-135.

18. 

Rambachan, A., & Roth, J (2023). A more credible approach to parallel trends. Review of Economic Studies, 90(5), 2555-2591.

19. 

Ross, R., Chaput, J. P., Giangregorio, L. M., Janssen, I., Saunders, T. J., Kho, M. E., & … Tremblay, M. S (2020). Canadian 24-hour movement guidelines for adults. Applied Physiology, Nutrition, and Metabolism, 45(10), S57-S102. pubmed id:PubMed ID

20. 

Swift, D. L., Johannsen, N. M., Lavie, C. J., Earnest, C. P., & Church, T. S (2014). The role of exercise and physical activity in weight loss and maintenance. Progress in Cardiovascular Diseases, 56(4), 441-447. pubmed id:PubMed IDPMC3925973

21. 

Trogdon, J. G., Finkelstein, E. A., Feagan, C. W., & Cohen, J. W (2008). State- and payer-specific estimates of annual medical expenditures attributable to obesity. Obesity, 16(10), 2323-2330.

22. 

Verbeek, M., & Nijman, T (1993). Minimum MSE estimation of a regression model with incomplete panels. Journal of Econometrics, 59(1-2), 125-136.