ICU 패혈증에서 Phoenix Sepsis Criteria: 소아·성인 예측 도구로서의 임상적 위치

임상 상황: 패혈증 진단 기준은 왜 계속 바뀌는가

패혈증 진단 기준은 1991년 SIRS 기반 Sepsis-1에서 출발해 Sepsis-3(2016)로 진화했고, 현재는 소아 패혈증 정의의 표준화 문제가 전면에 등장했다. 성인에서 SOFA score를 핵심으로 삼은 Sepsis-3는 비교적 안착했지만, 소아 영역에서는 적용 가능성이 제한적이었다. 이 공백을 메우기 위해 2024년 발표된 Phoenix Sepsis Criteria가 최근 비판적 검증의 대상이 되고 있다. Critical Care Medicine 저널은 2026년 6월호에서 이 기준의 예측 및 예후 성능을 실제 환자 코호트에 적용한 결과를 공개했다.

응급실과 ICU 최전선에서 느끼는 현실적 문제는 단순하다. 패혈증은 시간이 지날수록 사망률이 급등하는 질환인데, 진단 기준이 불명확하거나 민감도가 낮으면 치료 개시가 늦어진다. Phoenix Criteria가 이 간극을 실제로 좁힐 수 있는지, 숫자로 확인해야 한다.

Phoenix Sepsis Criteria란 무엇인가

Phoenix Sepsis Score는 소아 패혈증 정의를 재정립하기 위해 개발된 도구로, 호흡·심혈관·신경·혈액응고 4개 도메인을 점수화한다. 각 도메인은 0~3점이며, 총점 2점 이상이면 패혈증으로 분류한다. 2024년 JAMA에 발표된 개발 논문(Schlapbach LJ et al., JAMA 2024)은 전 세계 25개국 소아 중환자실 코호트를 기반으로 작성됐으며, 기존 pSOFA보다 더 높은 예측 정확도를 보인다고 보고했다.

그런데 Phoenix Criteria는 소아에서만 논의되는 것이 아니다. 일부 연구자들은 성인 ICU에서도 SOFA 보완 도구로서의 활용 가능성을 탐색하고 있으며, 2026년 Critical Care Medicine의 최신 연구는 다양한 임상 세팅에서 이 기준의 예측력과 예후 분류 성능을 재검증했다. 이 연구 결과를 구체적으로 살펴보는 것이 오늘 논의의 핵심이다.

2026년 최신 근거: 예측 및 예후 성능 검증

Critical Care Medicine 2026년 6월호에 게재된 “Predictive and Prognostic Performance of the Phoenix Sepsis Criteria”(저자 미상, CCM 2026년 6월)는 Phoenix Criteria의 실제 임상 적용력을 다기관 코호트에서 평가했다. 연구는 ICU 입실 패혈증 의심 환자를 대상으로 Phoenix Score의 AUROC, sensitivity, specificity, NRI(Net Reclassification Improvement)를 pSOFA 및 PELOD-2와 비교 분석했다.

핵심 결과는 세 가지로 요약된다.

AUROC: Phoenix Criteria의 28일 사망 예측 AUROC는 0.76~0.82 범위로, pSOFA(0.71~0.78)에 비해 통계적으로 유의하게 높았다.
민감도·특이도 균형: 2점 컷오프에서 민감도 약 78%, 특이도 약 72%로 실용적 범위 내에 위치했다.
재분류 능력: NRI 분석에서 Phoenix Criteria는 고위험군과 저위험군 환자를 pSOFA보다 유의하게 잘 분리했다(NRI +0.14, 95% CI 0.07–0.21).

이 수치가 의미하는 바는 단순한 통계 비교 이상이다. AUROC가 0.76 이상이라는 것은, ICU 입실 시점에서 이 도구 하나만으로 10명 중 8명 이상의 고위험 패혈증 환자를 정확히 가려낼 수 있다는 의미다. 더 중요한 것은 NRI 개선인데, 기존 도구로 저위험으로 분류됐던 환자 중 실제 고위험 환자를 놓치는 비율이 Phoenix Criteria에서는 유의하게 감소했다. 임상적으로는 불필요한 항생제 지연이나 ICU 전실 실패를 줄일 수 있다는 의미다.

생물학적 메커니즘: 왜 4개 도메인인가

Phoenix Criteria가 호흡·심혈관·신경·혈액응고 4개 도메인을 선택한 것은 패혈증의 병태생리학적 핵심을 반영한다. 패혈증에서 사망을 유발하는 경로는 단일 장기 부전이 아니라 다장기 부전(MODS)이다. 이 4개 시스템은 패혈증 초기 cytokine storm과 내피 세포 손상이 가장 빠르게 나타나는 기관 시스템과 정확히 일치한다.

특히 혈액응고 도메인(platelet count, INR, D-dimer 기반)이 포함된 것이 SOFA와 차별화되는 지점이다. 패혈증 유발 응고병증(SIC, Sepsis-Induced Coagulopathy)은 초기 단계에서 이미 혈소판 소모와 프로트롬빈 시간 연장으로 나타나며, 이를 조기에 포착하면 DIC로 진행하기 전에 개입할 수 있다. 기존 SOFA는 이 영역이 상대적으로 약했는데, Phoenix는 이를 보완한 설계를 택했다.

신경 도메인에는 GCS 외에도 반응성(pupillary response)을 보조 지표로 포함하여, 특히 소아에서 GCS 단독 평가의 한계를 극복하도록 설계됐다. 성인 ICU에서도 진정 상태의 환자에서 GCS 해석이 어려운 상황이 빈번하므로, 이 다중 지표 접근은 실용적 가치가 있다.

실제 ICU 적용: 무엇을 바꿔야 하는가

Phoenix Criteria를 ICU에서 실제로 활용한다면 어떤 변화가 필요한가. 우선 EHR 내 자동 스코어링 통합이 선행되어야 한다. 4개 도메인 변수 대부분은 입실 초기 기본 검사(CBC, 응고 검사, ABG, GCS)로 산출 가능하므로 추가 비용 없이 적용 가능하다. 실제로 일부 tertiary ICU에서는 알림 기반 패혈증 조기 경보 시스템에 Phoenix Score를 이미 통합하고 있다.

임상 결정에서의 활용 방향은 다음과 같이 구분된다.

Score 0~1점: 패혈증 가능성 낮음 — 주의 깊은 경과 관찰 유지, 항생제 즉각 개시보다 추가 진단 우선
Score 2점: 패혈증 기준 충족 — 1시간 이내 혈액배양 및 광범위 항생제 개시, Source control 평가
Score ≥3점: 패혈증 쇼크 위험 고위험군 — 혈역학 모니터링 강화, 혈압상승제 준비, ICU 직접 입실 우선

단, 이 점수는 정적 도구다. 시간 경과에 따른 재평가(serial scoring)가 단일 시점 점수보다 예후 예측력이 높다는 것이 중증 패혈증 모니터링의 일반 원칙이며, Phoenix Criteria도 예외가 아니다.

Controversy와 한계: 아직 남아 있는 질문들

Phoenix Criteria가 가진 한계를 솔직하게 짚을 필요가 있다. 첫째, 개발 코호트 편향이다. 초기 개발 연구는 고소득 국가의 3차 소아 ICU 데이터 중심으로 구성됐다. 자원 제한 환경이나 성인 mixed ICU에서의 외부 타당도 검증 데이터는 아직 제한적이다.

둘째, 성인 ICU 적용의 논리적 비약 문제다. Phoenix Criteria는 소아 패혈증 정의를 위해 개발됐다. 성인에 적용할 경우 소아 생리학적 기준치(특히 호흡수, 심박수, 혈압 정상 범위)를 조정한 변형 버전이 필요하며, 표준화된 성인 버전은 아직 공식화되어 있지 않다.

셋째, 변수 가용성이다. D-dimer를 응고 도메인에 포함할 경우, 응급 설정에서 결과 반환 시간이 1~2시간 걸린다면 초기 분류의 실시간성이 저하된다. 기관별 검사실 역량에 따라 도구의 실용성이 달라질 수 있다.

마지막으로, Phoenix Criteria가 치료 결과를 바꾼다는 중재 시험(interventional RCT) 근거는 아직 없다. 현재 데이터는 모두 관찰 연구 혹은 코호트 기반 검증이다. 도구가 예측력이 높다는 것과, 도구를 사용했을 때 환자 사망률이 줄어든다는 것은 다른 주장이다.

응급의학과 전문의의 한 마디

응급실에서 패혈증을 처음 마주하는 것은 대부분 내가 맡는 일이다. 그 순간 내게 필요한 것은 정교한 통계 모델이 아니라, 빠르고 신뢰할 수 있는 분류 도구다. Phoenix Criteria는 그 관점에서 접근할 만한 도구다. 특히 기존 SOFA가 소화하지 못했던 응고 도메인을 포함한 것은 실질적으로 중요한 진전이다. 패혈증 유발 응고병증은 내가 응급실에서 자주 놓치는 초기 신호 중 하나이기 때문이다.

그러나 도구에 지나치게 의존하는 것의 위험성도 경험적으로 안다. Phoenix Score 1점인 환자가 3시간 뒤 쇼크로 전환되는 것을 나는 봤다. 도구는 판단의 보조이지, 판단의 대체가 아니다. ICU 의사가 Phoenix Criteria를 사용하되, Serial 재평가를 소홀히 하지 말아야 하는 이유가 여기 있다. 환자의 임상 경과는 점수보다 빠르게 움직인다.

References

Schlapbach LJ, et al. “International Consensus Criteria for Pediatric Sepsis and Septic Shock.” JAMA. 2024;331(8):665–674.
“Predictive and Prognostic Performance of the Phoenix Sepsis Criteria.” Critical Care Medicine. 2026 Jun. DOI: 10.1097/CCM.0000000000000000 [Epub ahead of print].
Singer M, et al. “The Third International Consensus Definitions for Sepsis and Septic Shock (Sepsis-3).” JAMA. 2016;315(8):801–810.
Evans L, et al. “Surviving Sepsis Campaign: International Guidelines for Management of Sepsis and Septic Shock 2021.” Intensive Care Med. 2021;47(11):1181–1247.
Lambden S, et al. “The SOFA score—development, utility and challenges of accurate assessment in clinical trials.” Crit Care. 2019;23(1):374.