Search
Duplicate

국민건강보험공단 데이터에 기반한 환자의 재원일수 분석

요약
2016~2019년 국민건강보험공단 건강검진 코호트 데이터를 기반으로, 환자의 재원일수에 중요한 영향을 끼치는 요인을 분석하는 연구입니다.
진행 기간
2022/07/11 → 2023/01/25
기술 스택
R
카테고리
논문
프로젝트 대표 이미지를 넣어주세요

논문 링크

논문 개요

본 연구의 주제는 2016년 ~ 2019년 대한민국 의료기관에 입원 내역이 있는 환자에 대하여, 재원일수를 분석하고, 재원일수에 영향을 끼친 주요 요인에 대하여 파악하는 것입니다.
논문 제목은 ‘Analysis of length of stay for patients admitted to Korean hospitals based on the Korean National Health Insurance Service Database’ 이며, 2023년 1월에 Scopus 저널 중 한 곳인 ‘Informatics in Medicine Unlocked’에 게재하였습니다.
논문에 대한 요약은 아래를 참고해주세요!
요약
연구 배경
환자의 재원일수는 의료정책을 수립하고, 의료기관의 자원을 효율적으로 운영하는 데 있어 매우 중요한 요소임.
재원일수 관련 선행 연구의 대부분은, 연구 범위를 특정 질병군으로 한정하였음.
따라서, 본 연구는 특정 기간 동안 대한민국 의료 기관에 입원한 전체 환자를 대상으로 재원일수 분석을 수행하였음.
연구 목적
재원일수 변동에 영향을 끼친 주요 특성을 파악
연구 프로세스
1단계: 연구에서 사용할 환자의 특성 선정
(1차) 재원일수 관련 선행 연구를 참고하여, 공통적으로 사용하였던 특성을 선택
(2차) 건강검진 코호트 데이터에서, 건강검진 및 진료에 관련된 특성을 선택 (1차와 결합)
2단계: 머신러닝 파이프라인 구축
데이터 전처리 > 데이터 분할 > 모델 구축 > 모델 학습 > 모델 검증 과정을 수행하는 머신러닝 파이프라인 구축
3단계: 특성 중요도 분석
특성 중요도 분석을 통해, 환자의 재원 일수를 결정하는 데 있어 영향력을 행사하는 특성을 발견
연구 결과
핵심 특성 발견
특성 중요도 값을 기존으로 상위 열 개의 특성을 확인함.
주상병(핵심 질환), 부상병(동반 질환)의 수, 특정 의료 기관에서 근무하는 의사 수, 병상 수, 연령, 헤모글로빈/체질량 지수 등 일부 건강검진 기록
이 중에서 부상병 수, 의사 수, 병상 수는 기존 연구에서 밝혀지지 않은 핵심 특성임을 확인함.
연구 한계
카테고리 분류 기준
본 연구는 분류(Classification) 문제를 바탕으로, 재원일수에 주요 영향을 끼치는 특성을 분석함. (단기/중기/장기 입원환자 분류)
따라서, 연속형 변수인 재원일수를 이산형 변수로 범주화(categorization)하는 과정이 필요함.
이때, 선행 연구마다 범주화를 하는 기준(유형의 갯수 및 임계값 설정)이 상이하여 별도의 가이드라인이 존재하지 않음.
후 연구 계획
본 연구에서 발견한 핵심 특성을 특정 질환을 앓고 있는 환자에게 적용하여, 재원일수의 예측 정확도를 높일 수 있는 연구를 수행
데이터 추가(환자의 시계열 데이터) 및 분석 모델의 고도화를 통해, 재원일수의 예측 정확도를 높일 수 있는 연구를 수행

기술 스택

R