Compass 데이터 분석 플랫폼은 연구자나 의료 전문가가 공통 데이터 모델(OMOP CDM; Observational Medical Outcomes Partnership Common Data Model)로 변환된 실세계 임상 및 유전체 데이터에 액세스를 제공하는 연구 분석 플랫폼입니다. 광범위한 기능을 갖춘 Compass는 연구자가 고급 통계 분석을 수행할 수 있을 뿐만 아니라 심층 데이터 탐색 및 예측 모델링을 위한 기계 학습 기술도 가능하게 합니다.
연구자는 Compass 플랫폼으로 도구와 기능을 활용하여 복잡한 데이터셋을 조사하고, 가치 있는 인사이트를 발견하며, 임상 및 유전체 정보에 대한 더 깊은 이해를 얻을 수 있습니다. 플랫폼의 사용자 친화적인 인터페이스와 직관적인 기능을 통해 사용자는 광범위한 기술 전문 지식 없이도 최적의 분석을 수행할 수 있습니다.
강원대학교(KNU) Compass는 교육용으로 설계된 데이터 분석 플랫폼으로 학생과 교육자가 OMOP CDM으로 변환된 합성 임상 및 유전체 데이터를 탐색하고 분석할 수 있도록 지원하는 도구입니다. 본 플랫폼은 교육용 데이터 분석 프로세스를 단순화하는 사용자 친화적인 인터페이스를 제공합니다.
OMOP CDM(공통 데이터 모델)로 변환된 합성(가상) 임상 및 유전체 데이터
분석에 사용되는 데이터 리소스는 만성 폐쇄성 폐질환(COPD), 대장암(CRC), 심근경색(MI), 유방암(Breast Cancer), 급성 골수성 백혈병(AML)에 대한 합성(가상) 임상 및 유전체 데이터로 구성되며, 이는 OMOP CDM(참조: OHDSI)으로 알려진, 보편적으로 인식되고 표준화된 공통 데이터 모델의 형식으로 변환되었습니다. 이 변환 프로세스는 데이터가 일관된 구조와 표현을 준수하도록 보장하여 서로 다른 의료 시스템 및 연구 플랫폼 간의 통합과 상호 운용성을 가능하게 합니다.
합성 임상 및 유전체 데이터는 실세계 시나리오를 모방하여 광범위한 임상 조건, 유전적 변이 및 인구 통계학적 특성을 바탕으로 현실적인 환자 프로파일, 의료 이력 및 유전자 변이를 포함합니다.
데이터는 다음과 같은 구조로 구성되어 있습니다.
Person(사람)
데이터베이스의 모든 환자들의 고유 식별 ID와 일부 인구통계학적 정보(demographics) 가 저장된 테이블입니다. 나이, 인종, 성별 정보 등을 포함하며, 각 환자에게는 고유 식별자가 할당되어 서로 다른 데이터 리소스에서 데이터를 추적할 수 있습니다.
Measurement(측정)
검사실 테스트(laboratory tests), 활력 징후(vital signs), 병리학 보고서(pathology reports)와 같은 표준화된 검사 또는 환자와 환자의 샘플 테스트를 통해 얻은 측정 기록들이 저장된 테이블입니다. Measurement 테이블에 포함된 데이터는 양적 또는 질적결과를 생성하기 위해 표준화된 검사 등이 필요하다는 점에서 관측 테이블에 포함 되는 데이터들과 차이를 두며, 체질량지수(BMI), 1초당강제날숨량(FEV1) 등의 기록을 포함합니다.
Observation(관찰)
검사 기록(examination), 질문지 응답 또는 procedure에 같은 임상 데이터들의 관찰값이 기록된 테이블입니다. 사회적 상황, 생활방식, 의료 기록, 가족력 등 다른 영역에서 나타낼 수 없는 모든 기록들이 저장되며, 흡연력, 음주력, 유전적 변이 정보(rs22866351, rs141553824 등)의 경우 각각의 concept_id가 배정되어 포함됩니다.
Condition_occurrence(진단)
의료진 또는 환자로부터 보고된 진단, 징후 또는 증상으로 명시된 질병이나 의학적 컨디션 기록들이 포함된 테이블입니다. 고혈압, 당뇨, 뇌졸중 등 다양한 과거병력 정보를 포함합니다.
Death(사망)
환자의 사망에 관련해 사망 원인과 시기에 대한 임상 이벤트 기록들이 저장된 테이블 입니다. 사망 날짜와 시간, 사망 원인 등의 정보를 포함합니다.
Drug_exposure(약물)
환자가 섭취하거나 환자의 체내에 유입된 약물에 대한 노출 기록들이 저장된 테이블입니다. 아스피린, 클로피도그렐, 스테로이드, 항우울증약, 비스테로이드성 진통소염제 등의 약물 이름, 복용 기간, 중단 이유 등의 정보를 포함합니다.
Procedure_occurrence(치료)
진단 또는 치료 목적을 가진 환자에 대해 health provider가 수행한 activity 또는 process에 대한 기록들이 저장된 테이블입니다. 치료 날짜 및 시간 등의 기록을 포함합니다.
Concept(개념)
OMOP concept으로 변환된 모든 데이터의 관련 정보를 포함하는 테이블입니다. Standardized Vocabularies는 모든 도메인테이블에서 임상정보를 표현하는데 사용되는 각 기본 단위의 의미에 대한 기록 또는 concept의 고유 식별 ID를 포함합니다.
Concept은 도메인(증상(condition), 약물(drug), 치료(procedure))부터 코드의 사용과 관련 설명의 임상정보를 나타내는 vocabulary에서 파생됩니다. 일부 concept은 standard concept으로 지정됩니다. 즉, 이러한 concept들은 OMOP CDM과 표준화된 분석에서 임상 개체의 규범적 표현으로 사용될 수 있습니다.
Standardized vocabulary에 포함된 기록들은 국내 또는 국제 vocabulary에서 파생됩니다. 예시로 SNOMED-CT, RxNorm, LOINC 또는 다양한 측면의 관찰 데이터 분석을 정의하기 위한 custom concept 등이 있습니다.
Visit_occurrence(방문)
환자가 의료 시스템에 속해 있는 동안 발생한 이벤트들을 포함하는 테이블입니다. 기록들은 종종 ‘Encounters’로 표현되기도 하며, Visit은 방문이 발생한 상황의 configuration 에 의해 정의됩니다.
Visit_detail(방문 세부)
Visit_detail 테이블은 상위 Visit_occurrence 테이블의 각 레코드에 대한 세부 정보를 나타내는 데 사용되는 선택적 테이블입니다. 예시로는 입원 기간 동안 병실 이동, 또는 보험 청구와 관련된 정보 등이 있습니다. Visit_occurrence 테이블의 모든 기록에 대해 Visit_detail 테이블은 0개 이상 존재할 수 있습니다. (1:n 관계, n은 0일 수 있음) Visit_detail 테이블은 구조적으로 Visit_occurrence 테이블과 매우 유사하며 Visit 도메인에 속합니다.
개인 Compass 계정 가입을 위해서는 담당 관리자에게 문의하여 초대를 받아주시기 바랍니다.
① 아이디 & 패스워드
② 'Remember my username' 체크 박스
User flow diagram
Compass 플랫폼은 사용자 친화적인 인터페이스, 포괄적인 도구 및 데이터 분석 프로세스를 간소화할 수 있는 강력한 기능을 제공합니다. Compass의 모든 연구 프로젝트는 크게 4개의 단계로 구성되어 있습니다.
아래에서는 본격적으로 Compass와 함께 연구 프로젝트를 시작할 수 있도록 단계별로 구체적인 사용법을 소개합니다.
<aside> 💡 새 프로젝트를 시작하여 플랫폼에서 프로젝트를 직접 설계해보세요. 먼저 목록에서 데이터 분석을 수행할 데이터 리소스를 선택하여 특정 연구 관심사에 맞는 스터디를 설계합니다.
생성할 수 있는 새 프로젝트 수에는 제한이 없습니다.
</aside>
① 'Project Dashboard' 버튼
③ 프로젝트 현황
② 'Create New Project' 버튼
④ 'Help contents' 토글
<aside> 💡 원하는 데이터 리소스를 선택하여 새 프로젝트를 만든 후에는, 본인의 연구에 부합하는 포함 및 제외 기준을 선택하여 코호트(분석 대상 집단)를 선택, 정의해야 합니다.
</aside>
연구자와 분석가는 환자들의 인구 통계학적 정보, 임상 증상, 치료, 약물 및 기타 관련 변수에 기초한 기준을 지정하여 연구 또는 분석을 위한 적절한 코호트를 만들 수 있습니다.