프로세스마이닝 분석을 위한 데이터 요소


프로세스 마이닝 분석을 위해서 제일 중요한 선결 조건은 데이터이지만, 많은 데이터 속성을 필요로 하지는 않습니다. 프로세스 모델을 도출하기 위하여 로그로부터 필요한 요소는 아래와 같이 무엇을(What), 언제(When), 어떻게(How) 했는지에 대한 기록이며, 추가적인 성과 분석을 위해서는 누가(Who) 했는지에 대한 정보만 있으면 됩니다.

 ·  수행 대상(Case ID):  여러 개의 업무로 구성된 하나의 프로세스에서 주요 키(Key)가 되는 속성입니다.
    AS 업무 시스템에서는 경우 AS NO가 될 수도 있고, 제품 관리 시스템에서는 제품 번호, 구매 시스템에서는 
   구매 번호 등이 됩니다. 여러 개의 행위가 하나의 프로세스에 속할 수 있도록 묶어주는 역할을 합니다.
 ·  수행자(Resource): 실제 이벤트를 발생시킨 업무 수행자를 의미하며, 사람이 아닌 부서나 설비가 될 수도
   있습니다.
 ·  시간(Timestamp): 실제 이벤트가 시작되거나 종료된 시간입니다..  Ex) YYYY:MM:DD HH:MI:SS
 ·  업무(Activity): 하나의 프로세스 내에서 수행되는 업무를 구분할 수 있는 속성으로 하나의 프로세스 여러 개
    의 연속된 업무로 이뤄집니다.

이벤트 추출을 위한 대상 시스템 및 로그 형태

개별 시스템에 대한 사용 현황 통계는 이미 기존 시스템에서 제공되고 있을 수 있습니다. 프로세스 마이닝 분석의 장점 중의 하나는 이벤트 로그를 추출해야 하는 시스템은 하나의 시스템에 국한되지 않고 다양한 여러 개의 시스템으로부터 이벤트 정보를 수집하여 하나의 전체 프로세스로 시각화하여 표현하는데 있습니다.
여기서 수집되는 시스템 로그 이력의 형태는 파일 시스템에 기록되는 로그 파일 만을 의미하지 않으며, 업무 시스템 내 데이터베이스에 기록되는 업무 속성 정보 일 수도 있습니다.  ERP, MES, Groupware 등 프로세스가 존재하는 모든 시스템들은 업무 진행과 관련된 이력들은 주로 데이터베이스 등의 정형화된 형태의 정보를 반드시 저장하고 있으며, 최근에는 IoT 사물 인터넷 등을 통하여 수집된 센서 데이터 정보 역시 저장소에 기록되어 프로세스 마이닝 분석에 사용될 수 있습니다.
조직 내의 가치 창출을 위한 업무는 단순히 하나의 시스템을 통해서 수행되지는 않으므로, 여러 개의 시스템을 통해 나오는 로그들을 하나의 시각에서 분석할 필요가 있습니다. 다양한 시스템으로부터 나오는 데이터를 통합 관리하기 위하여 때로는 기존 데이터 웨어하우스를 활용한 통합 데이터 이벤트 리포지토리 등이 End-To-End 전체 프로세스 모델 도출을 용이하게 합니다.
다음은 고객 만족도 향상 및 업무 효율화를 위해 병원정보시스템 내의 개별 시스템 혹은 업무 DB 테이블로부터 데이터를 취합하는 사례입니다. 이렇게 수집된 데이터에 프로세스 마이닝을 적용하여 환자가 내원하여 귀가할 때까지의 이동 동선과 서비스 흐름을 파악할 수가 있습니다.

프로세스 마이닝 이벤트 로그 사례

일반적으로 프로세스 마이닝은 프로세스가 존재하고 이와 관련된 데이터가 존재하는 곳이면 모두 적용될 수 있습니다.

1) 일반 웹 서버 로그 파일 프로세스 마이닝 로그 사례
웹 서버에 기록되는 Access Log 파일 역시 프로세스 마이닝 분석을 수행하기 위한 정보를 포함하고 있습니다. 아래와 같이 접속 Client IP가 Case ID로 사용되고, Activity로는 URL 경로를 사용하여, 특정 IP 접속 사용자를 중심으로 어떤 서비스가 이뤄졌는지 추적할 수가 있습니다. 이를 통해 홈페이지에 접속한 사용자의 페이지 이동 경로 및 소요 체류 시간을 파악하고 웹 서비스 이탈 요인 분석 및 UI 편의 개선 등에 활용할 수 있게 됩니다.

2) 문서 협업 시스템 프로세스 마이닝 로그 사례
그룹웨어, 문서 관리 등 업무 협업이 발생하는 시스템 영역에서도 작성, 승인, 조회, 폐기 등의 프로세스가 존재합니다. 해당 업무 시스템 데이터베이스로부터 항목들에 대한 DB 컬럼들에 대해서 별도 취합하여 분석이 이뤄질 수 있습니다. 이때 각 작업들은 데이터 베이스 상에서는 업무 코드나 화면 번호 등으로 기록될 수 있는데, 이러한 코드들은 데이터 전처리 혹은 리포팅 시에 대체되어 사용자가 이해하기 쉬운 이름으로 작업명으로 출력이 이뤄져 분석을 용이하게 합니다.

3) 기기 고장 수리 서비스
대표적인 고객 서비스 프로세스의 하나인 고장 접수 처리 과정의 경우 시스템에 의해 운영되는 경우가 많습니다. 이때, 고장 접수 기기의 일련번호(S/N)를 하나의 케이스(Case)로 보고, 작업(Activity)은 생산-입고-고장-현상파악-고장 원인 분석-조치-출고로 이뤄진 프로세스 정보를 표현하며, 기기의 수리 과정을 추적해 볼 수 있습니다.

이 밖에도 기업 내의 ERP 업무, 공정 계획 및 실적 관리, 제조 분야의 MES, 보험 심사 과정, 공공기관 업무 처리 등 다양한 분야에서 프로세스 마이닝 적용을 통해 시스템 상에서 수집된 이벤트 로그로부터 큰 어려움이나 노력 없이 필요한 최소한의 요소 정보 만을 추출하여 분석을 수행할 수 있습니다.