프로세스 분석에 엑셀보다 프로세스 마이닝이 적합한 이유
- 작성일2021/12/29 15:49
- 조회 857
우리는 프로세스 마이닝이 엑셀보다 프로세스 분석을 더 쉽게 만들어준다고 말하는 사람들을 계속해서 만나고 있다. “엑셀로 프로세스 분석을?”이라고 여러분들의 일부가 질문할지도 모른다. 하지만 엑셀을 이용해도 생각하지도 못한 많은 것들을 할 수 있다.
Mark kaisman의 놀라운 예술작품
예를 들어, 위의 그림은 오직 포장 테이프로만 만들어졌다. 우리는 그가 포장 테이프로 이런 일을 할 수 있을 것이라고 생각하지도 못했다. 이것이 이 그림이 예술 작품인 이유이다. 사실 엑셀이 지금은 매우 일반화되어 있으나, 현재의 수준에 도달하기까지 들인 헌신과 노력을 고려한다면 몇몇 엑셀 스프레드시트 프로그램들은 거의 예술 작품에 근접한다.
당면한 어떤 작업을 수행하기 위해서 비록 해당 도구들이 그 작업에 적합하지 않더라도 우리는 알고 있는 도구들을 이용하는 경향이 있다. 새로운 도구를 사용하기 위한 교육 시간을 고려하면, 이 방법이 타당할 수도 있다. 그러나 Disco와 같이 사용하기 쉬운 프로세스 마이닝 도구가 있다면 여러분이 자주 하고 있는 프로세스 분석들을 프로세스 마이닝을 이용하여 더 쉽고 빠르게 해결할 수 없는지에 대해 다시 논의해봐야 할 때이다.
당신이 생각하는 프로세스는 실제 프로세스가 아니다.
엑셀로 프로세스 분석을 하려는 사람들은 언제나 다음과 같은 데이터 포맷을 사용한다.
- 한 행이 하나의 케이스(아래 그림에 표시된 케이스 1 참조)
- 칼럼에 활동 이름을 사용하고 내용에는 날짜 혹은 타임스탬프가 기록됨
이런 데이터 포맷이 일을 쉽게 만들 때도 있다. 그러나 이 데이터 포맷을 이용하여 활동 A에서 활동 E가 수행될 때까지 걸린 시간을 어떻게 측정할 것인가?
<그림1> 이벤트 로그
이 데이터 포맷의 문제는 프로세스가 활동 A부터 E까지 순차적으로 수행된다고 가정하고 있다는 것이다. 하지만 실제 프로세스는 아주 복잡하기 때문에 이같은 칼럼 기반의 포맷은 실제 프로세스의 여러 정보를 포함하지 못한다.
아래는 위의 예가 행(row) 중심의 포맷으로 변환된 이벤트 로그를 보여준다.
- 하나의 케이스가 여러 행으로 표현됨(아래 그림 참조)
- 활동과 그 활동에 대한 시간을 기록하기 위해 개별적으로 칼럼을 추가함
<그림2> 이벤트 로그
Disco에서 이벤트 로그를 불러오기 위해서는 위의 포맷으로 데이터를 변환할 필요가 있다. 하지만 이것은 중요한 문제가 아니다. 칼럼 기반의 포맷은 프로세스의 이벤트를 제대로 포착하기에 적합하지 않다. 왜냐하면 이 포맷은 본질적으로 반복 수행에 대한 정보를 담지 못하기 때문이다.
다음 이벤트 로그는 반복 수행이 발생하는 것을 보여주는 실제 프로세스 흐름을 보여준다:
- 케이스 2만이 기대했던 경로로 수행 됐음
- 케이스 1과 케이스 3의 경우 칼럼 기반의 이벤트 로그에서는 나타나지 않았던 재작업이 일어났다(파란색 음영)
<그림3> 이벤트 로그
이제 칼럼 기반의 포맷에서 행(row) 기반의 포맷으로 변환된 데이터 셋(이벤트 로그 2)을 Disco에서 불러오면, 프로세스 마이닝으로 데이터를 분석할 수 있다. 하지만 프로세스 모델을 보면 의아한 부분을 찾을 수 있을 것이다(아래 프로세스 맵 참조). 예를 들어, 아래의 프로세스 맵(왼쪽)에서는 활동 B가 수행되고 바로 다음에 활동 D가 수행된 경우가 있다고 표현되었으나, 위의 실제 이벤트 로그(이벤트 로그 3)에서는 이런 경우가 발견되지 않는다. 실제 이벤트 로그(이벤트 로그 3)을 이용해서 도출한 프로세스 모델은 아래(오른쪽)와 같다.
<그림4>
위의 프로세스 모델들은 명확한 비교를 위해서 원래 프로세스 모델을 간소화 한 것이다. 아래에는 칼럼 기반의 이벤트 로그를 행(row) 중심으로 변환한 로그(왼쪽)의 프로세스 모델과 실제 이벤트 로그(오른쪽)의 원래 프로세스 모델을 보여준다.
<그림5>
위에서 설명한 내용은 여러분의 데이터를 엑셀에 적합한 포맷으로 포착함으로써 여러분은 실제 프로세스에 관한 정보를 잃는다는 것을 보여준다. 따라서 이벤트 로그 3과 같은 데이터를 활용하여 실제 프로세스를 분석하는 것이 좋고, Disco와 같은 프로세스 마이닝 도구는 이것을 쉽게 만들어준다.
케이스 맥락(context)이 보존된다.
프로세스 마이닝의 또 다른 장점은 다음과 같다. 분석이 원시 트랜잭션 데이터를 기반으로 수행되기 때문에 여러분은 항상 분석에서 발견한 패턴들에 관한 개별 예들(Disco의 케이스 뷰 스크린 샷 참조)을 발견할 수 있다는 것이다.
<그림6>
실제로 어떤 일이 일어났는지를 이해하고 실행 가능한 정보를 도출하기 위해서 구체적인 예들을 볼 수 있다는 사실은 중요하다.
“이게 일반적인 프로세스 경로인가? 이 경로를 따르는 예제 케이스들을 봐야겠어.”
“다섯 달이 넘게 걸린 케이스들은? 어떤 팀들이 그 일들을 처리했지? 그 팀들을 필터링 해서 좀더 자세하게 살펴봐야겠어.”
“이 경로는 불가능해! 어떻게 된 건지 이 케이스를 좀 더 자세하게 살펴봐야겠어.”
만약 엑셀로 케이스 별 수행 시간 분석을 수행하여 가장 오랫동안 시간이 걸린 10개의 케이스를 찾아냈다면, 그 케이스들의 맥락을 이해하고 프로세스 마이닝 분석에서 실행 가능한 정보를 도출하기 위해서 여러분은 업무 수행을 기록한 원시 시스템(예: CRM, ITSM, Workflow, ERP 시스템)의 기록들을 찾아보아야 한다. 이 작업을 하는 것은 많은 시간이 많이 걸리고 고통스러우며 일부 케이스들에 대해서만 수행될 수 있다.
손쉬운 필터링과 Variant 분석이 가능하다.
필터링은 프로세스 분석의 중요한 부분이다. 어떤 곳에서는 일반적이지 않은 방법으로 일하기 때문에 그런 곳에서 수행된 케이스들을 제외시키고 싶을 때가 있다. 또는 오랜 시간이 걸린 케이스에 집중할 필요가 있을 수도 있다. 여러분은 이런 경우에 대해서 더 자세하게 파고들고 싶을 것이며, 심지어 이 일을 빠르게 수행할 필요가 있을 것이다.
<그림7>
Disco는 아주 강력한 필터링 기능을 가지고 있고, 여러분이 가진 질문에 대한 거의 모든 답들을 아주 빠르게 제공한다(위의 성능 필터 그림 참고). 이것이 엑셀과 비교하여 프로세스 관점에 중점을 둔 프로세스 마이닝 전문 도구가 가진 장점이다. 필터링은 프로세스 중심이며 프로세스와 교감할 수 있는 기능이다.
엑셀로는 불가능한 프로세스 중심 분석의 또 다른 예는 Variant 분석이다. 이와 관련된 내용은 ‘프로세스에 내재된 베리언트 이해하기’라는 글을 참고하기 바란다.
프로세스를 가시화하는 것은 중요하다.
프로세스를 이해하기 위해서 가시화될 필요가 있다. 이것이 모든 전통적인 프로세스 발견과 분석 기법이 프로세스 맵을 그리는 이유이다. 프로세스 마이닝은 본질적으로 가시적이다. 왜냐하면 프로세스 마이닝은 발견된 프로세스에 대한 실제적이며 그래픽 표현을 제공하기 때문이다.
<그림8>
Disco는 또한 이벤트 로그를 기반으로 시간이 흐름에 따른 프로세스의 수행 모습을 재생하는 기능을 제공한다.
엑셀을 이용하면 여러분은 계산에 따라서 프로세스의 실제 수행 모습을 상상해야만 하며 이것은 오로지 단순한 프로세스에만 적용될 수 있다.
프로세스 마이닝은 탐색적 기법이다.
비쥬얼 베이직과 같은 프로그래밍 언어로 데이터를 목적에 맞게 잘 수정한다면 엑셀을 이용해도 많은 질문에 대한 답을 얻을 수 있을 정도로 엑셀은 아주 강력한 도구이다. 데이터베이스 내의 데이터를 기초로 SQL 쿼리를 이용하여 많은 질문들에 답할 수 있는 것처럼 말이다.
하지만 이러한 방법은 프로세스 마이닝의 중요한 요소에 대한 의문을 남긴다: 이미 가지고 있는 물음에는 나타나지 않는, 새로운 것을 발견할 가능성. 프로세스 마이닝은 본질적으로 탐색적인 기법이다. 프로세스 마이닝은 대상 프로세스에서 어떤 일이 일어나는지 보여준 다음에 프로세스 차원에서 쉽게 교감하고, 필터링하고, 데이터를 가시화할 수 있는 기회를 제공한다.
가시화, 상호 교감, 프로세스 중심의 분석은 이전에는 알 수 없었던 더 많은 것들을 발견할 수 있는 힘을 줄 것이다. Preben Ormen은 그의 Disco 리뷰에서 프로세스 마이닝과 엑셀을 이용한 그의 35년 실무 경력을 비교했다. Disco에 관한 그의 의견으로 이 아티클을 마무리하도록 하겠다.
“Disco 리뷰를 쓰면서 나는 Disco 사용 경험을 과거에 수행했던 주문 결제(order to cash) 프로세스 분석 프로젝트와 비교했다. 이 프로젝트의 목표는 수백만 달러의 비용 절감을 이루는 것이었고, 나는 Disco와 같은 프로세스 마이닝 도구 없이 이벤트 로그 형태의 데이터를 다루어야만 했다. 나는 전적으로 엑셀을 이용한 프로세스 분석에만 의존했다.”
“나는 구체적인 클라이언트와 프로세스 조건들을 기반으로 정의한 완벽한 프로세스를 분석에 사용했다. 데이터를 정의하고 추출하는 과정에 1주일 정도의 시간을 소모하고, 분석을 수행하는 데에 몇 달의 시간을 보냈다.”
“내 추측으로, Disco와 같은 도구를 사용했다면 훨씬 좋은 분석 결과를 2주 안에 만들 수 있었을 것이다.”
Fluxicon제공 | PMIG 번역 ( e-mail: info@pmig.co.kr website: http://www.pmig.co.kr/ )