래피드마이너 데이터 초간편 분석 9편모델 평가~!!이번 시간에는 모델 평가 방법에 대해 알아보겠습니다.지난 9편에서 저희는training data(label 있는 데이터)로 모델을 만들고testing data(label 없는 데이터)를 모델에 적용하여 고객의 충성도를 예측하였습니다.그러나 이 방법은 예측이 실제로 맞았는지 틀렸는지에 대한 정보가 없기 때문에모델의 성능을 실제로 평가할 수 없습니다.따라서 training과 testing에 동일한 데이터를 사용하여 모델을 평가해보겠습니다.먼저, '02-build decision tree' 프로세스를 더블 클릭하여 불러옵니다.'Apply Model' 오퍼레이터를 파라미터 패널로 드래그 앤 드롭합니다.'Decision Tree'의 mod 포트와 'Apply Model'의 mod 포트를 연결시켜 줍니다.'Apply Model'의 unl 포트에는 우리가 예측하고자 하는 라벨이 없는 데이터를 연결시켜 주어야 합니다.우리는 unl 포트에모델을 만드는데 사용한 데이터와 동일한 데이터를 넣어 줄 것입니다.'Filter Exampes'의 exa 포트를 'Apply Model'의 unl 포트에 연결시켜 줍니다.그러면 작은 파란색 아이콘이 생성되는 것을 볼 수 있습니다.아이콘을 클릭하면 'multiply' 오퍼레이터가 생성되고모델을 만드는데 사용된 데이터를 가져와서 모델에 적용시킬 수 있습니다.'Apply Model'의 lab 포트를 결과포트와 연결시켜주고프로세스를 실행합니다.결과의 label 값들을 비교해 보도록 하겠습니다.Churn 칼럼이 원래 label 값이고,prediction(churn)이 label에 대해 예측한 값입니다.15번부터 살펴보면 19번과 28번은 예측이 틀렸고, 나머지는 예측이 옳은 것을 확인할 수 있습니다.이렇듯 모든 데이터를 예측된 label과 비교하여 모델이 얼마나 정확한지 수치를 얻을 수 있습니다.이 역할을 래피드마이너의 'Performance' 오퍼레이터가 실행해줍니다.'Performance' 오퍼레이터를 프로세스 패널로 드래그 앤 드롭하고프로세스를 연결시켜줍니다.프로세스를 실행하기 전에해당 프로세스를 '04-testing the model'으로 저장해줍니다.실행결과, Accuracy가 87.44%로 나쁘지 않은 것을 확인할 수 있습니다.지금까지 모델 평가 방법에 대해 알아보았습니다~~!!더 자세한 기능이 궁금하시다면문의주세용~!!