8편 - 모델 적용(Apply Model)

래피드마이너 데이터 초간편 분석 8편​모델 적용(Apply Model)~!!​이번 시간에는 7편에서 만든의사결정나무 모델을 테스트 데이터에 적용시켜 보도록 하겠습니다.​지난 시간에 'Anny'라는 샘플 데이터를트리의 맨 위 분기부터 타고 내려오며 어느 label로 분류되는지 알아보았습니다.​그러나 모든 고객을 이렇게 직접 수행하는 것은 매우 비효율적입니다!!​래피드 마이너에서 제공하는'Apply Model' 오퍼레이터는해당 작업을 자동으로 수행해줍니다.​'Apply Model'에 대해 알아봅시다~!!​​먼저, 지난 시간에 만들었던 '02-build decision tree' 프로세스를카피한 뒤 프로세스 폴더에 붙여 넣어 줍니다.​​​그리고 'Insert copy of entry'를 선택하고 Ok 버튼을 눌러줍니다.​​​프로세스가 만들어졌으니 rename을 클릭해프로세스의 이름을 '03-apply the model'으로 변경하고 해당 프로세스를 불러옵니다.모델 적용을 하기 위해서는 우리가 예측하고자 하는 데이터즉, label 값이 없는 데이터를 원래 데이터에서 분리시켜 주어야 합니다.​데이터에 두 개의 'Filter Examples' 오퍼레이터를걸어 해당 작업을 수행해보겠습니다.​​​'Filter Examples' 오퍼레이터를 프로세스 패널로 드래그 앤 드롭합니다.​데이터에 두 개의 오퍼레이터를 연결해야 하지만래피드마이너에서는 하나의 출력포트는 다른 하나의 포트에만 연결할 수 있게 되어있습니다.​'Filter Examples (2)' 오퍼레이터와 연결하게 되면위의 'Filter Examples' 오퍼레이터와는 연결이 자동으로 끊기게 됩니다.​이러한 상황에서는??'Multiply' 오퍼레이터를 사용하면 됩니다.​'Multiply' 오퍼레이터는하나의 출력포트에 두 개 이상의 포트를 연결시켜 줍니다.​오퍼레이터 패널에서 'multiply'를 검색해서 가져와도 되지만다른 매우 간편한 방법이 있습니다.​​​데이터의 출력포트를 다시 위에 있는 'Filter Examples'와 연결시켜 줍니다.​포트를 연결하게 되면 다음과 같이 파란색 작은 아이콘이 나타납니다.해당 아이콘을 클릭하게 되면 자동으로 'Multiply' 오퍼레이터가 적용됩니다.​​​연결선이 복잡하게 연결 되어있으므로 연결선을 다시 연결시켜줍니다.​​​'Filter Examples (2)' 의 파라미터 패널에서 Add Filters를 클릭하고'Churn' 값이 missing 인 값만 가져오도록 설정해줍니다.​​​결과포트에 연결시켜주고 프로세스를 실행합니다.​실행결과, 96개의 데이터가 있으며'Churn' 칼럼의 값이 모두 missing으로 잘 분리된 것을 확인할 수 있습니다.이제 모델을 적용시켜 볼까요?​​'Apply Model' 오퍼레이터를 파라미터 패널로 드래그 앤 드롭합니다.​'Decision Tree'의 mod 포트를 'Apply Model'의 mod 포트로 연결해주고'Filter Examples (2)의 exa 포트를 'Apply Model'의 unl 포트로 연결시켜 줍니다.​여기서 unl은 라벨이 없는 데이터(unlabeled)를 의미합니다.​프로세스의 첫 번째 결과 포트는 mod와 연결되어 있기 때문에 의사결정나무 모델을 출력해주고두 번째 결과 포트는 lab와 연결 되었기 때문에 테스트 셋의 예측된 label을 제공해줍니다.​​​실행결과, 3가지의 새로운 special attribute가 생긴 것을 볼 수 있습니다.​​​missing 이었던 label 값들이 모두 예측된 것을 볼 수 있습니다.​1번 고객은 79.8%의 신뢰도로 이탈할 고객('Churn')으로 예측하였고7번 고객은 97.8%의 신뢰도로 충성스러운 고객('Loyal')으로 예측한 것을 확인할 수 있습니다.​​이제까지 모델 적용에 대해 알아보았습니다~!!​다음시간에는 모델의 성능을 평가하는 방법에 대해 알아보겠습니다!​​​래피드마이너에 대해 더 궁금하시면?!!문의주세요~!!​

Planto

logo
LOG IN 로그인
  • Services
    • Business Intelligence
    • Big Data
    • System Implementation
    • Consulting
  • Solutions
    • e·Mapp
    • RapidMiner
    • MSTR
    • SAS
    • AMS 책무구조
  • Platform
    • Big Data Platform
    • Smart Factory Platform
    • Data Science & Machine Learning Platform
  • Education
    • On/Offline Seminar
    • Information Center
  • ESG
    • 대표이사 메세지
    • ESG 전략체계
  • Company
    • About
    • History
    • Project
    • Contact Us
    • Notice

Planto

logo
  • Services
    • Business Intelligence
    • Big Data
    • System Implementation
    • Consulting
  • Solutions
    • e·Mapp
    • RapidMiner
    • MSTR
    • SAS
    • AMS 책무구조
  • Platform
    • Big Data Platform
    • Smart Factory Platform
    • Data Science & Machine Learning Platform
  • Education
    • On/Offline Seminar
    • Information Center
  • ESG
    • 대표이사 메세지
    • ESG 전략체계
  • Company
    • About
    • History
    • Project
    • Contact Us
    • Notice
Search 검색
Log In 로그인
Cart 장바구니

Planto

logo

Planto

logo
  • Services
    • Business Intelligence
    • Big Data
    • System Implementation
    • Consulting
  • Solutions
    • e·Mapp
    • RapidMiner
    • MSTR
    • SAS
    • AMS 책무구조
  • Platform
    • Big Data Platform
    • Smart Factory Platform
    • Data Science & Machine Learning Platform
  • Education
    • On/Offline Seminar
    • Information Center
  • ESG
    • 대표이사 메세지
    • ESG 전략체계
  • Company
    • About
    • History
    • Project
    • Contact Us
    • Notice
Search 검색
Log In 로그인
Cart 장바구니

Planto

logo
이용약관
개인정보처리방침
사업자정보확인

상호: PlanTo Business Consulting | 대표: 박경호 | 개인정보관리책임자: 박경호 | 전화: 02-782-3777 | 이메일: planto@planto.co.kr

주소: 서울특별시 영등포구 당산로41길 11, E동 1412호 | 사업자등록번호: 107-86-15583 | 통신판매: 미입력 | 호스팅제공자: (주)식스샵

floating-button-img