클래스: 데이터 과학의 기초: 기초

무료이용으로 수강해 보세요.

업계 전문가가 강의하는 클래스 24,000개를 수강하세요.

데이터 과학에서의 CRISP-DM 모델

데이터 과학에서의 CRISP-DM 모델

- [강사] 그러니까 제가 세상에서 가장 정리적인 사람은 아니라는 걸 알게 된 거죠. 사실 저도 중요한 문서와 심지어 데이터조차도 이런 식으로 저장된 적이 있지만, 우리 모두는 정리에 대한 퇴비화 접근 방식이 데이터 프로젝트를 훨씬 더 어렵게 만든다는 것을 알고 있기 때문에 일부 매우 똑똑한 사람들은 데이터 프로젝트를 보다 효과적으로 구성하는 방법에 대해 생각하는 데 많은 시간을 할애했습니다. 데이터 마이닝 세계에서 가장 일반적인 접근 방식 중 하나는 Cross-Industry Standard Process for Data Mining의 약자인 CRISP-DM입니다. 따라서 이것은 데이터 마이닝뿐만 아니라 실제로 모든 곳에서 데이터 프로젝트를 구성하는 방법에 대해 생각하는 좋은 방법입니다. 그리고 CRISP-DM은 데이터 프로젝트를 6단계로 설명합니다. 다시 말하지만, 그들은 데이터 마이닝에 대해 구체적으로 이야기하고 있지만 어떤 것에도 적용할 수 있습니다. 첫 번째 단계는 비즈니스 이해입니다. 여기서 아이디어는 비즈니스 목표가 무엇인지입니다. 당신의 실제 목표는 무엇입니까? 그런 다음 상황을 평가하고 데이터 마이닝 목표를 결정합니다. 다시 말하지만, 프로젝트를 진행하면서 달성하려는 것이 무엇인지 파악하려고 합니다. 그런 다음 프로젝트 계획을 세우고, 실제로 기록하고, 지도를 만들어 목표에 도달했을 때 알 수 있습니다. 다음 단계는 데이터 이해입니다. 따라서 초기 데이터를 수집하고, 데이터를 설명하고, 탐색하고, 데이터 품질을 검증하는데, 이는 적절한 성능을 발휘하지 못하면 다른 모든 것이 진행 중일 때 바로 창 밖으로 사라질 수 있는 중요한 단계입니다. 그런 다음 데이터를 준비해야 합니다. 따라서 데이터 세트를 가져오고, 데이터를 선택하고, 데이터를 정리하고, 예를 들어 모델을 구축하는 데 사용할 지표나 요인 점수 또는 기능을 만들어 데이터를 구성합니다. 또한 이 현재 데이터 세트뿐만 아니라 사용 가능한 다른 데이터 세트와 데이터를…

목차