안녕하세요 오늘은 ADsP 공부 2일차입니다.
오늘도 회귀와 함께 정리본 작성해보겠습니다.
20일간 열심히 스터디를 진행해서 자격증 합격까지 마무리해봅시다 !
2일차 정리본은 아래 게시물 참고해주세요 ~
2025.01.29 - [ADsP 자격증] - [2일차] ADsP 자격증 2장 데이터의 가치와 미래
[2일차] ADsP 자격증 2장 데이터의 가치와 미래
안녕하세요 오늘은 ADsP 공부 2일차입니다.오늘도 회귀와 함께 정리본 작성해보겠습니다.20일간 열심히 스터디를 진행해서 자격증 합격까지 마무리해봅시다 ! 1일차 정리본은 아래 게시물 참고
lnylnylnylny.tistory.com
저의 ADsP 공부는 미어캣책과 함께 공부를 진행하려고 합니다. 아래 게시글을 참고해주세요 !
2025.01.20 - [ADsP 자격증] - ADsP 데이터분석 준전문가 비전공자도 독학으로 부시기 !
ADsP 데이터분석 준전문가 비전공자도 독학으로 부시기 !
안녕하세요 이번 ADsP 44회를 도전하고 있는 대학생입니다. 이 시험을 준비하기 앞서 저는 미어캣 책으로 유명한 위키북스 책으로 고르게 되었습니다.작년에도 시험에 도전하려고 했는데 시간적
lnylnylnylny.tistory.com
그럼 바로 3일차 <분석 기획과 분석 방법론> 정리를 해보겠습니다.
1. 분석기획
: 실제 분석 수행 전 분석을 수행할 과제의 정의 및 의도했던 결과 도출하도록 사전 계획하는 것
2. 분석 대상과 그 방법에 따른 4가지 분석 주제
분석 대상 (What) | |||
분석 방법 (How) |
Known | Unknown | |
Known | 최적화 | 통찰력 | |
UnKnown | 해결책 | 발견 |
3. 목표 시점별 분석 기획 방안
- 과제 중심적 접근 방식 : 빠르기 해결 + 빠른 수행과 문제해결 목적
- 장기적인 마스터플랜 방식 : 지속적인 분석 내재화 + 정확도와 무엇이 문제인가에 대한 문제 정의
과제 단위 | 마스터플랜 단위 | |
목적 | 빠른 해결 | 지속적으로 해결 |
1차 목표 | Speed + Test | Accuracy + Deploy |
과제 유형 | Quick + Win | LongTerm View |
접근 방식 | Problem Solving | Problem Definition |
4. 분석 기획 시 고려사항
- 가용 데이터 고려 : 데이터가 확보될 수 있는 지에 대한 고려 필요
- 적절한 활용방안과 유스케이스 탐색 : 과거의 유사 분석 사례가 있으면 실패를 반복하지 않거나 성공적인 분석 가이드로 활용
- 장애 요소에 대한 사전 계획 수립
5. 분석 방법론
: 주어진 과제를 해결하기 위해 조직이 어떠한 절차로 작업을 수행해 나갈 것인지 일련의 절차
6. 방법론 구성요소
- 상세한 절차 : 작업을 수행하기 위한 절차
- 방법 : 절차를 수행하기 위한 방법 ex) 전문가 자문, 대면조사
- 도구와 기법 : 작업을 수행하는 데 필요한 것 ex) PPT, R
- 템플릿과 산출물 : 작업을 수행하기 위해 문서를 작성할 때 참고되는 양식. 해당 작업 종류 이후 작성된 문서
7. 기업의 합리적 의사결정 방해요소
- 고정관념
- 편향된 생각
- 프레이밍 효과 : 동일한 사건이나 상황을 두고 개인의 판단과 선택이 달라지는 현상
8. 분석 방법론 생성과정
암묵지 -> 형식지 -> 방법론
암묵지 | 형식화 | 형식지 | 체계화 | 방법론 |
------------------------> | ------------------------> |
9. 분석 방법론이 적용되는 업무 특성에 따른 모델
1) 폭포수 모델 : 단계를 거쳐 순차적 진행 (하향식), 개선 상황 발견 경우 이전 단계로 내려가는 피드백 과정 수행
2) 프로토타입 모델 : 사용자 중심의 개발 방법. 일부분을 먼저 개발하고 사용자 요구 분석, 정당성 점검, 성능 평가 등 개선 작업 시행하며 수행
3) 나선형 모델 : 반복을 통해 점진적 개발 + 위험요소 사전에 제거.
처음 시도하는 프로젝트에는 용이 but, 관리 체계를 효과적으로 갖추지 못하면 복잡도 높아짐
4) 계층적 프로세스 : 일반적인 분석방법론 모델
여러개의 단계 ⊃ 여러 개의 태스크 ⊃ 여러 개의 스텝
- 단계 : 프로세스 그룹을 통해 완성된 단계별 산출물 생성 , 버전관리 등을 통한 통제 필요
- 태스크 : 단계를 구성하는 단위활동, 물리적/논리적 단위로 품질 검토 항목이 될 수도 있음
- 스탭 : WBS의 워크패키지에 해당. 입력자료 처리/도구, 출력자료로 구성된 단위 프로세스
10. 전통적인 분석 방법론
- KDD 분석방법론 : 데이터로부터 통계적 패턴이나 지식을 찾기 위한 체계적으로 정리한 데이터마이닝 프로세스
- CRISP-DM 분석방법론 : KDD와 비슷하나 약간 더 세분화됨
11. KDD 분석 방법론 프로세스
1) 데이터셋 선택 : 비즈니스 도메인 이해 + 프로젝트 목표 설정 -> 타깃 데이터 생성
2) 데이터 전처리 : 잡음, 이상치, 결측치 제거 / 재가공. 추가로 요구되는 데이터셋 있으면 재실행
3) 데이터 변환 : 변수 생성/선택 + 데이터 차원 낮춤 , 학습용 데이터와 검증요 데이터 분리
4) 데이터 마이닝 : 학습용 데이터로 분석목적에 맞는 데이터 마이닝 기법 선택 -> 적절한 알고리즘 적용
5) 해석과 평가 : 분석목적과의 일치성 확인 + 평가
12. CRISP-DM 분석 방법론 프로세스
1) 업무이해 : 업무 목적 파악, 상황 파악, 데이터 마이닝 목표 설정
2) 데이터 이해 : 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색
3) 데이터 준비 : 분석용 데이터셋 선택 , 데이터 정제, 분석용 데이터셋 편성
4) 모델링 : 모델링 기법 선택, 모델링 테스트 계획 설계
5) 평가 : 분석결과 평가, 모델링 과정 평가
6) 전개 : 전개 계획 수립, 모니터링과 유지보수 계획 수립, 종료 보고서 작성, 프로젝트 리뷰
13. 빅데이터 분석방법론
분석기획 -> 데이터 준비 -> 데이터 분석 -> 시스템 구현 -> 평가 및 전개
14. 5단계 빅데이터 분석 방법론 플로우
단계 | 태스크 | 스텝 |
1단계 분석 기획 |
비즈니스 이해 및 범위 설정 | 비즈니스 이해 + 프로젝트 범위 설정 |
프로젝트 정의 및 계획 수립 | 데이터 분석 프로젝트 정의 + 프로젝트 수행 계획 수립 | |
프로젝트 위험 계획 수립 | 데이터 분석 위험 식별 + 위험 대응 계획 수립 | |
2단계 데이터 준비 |
필요 데이터 정의 | 데이터 정의 + 데이터 획득 방안 수립 |
데이터 스토어 설계 | 정형 데이터 스토어 설계 + 비정형 데이터 스토어 설계 | |
데이터 수집 및 정합성 검정 | 데이터 수집 및 저장 + 데이터 정합성 검정 | |
3단계 데이터 분석 |
분석용 데이터 준비 | 비즈니스룰 확인 + 분석용 데이터셋 준비 |
텍스트 분석 | 텍스트 데이터 확인 및 추출 + 텍스트 데이터 분석 | |
탐색적 분석 | 탐색적 데이터 분석 + 데이터 시각화 | |
모델링 | 데이터 분할 + 데이터 모델링 + 모델 적용 및 운영 방안 | |
모델 평가 및 검증 | 모델 평가 + 모델 검증 | |
4단계 시스템 구현 |
설계 및 구현 | 시스템 분석 및 설계 + 시스템 구현 |
시스템 테스트 및 운영 | 시스템 테스트 + 시스템 운영 계획 | |
5단계 평가 및 전개 |
모델 발전 계획 | 모델 발전 계획 |
프로젝트 평가 및 보고 | 프로젝트 성과 평가 + 프로젝트 종료 |
15. 위험 대응 계획 수립
- 회피 : 위험 자체를 피하는 방법
- 전이 : 위험을 다른 주체에게 이전
- 완화 : 위험의 영향을 줄임
- 수용 : 위험을 받아들이고 대비
'ADsP 자격증' 카테고리의 다른 글
[5일차] ADsP 자격증 : 분석 마스터플랜 (1) | 2025.01.31 |
---|---|
[4일차] ADsP 자격증 : 분석과제 발굴, 분석 프로젝트 관리방안 (1) | 2025.01.30 |
[ADsP] 데이터 분석의 첫걸음, ADsP 자격증을 추천하는 이유 (0) | 2025.01.29 |
[2일차] ADsP 자격증 2장 데이터의 가치와 미래 (0) | 2025.01.29 |
[KDATA] 데이터 관련 자격증 추천 및 종류 알아보기 (1) | 2025.01.28 |