본문 바로가기
ADsP 자격증

[3일차] ADsP 자격증 : 분석 기획과 분석 방법론

by 잉나영 2025. 1. 29.
반응형

안녕하세요 오늘은 ADsP 공부 2일차입니다.

오늘도 회귀와 함께 정리본 작성해보겠습니다.

20일간 열심히 스터디를 진행해서 자격증 합격까지 마무리해봅시다 !

 

2일차 정리본은 아래 게시물 참고해주세요 ~

2025.01.29 - [ADsP 자격증] - [2일차] ADsP 자격증 2장 데이터의 가치와 미래

 

[2일차] ADsP 자격증 2장 데이터의 가치와 미래

안녕하세요 오늘은 ADsP 공부 2일차입니다.오늘도 회귀와 함께 정리본 작성해보겠습니다.20일간 열심히 스터디를 진행해서 자격증 합격까지 마무리해봅시다 ! 1일차 정리본은 아래 게시물 참고

lnylnylnylny.tistory.com

 

 

저의 ADsP 공부는 미어캣책과 함께 공부를 진행하려고 합니다. 아래 게시글을 참고해주세요 !

2025.01.20 - [ADsP 자격증] - ADsP 데이터분석 준전문가 비전공자도 독학으로 부시기 !

 

ADsP 데이터분석 준전문가 비전공자도 독학으로 부시기 !

안녕하세요 이번 ADsP 44회를 도전하고 있는 대학생입니다. 이 시험을 준비하기 앞서 저는 미어캣 책으로 유명한 위키북스 책으로 고르게 되었습니다.작년에도 시험에 도전하려고 했는데 시간적

lnylnylnylny.tistory.com

 

그럼 바로 3일차 <분석 기획과 분석 방법론> 정리를 해보겠습니다.


1. 분석기획

: 실제 분석 수행 전 분석을 수행할 과제의 정의 및 의도했던 결과 도출하도록 사전 계획하는 것

 

2. 분석 대상과 그 방법에 따른 4가지 분석 주제

  분석 대상 (What)
분석 방법
(How)
  Known Unknown
Known 최적화 통찰력
UnKnown 해결책 발견

 

3. 목표 시점별 분석 기획 방안

- 과제 중심적 접근 방식 : 빠르기 해결 + 빠른 수행과 문제해결 목적

- 장기적인 마스터플랜 방식 : 지속적인 분석 내재화 + 정확도와 무엇이 문제인가에 대한 문제 정의

 

  과제 단위 마스터플랜 단위
목적 빠른 해결 지속적으로 해결
1차 목표 Speed + Test Accuracy + Deploy
과제 유형 Quick + Win LongTerm View
접근 방식 Problem Solving Problem Definition

 

4. 분석 기획 시 고려사항

- 가용 데이터 고려 : 데이터가 확보될 수 있는 지에 대한 고려 필요

- 적절한 활용방안과 유스케이스 탐색 : 과거의 유사 분석 사례가 있으면 실패를 반복하지 않거나 성공적인 분석 가이드로 활용

- 장애 요소에 대한 사전 계획 수립

 

5. 분석 방법론

: 주어진 과제를 해결하기 위해 조직이 어떠한 절차로 작업을 수행해 나갈 것인지 일련의 절차

 

6. 방법론 구성요소

- 상세한 절차 : 작업을 수행하기 위한 절차

- 방법 : 절차를 수행하기 위한 방법 ex) 전문가 자문, 대면조사

- 도구와 기법 : 작업을 수행하는 데 필요한 것 ex) PPT, R

- 템플릿과 산출물 : 작업을 수행하기 위해 문서를 작성할 때 참고되는 양식. 해당 작업 종류 이후 작성된 문서

 

7. 기업의 합리적 의사결정 방해요소

- 고정관념

- 편향된 생각

- 프레이밍 효과 : 동일한 사건이나 상황을 두고 개인의 판단과 선택이 달라지는 현상

 

8. 분석 방법론 생성과정

암묵지 -> 형식지 -> 방법론

암묵지 형식화 형식지 체계화 방법론
------------------------> ------------------------> 

 

9. 분석 방법론이 적용되는 업무 특성에 따른 모델

1) 폭포수 모델 : 단계를 거쳐 순차적 진행 (하향식), 개선 상황 발견 경우 이전 단계로 내려가는 피드백 과정 수행

 

2) 프로토타입 모델 : 사용자 중심의 개발 방법. 일부분을 먼저 개발하고 사용자 요구 분석, 정당성 점검, 성능 평가 등 개선 작업 시행하며 수행

 

3) 나선형 모델 : 반복을 통해 점진적 개발 + 위험요소 사전에 제거.

처음 시도하는 프로젝트에는 용이 but, 관리 체계를 효과적으로 갖추지 못하면 복잡도 높아짐

 

4) 계층적 프로세스 : 일반적인 분석방법론 모델

여러개의 단계 ⊃ 여러 개의 태스크 ⊃ 여러 개의 스텝 

 

- 단계 : 프로세스 그룹을 통해 완성된 단계별 산출물 생성 , 버전관리 등을 통한 통제 필요

- 태스크 : 단계를 구성하는 단위활동, 물리적/논리적 단위로 품질 검토 항목이 될 수도 있음

- 스탭 : WBS의 워크패키지에 해당. 입력자료 처리/도구, 출력자료로 구성된 단위 프로세스

 

10. 전통적인 분석 방법론

- KDD 분석방법론 : 데이터로부터 통계적 패턴이나 지식을 찾기 위한 체계적으로 정리한 데이터마이닝 프로세스

- CRISP-DM 분석방법론 : KDD와 비슷하나 약간 더 세분화됨

 

11. KDD 분석 방법론 프로세스

1) 데이터셋 선택 : 비즈니스 도메인 이해 + 프로젝트 목표 설정 -> 타깃 데이터 생성

2) 데이터 전처리 : 잡음, 이상치, 결측치 제거 / 재가공. 추가로 요구되는 데이터셋 있으면 재실행

3) 데이터 변환 : 변수 생성/선택 + 데이터 차원 낮춤 , 학습용 데이터와 검증요 데이터 분리

4) 데이터 마이닝 : 학습용 데이터로 분석목적에 맞는 데이터 마이닝 기법 선택 -> 적절한 알고리즘 적용

5) 해석과 평가 : 분석목적과의 일치성 확인 + 평가

 

12. CRISP-DM 분석 방법론 프로세스

1) 업무이해 : 업무 목적 파악, 상황 파악, 데이터 마이닝 목표 설정

2) 데이터 이해 : 초기 데이터 수집, 데이터 기술 분석, 데이터 탐색

3) 데이터 준비 : 분석용 데이터셋 선택 , 데이터 정제, 분석용 데이터셋 편성

4) 모델링 : 모델링 기법 선택,  모델링 테스트 계획 설계

5) 평가 : 분석결과 평가, 모델링 과정 평가

6) 전개 : 전개 계획 수립, 모니터링과 유지보수 계획 수립, 종료 보고서 작성, 프로젝트 리뷰

13. 빅데이터 분석방법론

분석기획 -> 데이터 준비 -> 데이터 분석 -> 시스템 구현 -> 평가 및 전개

 

14. 5단계 빅데이터 분석 방법론 플로우

단계 태스크 스텝
1단계
분석 기획
비즈니스 이해 및 범위 설정 비즈니스 이해 + 프로젝트 범위 설정
프로젝트 정의 및 계획 수립 데이터 분석 프로젝트 정의 + 프로젝트 수행 계획 수립
프로젝트 위험 계획 수립 데이터 분석 위험 식별 + 위험 대응 계획 수립
2단계
데이터 준비
필요 데이터 정의 데이터 정의 + 데이터 획득 방안 수립
데이터 스토어 설계 정형 데이터 스토어 설계 + 비정형 데이터 스토어 설계 
데이터 수집 및 정합성 검정 데이터 수집 및 저장 + 데이터 정합성 검정
3단계
데이터 분석
분석용 데이터 준비 비즈니스룰 확인 + 분석용 데이터셋 준비
텍스트 분석 텍스트 데이터 확인 및 추출 + 텍스트 데이터 분석
탐색적 분석 탐색적 데이터 분석 + 데이터 시각화
모델링 데이터 분할 + 데이터 모델링 + 모델 적용 및 운영 방안
모델 평가 및 검증 모델 평가 + 모델 검증
4단계
시스템 구현
설계 및 구현 시스템 분석 및 설계 + 시스템 구현
시스템 테스트 및 운영 시스템 테스트 + 시스템 운영 계획
5단계
평가 및 전개
모델 발전 계획 모델 발전 계획
프로젝트 평가 및 보고 프로젝트 성과 평가 + 프로젝트 종료

 

15. 위험 대응 계획 수립

- 회피 : 위험 자체를 피하는 방법

- 전이 : 위험을 다른 주체에게 이전

- 완화 : 위험의 영향을 줄임

- 수용 : 위험을 받아들이고 대비

반응형