📊 빅데이터분석기사 필기 완벽 정리 (시험일 4/4)
✅ 빅데이터분석기사란?
빅데이터분석기사(빅분기)는
데이터를 수집하고, 분석하고, 인사이트를 도출하는 능력을 평가하는 국가기술자격증이다.
👉 쉽게 말하면
“데이터를 활용해서 의미 있는 결과를 만들어내는 능력”을 보는 시험
✅ 시험 구성
✔ 필기 과목 (4과목)
- 빅데이터 분석 기획
- 빅데이터 탐색
- 빅데이터 모델링
- 빅데이터 결과 해석
👉 객관식 시험
👉 과목당 과락 있음 (40점 미만 탈락)
👉 평균 60점 이상 합격
📅 시험 일정
- 시험일: 4월 4일 (D-14)
👉 지금 시점 기준
“개념 정리보다 기출 반복이 훨씬 중요”
📌 과목별 핵심 요약
1️⃣ 빅데이터 분석 기획
✔ 빅데이터 특징 (3V)
- Volume (데이터 양)
- Velocity (속도)
- Variety (다양성)
👉 추가 개념
- Veracity (정확성)
- Value (가치)
✔ 분석 절차 (중요)
- 문제 정의
- 데이터 수집
- 전처리
- 분석
- 결과 해석
👉 순서 문제 자주 출제됨
2️⃣ 빅데이터 탐색
✔ 데이터 전처리 (시험 핵심)
- 결측치 처리 (삭제 / 평균 대체)
- 이상치 처리
- 정규화 vs 표준화
👉 차이
- 정규화: 0~1
- 표준화: 평균 0, 표준편차 1
✔ EDA (탐색적 분석)
- 데이터 분포 확인
- 변수 간 관계 분석
- 이상치 탐색
3️⃣ 빅데이터 모델링
✔ 지도학습 vs 비지도학습
- 지도학습: 정답 있음
- 비지도학습: 정답 없음
✔ 핵심 개념
- 회귀: 연속값 예측
- 분류: 범주 예측
✔ 자주 나오는 알고리즘
- KNN
- 의사결정트리
- 로지스틱 회귀
✔ 과적합 / 언더피팅
- 과적합: 학습 데이터에만 맞음
- 언더피팅: 너무 단순
👉 해결 방법
- 데이터 증가
- 규제
- 교차검증
4️⃣ 결과 해석 (모델 평가)
✔ 분류 평가 지표 (⭐ 핵심)
- 정확도
- 정밀도
- 재현율
👉 차이
- 정밀도: 예측 중 맞은 것
- 재현율: 실제 중 맞춘 것
✔ F1 Score
- 정밀도 + 재현율 균형 지표
✔ 회귀 평가 지표
- MSE
- RMSE
- MAE
👉 값이 작을수록 좋음
🔥 시험 대비 핵심 전략
✔ 반드시 기억
- 전처리 = 무조건 나온다
- 평가 지표 = 무조건 나온다
- 회귀 vs 분류 = 필수
- 과적합 = 단골
✔ 공부 방법 (2주 남았을 때)
👉 이게 진짜 중요
- 기출 3회독
- 틀린 문제 반복
- 오답노트 정리
💡 한줄 요약
👉 “빅분기는 기출 반복으로 합격하는 시험이다.”