자격증

제45회 ADSP(데이터분석 준전문가) 복원 문제

eunslog 2025. 6. 5. 17:19

2025.06.05 - [자격증] - 제45회 ADsP(데이터 분석 준전문가) 독학 합격후기 (교재 추천, 비전공자 공부법)

 

제45회 ADsP(데이터 분석 준전문가) 독학 합격후기 (교재 추천, 비전공자 공부법)

안녕하세요! 이번에 ADsP를 취득했습니다. 참고로 저는 컴퓨터공학 전공자입니다. 빅데이터분석기사 필기도 합격했기 때문에 겹치는 내용이 많았어서,보다 수월했던 점도 있습니다. 전공자분들

codingtoday.tistory.com

 

ADSP 공부법 등은 위 글에 적어두었습니다.

복원 문제는 제 기억과 다른 사람들의 기억 등을 종합하여 문제를 복구했습니다.

완벽하지는 않을 수 있다는 점 참고 부탁드립니다.

 

제 45회 ADsP 기출 복원 문제

1과목

1. DIKW에 대한 설명 중 틀린 것은 무엇인가?

③  지식과 아이디어가 결합된 창의적 산물이다.

데이터를 가공한 것이 정보이다.

: ③

 

2. 빅데이터의 특징이 아닌 것은?

개인 맞춤화가 불가능하다.

Volume, Variety, Veracity 등이 포함된다.

③  진실성?

데이터를 이용하는 사람들은 모두 동일한 목적을 가지고 이용한다.

:

 

3. 데이터베이스의 특징으로 틀린 것은 무엇인가?

기계가독성/검색가능성/원격조작성

새로운 데이터 추가/갱신/제거

데이터를 이용하는 사람들은 모두 동일한 목적을 가지고 이용한다.

 

: ③

 

4. 데이터의 일관성과 정확성을 유지하고 검증하는 DBMS의 특징은 무엇인가?

데이터의 가용성

데이터의 무결성

데이터의 효율성

데이터의 기밀성

:

 

5. 자동차 회사에서 연료 효율성을 극대화시키기 위해 데이터 분석을 사용했고 그 결과 연료절약형 차량을 설계할 수 있었다. 이때 사용한 알고리즘은 무엇인가?

연관규칙

회귀분석

유전자 알고리즘

④ 분류분석

: ③

 

6. 개인정보 비식별 기술 중 틀린 것은 무엇인가?

가명처리: 개인 식별이 가능한 데이터에 대하여 직접적으로 식별할 수 없는 다른 값으로 대체한다.

데이터 마스킹: 개인정보 식별이 가능한 특정 데이터 값을 삭제한다.

범주화: 단일 식별 정보를 해당 그룹의 대표 값으로 변환한다.

총계처리: 개별 데이터 값을 총합 또는 평균값으로 대체한다.

:

 

7. 빅데이터의 최종 목적은?

③ 가치창출

:

 

8. 빅데이터 활용으로 옳지 않은 것은?

사용자 분석을 통해 서비스 개선 방향을 제시한다.

구매이력을 바탕으로 개인 맞춤형 상품을 추천한다.

팬들의 반응 데이터를 분석해 콘서트의 노래 순서를 정한다.

전문가와의 심층 면담으로 절차를 개선한다.

: ④

 

9. 빅데이터 정보활용 중 적절하지 않은 것은?

개인정보 대량 공유

:

 

10. 빅데이터 시대의 위기요인에 대한 적절한 해결방안이 아닌 것은 무엇인가?

개인정보 활용에 대한 동의를 강화한다.

개인정보 사용자의 책임을 강화한다.

③ 결과 기반 책임 원칙을 강화한다.

④ 알고리즘에 대한 접근권을 허용한다.

:

 

2과목

11. 분석 방법을 알지만 분석 대상을 모를 때 수행하는 분석 기획 유형으로 적합한 것은 무엇인가?

최적화

솔루션

③ 통찰

④ 발견

: ③

 

12. 전사차원의 모든 데이터에 대해 조직, 프로세스 등 표준화된 관리체계를 수립한 쳬계는 무엇인가?

데이터 거버넌스

데이터 모델링

③ 데이터 마스터 플랜

데이터 아키텍처

:

 

13. 다음에서 설명하는 데이터 분석 성숙도 모델은 무엇인가?

기업 데이터에 분석 수준 진단에서, 기업에서 활용하는 분석 업무나 분석 기법은 부족하지만 조직 인력 등을 갖추고 있어, 데이터 분석을 바로 시행할 수 있는 수준

 

준비형

도입형

확산형

④ 정착형

:

 

14. 상향식 접근법 중 틀린 것은?

④ 문제가 정해져 있고 답을 찾는 기법이다.

: ④

 

15. 과제 우선순위 평가 기준 중 본원적 업무에 직접적인 연관관계 밀접한 정도, 이슈 미해결 시 발생하게 될 위험 및 손실에 대한 정도는 무엇인가?

업무 시급성

투자 용이성

③ 전략적 필요성

④ 기술 용이성

: ③

 

16. 하향식 접근법 분석 과제 도출 단계를 순서대로 나열한 것은 무엇인가?

() 문제 정의
() 문제 탐색
() 타당성 검토
() 해결방안 탐색

---

---

③ 나---

④ 나---

: ④

 

17. 분석 성숙도를 진단하는 대상이 아닌 것은 무엇인가?

비용 부문

IT 부문

비즈니스 부문

조직역량 부문

:

 

18. 분석 기획 중 해당하지 않는 것은?

비용 요소

최신 분석 방법으로 확인한 모형

③ 안정성

④ 결과 설명 용이성

:

 

19. 분석 과제에서 고려해야할 요소로 옳은 것은?

정확한 데이터를 위해 복잡한 분석기법을 사용하면 결과 해석이 어려워질 수 있다는 것을 고려해야 한다.

: ①

 

20. 1) 데이터의 정합성을 검토하고 특성을 파악한다. 2) 데이터를 시각화하고 요약하여 숨겨진 패턴 관계 이상값 등을 발견한다. 이 두 가지를 설명하는 분석 태스크는 무엇인가?

머신 러닝 모델링

탐색적 자료 분석

③ 모델 평가 및 검증

④ 데이터 전처리

:

 

3과목

21. 척도에 대한 내용으로 올바르게 짝지어진 것은 무엇인가?

몸무게(kg)는 이산형 척도이다.

고향이 수도권/비수도권인지는 명목척도(Nominal)이다.

③ 정수 0~5 중에 선택하는 것은 연속형 척도이다.

④ 교통사고의 확률은 순서형 척도이다.

:

 

22. ROC 그래프 최대일 때 x, y축은?

(0, 0)

(1, 0)

③ (0, 1)

④ (1, 1)

: ③

 

23. 시계열 데이터 정상화 방법으로 적절한 것은 무엇인가?

차분

결측값 제거

③ 분산제곱통계량

④ 이상치 제거

:

 

24. 로지스틱 회귀분석의 예시로 적절한 것은 무엇인가?

학생들의 시험 점수 예측

마케팅의 성공 여부 예측

③ 제품 출시 판매량의 예측

④ 정년 예측

:

 

25. 시계열 분해에 대한 설명으로 잘못된 것은 무엇인가?

자료가 장기적으로 커지거나 작아지는 변화를 나타내는 요인을 추세요인이라고 한다.

일정한 주기를 가지고 반복적으로 같은 패턴을 보이는 변화를 나타내는 요인을 계절요인이라고 한다.

③ 설명할 수 있는 원인에 의해 변화가 나타내는 요인을 순환요인이라고 한다.

④ 추세요인, 계절요인, 순환요인으로 설명이 불가능한 요인을 불규칙 요인이라고 한다.

:

 

26. 주성분 분석으로 틀린 것은?

①   Javeline 영향력이 가장 크다.

: ①

 

27. 주성분 분석

:

 

28. 기술통계에 대한 설명으로 틀린 것은?

④ 결측치를 모두 0으로 만든다.

: ④

 

29. 다음 중 연속형 변수 간의 유사성 또는 거리를 측정하는 방법으로 적절하지 않은 것은 무엇인가?

마할라노비스거리

맨하튼 거리

③ 유클리드 거리

자카드 거리

: ④

 

 

30. 콜레스테롤 관련 문제 - 문항 회귀식을 구하라.

(자료 주어짐)

96.04x^1.97

1.97x^96.04

f(x) = 1.97 + 96.04x

f(x) = 96.04 + 1.97x

 

31. 다음 중 앙상블 기법인 배깅(Bagging)과 부스팅(Boosting)에 대한 설명으로 적절한 것은 무엇인가?

배깅은 재표본 추출을 사용하지 않는다.

부스팅은 잘못 분류된 데이터에 대해 더 큰 가중치를 부여한다.

배깅은 항상 단일 모형보다 높은 정확도를 보장한다.

부스팅은 과적합 문제를 방지한다.

:

 

32. 최적의 회귀 방정식 탐색 방법 중 모든 변수를 포함한 모델에서 변수를 하나씩 제거하는 방법은?

전진 제거법

후진 선택법

단계별 선택법

전체 선택법

:

 

33. 문제 예측이 참일 때 실제 값도 참인 것은?

정밀도

민감도

재현율

특이도

:

 

34. 의사결정나무에 대한 설명으로 옳지 않은 것은 무엇인가?

최종 노드가 많아질수록 과대적합 발생 가능성이 커진다.

종속 변수가 연속형일 때 가지 분할의 분산을 수행할 수 있다.

종속 변수가 범주형일 때 가지 분할에 엔트로피 지수를 활용할 수 있다.

가지치기(Pruning)을 통해 학습 데이터 세트에서의 정확도를 높일 수 있다.

: ④

 

35. 상관분석

: 스피어만은 범주형

 

36. IQR 문제

(자료 주어짐)

 Sales 25% ~보다 크다.

:  ②

 

37. 인공신경망

: 은닉층이 많아질수록 성능이 높아진다.

 

38. 인공신경망 모형에 대한 설명으로 옳지 않은 것은 무엇인가?

은닉층 개수가 많아진다고 해서 정확도 향상이 보장되지는 않는다.

은닉층마다 노드의 개수는 분석가가 직접 설정해야 한다.

은닉층에서 사용하는 활성화 함수의 종류에 따라 선형적, 비선형적 모형 설계가 가능하다.

설명력 있는 가중치를 선출할 수 있다.

: ④

 

39. K-means에 대한 설명으로 틀린 것은 무엇인가?

: 마지막에 군집 개수 k를 알고리즘이 자동으로 선택해준다.

 

40. 선형회귀분석의 가정에 대한 설명 중 옳지 않은 것은 무엇인가?

정규성: 잔차의 분포가 정규분포를 따른다.

독립성: 독립변수 간에는 서로 독립이다.

등분산성: 잔차의 분산이 모든 관측치에서 일정하다.

선형성: 독립변수와 종속변수 간에는 선형관계가 있다.

:

 

41. 상관계수에 대한 설명 중 틀린 것은 무엇인가?

상관계수가 -1일 때, 상관관계가 가장 약하다.

공분산은 단위가 있고 상관계수는 단위가 없다.

스피어만 계수는 순서척도에서 쓰일 수 있다.

상관계수는 1 ~ 1 사이의 값을 갖는다.

:

 

42. 회귀분석 Education에 대한 설명으로 틀린 것은?

(회귀분석 결과 주어짐.)

: 설명력 67%이다.

 

43. 범주형 자료 분석에 대한 설명 중 틀린 것은 무엇인가?

범주의 특성에 따른 관찰 도수의 비교될 수 있는 기대 도수를 계산하여 사용한다.

동질성 검정은 관측 값들이 정해진 범주 내에서 서로 비슷하게 나타나고 있는지를 검정한다.

적합도 검정은 도수표 내 관찰 도수의 분산과 기대보수 분산이 얼마나 일치하는지를 검정한다.

독립성 검정은 서로 다른 요인들에 의해 분할되어 있는 경우 그 요인들이 관찰값에 영향을 주는지 여부를 검정한다.

:

 

44. 상관관계 비교 - educationcensus, educationinformation(?) 2개의 상관계수 값을 비교하는 문제

(자료 주어짐)

census와의 상관계수 값이 -0.8, information과의 상관계수 값이 +0.5

④ education census보다 education information과의 상관관계가 더 강하다.

: ④

 

45. 다차원척도법 절대적 위치

 

46. 계통추출법

 

47. SOM에 대한 설명으로 틀린 것은 무엇인가?

고차원 데이터를 저차원 데이터로 나타내는 것이다.

정확한 거리를 알 수 있다.

부분적으로(locally) 연결된다.

순전파 방식이다.

:

 

48. (덴드로그램 그림이 주어짐) Height = 2일 때, 몇 개의 클러스터를 가지는가?

2

3

4

5

: ④

 

49. 버터를 구매했을 때와 버터와 빵을 함께 구매했을 때의 상관관계에 해당하는 이름과 값은 무엇인가?

빵, 버터
빵, 우유, 버터
빵, 버터, 잼
잼, 우유

향상도 1.25

향상도 0.25

신뢰도 0.75

신뢰도 0.6

:

 

50. 연관분석 A B일 경우, 지지도에 해당하는 보기는 무엇인가?

전체 중 A를 구매할 확률

전체 중 B를 구매할 확률

전체 중 AB의 확률

A를 구매할 때, B를 구매할 확률

: ③