본문 바로가기
[자격증]/ADsP 문제 풀이

[39회 기출 변형 문제]

by 에디터 윤슬 2024. 10. 27.
 

[2과목]

01. 다음 중 위험 대응 계획 수립의 방법으로 적절하지 않은 것은?

  1. 회피
  2. 전이
  3. 관리
  4. 완화

해설

  • 개념 개요
    • 위험 대응 계획은 프로젝트나 업무에서 발생할 수 있는 위험을 효과적으로 관리하기 위한 전략을 수립하는 과정입니다. 일반적으로 사용되는 위험 대응 전략에는 위험 회피, 위험 전가, 위험 완화, 위험 수용 등이 있습니다.
  • 초등학생도 이해하기 쉬운 설명
    • 위험 대응 계획은 마치 비 오는 날 우산을 준비하는 것과 같아요. 비가 올 때 젖지 않도록 미리 준비하는 거죠. 우산을 쓰거나, 비를 피할 장소를 찾는 것처럼요.
  • 각 문제 항목 해설
    • 회피 (Avoidance)
      • 위험을 완전히 피하기 위해 특정 활동을 하지 않거나 대안을 선택하는 전략입니다.
    • 전이 (Transfer)
      • 위험의 영향을 제3자에게 넘기는 전략으로, 보험 가입 등이 예입니다.
    • 관리
      • 이 용어는 일반적인 위험 대응 전략으로 명시되지 않습니다. 대신, 관리라는 용어는 위험을 모니터링하고 조정하는 일반적인 과정에 사용될 수 있습니다.
    • 완화 (Mitigation)
      • 위험의 발생 가능성이나 영향을 줄이기 위한 예방적 조치를 취하는 전략입니다.
  • 오답 노트
    • 관리는 특정한 위험 대응 전략으로 분류되지 않으며, 일반적인 관리 활동이나 프로세스를 의미할 수 있습니다. 반면에 회피, 전이, 완화는 명확한 위험 대응 전략으로 사용됩니다.

02. 분석 과제들에 대한 우선순위를 고려할 때 빅데이터의 특징을 고려할 수 있다. 다음 ROI 관점에서 우선순위를 선정할 때 그 요소로 적절하지 않은 것은 무엇인가?

  1. Volume
  2. Variety
  3. Value
  4. Veracity

해설

  • ROI 관점의 4V는 Volume, Variety, Velocity, Value이다.

03. 다음 중 아래 보기에서 설명하는 조직구조는 무엇인가?

전사 내에 별도의 분석조직을 보유하고 있으며, 분석조직의 인력을 현업 부서로 배치하여 분석 업무를 수행한다. 전사적 관점에서 분석과제의 우선순위 선정이 가능하다는 장점이 있다.
  1. 집중형 조직 구조
  2. 기능 중심 조직 구조
  3. 고객 중심 조직 구조
  4. 분산형 조직 구조

해설

  • 개념 개요
    • 분산형 조직 구조는 분석 인력을 각 현업 부서에 배치하여, 부서별로 독립적으로 분석 업무를 수행하는 방식입니다. 이 구조는 전사적인 관점에서 분석과제의 우선순위를 설정할 수 있는 장점이 있습니다.
  • 초등학생도 이해하기 쉬운 설명
    • 분산형 조직 구조는 마치 학교에서 각 반마다 선생님이 따로 있어서, 그 반에 맞는 수업을 진행하는 것과 같아요. 이렇게 하면 각 반의 필요에 맞춘 공부를 할 수 있어요.

04. 다음 중 분석 과제 관리 프로세스에 대한 설명으로 잘못된 것은?

  1. 과제 발굴과 과제 수행의 두 가지 영역으로 나누어 볼 수 있다.
  2. 과제 발굴 단계에서 선정된 과제 후보는 현재 혹은 미래에 수행 가능하도록 풀로써 관리한다.
  3. 수행된 분석 과제에 대해서는 과제 결과를 다시 과제 후보 풀로써 관리한다.
  4. 과제 수행 단계에서 선정된 과제는 팀을 구성하고 과제를 수행하면서 지속적인 모니터링 작업을 병행한다.

해설

  • 수행된 분석 과제는 과제 후보 풀이 아닌 과제 결과 풀로써 관리한다.

05. 다음 중 하향식 접근법의 프로세스에 대한 설명으로 잘못된 것은 무엇인가?

  1. 타당성 검토 단계에서는 경제적 타당성과 데이터 및 기술적 타당성 검토를 통해 문제 해결 수행 여부를 경정한다.
  2. 탐색된 문제에 대해 데이터 문제로 변환하는 문제 정의를 수행한다.
  3. 비즈니스 모델 캔버스와 더불어 분석 기회 발굴 범위 확장 등을 통해 문제를 탐색한다.
  4. 무엇을, 어떻게 분석해야 할지를 기준으로 해결 방안을 탐색한다.

해설

  • 하향식 접근법에서는 문제 탐색, 문제 정의, 해결방안 탐색, 타당성 검토의 순서로 진행됩니다. "무엇을, 어떻게 분석해야 할지"는 상향식 접근법에서 주로 사용하는 방식으로, 하향식 접근법에서는 문제의 정의와 해결 방안이 먼저 고려됩니다.

[3과목]

01. 다음 중 시계열 분석에 대한 설명으로 부적절한 것은?

  1. 시계열 자료에서 현재 시점의 데이터로부터 특정 시차만큼 떨어진 값들에 대한 상관계수를 함수로 나타낸 것이 자기상관함수다.
  2. 백색잡음이란 정규분포로부터 추출된 데이터로, 시계열 자료에서 오차항에 해당한다.
  3. 평균이 일정하지 않은 경우 변화, 분산이 일정하지 않은 경우 차분을 통해 정상성을 만족시킬 수 있다.
  4. 자기상관함수는 시차가 0일 때 자기 자신과의 상관계수를 의미하므로 자기상관함수의 값은 1이다.

해설

  • 개념 개요
    • 시계열 분석은 시간의 흐름에 따라 수집된 데이터를 분석하여 패턴을 파악하고 미래를 예측하는 방법입니다. 정상성, 자기상관함수, 백색잡음 등의 개념이 중요합니다.
  • 초등학생도 이해하기 쉬운 설명
    • 시계열 분석은 날씨 예보처럼 시간에 따라 변하는 데이터를 보고 미래를 예측하는 거예요. 데이터를 잘 정리해서 어떤 패턴이 있는지 찾는 거죠.
  • 각 항목 해설
    • 자기상관함수
      • 현재 시점의 데이터와 특정 시차만큼 떨어진 값들 간의 상관성을 나타냅니다. 시차가 0일 때 값은 1입니다.
    • 백색잡음
      • 평균이 0이고 분산이 일정한 정규분포를 따르는 오차항입니다.
    • 평균과 분산 처리
      • 평균이 일정하지 않은 경우 차분을 사용합니다.
      • 분산이 일정하지 않은 경우 로그 변환 등을 사용해야 합니다. 이 설명이 부적절합니다.
    • 자기상관함수의 값
      • 시차가 0일 때 자기 자신과의 상관계수는 항상 1입니다.
  • 오답 노트
    • 평균과 분산 처리: 차분은 주로 평균을 일정하게 하기 위해 사용되며, 분산이 일정하지 않을 때는 로그 변환 같은 방법을 사용해야 합니다.

02. 다음 중 배깅에 대한 설명으로 잘못된 것은 무엇인가?

  1. 한 개의 분류기에서 오는 불확실성 문제를 해결하기 위해 여러 개의 분류기를 통해 최종결과를 선발하는 모형을 의미한다.
  2. 지도학습의 한 종류로 목표변수를 포함하여 학습해야 한다.
  3. 분산이 작을수록 좋은 예측력을 보유하기 위해 모집단의 특성을 잘 반영할 수 있는 붓스트랩을 활용하여 분류기를 구축해야 한다.
  4. 앙상블 모델을은 각 분류기 간에 상호 연관성이 높을수록 정확도가 향상된다.

해설

  • 개념 개요
    • 배깅(Bagging)은 Bootstrap Aggregating의 약자로, 여러 개의 분류기를 통해 예측의 신뢰성을 높이고 불확실성을 줄이는 앙상블 기법입니다. 이는 데이터의 다양한 부분집합을 사용하여 여러 모델을 독립적으로 학습시키고, 그 결과를 평균하거나 투표하여 최종 예측을 만듭니다.
  • 초등학생도 이해하기 쉬운 설명
    • 배깅은 여러 친구들이 각각 문제를 풀고, 그 답을 모아서 가장 많이 나온 답을 정답으로 하는 방법이에요. 이렇게 하면 한 친구가 틀렸더라도 다른 친구들이 맞춰줘서 더 정확한 답을 얻을 수 있어요.
  • 각 항목 해설
    • 한 개의 분류기에서 오는 불확실성 문제를 해결하기 위해 여러 개의 분류기를 통해 최종결과를 선발하는 모형을 의미한다.
      • 배깅은 여러 모델의 예측을 결합하여 신뢰성을 높입니다.
    • 지도학습의 한 종류로 목표변수를 포함하여 학습해야 한다.
      • 배깅은 지도학습 기법으로, 목표변수를 포함한 학습 데이터를 사용합니다.
    • 분산이 작을수록 좋은 예측력을 보유하기 위해 모집단의 특성을 잘 반영할 수 있는 붓스트랩을 활용하여 분류기를 구축해야 한다.
      • 배깅은 붓스트랩 샘플링을 통해 분산을 줄이고 예측력을 향상시킵니다.
    • 앙상블 모델은 각 분류기 간에 상호 연관성이 높을수록 정확도가 향상된다.
      • 잘못된 설명입니다. 배깅에서는 각 분류기 간의 상호 연관성이 낮을수록 다양한 관점을 반영할 수 있어 더 나은 성능을 보입니다.
  • 오답 노트
    • 분류기 간 상호 연관성: 배깅에서는 분류기 간의 상호 연관성이 낮아야 다양한 오류를 상쇄할 수 있어 성능이 향상됩니다. 높은 상관성은 오히려 성능 저하를 초래할 수 있습니다.

03. 다음 중 k-평균군집을 수행하는 순서를 올바르게 나열한 것은?

  • (가) 모든 개체가 군집으로 할당될 때까지 위의 과정을 반복한다.
  • (나) 각 군집의 seed 값을 계산한다.
  • (다) 원하는 군집의 개수와 초깃값을 정해 군집을 형성한다.
  • (라) 각 데이터를 가장 가까운 seed가 있는 군집으로 분류한다.

해설

  • (다) 원하는 군집의 개수와 초깃값을 정해 군집을 형성한다.
    • 초기 단계에서 군집의 개수(k)와 각 군집의 초기 중심(seed)을 설정합니다.
  • (라) 각 데이터를 가장 가까운 seed가 있는 군집으로 분류한다.
    • 각 데이터 포인트를 가장 가까운 중심점이 있는 군집에 할당합니다.
  • (나) 각 군집의 seed 값을 계산한다.
    • 각 군집에 할당된 데이터 포인트들의 평균을 계산하여 새로운 중심점을 설정합니다.
  • (가) 모든 개체가 군집으로 할당될 때까지 위의 과정을 반복한다.
    • 데이터 포인트의 할당이 더 이상 변하지 않을 때까지 (라)와 (나)의 과정을 반복합니다.

04. 다음 중 다차원 척도법에 대한 설명으로 잘못된 것은 무엇인가?

  1. 객체 간의 유사성을 시각화하는 통계 기법으로 군집분석과 유사하다.
  2. Stress 값을 척도로 활용하여 적합도를 판단할 수 있으며 그 값이 높을수록 좋다.
  3. 주성분분석과 마찬가지로 차원 압축이라는 점은 시각화에 있어 한계점이 있음은 분명하다.
  4. 구간척도 또는 비율척도인 경우 계량적 방법을 활용해야 한다.

해설

  • 개념 개요
    • 다차원 척도법(MDS)은 객체 간의 유사성을 시각적으로 표현하는 통계 기법입니다. 주로 고차원 데이터를 저차원 공간에 배치하여 유사성을 쉽게 이해할 수 있도록 합니다.
  • 초등학생도 이해하기 쉬운 설명
    • 다차원 척도법은 여러 친구들의 키와 몸무게를 비교해서, 비슷한 친구들끼리 가까이 놓는 그림을 그리는 것과 같아요. 이렇게 하면 누가 더 비슷한지 쉽게 볼 수 있어요.
  • 각 항목 해설
    • 객체 간의 유사성을 시각화하는 통계 기법으로 군집분석과 유사하다.
      • MDS는 객체 간의 유사성을 시각적으로 표현합니다.
    • Stress 값을 척도로 활용하여 적합도를 판단할 수 있으며 그 값이 높을수록 좋다.
      • Stress 값은 낮을수록 모델의 적합도가 좋습니다.
    • 주성분분석과 마찬가지로 차원 압축이라는 점은 시각화에 있어 한계점이 있음은 분명하다.
      • 차원 압축 과정에서 정보 손실이 발생할 수 있습니다.
    • 구간척도 또는 비율척도인 경우 계량적 방법을 활용해야 한다.
      • 계량적 MDS는 구간척도나 비율척도를 사용할 때 적합합니다.
  • 오답 노트
    • Stress 값: MDS에서 모델의 적합도를 평가하는 지표로, 값이 낮을수록 데이터 표현이 잘 된 것입니다. 높은 값은 적합도가 낮음을 나타냅니다.

05. 다음 중 자기조직화지도에 대한 설명으로 올바르지 않은 것은 무엇인가?

  1. 승자 독식 구조에 의해 군집이 수행된다.
  2. 역전파 알고리즘을 활용하여 군집의 수행속도가 매우 빠르다.
  3. 한 번 경쟁층에 도달한 벡터는 iteration이 진행됨에 따라 가중치가 변경되므로 승자 노드가 변경될 수 있다.
  4. 초기 학습률 및 가중치 행렬, 경쟁층의 노드의 수 등 최적의 파라미터 수 결정이 어렵다.

해설

  • 이유
    • 자기조직화지도(SOM)는 역전파 알고리즘을 사용하지 않습니다. 대신, 경쟁 학습(competitive learning)을 통해 가중치를 조정합니다. 이는 지도학습이 아닌 비지도학습 방법으로, 역전파와 같은 오류 수정 학습을 사용하지 않습니다
  • 각 항목 해설
    • 승자 독식 구조에 의해 군집이 수행된다.
      • SOM은 입력 데이터와 가장 가까운 가중치를 가진 노드가 승자가 되어 가중치가 조정되는 승자 독식 구조를 사용합니다.
    • 역전파 알고리즘을 활용하여 군집의 수행속도가 매우 빠르다.
      • SOM은 역전파 알고리즘을 사용하지 않고, 경쟁 학습을 통해 가중치를 조정합니다.
    • 한 번 경쟁층에 도달한 벡터는 iteration이 진행됨에 따라 가중치가 변경되므로 승자 노드가 변경될 수 있다.
      • 반복(iteration)이 진행되면서 가중치가 조정되어 승자 노드가 변경될 수 있습니다.
    • 초기 학습률 및 가중치 행렬, 경쟁층의 노드의 수 등 최적의 파라미터 수 결정이 어렵다.
      • SOM의 성능은 초기 학습률, 가중치 설정, 노드 수 등 여러 파라미터에 민감하며, 최적의 값을 찾기가 어렵습니다.
  • 오답 노트
    • 역전파 알고리즘: SOM은 비지도학습 기법으로 역전파를 사용하지 않으며, 대신 경쟁 학습을 통해 데이터를 군집화합니다.

06. 다음 중 로지스틱 회귀분석에 대한 설명으로 잘못된 것은?

  1. 분석을 통해 얻능 회귀계수가 한 단위 증가할 때 특정 집단에 속할 확률은 e의 회귀계수승만큼 증가한다.
  2. 로지스틱 회귀분석의 종속변수는 범주형이다.
  3. 독립변수가 여러 개 있는 경우에도 다중회귀와 같은 방법으로 종속변수(y)의 확률값을 구할 수 있다.
  4. 오즈란 실패확률을 성공확률로 나눈 값이다.

해설

  • 이유
    • 오즈(odds)는 성공 확률을 실패 확률로 나눈 값입니다. 즉, 이벤트가 발생할 확률을 발생하지 않을 확률로 나눈 것입니다
  • 각 항목 해설
    • 분석을 통해 얻는 회귀계수가 한 단위 증가할 때 특정 집단에 속할 확률은 e의 회귀계수승만큼 증가한다.
      • 이는 로지스틱 회귀에서 회귀계수가 오즈비(odds ratio)로 해석되는 방식입니다.
    • 로지스틱 회귀분석의 종속변수는 범주형이다.
      • 로지스틱 회귀는 이진 또는 다중 범주형 종속변수를 예측하는 데 사용됩니다
    • 독립변수가 여러 개 있는 경우에도 다중회귀와 같은 방법으로 종속변수(y)의 확률값을 구할 수 있다.
      • 로지스틱 회귀는 여러 독립변수를 사용하여 범주형 종속변수의 확률을 예측합니다
    • 오즈란 실패확률을 성공확률로 나눈 값이다.
      • 오즈는 성공 확률을 실패 확률로 나눈 값입니다

07. 다음 중 K-FOLD 교차검증에 대한 설명으로 잘못된 것은?

  1. 데이터셋을 K개의 집합으로 나눈 뒤 K-1개를 훈련용으로, 나머지 1개를 테스트용으로 모델을 검증하는 방법이다.
  2. K값이 전체 데이터의 크기 값인 경우네는 LOOCV라 한다.
  3. LOOCV는 불필요한 모델 훈련 및 검증 횟수를 줄인 것이므로 수행 속도가 매우 빠르다.
  4. 교차검증의 목적은 모델의 정확도를 향상시키고 과적합을 방지하기 위함이다.

해설

  • 이유
    • Leave-One-Out Cross-Validation (LOOCV)는 데이터셋의 각 데이터 포인트를 테스트 세트로 사용하고 나머지를 훈련 세트로 사용하는 방식입니다. 이 방법은 데이터 포인트 수만큼 모델을 훈련해야 하므로, 계산 비용이 높고 수행 속도가 느립니다.
  • 각 항목 해설
    • 데이터셋을 K개의 집합으로 나눈 뒤 K-1개를 훈련용으로, 나머지 1개를 테스트용으로 모델을 검증하는 방법이다.
      • K-Fold 교차검증의 기본적인 절차입니다.
    • K값이 전체 데이터의 크기 값인 경우에는 LOOCV라 한다.
      • LOOCV는 K-Fold에서 K가 데이터 개수와 같은 경우입니다.
    • LOOCV는 불필요한 모델 훈련 및 검증 횟수를 줄인 것이므로 수행 속도가 매우 빠르다.
      • LOOCV는 많은 횟수의 모델 훈련이 필요하므로 수행 속도가 느립니다.
    • 교차검증의 목적은 모델의 정확도를 향상시키고 과적합을 방지하기 위함이다.
      • 교차검증은 모델의 일반화 능력을 평가하고 과적합을 방지하는 데 사용됩니다.

08. 다음 중 분해 시계열 요소가 아닌 것은?

  1. 정상 요인
  2. 계절 요인
  3. 순환 요인
  4. 추세 요인

해설

  • 개념 개요
    • 시계열 분석에서는 데이터를 몇 가지 주요 요소로 분해하여 분석합니다. 일반적으로 사용되는 요소는 추세 요인, 순환 요인, 계절 요인, 그리고 불규칙 요인입니다.
  • 각 요소 해설
    • 추세 요인 (Trend factor): 장기적인 증가나 감소의 패턴을 나타냅니다.
    • 순환 요인 (Cycle factor): 일정한 주기를 가지고 반복되는 패턴을 나타냅니다.
    • 계절 요인 (Seasonal factor): 계절이나 특정 기간에 따라 반복되는 패턴을 나타냅니다.
    • 불규칙 요인 (Irregular factor): 예측할 수 없는 변동이나 잡음을 포함합니다.

09. 다음 중 Lasoo 회귀모형에 대한 설명으로 부적절한 것은?

  1. L2 penalty를 사용한다.
  2. 회귀계수의 절대값이 클수록 강한 penalty를 부여한다.
  3. 변수를 자동으로 선택하기에 편리하다.
  4. 람다 값으로 penalty 정도를 조정한다.

해설

  • 이유
    • Lasso 회귀는 L1 정규화(페널티)를 사용합니다. L1 정규화는 회귀 계수의 절대값의 합에 페널티를 부여하여 일부 계수를 0으로 만들어 변수 선택을 가능하게 합니다. 반면, L2 정규화는 Ridge 회귀에서 사용되며, 계수의 제곱합에 페널티를 부여하여 모든 계수를 작게 만드는 방식입니다.
  • 각 항목 해설
    • L2 penalty를 사용한다.
      • Lasso 회귀는 L1 penalty를 사용합니다.
    • 회귀계수의 절대값이 클수록 강한 penalty를 부여한다.
      • Lasso는 계수의 절대값에 페널티를 부여하여 모델을 단순화합니다.
    • 변수를 자동으로 선택하기에 편리하다.
      • Lasso 회귀는 불필요한 변수를 제거하여 모델을 단순화하는 기능이 있습니다.
    • 람다 값으로 penalty 정도를 조정한다.
      • 람다(λ) 값은 페널티의 강도를 조절하며, 값이 클수록 더 많은 계수가 0으로 수렴됩니다.

10. 다음 중 변수의 표준화와 함께 변수의 상관성까지 고려한 통계적 거리는?

  1. 체비셰프 거리
  2. 마할라노비스 거리
  3. 민코프스키 거리
  4. 표준화 거리

해설

  • 개념 개요
    • 마할라노비스 거리는 다변량 공간에서 두 점 사이의 거리를 측정하는 방법으로, 변수 간의 상관성을 고려하여 거리를 계산합니다. 이는 데이터가 중심점(평균)에서 얼마나 떨어져 있는지를 측정하며, 특히 이상치 탐지에 유용합니다.
  • 초등학생도 이해하기 쉬운 설명
    • 마할라노비스 거리는 마치 여러 방향으로 걸어갈 수 있는 길에서, 각 길이 서로 얼마나 관련이 있는지를 고려해서 가장 가까운 길을 찾는 것과 같아요. 이렇게 하면 길이 서로 겹치는 경우에도 정확하게 거리를 잴 수 있어요.
  • 각 항목 해설
    • 체비셰프 거리
      • 각 차원에서의 최대 차이를 사용하는 거리로, 상관성을 고려하지 않습니다.
    • 마할라노비스 거리
      • 변수의 표준화와 상관성을 모두 고려하여 거리를 측정합니다. 변수 간의 상관 관계를 반영하는 점에서 다른 거리와 차별됩니다.
    • 민코프스키 거리
      • 일반화된 거리 측정 방법으로, 특정한 형태로는 유클리드 거리나 맨해튼 거리가 될 수 있습니다. 상관성을 고려하지 않습니다.
    • 표준화 거리
      • 단순히 변수를 표준화하여 사용하는 거리로, 상관성을 직접적으로 고려하지 않습니다.
  • 오답 노트
    • 마할라노비스 거리는 변수 간의 상관성을 반영하여 다변량 데이터를 분석하는 데 적합한 방법입니다. 다른 옵션들은 변수 간의 상관성을 고려하지 않거나 단순히 표준화만을 수행합니다.

11. 다음 중 데이터마이닝 기법 중 그 특성이 나머지와 다른 것은?

  1. 자기 조직화 지도
  2. 혼합 분포 군집
  3. K-평균 군집
  4. 랜덤 포레스트

해설

  • 기법특성 및 설명 
    자기 조직화 지도 비지도 학습의 클러스터링 기법으로, 데이터의 패턴을 시각화하는 데 사용됩니다
    혼합 분포 군집 모형 기반의 클러스터링 기법으로, 확률 분포를 사용하여 데이터를 군집화합니다
    K-평균 군집 거리 기반의 비계층적 클러스터링 기법으로, 데이터를 K개의 군집으로 나눕니다
    랜덤 포레스트 앙상블 학습 기법으로, 여러 의사결정 트리를 결합하여 예측을 수행합니다
  • 랜덤 포레스트는 다른 세 가지 기법이 주로 데이터의 군집화를 목적으로 하는 반면, 분류와 회귀 문제를 해결하는 데 사용되는 앙상블 학습 기법입니다. 따라서 특성이 다릅니다.

12. 다음 중 표본조사에 대한 설명으로 부적절한 것은 무엇인가?

  1. 비표본오차는 조사 과정에서 발생할 수 있는 모든 부주의나 실수 등을 의미하며 표본의 크기에 상관없이 일정한 오차를 갖는다.
  2. 모표본오차는 모집단을 대표할 수 있는 표본들이 표본집단에 속하지 못함으로써 발생하는 오차를 의미한다.
  3. 표본편의는 모수를 작게 또는 크게 할 때 추정하는 것과 같이 표본추출방법에 의한 오차를 의미한다.
  4. 표본 표준편차는 모집단의 표준편차에 비례하며, 표본 크기의 제곱근에 반비례한다.

13. 다음 중 데이터의 정규성을 확인하기 위한 방법이 아닌 것은?

  1. 샤피로 검정
  2. QQ plot
  3. 히스토그램
  4. 카이제곱 검정

해설

  • 이유
    • 샤피로 검정: 데이터가 정규 분포를 따르는지를 검정하는 통계적 방법입니다. Shapiro-Wilk 검정은 특히 소규모 표본에 대해 강력한 성능을 보입니다
    • QQ plot: 데이터의 정규성을 시각적으로 평가하는 방법으로, 데이터의 분위수를 이론적인 정규 분포의 분위수와 비교하여 직선에 가까울수록 정규성을 띤다고 판단합니다
    • 히스토그램: 데이터의 분포를 시각적으로 확인할 수 있는 방법으로, 종 모양에 가까울수록 정규 분포를 따른다고 볼 수 있습니다
    • 카이제곱 검정: 주로 범주형 데이터의 적합도나 독립성을 검정하는 데 사용되며, 정규성 검정을 위한 방법으로는 일반적으로 사용되지 않습니다. 카이제곱 적합도 검정을 통해 정규성 검정을 수행할 수 있지만, 이는 주된 용도가 아닙니다

'[자격증] > ADsP 문제 풀이' 카테고리의 다른 글

[3과목 예상문제] ADsP 오답 풀이  (3) 2024.10.31
[3과목 기출문제] ADsP 오답 풀이  (0) 2024.10.31
[38회 기출 변형 문제]  (0) 2024.10.27
[37회 기출 변형 문제]  (0) 2024.10.25
[3회 모의고사]  (2) 2024.10.24