본문 바로가기
[자격증]/ADsP 문제 풀이

[3회 모의고사]

by 에디터 윤슬 2024. 10. 24.
 

[1과목]

01. 다음 중 빅데이터 활용 기본 테크닉과 그 사례가 가장 거리가 멀게 연결된 것은 무엇인가?

  1. 유형분석 - 기업의 경영상태, 채권 관련 재무 상태 등으로 기업의 파산(yes)/회생(no) 여부를 분류
  2. 회귀분석 - SNS 이요 시간 대비 온라인상에 흩어져 있는 개인정보 데이터 양의 관계
  3. 연관분석 - A를 시청한 고객이 B를 시청할 가능성을 파악하여 추천 여부를 결정
  4. 기계학습 - 고객의 쇼핑몰 장바구니를 분석하여 상품 간의 관계를 파악

해설

  1. 유형분석 - 분류
  2. 회귀분석 - 변수 간의 관계
  3. 연관분석 - 항목 간의 관계
  4. 기계학습 - 기계학습은 복잡한 패턴을 학습하고 예측하는 데 사용

02. 데이터베이스의 활용은 기업의 목적과 사회의 목적으로 나누어 볼 수 있다. 다음 중 나머지와 다른 특성의 데이터베이스는 무엇인가?

  1. EAI
  2. ITS
  3. NEIS
  4. GPS

해설

  • 개념 개요
    • 데이터베이스는 다양한 목적으로 활용됩니다. 기업의 내부 운영을 지원하거나, 사회적 목적을 위해 공공 데이터를 관리하는 데 사용됩니다. 각 데이터베이스는 특정한 기능과 목적에 맞게 설계되어 있습니다.
  • 초등학생도 이해할 수 있는 설명
    • 데이터베이스는 큰 노트북처럼 많은 정보를 저장하고 관리하는 시스템이에요. 어떤 데이터베이스는 회사에서 일할 때 도움을 주고, 어떤 것은 사람들이 더 편리하게 살 수 있도록 도와줘요.
  • 문제 항목에 대한 상세한 해설
    • 1. EAI (Enterprise Application Integration): 기업 내부의 다양한 애플리케이션을 통합하여 정보를 관리하는 시스템입니다. 주로 기업 내부의 효율성을 높이기 위한 목적으로 사용됩니다.
    • 2. ITS (Intelligent Transportation System): 교통 시스템을 개선하기 위한 지능형 교통 시스템입니다. 사회적 목적을 가지고 있으며, 교통 흐름을 개선하고 안전성을 높이는 데 사용됩니다.
    • 3. NEIS (National Education Information System): 교육 분야에서 사용되는 시스템으로, 교육 관련 정보를 통합 관리합니다. 사회적 목적을 가지고 있습니다.
    • 4. GPS (Global Positioning System): 위치 정보를 제공하는 시스템으로, 다양한 분야에서 활용됩니다. 사회적 목적과 관련이 있습니다.
  • 오답 노트
    • **EAI(1번)**은 주로 기업 내부의 효율성을 높이기 위한 목적으로 사용되며, 다른 항목들은 사회적 목적과 관련이 있습니다.
    • ITS, NEIS, GPS는 모두 사회적 목적을 가진 데이터베이스입니다.

[2과목]

01. 다음 중 분석 마스터플랜에 대한 설명으로 가장 부적절한 것은 무엇인가?

  1. 탐색한 문제에 대한 해결 방안들을 총체적인 관점에서 적용 우선순위를 설정하기 위함이다.
  2. 우선순위 결정을 위해서는 전략적 중요도, ROI 관점 등의 요소를 고려한다.
  3. 적용 범위 및 방식을 고려하기 위해 실행 용이성과 기술 적용 수준의 요소를 고려한다.
  4. 분석 마스터플랜은 분석 과제 도출, 우선순위 평가, 이행계획 수립 순서로 수행된다.

해설

  • 실행 용이성은 적용 범위 및 방식이 아닌 우선순위 고려 요소이다.

02. 다음 중 분석 기획 고려사항에 대한 설명으로 가장 관련이 적은 것은?

  1. 분석의 재료가 되는 사용 가능한 데이터의 존재 여부를 반드시 고려해야 한다.
  2. 기존 실패 사례 등 유스케이스를 확보하여 과거의 전례를 밟지 않도록 한다.
  3. 분석을 수행하는 데 있어 발생 가능한 장애요소에 대한 사전계획을 수립한다.
  4. 확보한 데이터들을 어떻게 분석할 수 있을지 분석 기법과 분석의 목적을 설정한다.

해설

  • 분석 기획 시 3가지 주요 고려사항으로는
    1. 가용 데이터의 존재 여부
    2. 유스케이스 탐색
    3. 장애요소에 대한 사전계획 수립
  • 오답 노트
    • 4번은 분석 기법과 목적 설정이 중요하지만, 이는 데이터 확보 후에 이루어지는 부분으로, 다른 항목들에 비해 초기 단계에서 직접적으로 고려해야 할 사항은 아닙니다.

03. 다음 중 분석 과제 발굴을 위한 하향식 접근법을 수행하기 위한 각 단계와 그 설명을 잘못 짝지은 것은 무엇인가?

  1. 문제 탐색: 분석 과제 발굴을 위해 무엇이 문제인지를 파악하고자 모델 기반 탐색과 외부 사례 기반 문제 탐색을 실시한다.
  2. 문제 정의: 탐색된 문제에 대하여 데이터 문제를 비즈니스 문제로 변환한다.
  3. 해결 방안 탐색: 정의된 문제에 대하여 해결 방안을 모색하는 단계다.
  4. 타당성 검토: 경제적 타당성과 데이터 및 기술적 타당성 평가를 통해 해결 방안을 결정한다.

해설

  • 개념 개요
    • 하향식 접근법은 분석 과제를 발굴하기 위해 문제를 상위 수준에서 정의하고, 이를 해결하기 위한 방안을 탐색하는 방법입니다. 이 방법은 문제를 체계적으로 분석하여 효과적인 해결책을 찾는 데 도움을 줍니다.
  • 초등학생도 이해할 수 있는 설명
    • 하향식 접근법은 큰 문제를 해결하기 위해 먼저 무엇이 문제인지 알아내고, 그 문제를 해결할 방법을 찾는 과정이에요. 마치 퍼즐을 맞추기 전에 그림을 먼저 보는 것과 비슷해요.
  • 문제 항목에 대한 상세한 해설
    • 1. 문제 탐색: 분석 과제 발굴을 위해 무엇이 문제인지를 파악하고, 모델 기반 탐색과 외부 사례 기반 문제 탐색을 실시합니다. 이는 적절한 설명입니다.
    • 2. 문제 정의: 탐색된 문제에 대해 데이터를 비즈니스 문제로 변환하는 것이 아니라, 비즈니스 문제를 데이터 문제로 변환해야 합니다. 따라서 이 설명은 부적절합니다.
    • 3. 해결 방안 탐색: 정의된 문제에 대해 해결 방안을 모색하는 단계입니다. 이는 적절한 설명입니다.
    • 4. 타당성 검토: 경제적 타당성과 데이터 및 기술적 타당성 평가를 통해 해결 방안을 결정하는 단계입니다. 이는 적절한 설명입니다.

[3과목]

01. 다음 중 시계열 분석에 대한 설명 중 잘못된 것은 무엇인가?

  1. 이동평균법, 지수평활법과 같은 방법들이 있다.
  2. 대부분의 시계열은 비정상 자료이며, 정상성을 만족하지 못하는 시계열 자료는 정상성 조건을 만족시킨 후 시계열 분석을 수행한다.
  3. ARIMA(1, 2, 3) 모형의 경우 1회의 차분이 요구된다.
  4. 평균이 일정하지 못한 경우에는 차분, 분산이 일정하지 못한 경우에는 변환을 통해 정상 시계열로 만들어준다.

해설

  • 개념 개요
    • 시계열 분석은 시간에 따라 변화하는 데이터를 분석하여 미래를 예측하는 방법입니다. 시계열 데이터는 종종 비정상적이기 때문에, 정상성을 확보하기 위해 차분이나 변환을 사용합니다. 주요 기법으로는 이동평균법, 지수평활법, ARIMA 모델 등이 있습니다.
  • 초등학생도 이해할 수 있는 설명
    • 시계열 분석은 날씨나 주식 가격처럼 시간이 지나면서 변하는 것들을 예측하는 방법이에요. 만약 데이터가 너무 불규칙하다면, 규칙적으로 보이도록 바꾼 다음에 분석해요.
  • 문제 항목에 대한 상세한 해설
    • 1. 이동평균법, 지수평활법과 같은 방법들이 있다: 시계열 분석에서 흔히 사용되는 방법들로, 적절한 설명입니다.
    • 2. 대부분의 시계열은 비정상 자료이며, 정상성을 만족하지 못하는 시계열 자료는 정상성 조건을 만족시킨 후 시계열 분석을 수행한다: 비정상 시계열을 정상 시계열로 변환한 후 분석하는 것은 일반적인 절차입니다.
    • 3. ARIMA(1, 2, 3) 모형의 경우 1회의 차분이 요구된다: ARIMA(p, d, q)에서 d는 차분 횟수를 나타냅니다. 따라서 ARIMA(1, 2, 3) 모형에서는 2회의 차분이 필요합니다. 이 설명은 잘못되었습니다.
    • 4. 평균이 일정하지 못한 경우에는 차분, 분산이 일정하지 못한 경우에는 변환을 통해 정상 시계열로 만들어준다: 이는 정상성을 확보하기 위한 일반적인 방법으로, 적절한 설명입니다.

02. 다음 중 R에서 apriori 알고리즘을 통한 연관분석을 수행한 뒤 연관 규칙에 대한 결과를 확인하기 위한 함수로 올바른 것은?

  1. inspect
  2. aov
  3. summary
  4. arule

해설

  • 개념 개요
    • Apriori 알고리즘은 연관 분석을 수행하는 데 사용되는 알고리즘으로, 데이터에서 자주 발생하는 항목 집합과 이들 간의 연관 규칙을 찾습니다. R에서는 `apriori()` 함수를 사용하여 연관 분석을 수행하며, 결과를 확인하기 위해 `inspect()` 함수를 사용합니다.
  • 초등학생도 이해할 수 있는 설명
    • Apriori 알고리즘은 사람들이 어떤 물건들을 함께 사는지를 알아보는 방법이에요. R이라는 프로그램에서는 이 방법을 사용해서 결과를 확인할 수 있어요. `inspect()`라는 특별한 도구를 사용하면, 어떤 물건들이 함께 팔리는지를 쉽게 볼 수 있어요.
  • 문제 항목에 대한 상세한 해설
    1. inspect: Apriori 알고리즘을 통해 생성된 연관 규칙의 결과를 확인하는 함수입니다. 적절한 선택입니다.
    2. aov: 분산분석(ANOVA)을 수행하는 함수로, 연관 분석과는 관련이 없습니다.
    3. summary: 객체의 요약 정보를 제공하는 함수로, 연관 규칙의 세부 내용을 직접적으로 보여주지는 않습니다.
    4. arule: 잘못된 함수명입니다. 올바른 함수는 `apriori`입니다.

03. 다음 중 다중공선성에 대한 설명으로 올바른 것은 무엇인가?

  1. 분산팽창요인(VIF) 값이 4보다 작으면 심각한 문제가 있다고 판단한다.
  2. 회귀분석에서 독립변수 사이에 상관성이 존재하여 회귀식 추정이 어려운 문제다.
  3. 카이제곱 검정을 수행하여 다중 공선성 존재 여부를 파악한다.
  4. 인공신경망의 역전파 과정에서 기울기가 점차적으로 작아져 가중치 조정이 이루어지지 않는 문제다.

해설

  • 개념 개요
    • 다중공선성은 회귀분석에서 독립변수들 간에 강한 상관관계가 있어 회귀계수의 추정이 불안정해지는 문제입니다. 다중공선성이 있으면 모델의 해석이 어려워질 수 있습니다.
  • 초등학생도 이해할 수 있는 설명
    • 다중공선성은 친구들이 서로 너무 비슷해서, 어떤 친구가 더 중요한지 알기 어려운 상황이에요. 그래서 어떤 친구가 정말로 중요한지 알기 힘들어져요.
  • 문제 항목에 대한 상세한 해설
    1. 분산팽창요인(VIF) 값이 4보다 작으면 심각한 문제가 있다고 판단한다: 일반적으로 VIF 값이 10을 넘으면 다중공선성이 심각하다고 판단합니다. 4보다 작으면 문제가 없다고 봅니다.
    2. 회귀분석에서 독립변수 사이에 상관성이 존재하여 회귀식 추정이 어려운 문제다: 이 설명이 다중공선성에 대한 올바른 설명입니다.
    3. 카이제곱 검정을 수행하여 다중 공선성 존재 여부를 파악한다: 카이제곱 검정은 범주형 데이터의 독립성을 테스트하는 방법으로, 다중공선성과 관련이 없습니다.
    4. 인공신경망의 역전파 과정에서 기울기가 점차적으로 작아져 가중치 조정이 이루어지지 않는 문제다: 이는 기울기 소실 문제로, 다중공선성과 관련이 없습니다.

04. 성공확률이 1/4인 베르누이 시행을 100번 시행하는 확률변수 X가 있다. X의 기댓값과 분산은 무엇인가?

 

05. 다음 중 여러 신경망 모형에 대해서 그 설명이 잘못된 것은 무엇인가?

  1. RNN: 순환 신경망으로 은닉층이 출력값이 자기 자신에게 다시 입력되는 형태로서 언어 모델링 및 음성 인식에 활용된다.
  2. CNN: 합성곱 신경망으로 합성곱 단계와 풀링 단계를 반복함으로써 데이터로부터 두드러지는 특징을 추출한다. 이미지 분류에 뛰어난 성능을 보인다.
  3. YOLO: 생산적 적대 신경망으로 기존에 구축된 분류 모형으로부터 최적으로 분류되기 위해 반복적으로 학습하는 과정이다. 대표적인 사례로는 페이스북의 딥 페이스가 있다.
  4. LSTM: 장단기 메모리로 RNN의 단점을 보완하기 위해 고안되었다. 오래된 데이터는 잊고, 최근 데이터를 더욱 잘 기억하는 특징이 있다.

해설

  • RNN (Recurrent Neural Network)
    • • 설명: RNN은 데이터를 순차적으로 처리하는 신경망입니다. 이전의 결과를 기억하고 다음 계산에 반영하므로, 시계열 데이터나 자연어 처리에 적합합니다.
  • CNN (Convolutional Neural Network)
    • • 설명: CNN은 이미지 데이터를 처리하는 데 특화된 신경망입니다. 합성곱과 풀링을 통해 이미지를 분석하고 특징을 추출하여 분류합니다.
  • YOLO (You Only Look Once)
    • • 설명: YOLO는 객체 탐지 알고리즘으로, 이미지를 한 번만 보고 객체의 위치와 종류를 실시간으로 탐지합니다. 빠르고 효율적인 탐지에 강점이 있습니다.
  • LSTM (Long Short-Term Memory)
    • • 설명: LSTM은 RNN의 개선된 버전으로, 장기 의존성을 처리하는 데 뛰어납니다. 오래된 정보와 새로운 정보를 효과적으로 관리하여 시계열 데이터 분석에 유리합니다.

06. 다음 중 아래에서 설명하는 것은 무엇인가?

데이터 마이닝의 여러 기법들 중 yes(1)/no(2)의 이진 분류를 목적으로 하는 경우 yes(1)에 속할 확률값을 반환하여 yes와 no를 분류한다. 모형의 성능에 중요한 영향을 미치며 일반적으로 0.5의 값을 사용하지만 yes로 분류하기 위한 최소확률 값을 나타낸다.
  1. p value
  2. cutoff value
  3. VIF
  4. confidence Level

해설

  • 개념 개요
    • Cutoff value는 이진 분류 문제에서 예측된 확률을 기준으로 데이터를 특정 클래스에 할당하는 경계값입니다. 일반적으로 0.5를 사용하지만, 문제에 따라 조정할 수 있습니다.
  • 초등학생도 이해할 수 있는 설명
    • Cutoff value는 친구들이 어떤 팀에 들어갈지를 정하는 기준이에요. 예를 들어, 50점 이상이면 A팀, 미만이면 B팀에 들어가는 것처럼요. 이 점수를 바꿔가면서 팀을 어떻게 나눌지 결정할 수 있어요.
  • 문제 항목에 대한 상세한 해설
    1. p value: 통계적 검정에서 귀무가설을 기각할지 여부를 결정하는 값입니다. Cutoff value와 관련이 없습니다.
    2. cutoff value: 이진 분류에서 확률값을 기준으로 데이터를 분류하는 경계값입니다. 올바른 설명입니다.
    3. VIF (Variance Inflation Factor): 회귀분석에서 다중공선성을 진단하는 지표로, Cutoff value와 관련이 없습니다.
    4. confidence Level: 신뢰 구간의 범위를 나타내는 값으로, Cutoff value와 관련이 없습니다.

07. 다음 중 분류 분석 모형의 성능을 평가하기 위한 그래프 중 하나로 랜덤모델과 비교하였을 때 일부 상위 데이터에서 모델의 성능이 얼마나 우수한지를 평가하기 위한 그래프는 무엇인가?

  1. ROC 그래프
  2. 향상도 곡선
  3. 제곱합 그래프
  4. 덴드로그램

해설

  • 개념 개요
    • 향상도 곡선(Lift Curve)는 분류 모델의 성능을 평가하기 위한 그래프 중 하나로, 랜덤 모델과 비교하여 상위 데이터에서 모델의 성능이 얼마나 우수한지를 평가합니다. 이는 모델이 특정 범위 내에서 얼마나 더 나은 예측을 하는지를 보여줍니다.
  • 초등학생도 이해할 수 있는 설명
    • 향상도 곡선은 친구들이 시험을 볼 때, 어떤 친구가 평균보다 더 잘했는지를 보는 그래프예요. 이 그래프를 보면 누가 더 잘했는지 쉽게 알 수 있어요.
  • 문제 항목에 대한 상세한 해설
    1. ROC 그래프: 민감도와 특이도를 시각화하여 이진 분류기의 성능을 평가하는 데 사용됩니다.
    2. 향상도 곡선: 랜덤 모델과 비교하여 모델의 성능을 평가하는 데 사용됩니다. 올바른 설명입니다.
    3. 제곱합 그래프: 주로 군집 분석에서 최적의 군집 수를 찾기 위해 사용됩니다.
    4. 덴드로그램: 계층적 군집 분석의 결과를 시각화하는 데 사용됩니다.

08. 다음 중 자기조직화지도(SOM)를 수행하기 위한 절차를 바르게 나열한 것은?

ㄱ. 위 과정을 반복하여 모든 데이터에 대한 승자노드를 표시한다.
ㄴ. 초기 학습률 및 가중치를 결정한다.
ㄷ. 입력 벡터와 가장 가까운 경쟁층에 승자노드를 나타내고 해당 가중치를 변경한다.
ㄹ. 학습률을 변경한다.
ㅁ. 특정 반복 수에 도달할 때까지 위 과정을 반복한다.

 

해설

  • 올바른 순서
    • 1. 초기 학습률 및 가중치를 결정한다: 초기 설정을 통해 학습을 시작합니다.
    • 2. 입력 벡터와 가장 가까운 경쟁층에 승자노드를 나타내고 해당 가중치를 변경한다: 입력 데이터와 가장 유사한 노드를 찾아 그 노드의 가중치를 조정합니다.
    • 3. 위 과정을 반복하여 모든 데이터에 대한 승자노드를 표시한다: 각 데이터에 대해 승자노드를 찾고 가중치를 조정하는 과정을 반복합니다.
    • 4. 학습률을 변경한다: 학습이 진행됨에 따라 학습률을 조정합니다.
    • 5. 특정 반복 수에 도달할 때까지 위 과정을 반복한다: 설정된 반복 횟수에 도달할 때까지 학습을 계속합니다.

09. 다음 중 아래 주성분분석에 대한 설명으로 부적절한 것은 무엇인가?

  1. 서로 상관성이 높은 변수들의 선형 결합으로 새로운 주성분을 만들어 변수를 요약 및 축소하는 기법이다.
  2. 회귀분석에서 다중공선성이 우려되는 경우 주성분분석 수행 이후 각 주성분을 독립변수로 회귀분석을 수행하기도 한다.
  3. 주성분분석은 변수의 요약 및 축소 기법으로 변수들이 한 곳에 잘 집중될 수 있도록 분산이 가장 작은 축을 찾아 첫 번째 주성분으로 선정한다.
  4. 주성분의 개수를 선택하기 위해 누적 설명률과 함께 scree plot을 활용한다.

해설

  • 개념 개요
    • 주성분분석(PCA)는 데이터의 차원을 줄이기 위해 사용되는 기법으로, 서로 상관성이 높은 변수들을 선형 결합하여 새로운 주성분을 만듭니다. 이를 통해 데이터의 변동성을 최대한 유지하면서 변수를 요약하고 축소할 수 있습니다.
  • 초등학생도 이해하기 쉬운 설명
    • 주성분분석은 많은 정보를 가진 큰 그림을 작은 그림으로 바꾸는 방법이에요. 중요한 부분만 남기고 덜 중요한 부분은 줄여서 더 쉽게 이해할 수 있게 해줘요.
  • 문제 항목에 대한 해석
    1. 서로 상관성이 높은 변수들의 선형 결합으로 새로운 주성분을 만들어 변수를 요약 및 축소하는 기법이다: 적절한 설명입니다.
    2. 회귀분석에서 다중공선성이 우려되는 경우 주성분분석 수행 이후 각 주성분을 독립변수로 회귀분석을 수행하기도 한다: 다중공선성을 해결하기 위한 방법으로 적절합니다.
    3. 주성분분석은 변수의 요약 및 축소 기법으로 변수들이 한 곳에 잘 집중될 수 있도록 분산이 가장 작은 축을 찾아 첫 번째 주성분으로 선정한다: 부적절한 설명입니다. 주성분은 분산이 가장 큰 축을 선택하여 최대한의 변동성을 설명합니다.
    4. 주성분의 개수를 선택하기 위해 누적 설명률과 함께 scree plot을 활용한다: 적절한 설명입니다.

10. 분류 모형의 성과를 평가하기 위해 ROC 커브를 주로 사용한다. ROC 커브 중 가장 좋은 모형이라 할 수 있는 것은?

 

해설

  • 개념 개요
    • ROC 커브(Receiver Operating Characteristic Curve)는 분류 모델의 성능을 평가하는 그래프입니다. 이 그래프는 민감도(Sensitivity)와 1-특이도(1-Specificity)를 축으로 사용하여 모델의 다양한 임계값에서의 성능을 시각화합니다.
  • 초등학생도 이해하기 쉬운 설명
    • ROC 커브는 친구들이 시험에서 얼마나 잘했는지를 보여주는 그림이에요. 이 그림에서 점이 왼쪽 위에 가까울수록 친구들이 시험을 정말 잘 본 거예요.
  • ROC 커브의 좋은 모형
    • • 가장 좋은 모형: ROC 커브에서 가장 좋은 모형은 그래프가 왼쪽 위 모서리에 가까운 형태입니다. 이는 민감도와 특이도가 모두 높은 경우를 나타냅니다.
    • • 이유: 왼쪽 위에 가까울수록 모델이 양성과 음성을 잘 구분한다는 의미입니다. 즉, 참인 것을 참으로, 거짓인 것을 거짓으로 잘 예측하는 경우입니다.
  • 문제 항목에 대한 해석
    • ROC 커브는 모델의 성능을 다양한 임계값에서 평가할 수 있게 해주며, 곡선 아래 면적(AUC)이 클수록 모델의 성능이 좋습니다.
  • 오답 노트
    • ROC 커브는 민감도와 1-특이도를 시각화하여 모델의 성능을 전반적으로 평가하는 데 유용합니다.
    • 가장 좋은 ROC 커브는 왼쪽 위 코너에 가까운 형태로 나타납니다. 이는 높은 민감도와 특이도를 의미합니다.

 

11. plyr 패키지가 보유한 여러 함수에 대해 설명하시오.

  1. apply
  2. sapply
  3. dlply
  4. ddply

해설

  • 개념 개요
    • plyr는 R에서 데이터 분석을 쉽게 하기 위해 설계된 패키지로, 데이터를 나누고(`split`), 함수 적용(`apply`), 결과를 합치는(`combine`) 작업을 간단하게 수행할 수 있게 도와줍니다.
  • 초등학생도 이해하기 쉬운 설명
    • `plyr`은 큰 퍼즐을 작은 조각으로 나누고, 각 조각에 색칠한 후 다시 합치는 것과 같아요. 이렇게 하면 전체 그림을 더 쉽게 완성할 수 있어요.
  • 주요 함수 설명
    1. apply: 배열이나 행렬에 함수를 적용하는 기본 R 함수입니다. `plyr` 패키지의 함수는 아닙니다.
    2. sapply: 리스트나 벡터에 함수를 적용하여 결과를 벡터로 반환하는 기본 R 함수입니다. `plyr` 패키지의 함수는 아닙니다.
    3. dlply: 데이터 프레임을 리스트로 나누고, 각 리스트 요소에 함수를 적용한 후 결과를 리스트로 반환합니다.
    4. ddply: 데이터 프레임을 그룹별로 나누고, 각 그룹에 함수를 적용하여 결과를 데이터 프레임으로 반환합니다.

12. 다음 중 보기에서 설명하는 것은 무엇인가?

인간의 뇌를 기반으로 제작된 인공신경망의 작은 한 단위이며, 이 단위 하나가 인공신경망이 될 수 있다. 또한 두 개 이상의 결합으로 더욱 복잡한 구조를 표현하는 인공신경망이 될 수도 있다. 뉴런과 같은 역할을 담당하며 여러 개의 입력 신호를 받아 가중치와의 조합을 통해 하나의 출력을 내보낸다.
  1. 노드
  2. 퍼셉트론
  3. 벡터
  4. 붓스트랩

해설

  • 개념 개요
    • 주어진 설명은 **퍼셉트론(Perceptron)**에 대한 것입니다. 퍼셉트론은 인공신경망의 기본 단위로, 뉴런과 유사한 역할을 하며 여러 입력 신호를 받아 가중치와 결합하여 출력을 생성합니다.
  • 초등학생도 이해하기 쉬운 설명
    • 퍼셉트론은 뇌 속의 작은 뉴런처럼 작동하는 컴퓨터 프로그램이에요. 여러 정보를 받아서 계산하고, 결과를 내보내는 역할을 해요.
  • 문제 항목에 대한 해석
    1. 노드: 일반적인 용어로, 신경망에서 퍼셉트론이나 뉴런을 포함할 수 있지만, 주어진 설명에 정확히 맞지는 않습니다.
    2. 퍼셉트론: 인공신경망의 기본 단위로, 주어진 설명에 정확히 부합합니다.
    3. 벡터: 수학적 개념으로, 방향과 크기를 가진 양입니다. 신경망의 단위와는 다릅니다.
    4. 붓스트랩: 통계적 방법으로, 데이터 샘플링 기법입니다. 신경망과 관련이 없습니다.

13. 다음 중 시계열분석에 대한 설명으로 올바른 것은 무엇인가?

  1. 일정 시간 간격으로 기록된 자료에 대한 특성을 파악하고 과거를 추론하는 데 활용하는 방법이다.
  2. 평균이 일정하지 않은 비정상 시계열의 경우 변환을 통해 정상 시계열로 변환할 수 있다.
  3. 자기회귀는 과거 n번째 이전 시점이 현재 시점을 설명할 수 있음을 의미한다.
  4. 지수평활법은 최근 자료가 과거 자료보다 예측에 효과적이라는 가정하에 최근 데이터에 더 큰 가중치를 부여하는 방법이다.

해설

  • 시계열 분석은 미래 예측이 주 목적이고, 평균이 일정하지 않은 경우 차분을 통해 정상 시계열로 변환하며, 자기회귀모형은 현재 시점은 바로 직전의 몇 개의 데이터에 의해 설명될 수 있음을 의미

'[자격증] > ADsP 문제 풀이' 카테고리의 다른 글

[38회 기출 변형 문제]  (0) 2024.10.27
[37회 기출 변형 문제]  (0) 2024.10.25
[2회 모의고사]  (0) 2024.10.23
[1회 모의고사]  (1) 2024.10.22
[2과목] 기출유형 문제 및 예상 문제  (0) 2024.10.17