[1과목]
01. 다음 중 빅데이터 활용 기본 테크닉과 그 사례가 가장 거리가 멀게 연결된 것은 무엇인가?
- 유형분석 - 기업의 경영상태, 채권 관련 재무 상태 등으로 기업의 파산(yes)/회생(no) 여부를 분류
- 회귀분석 - SNS 이요 시간 대비 온라인상에 흩어져 있는 개인정보 데이터 양의 관계
- 연관분석 - A를 시청한 고객이 B를 시청할 가능성을 파악하여 추천 여부를 결정
- 기계학습 - 고객의 쇼핑몰 장바구니를 분석하여 상품 간의 관계를 파악
해설
- 유형분석 - 분류
- 회귀분석 - 변수 간의 관계
- 연관분석 - 항목 간의 관계
- 기계학습 - 기계학습은 복잡한 패턴을 학습하고 예측하는 데 사용
02. 데이터베이스의 활용은 기업의 목적과 사회의 목적으로 나누어 볼 수 있다. 다음 중 나머지와 다른 특성의 데이터베이스는 무엇인가?
- EAI
- ITS
- NEIS
- GPS
해설
- 개념 개요
- 데이터베이스는 다양한 목적으로 활용됩니다. 기업의 내부 운영을 지원하거나, 사회적 목적을 위해 공공 데이터를 관리하는 데 사용됩니다. 각 데이터베이스는 특정한 기능과 목적에 맞게 설계되어 있습니다.
- 초등학생도 이해할 수 있는 설명
- 데이터베이스는 큰 노트북처럼 많은 정보를 저장하고 관리하는 시스템이에요. 어떤 데이터베이스는 회사에서 일할 때 도움을 주고, 어떤 것은 사람들이 더 편리하게 살 수 있도록 도와줘요.
- 문제 항목에 대한 상세한 해설
- 1. EAI (Enterprise Application Integration): 기업 내부의 다양한 애플리케이션을 통합하여 정보를 관리하는 시스템입니다. 주로 기업 내부의 효율성을 높이기 위한 목적으로 사용됩니다.
- 2. ITS (Intelligent Transportation System): 교통 시스템을 개선하기 위한 지능형 교통 시스템입니다. 사회적 목적을 가지고 있으며, 교통 흐름을 개선하고 안전성을 높이는 데 사용됩니다.
- 3. NEIS (National Education Information System): 교육 분야에서 사용되는 시스템으로, 교육 관련 정보를 통합 관리합니다. 사회적 목적을 가지고 있습니다.
- 4. GPS (Global Positioning System): 위치 정보를 제공하는 시스템으로, 다양한 분야에서 활용됩니다. 사회적 목적과 관련이 있습니다.
- 오답 노트
• **EAI(1번)**은 주로 기업 내부의 효율성을 높이기 위한 목적으로 사용되며, 다른 항목들은 사회적 목적과 관련이 있습니다.
• ITS, NEIS, GPS는 모두 사회적 목적을 가진 데이터베이스입니다.
[2과목]
01. 다음 중 분석 마스터플랜에 대한 설명으로 가장 부적절한 것은 무엇인가?
- 탐색한 문제에 대한 해결 방안들을 총체적인 관점에서 적용 우선순위를 설정하기 위함이다.
- 우선순위 결정을 위해서는 전략적 중요도, ROI 관점 등의 요소를 고려한다.
- 적용 범위 및 방식을 고려하기 위해 실행 용이성과 기술 적용 수준의 요소를 고려한다.
- 분석 마스터플랜은 분석 과제 도출, 우선순위 평가, 이행계획 수립 순서로 수행된다.
해설
- 실행 용이성은 적용 범위 및 방식이 아닌 우선순위 고려 요소이다.
02. 다음 중 분석 기획 고려사항에 대한 설명으로 가장 관련이 적은 것은?
- 분석의 재료가 되는 사용 가능한 데이터의 존재 여부를 반드시 고려해야 한다.
- 기존 실패 사례 등 유스케이스를 확보하여 과거의 전례를 밟지 않도록 한다.
- 분석을 수행하는 데 있어 발생 가능한 장애요소에 대한 사전계획을 수립한다.
- 확보한 데이터들을 어떻게 분석할 수 있을지 분석 기법과 분석의 목적을 설정한다.
해설
- 분석 기획 시 3가지 주요 고려사항으로는
- 가용 데이터의 존재 여부
- 유스케이스 탐색
- 장애요소에 대한 사전계획 수립
- 오답 노트
• 4번은 분석 기법과 목적 설정이 중요하지만, 이는 데이터 확보 후에 이루어지는 부분으로, 다른 항목들에 비해 초기 단계에서 직접적으로 고려해야 할 사항은 아닙니다.
03. 다음 중 분석 과제 발굴을 위한 하향식 접근법을 수행하기 위한 각 단계와 그 설명을 잘못 짝지은 것은 무엇인가?
- 문제 탐색: 분석 과제 발굴을 위해 무엇이 문제인지를 파악하고자 모델 기반 탐색과 외부 사례 기반 문제 탐색을 실시한다.
- 문제 정의: 탐색된 문제에 대하여 데이터 문제를 비즈니스 문제로 변환한다.
- 해결 방안 탐색: 정의된 문제에 대하여 해결 방안을 모색하는 단계다.
- 타당성 검토: 경제적 타당성과 데이터 및 기술적 타당성 평가를 통해 해결 방안을 결정한다.
해설
- 개념 개요
- 하향식 접근법은 분석 과제를 발굴하기 위해 문제를 상위 수준에서 정의하고, 이를 해결하기 위한 방안을 탐색하는 방법입니다. 이 방법은 문제를 체계적으로 분석하여 효과적인 해결책을 찾는 데 도움을 줍니다.
- 초등학생도 이해할 수 있는 설명
- 하향식 접근법은 큰 문제를 해결하기 위해 먼저 무엇이 문제인지 알아내고, 그 문제를 해결할 방법을 찾는 과정이에요. 마치 퍼즐을 맞추기 전에 그림을 먼저 보는 것과 비슷해요.
- 문제 항목에 대한 상세한 해설
- 1. 문제 탐색: 분석 과제 발굴을 위해 무엇이 문제인지를 파악하고, 모델 기반 탐색과 외부 사례 기반 문제 탐색을 실시합니다. 이는 적절한 설명입니다.
- 2. 문제 정의: 탐색된 문제에 대해 데이터를 비즈니스 문제로 변환하는 것이 아니라, 비즈니스 문제를 데이터 문제로 변환해야 합니다. 따라서 이 설명은 부적절합니다.
- 3. 해결 방안 탐색: 정의된 문제에 대해 해결 방안을 모색하는 단계입니다. 이는 적절한 설명입니다.
- 4. 타당성 검토: 경제적 타당성과 데이터 및 기술적 타당성 평가를 통해 해결 방안을 결정하는 단계입니다. 이는 적절한 설명입니다.
[3과목]
01. 다음 중 시계열 분석에 대한 설명 중 잘못된 것은 무엇인가?
- 이동평균법, 지수평활법과 같은 방법들이 있다.
- 대부분의 시계열은 비정상 자료이며, 정상성을 만족하지 못하는 시계열 자료는 정상성 조건을 만족시킨 후 시계열 분석을 수행한다.
- ARIMA(1, 2, 3) 모형의 경우 1회의 차분이 요구된다.
- 평균이 일정하지 못한 경우에는 차분, 분산이 일정하지 못한 경우에는 변환을 통해 정상 시계열로 만들어준다.
해설
- 개념 개요
- 시계열 분석은 시간에 따라 변화하는 데이터를 분석하여 미래를 예측하는 방법입니다. 시계열 데이터는 종종 비정상적이기 때문에, 정상성을 확보하기 위해 차분이나 변환을 사용합니다. 주요 기법으로는 이동평균법, 지수평활법, ARIMA 모델 등이 있습니다.
- 초등학생도 이해할 수 있는 설명
- 시계열 분석은 날씨나 주식 가격처럼 시간이 지나면서 변하는 것들을 예측하는 방법이에요. 만약 데이터가 너무 불규칙하다면, 규칙적으로 보이도록 바꾼 다음에 분석해요.
- 문제 항목에 대한 상세한 해설
- 1. 이동평균법, 지수평활법과 같은 방법들이 있다: 시계열 분석에서 흔히 사용되는 방법들로, 적절한 설명입니다.
- 2. 대부분의 시계열은 비정상 자료이며, 정상성을 만족하지 못하는 시계열 자료는 정상성 조건을 만족시킨 후 시계열 분석을 수행한다: 비정상 시계열을 정상 시계열로 변환한 후 분석하는 것은 일반적인 절차입니다.
- 3. ARIMA(1, 2, 3) 모형의 경우 1회의 차분이 요구된다: ARIMA(p, d, q)에서 d는 차분 횟수를 나타냅니다. 따라서 ARIMA(1, 2, 3) 모형에서는 2회의 차분이 필요합니다. 이 설명은 잘못되었습니다.
- 4. 평균이 일정하지 못한 경우에는 차분, 분산이 일정하지 못한 경우에는 변환을 통해 정상 시계열로 만들어준다: 이는 정상성을 확보하기 위한 일반적인 방법으로, 적절한 설명입니다.
02. 다음 중 R에서 apriori 알고리즘을 통한 연관분석을 수행한 뒤 연관 규칙에 대한 결과를 확인하기 위한 함수로 올바른 것은?
- inspect
- aov
- summary
- arule
해설
- 개념 개요
- Apriori 알고리즘은 연관 분석을 수행하는 데 사용되는 알고리즘으로, 데이터에서 자주 발생하는 항목 집합과 이들 간의 연관 규칙을 찾습니다. R에서는 `apriori()` 함수를 사용하여 연관 분석을 수행하며, 결과를 확인하기 위해 `inspect()` 함수를 사용합니다.
- 초등학생도 이해할 수 있는 설명
- Apriori 알고리즘은 사람들이 어떤 물건들을 함께 사는지를 알아보는 방법이에요. R이라는 프로그램에서는 이 방법을 사용해서 결과를 확인할 수 있어요. `inspect()`라는 특별한 도구를 사용하면, 어떤 물건들이 함께 팔리는지를 쉽게 볼 수 있어요.
- 문제 항목에 대한 상세한 해설
1. inspect: Apriori 알고리즘을 통해 생성된 연관 규칙의 결과를 확인하는 함수입니다. 적절한 선택입니다.
2. aov: 분산분석(ANOVA)을 수행하는 함수로, 연관 분석과는 관련이 없습니다.
3. summary: 객체의 요약 정보를 제공하는 함수로, 연관 규칙의 세부 내용을 직접적으로 보여주지는 않습니다.
4. arule: 잘못된 함수명입니다. 올바른 함수는 `apriori`입니다.
03. 다음 중 다중공선성에 대한 설명으로 올바른 것은 무엇인가?
- 분산팽창요인(VIF) 값이 4보다 작으면 심각한 문제가 있다고 판단한다.
- 회귀분석에서 독립변수 사이에 상관성이 존재하여 회귀식 추정이 어려운 문제다.
- 카이제곱 검정을 수행하여 다중 공선성 존재 여부를 파악한다.
- 인공신경망의 역전파 과정에서 기울기가 점차적으로 작아져 가중치 조정이 이루어지지 않는 문제다.
해설
- 개념 개요
- 다중공선성은 회귀분석에서 독립변수들 간에 강한 상관관계가 있어 회귀계수의 추정이 불안정해지는 문제입니다. 다중공선성이 있으면 모델의 해석이 어려워질 수 있습니다.
- 초등학생도 이해할 수 있는 설명
- 다중공선성은 친구들이 서로 너무 비슷해서, 어떤 친구가 더 중요한지 알기 어려운 상황이에요. 그래서 어떤 친구가 정말로 중요한지 알기 힘들어져요.
- 문제 항목에 대한 상세한 해설
1. 분산팽창요인(VIF) 값이 4보다 작으면 심각한 문제가 있다고 판단한다: 일반적으로 VIF 값이 10을 넘으면 다중공선성이 심각하다고 판단합니다. 4보다 작으면 문제가 없다고 봅니다.
2. 회귀분석에서 독립변수 사이에 상관성이 존재하여 회귀식 추정이 어려운 문제다: 이 설명이 다중공선성에 대한 올바른 설명입니다.
3. 카이제곱 검정을 수행하여 다중 공선성 존재 여부를 파악한다: 카이제곱 검정은 범주형 데이터의 독립성을 테스트하는 방법으로, 다중공선성과 관련이 없습니다.
4. 인공신경망의 역전파 과정에서 기울기가 점차적으로 작아져 가중치 조정이 이루어지지 않는 문제다: 이는 기울기 소실 문제로, 다중공선성과 관련이 없습니다.
04. 성공확률이 1/4인 베르누이 시행을 100번 시행하는 확률변수 X가 있다. X의 기댓값과 분산은 무엇인가?
05. 다음 중 여러 신경망 모형에 대해서 그 설명이 잘못된 것은 무엇인가?
- RNN: 순환 신경망으로 은닉층이 출력값이 자기 자신에게 다시 입력되는 형태로서 언어 모델링 및 음성 인식에 활용된다.
- CNN: 합성곱 신경망으로 합성곱 단계와 풀링 단계를 반복함으로써 데이터로부터 두드러지는 특징을 추출한다. 이미지 분류에 뛰어난 성능을 보인다.
- YOLO: 생산적 적대 신경망으로 기존에 구축된 분류 모형으로부터 최적으로 분류되기 위해 반복적으로 학습하는 과정이다. 대표적인 사례로는 페이스북의 딥 페이스가 있다.
- LSTM: 장단기 메모리로 RNN의 단점을 보완하기 위해 고안되었다. 오래된 데이터는 잊고, 최근 데이터를 더욱 잘 기억하는 특징이 있다.
해설
- RNN (Recurrent Neural Network)
- • 설명: RNN은 데이터를 순차적으로 처리하는 신경망입니다. 이전의 결과를 기억하고 다음 계산에 반영하므로, 시계열 데이터나 자연어 처리에 적합합니다.
- CNN (Convolutional Neural Network)
- • 설명: CNN은 이미지 데이터를 처리하는 데 특화된 신경망입니다. 합성곱과 풀링을 통해 이미지를 분석하고 특징을 추출하여 분류합니다.
- YOLO (You Only Look Once)
- • 설명: YOLO는 객체 탐지 알고리즘으로, 이미지를 한 번만 보고 객체의 위치와 종류를 실시간으로 탐지합니다. 빠르고 효율적인 탐지에 강점이 있습니다.
- LSTM (Long Short-Term Memory)
- • 설명: LSTM은 RNN의 개선된 버전으로, 장기 의존성을 처리하는 데 뛰어납니다. 오래된 정보와 새로운 정보를 효과적으로 관리하여 시계열 데이터 분석에 유리합니다.
06. 다음 중 아래에서 설명하는 것은 무엇인가?
데이터 마이닝의 여러 기법들 중 yes(1)/no(2)의 이진 분류를 목적으로 하는 경우 yes(1)에 속할 확률값을 반환하여 yes와 no를 분류한다. 모형의 성능에 중요한 영향을 미치며 일반적으로 0.5의 값을 사용하지만 yes로 분류하기 위한 최소확률 값을 나타낸다.
- p value
- cutoff value
- VIF
- confidence Level
해설
- 개념 개요
- Cutoff value는 이진 분류 문제에서 예측된 확률을 기준으로 데이터를 특정 클래스에 할당하는 경계값입니다. 일반적으로 0.5를 사용하지만, 문제에 따라 조정할 수 있습니다.
- 초등학생도 이해할 수 있는 설명
- Cutoff value는 친구들이 어떤 팀에 들어갈지를 정하는 기준이에요. 예를 들어, 50점 이상이면 A팀, 미만이면 B팀에 들어가는 것처럼요. 이 점수를 바꿔가면서 팀을 어떻게 나눌지 결정할 수 있어요.
- 문제 항목에 대한 상세한 해설
1. p value: 통계적 검정에서 귀무가설을 기각할지 여부를 결정하는 값입니다. Cutoff value와 관련이 없습니다.
2. cutoff value: 이진 분류에서 확률값을 기준으로 데이터를 분류하는 경계값입니다. 올바른 설명입니다.
3. VIF (Variance Inflation Factor): 회귀분석에서 다중공선성을 진단하는 지표로, Cutoff value와 관련이 없습니다.
4. confidence Level: 신뢰 구간의 범위를 나타내는 값으로, Cutoff value와 관련이 없습니다.
07. 다음 중 분류 분석 모형의 성능을 평가하기 위한 그래프 중 하나로 랜덤모델과 비교하였을 때 일부 상위 데이터에서 모델의 성능이 얼마나 우수한지를 평가하기 위한 그래프는 무엇인가?
- ROC 그래프
- 향상도 곡선
- 제곱합 그래프
- 덴드로그램
해설
- 개념 개요
- 향상도 곡선(Lift Curve)는 분류 모델의 성능을 평가하기 위한 그래프 중 하나로, 랜덤 모델과 비교하여 상위 데이터에서 모델의 성능이 얼마나 우수한지를 평가합니다. 이는 모델이 특정 범위 내에서 얼마나 더 나은 예측을 하는지를 보여줍니다.
- 초등학생도 이해할 수 있는 설명
- 향상도 곡선은 친구들이 시험을 볼 때, 어떤 친구가 평균보다 더 잘했는지를 보는 그래프예요. 이 그래프를 보면 누가 더 잘했는지 쉽게 알 수 있어요.
- 문제 항목에 대한 상세한 해설
1. ROC 그래프: 민감도와 특이도를 시각화하여 이진 분류기의 성능을 평가하는 데 사용됩니다.
2. 향상도 곡선: 랜덤 모델과 비교하여 모델의 성능을 평가하는 데 사용됩니다. 올바른 설명입니다.
3. 제곱합 그래프: 주로 군집 분석에서 최적의 군집 수를 찾기 위해 사용됩니다.
4. 덴드로그램: 계층적 군집 분석의 결과를 시각화하는 데 사용됩니다.
08. 다음 중 자기조직화지도(SOM)를 수행하기 위한 절차를 바르게 나열한 것은?
ㄱ. 위 과정을 반복하여 모든 데이터에 대한 승자노드를 표시한다.
ㄴ. 초기 학습률 및 가중치를 결정한다.
ㄷ. 입력 벡터와 가장 가까운 경쟁층에 승자노드를 나타내고 해당 가중치를 변경한다.
ㄹ. 학습률을 변경한다.
ㅁ. 특정 반복 수에 도달할 때까지 위 과정을 반복한다.
해설
- 올바른 순서
- 1. 초기 학습률 및 가중치를 결정한다: 초기 설정을 통해 학습을 시작합니다.
- 2. 입력 벡터와 가장 가까운 경쟁층에 승자노드를 나타내고 해당 가중치를 변경한다: 입력 데이터와 가장 유사한 노드를 찾아 그 노드의 가중치를 조정합니다.
- 3. 위 과정을 반복하여 모든 데이터에 대한 승자노드를 표시한다: 각 데이터에 대해 승자노드를 찾고 가중치를 조정하는 과정을 반복합니다.
- 4. 학습률을 변경한다: 학습이 진행됨에 따라 학습률을 조정합니다.
- 5. 특정 반복 수에 도달할 때까지 위 과정을 반복한다: 설정된 반복 횟수에 도달할 때까지 학습을 계속합니다.
09. 다음 중 아래 주성분분석에 대한 설명으로 부적절한 것은 무엇인가?
- 서로 상관성이 높은 변수들의 선형 결합으로 새로운 주성분을 만들어 변수를 요약 및 축소하는 기법이다.
- 회귀분석에서 다중공선성이 우려되는 경우 주성분분석 수행 이후 각 주성분을 독립변수로 회귀분석을 수행하기도 한다.
- 주성분분석은 변수의 요약 및 축소 기법으로 변수들이 한 곳에 잘 집중될 수 있도록 분산이 가장 작은 축을 찾아 첫 번째 주성분으로 선정한다.
- 주성분의 개수를 선택하기 위해 누적 설명률과 함께 scree plot을 활용한다.
해설
- 개념 개요
- 주성분분석(PCA)는 데이터의 차원을 줄이기 위해 사용되는 기법으로, 서로 상관성이 높은 변수들을 선형 결합하여 새로운 주성분을 만듭니다. 이를 통해 데이터의 변동성을 최대한 유지하면서 변수를 요약하고 축소할 수 있습니다.
- 초등학생도 이해하기 쉬운 설명
- 주성분분석은 많은 정보를 가진 큰 그림을 작은 그림으로 바꾸는 방법이에요. 중요한 부분만 남기고 덜 중요한 부분은 줄여서 더 쉽게 이해할 수 있게 해줘요.
- 문제 항목에 대한 해석
1. 서로 상관성이 높은 변수들의 선형 결합으로 새로운 주성분을 만들어 변수를 요약 및 축소하는 기법이다: 적절한 설명입니다.
2. 회귀분석에서 다중공선성이 우려되는 경우 주성분분석 수행 이후 각 주성분을 독립변수로 회귀분석을 수행하기도 한다: 다중공선성을 해결하기 위한 방법으로 적절합니다.
3. 주성분분석은 변수의 요약 및 축소 기법으로 변수들이 한 곳에 잘 집중될 수 있도록 분산이 가장 작은 축을 찾아 첫 번째 주성분으로 선정한다: 부적절한 설명입니다. 주성분은 분산이 가장 큰 축을 선택하여 최대한의 변동성을 설명합니다.
4. 주성분의 개수를 선택하기 위해 누적 설명률과 함께 scree plot을 활용한다: 적절한 설명입니다.
10. 분류 모형의 성과를 평가하기 위해 ROC 커브를 주로 사용한다. ROC 커브 중 가장 좋은 모형이라 할 수 있는 것은?
해설
- 개념 개요
- ROC 커브(Receiver Operating Characteristic Curve)는 분류 모델의 성능을 평가하는 그래프입니다. 이 그래프는 민감도(Sensitivity)와 1-특이도(1-Specificity)를 축으로 사용하여 모델의 다양한 임계값에서의 성능을 시각화합니다.
- 초등학생도 이해하기 쉬운 설명
- ROC 커브는 친구들이 시험에서 얼마나 잘했는지를 보여주는 그림이에요. 이 그림에서 점이 왼쪽 위에 가까울수록 친구들이 시험을 정말 잘 본 거예요.
- ROC 커브의 좋은 모형
- • 가장 좋은 모형: ROC 커브에서 가장 좋은 모형은 그래프가 왼쪽 위 모서리에 가까운 형태입니다. 이는 민감도와 특이도가 모두 높은 경우를 나타냅니다.
- • 이유: 왼쪽 위에 가까울수록 모델이 양성과 음성을 잘 구분한다는 의미입니다. 즉, 참인 것을 참으로, 거짓인 것을 거짓으로 잘 예측하는 경우입니다.
- 문제 항목에 대한 해석
- ROC 커브는 모델의 성능을 다양한 임계값에서 평가할 수 있게 해주며, 곡선 아래 면적(AUC)이 클수록 모델의 성능이 좋습니다.
- 오답 노트
• ROC 커브는 민감도와 1-특이도를 시각화하여 모델의 성능을 전반적으로 평가하는 데 유용합니다.
• 가장 좋은 ROC 커브는 왼쪽 위 코너에 가까운 형태로 나타납니다. 이는 높은 민감도와 특이도를 의미합니다.
11. plyr 패키지가 보유한 여러 함수에 대해 설명하시오.
- apply
- sapply
- dlply
- ddply
해설
- 개념 개요
- plyr는 R에서 데이터 분석을 쉽게 하기 위해 설계된 패키지로, 데이터를 나누고(`split`), 함수 적용(`apply`), 결과를 합치는(`combine`) 작업을 간단하게 수행할 수 있게 도와줍니다.
- 초등학생도 이해하기 쉬운 설명
- `plyr`은 큰 퍼즐을 작은 조각으로 나누고, 각 조각에 색칠한 후 다시 합치는 것과 같아요. 이렇게 하면 전체 그림을 더 쉽게 완성할 수 있어요.
- 주요 함수 설명
1. apply: 배열이나 행렬에 함수를 적용하는 기본 R 함수입니다. `plyr` 패키지의 함수는 아닙니다.
2. sapply: 리스트나 벡터에 함수를 적용하여 결과를 벡터로 반환하는 기본 R 함수입니다. `plyr` 패키지의 함수는 아닙니다.
3. dlply: 데이터 프레임을 리스트로 나누고, 각 리스트 요소에 함수를 적용한 후 결과를 리스트로 반환합니다.
4. ddply: 데이터 프레임을 그룹별로 나누고, 각 그룹에 함수를 적용하여 결과를 데이터 프레임으로 반환합니다.
12. 다음 중 보기에서 설명하는 것은 무엇인가?
인간의 뇌를 기반으로 제작된 인공신경망의 작은 한 단위이며, 이 단위 하나가 인공신경망이 될 수 있다. 또한 두 개 이상의 결합으로 더욱 복잡한 구조를 표현하는 인공신경망이 될 수도 있다. 뉴런과 같은 역할을 담당하며 여러 개의 입력 신호를 받아 가중치와의 조합을 통해 하나의 출력을 내보낸다.
- 노드
- 퍼셉트론
- 벡터
- 붓스트랩
해설
- 개념 개요
- 주어진 설명은 **퍼셉트론(Perceptron)**에 대한 것입니다. 퍼셉트론은 인공신경망의 기본 단위로, 뉴런과 유사한 역할을 하며 여러 입력 신호를 받아 가중치와 결합하여 출력을 생성합니다.
- 초등학생도 이해하기 쉬운 설명
- 퍼셉트론은 뇌 속의 작은 뉴런처럼 작동하는 컴퓨터 프로그램이에요. 여러 정보를 받아서 계산하고, 결과를 내보내는 역할을 해요.
- 문제 항목에 대한 해석
1. 노드: 일반적인 용어로, 신경망에서 퍼셉트론이나 뉴런을 포함할 수 있지만, 주어진 설명에 정확히 맞지는 않습니다.
2. 퍼셉트론: 인공신경망의 기본 단위로, 주어진 설명에 정확히 부합합니다.
3. 벡터: 수학적 개념으로, 방향과 크기를 가진 양입니다. 신경망의 단위와는 다릅니다.
4. 붓스트랩: 통계적 방법으로, 데이터 샘플링 기법입니다. 신경망과 관련이 없습니다.
13. 다음 중 시계열분석에 대한 설명으로 올바른 것은 무엇인가?
- 일정 시간 간격으로 기록된 자료에 대한 특성을 파악하고 과거를 추론하는 데 활용하는 방법이다.
- 평균이 일정하지 않은 비정상 시계열의 경우 변환을 통해 정상 시계열로 변환할 수 있다.
- 자기회귀는 과거 n번째 이전 시점이 현재 시점을 설명할 수 있음을 의미한다.
- 지수평활법은 최근 자료가 과거 자료보다 예측에 효과적이라는 가정하에 최근 데이터에 더 큰 가중치를 부여하는 방법이다.
해설
- 시계열 분석은 미래 예측이 주 목적이고, 평균이 일정하지 않은 경우 차분을 통해 정상 시계열로 변환하며, 자기회귀모형은 현재 시점은 바로 직전의 몇 개의 데이터에 의해 설명될 수 있음을 의미
'[자격증] > ADsP 문제 풀이' 카테고리의 다른 글
[38회 기출 변형 문제] (0) | 2024.10.27 |
---|---|
[37회 기출 변형 문제] (0) | 2024.10.25 |
[2회 모의고사] (0) | 2024.10.23 |
[1회 모의고사] (1) | 2024.10.22 |
[2과목] 기출유형 문제 및 예상 문제 (0) | 2024.10.17 |