본문 바로가기
[자격증]/ADsP 문제 풀이

[1과목] 데이터의 이해_문제 풀이

by 에디터 윤슬 2024. 10. 12.
 

문제

01. 다음 중 비즈니스 모델에서 빅데이터 분석 방법과 그에 대한 활용 예시가 부적절한 것은?

  1. 회귀분석: 연인들의 거리에 따른 애정도의 변화는 얼마인가?
  2. 감정분석: 고객의 만족도가 높을수록 재방문할 가능성은 얼마인가?
  3. 유형분석: 같은 패턴의 행동을 보이는 동물은 무엇인가?
  4. 연관 규칙학습: 고객의 장바구니를 분석한 결과 어떤 구입 품목들이 연관성을 가지는가?

해설

감정분석은 특정 주제에 대한 사용자들의 긍정, 부정의 의견을 분석하는 방법이다. 고객의 만족도(독립변수)에 따른 재방문 가능성(종속변수)은 회귀분석이 적절하다.

 

02. 딥러닝과 관련된 분석 기법 중 거리가 가장 먼 것은?

  1. AUTIENCODER
  2. LSTM
  3. SVM
  4. CNN

해설

  • 오토인코더(Autoencoder): 입력 데이터를 재구성하는 데 사용되는 신경망. 주로 데이터의 차원 축소, 이상 탐지, 노이즈 제거 등의 작업에 활용. 
  • LSTM(Long Short-Term Memory): 순환 신경망의 한 종류로, 장기 및 단기 기억을 모두 처리할 수 있도록 설계. 순환신경망(RNN)의 단점인 장기 의존성 문제를 해결하기 위해 개발
  • CNN(Convolutional Neural Network): 주로 이미지나 영상 데이터를 처리하는 데 강점을 가진 신경망
  • SVM(Suport Vector Machine): 분류와 회귀분석에 사용된다. 데이터 포인트 간의 최대 마진을 찾는 것을 목표

 

03. 데이터 사이언스와 관련해 다른 영역에 속하는 것은?

  1. 데이터 시각화
  2. 시그널 프로세싱
  3. 고성능 컴퓨팅
  4. 프로그래밍

해설

  • 데이터 사이언스 구성 요소
    • Analytics: 수학, 확률 모델, 머신러닝, 분석학, 패턴 인식과 학습, 불확실성 모델링 등
    • IT(Date Management): 시그널 프로세싱, 프로그래밍, 데이터 엔지니어링, 데이터 웨어하우징, 고성능 컴퓨팅 등
    • 비즈니스 분석: 커뮤니케이션, 프레젠테이션, 스토리텔링, 데이터 시각화 등

데이터 사이언스의 핵심 구성 요소

 

04. 데이터베이스 설계 절차로 적절한 것은?

  1. 요구사항 분석 -> 개념적 설계 -> 논리적 설계 -> 물리적 설계

해설

  • 1. 요구 사항 분석
    • 목적: 데이터베이스가 충족해야 할 사용자 요구 사항을 수집하고 분석합니다.
    • 활동: 사용자와의 인터뷰, 설문조사 등을 통해 시스템의 목표와 필요한 기능을 정의하고, 업무 규칙을 파악합니다.
    2. 개념적 설계
    • 목적: 요구 사항을 바탕으로 데이터와 그 관계를 추상화하여 개념적 데이터 모델을 만듭니다.
    • 활동: ER 다이어그램을 사용하여 엔티티, 속성, 관계를 식별하고, 데이터 무결성을 검토합니다.
    3. 논리적 설계
    • 목적: 개념적 설계를 실제 DBMS에 맞게 변환하여 논리적 데이터 모델을 만듭니다.
    • 활동: 테이블 구조를 설계하고, 정규화를 통해 중복 및 이상 현상을 제거하며, 인덱스와 트랜잭션, 제약 조건 등을 정의합니다.
    4. 물리적 설계
    • 목적: 논리적 구조를 기반으로 물리적 저장 구조를 설계하여 효율적인 데이터베이스 성능을 지원합니다.
    • 활동: 저장 장치의 특성을 고려하여 인덱스 구조, 접근 경로 등을 설계하며, 반응 시간과 저장 공간 활용도를 최적화합니다.
    5. 구현
    • 목적: 설계된 데이터베이스 구조를 실제 DBMS에서 구현하여 운영 가능한 상태로 만듭니다.
    • 활동: SQL 명령문을 사용하여 테이블과 인덱스를 생성하고 데이터를 입력하며, 응용 프로그램에서 사용할 트랜잭션을 작성합니다

05. 다음과 같은 일차원적 분석을 수행하는 산업으로 가장 적절한 것은?

트레이딩, 공급/수요 예측
  1. 에너지
  2. 금융 서비스
  3. 소매업
  4. 제조업

해설

산업 일차원적 분석 애플리케이션
금융 서비스 신용점수 산정, 사기 탐지, 가격 책정, 프로그램 트레이딩, 클레임 분석, 고객 수익성 분석
에너지 트레이딩, 공급/수요 예측
병원 가격 책정, 고객 로열티, 수익 관리
정부 사기탐지, 사례관리, 범죄방지, 수익최적화
소매업 판촉, 매대 관리, 수요 예측, 재고 보충, 가격 및 제조 최적화
제조업 공급사슬 최적화, 수요 예측, 재고 보충, 보증서 분석, 맞춤형 상품 개발, 신상품 개발

 

 

06. 데이터 웨어하우스에 대한 설명으로 가장 부적절한 것은?

  1. 데이터 웨어하우스에서 관리하는 데이터는 시간의 흐름에 따라 변화하는 값을 저장한다.
  2. ETL은 주기적으로 운영 시스템에서 데이터를 추출, 가공하여 데이터 웨어하우스에 적재한다.
  3. 데이터 웨어하우스는 데이터를 일관된 형식으로 관리한다.
  4. 전사적 차원에서 접근하기보다는 재무, 생산, 운영과 같이 특정 업무 분야에 초점을 맞춰 구축한다.

해설

  • ETL(Extract, Transform, Load): 추출, 변환, 로드
  • 데이터 웨어하우스: 비즈니스 인텔리전스와 분석을 위해 설계된 데이터 관리 시스템. 대량의 데이터를 수집하고 저장하여, 이를 분석 및 쿼리에 사용할 수 있도록 한다. 전사적 차원에서 접근한다.

데이터 웨어하우스의 주요 특징

  • 중앙 저장소: 데이터 웨어하우스는 여러 소스로부터 데이터를 통합하여 중앙 저장소에 보관합니다. 이를 통해 조직 내 모든 데이터가 한 곳에서 접근 가능해지며, 부서 간 일관된 데이터 분석이 가능합니다
  • OLAP 지원: 데이터 웨어하우스는 온라인 분석 처리(OLAP)를 지원하여 대량의 역사적 데이터를 빠르고 복잡한 쿼리를 통해 분석할 수 있습니다. 이는 운영 데이터베이스의 OLTP(온라인 트랜잭션 처리)와 대비됩니다.
  • 데이터 일관성 및 품질: 다양한 소스에서 수집된 데이터를 표준화된 형식으로 변환하여 데이터의 일관성과 품질을 유지합니다. 이는 비즈니스 부서 간에 동일한 데이터를 사용하여 일관된 보고서를 생성할 수 있게 합니다.
  • 역사적 데이터 저장: 과거의 데이터를 저장하고 분석할 수 있어, 시간에 따른 트렌드와 패턴을 파악하는 데 유용합니다. 이는 기업이 전략적 결정을 내리는 데 중요한 인사이트를 제공합니다.

데이터 웨어하우스의 이점

  • 비즈니스 인사이트 강화: 데이터를 통합하고 분석함으로써 비즈니스 인사이트를 강화하고, 더 나은 의사 결정을 지원합니다.
  • 데이터 접근성 향상: 사용자가 여러 시스템에 로그인할 필요 없이 한 인터페이스에서 모든 데이터를 쉽게 접근할 수 있습니다.
  • 자동화 효율성: 데이터 추출 전송을 자동화하여 정보 수집과 시각화에 필요한 시간을 줄이고, 빠르게 인사이트를 도출할 있습니다

07. 다음 중 용어와 설명의 연결이 부적절한 것끼리 짝지어진 것은?

가. OLAP. -- 온라인 거래 처리를 위한 소프트웨어
나. 데이터 마이닝  -- 대용량 데이터로부터 의미 있는 관계, 규칙, 패턴을 찾는 과정
다. BI. -- 데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구
라. Business Analytics. -- 다차원의 데이터를 대화식으로 분석하기 위한 소프트웨어

 

해설

  • OLAP(Online Analytics Processing): 다차원의 데이터를 대화식으로 분석하기 위한 소프트웨어
  • 데이터 마이닝: 대량의 데이터에서 유용한 패턴이나 규칙을 발견하는 과정
  • BI(Business Intelligent): 데이터 기반 의사결정을 지원하기 위한 리포트(시각화) 중심의 도구
  • 비즈니스 분석(Business Analytics): 경영 의사결정을 위한 통계적이고 수학적인 분석에 초점을 둔 기법

 

08. 멀티미디어 등 복잡한 데이터 구조를 표현 및 관리하는 DBMS로 적절한 것은?

  1. 계층형
  2. 네트워크
  3. 객체지향
  4. 분산형

해설

  • 계층형 데이터베이스

계층형 데이터베이스는 데이터를 트리 구조로 저장하는 방식입니다. 각 데이터 엔티티는 부모-자식 관계를 가지며, 하나의 부모 엔티티는 여러 자식 엔티티를 가질 수 있지만, 자식 엔티티는 하나의 부모 엔티티만 가질 수 있습니다. 이는 조직도나 파일 시스템과 같은 계층적 관계를 표현하는 데 적합합니다. 그러나 복잡한 다대다 관계를 표현하는 데는 한계가 있습니다.

 

  • 네트워크형 데이터베이스

네트워크형 데이터베이스는 계층형 모델의 확장으로, 그래프 구조를 사용하여 데이터를 저장합니다. 이 모델에서는 각 데이터 엔티티가 여러 부모와 자식 관계를 가질 수 있어, 복잡한 다대다 관계를 표현할 수 있습니다. CODASYL DBTG 모델이 대표적인 예이며, 유연성이 높지만 설계와 관리가 복잡할 수 있습니다.

 

  • 객체지향형 데이터베이스

객체지향형 데이터베이스는 객체 지향 프로그래밍의 개념을 데이터베이스에 적용한 모델입니다. 이 모델은 객체, 클래스, 상속 등의 개념을 지원하며, 복잡한 데이터와 그 동작을 함께 저장하고 관리할 수 있습니다. 이는 CAD/CAM 시스템이나 멀티미디어 애플리케이션 등 복잡한 데이터를 처리하는 데 유리합니다.

 

  • 분산형 데이터베이스

분산형 데이터베이스는 여러 물리적 위치에 걸쳐 데이터를 저장하고 관리하는 시스템입니다. 이는 네트워크를 통해 연결된 여러 노드에 데이터를 분산시켜 저장하며, 노드는 독립적으로 작동하면서도 전체적으로 하나의 통합된 시스템처럼 보이게 합니다. 분산형 데이터베이스는 높은 가용성과 신뢰성을 제공하며, 대규모 데이터를 처리하는 적합합니다

 

09. 여러 데이터베이스의 활용 방법 중 데이터를 통합/분석하여 기업 활동에 연관된 의사결정을 돕는 프로세스로, 가트너는 이것을 '여러 곳에 산재한 데이터를 수집하여 체계적이고 일목요연하게 정리함으로써 사용자가 필요로 하는 정보를 정확한 시간에 제공할 수 있는 환경'으로 정의했다.

  1. SCM
  2. ERP
  3. CRM
  4. BI

해설

  • BI(Business Intelligent): 데이터 기반 의사결정을 지원하기 위한 리포트(시각화) 중심의 도구
  • SCM(Supply Chain Management): 원자재의 조달부터 최종 제품의 배송에 이르기까지 모든 공급망 활동을 효율적으로 관리하는 시스템
  • ERP(Enterpriser Resource Planning): 전사적 자원 관리, 기업의 모든 자원을 통합적으로 관리하는 시스템
  • CRM(Customer Relationship Management): 고객 관계 관리. 고객과의 상호작용을 관리하고 분석

10. 페이스북은 SNS 서비스로 시작했지만, 2006년 F8 행사를 기점으로 자사의 소셜 그래프 자산을 외부 개발자에게 공개했고, 서드파티 개발자들이 페이스북 위에서 작동하는 앱을 만들기 시작했다. 각종 사용자 데이터나 M2N 센서 등에서 수집된 데이터를 가공, 처리, 저장해 두고 이 데이터에 접근할 수 있도록 API를 공개했는데, 이 설명은 빅데이터의 역할 중 무엇에 대한 설명인가?

  1. 플랫폼
  2. 프레임워크
  3. 오픈소스
  4. 아키텍처

해설

  • 플랫폼은 소프트웨어와 하드웨어의 조합으로, 특정 애플리케이션이나 서비스를 실행할 수 있는 환경을 제공합니다. 예를 들어, 클라우드 데이터 플랫폼은 여러 위치의 데이터를 통합하고 관리할 수 있는 환경을 제공하며, 데이터 레이크와 데이터 웨어하우스 기능을 결합하여 스트리밍 데이터와 비구조화 데이터를 처리할 수 있습니다. 이러한 플랫폼은 데이터의 민주화와 유연한 확장을 가능하게 하며, 다양한 분석 툴과의 상호 운용성을 지원합니다.
  • 오픈소스 소프트웨어는 소스 코드가 공개되어 누구나 사용할 수 있고 수정할 수 있는 프로그램을 의미합니다. 데이터 분석 분야에서 오픈소스 툴은 많은 인기를 끌고 있으며, 사용자가 자유롭게 커스터마이즈하고 커뮤니티의 지원을 받을 수 있습니다. 예를 들어, Apache Spark와 같은 오픈소스 툴은 대규모 데이터 처리에 널리 사용됩니다.
  • 아키텍처는 시스템의 구조와 설계 의미하며, 데이터 플랫폼에서는 데이터를 어떻게 저장하고 처리할지를 정의합니다. 예를 들어, 클라우드 데이터 플랫폼 아키텍처는 데이터 계열, 보안 감사 기록, 메타데이터 관리 등을 포함하여 데이터를 효율적으로 관리하고 보호하는 방법을 제공합니다이러한 아키텍처는 시스템의 확장성과 유연성을 높이며, 다양한 데이터 유형과 워크로드를 지원합니다.
  • 프레임워크는 특정 유형의 소프트웨어 개발을 위한 표준화된 방법론과 도구 세트를 제공합니다. 데이터 분석에서 프레임워크는 데이터 수집, 정제, 분석 및 시각화를 위한 구조를 제공합니다. 이는 개발자들이 일관된 방식으로 작업할 수 있도록 지원하며, 코드 재사용성과 효율성을 높여줍니다.

11. 다음 중 DIKW 피라미드에 대한 설명으로 잘못 연결된 것은 무엇인가?

  1. 데이터: 가공되지 않은 객관적인 사실을 의미하는 당위적 특성을 갖는다.
  2. 정보: 데이터의 가공, 처리를 통해 데이터 간의 관계에서 도출된 의미를 갖는다.
  3. 지식: 정보에 개인적인 경험을 결합해 고유의 지식으로 내재화한 것을 의미한다.
  4. 지혜: 지식의 축적과 아이디어가 결합된 창의적 산물을 의미한다.

해설

구분 형태 예시
존재적 특성(실제로 있는 것) 데이터는 있는 그대로의 객관적 사실 수학 80점, 영어 100점
당위적 특성(마땅히 그렇게 해야 하는 것) 데이터는 추론, 예측, 전망, 추정을 위한 근거 평균 90점

 

12. 다음 중 데이터 사이언티스트의 요구 역량인 소프트 스킬에 대한 예시를 올바르게 나열한 것은 무엇인가?

  1. 창의적 사고, 호기심
  2. 빅데이터 분석 방법론, 논리적 비판
  3. 분석 설계 최적화, 커뮤니케이션
  4. 스토리텔링, 분석 노하우

해설

  • 데이터 사이언티스트에게 요구되는 역량
하드 스킬 빅데이터에 대한 이론적 지식: 관련 기법에 대한 이해와 방법론 습득
분석 기술에 대한 숙련: 최적의 분석 설계 및 노하우 축적
소프트 스킬 통찰력 있는 분석: 창의적 사고, 호기심, 논리적 비판
설득력 있는 전달: 스토리텔링, 시각화
다분야 간 협력: 커뮤니케이션

13. 다음 중 기업이 외부 공급업체 또는 제휴업체와 통합된 정보시스템으로 연계하여 시간과 비용을 최적화시킬 수 있는 데이터베이스 시스템은 무엇인가?

  1. ERP
  2. BI
  3. SCM
  4. KMS

해설

  • KMS(Knowledge Management System), 즉 지식관리시스템은 조직이나 기업 내에서 지식을 체계적으로 수집, 저장, 관리, 공유하는 시스템