[1과목]
01. 아래는 빅데이터로 달성할 수 있는 경영혁신의 단계를 나열한 것이다. 빅데이터 경영혁신의 시작 단계에서 궁극적인 단계까지 바르게 나열된 것은?
(가) 비즈니스 프로세스 최적화
(나) 데이터 기반의 문제 인식
(다) 의사결정의 질적 향상
(라) 신규 시장 가치 창출
① (가) -> (나) -> (다) -> (라)
② (나) -> (다) -> (가) -> (라)
③ (다) -> (나) -> (라) -> (가)
④ (라) -> (다) -> (가) -> (나)
해설
- 빅데이터 경영혁신의 단계
- 빅데이터를 활용한 경영혁신은 데이터를 기반으로 문제를 인식하고, 이를 통해 비즈니스 프로세스를 최적화하며, 궁극적으로 의사결정의 질을 향상시키고, 나아가 신규 시장 가치를 창출하는 과정입니다. 이 과정은 일반적으로 다음과 같은 단계로 나뉩니다:
- 비즈니스 프로세스 최적화: 데이터를 활용하여 기존 비즈니스 프로세스를 개선하고, 효율성을 높이는 것이 첫 번째 목표입니다.
- 데이터 기반의 문제 인식: 데이터를 통해 비즈니스에서 발생하는 문제를 인식하고 정의하는 단계입니다.
- 의사결정의 질적 향상: 데이터를 기반으로 한 의사결정을 통해 더 나은 결정을 내리고, 비즈니스 성과를 높이는 단계입니다.
- 신규 시장 가치 창출: 궁극적으로 데이터를 활용하여 새로운 시장 가치를 창출하고, 혁신적인 비즈니스 모델을 개발하는 단계입니다.
- 빅데이터를 활용한 경영혁신은 데이터를 기반으로 문제를 인식하고, 이를 통해 비즈니스 프로세스를 최적화하며, 궁극적으로 의사결정의 질을 향상시키고, 나아가 신규 시장 가치를 창출하는 과정입니다. 이 과정은 일반적으로 다음과 같은 단계로 나뉩니다:
02. 데이터웨어하우스는 기업 내의 의사결정지원 어플리케이션에 정보 기반을 제공하는 하나의 통합된 데이터 저장 공간을 말한다. 다음 중 데이터웨어하우스의 고유한 특성이 아닌 것은?
① 데이터웨어하우스에서는 데이터의 지속적 갱신이 일어나며, 이 과정에서 데이터의 무결성을 유지하는 것이 중요하다.
② 데이터웨어하우스의 데이터들은 기업 전체에서 통합되어 일관된 형식으로 정의되고 관리된다.
③ 데이터웨어하우스는 데이터의 시간적 변화를 추적하여, 시간에 따라 변화하는 값들을 저장하는 특성이 있다.
④ 데이터웨어하우스는 특정 주제나 분야에 따라 데이터를 분류하고 저장하여 관리하는 방식을 취한다.
해설
- 문제 분석
- 데이터웨어하우스(Data Warehouse)는 기업 내에서 의사결정 지원을 위해 다양한 출처에서 데이터를 통합하여 저장하는 시스템입니다. 데이터웨어하우스는 주로 분석과 보고를 목적으로 사용되며, 운영 시스템과는 다른 특성을 가지고 있습니다. 이 문제는 데이터웨어하우스의 고유한 특성이 아닌 것을 찾는 문제입니다.
- 각 선택지 분석
- 1. 데이터웨어하우스에서는 데이터의 지속적 갱신이 일어나며, 이 과정에서 데이터의 무결성을 유지하는 것이 중요하다.
- 설명: 데이터웨어하우스는 주로 분석과 보고를 목적으로 사용되며, 실시간으로 데이터를 지속적으로 갱신하는 운영 시스템(OLTP)과는 다릅니다. 데이터웨어하우스에서는 정기적인 배치 처리(batch processing)를 통해 데이터를 업데이트하며, 실시간으로 지속적인 갱신이 이루어지지 않습니다.
- 부적절한 이유: 데이터웨어하우스는 실시간 운영보다는 분석을 위한 정적 데이터를 저장하는 데 중점을 두므로, 지속적인 갱신은 고유한 특성이 아닙니다.
- 2. 데이터웨어하우스의 데이터들은 기업 전체에서 통합되어 일관된 형식으로 정의되고 관리된다.
- 설명: 데이터웨어하우스는 여러 출처에서 데이터를 가져와 통합하고, 일관된 형식으로 정의하여 관리하는 것이 중요한 특징입니다. 이를 통해 기업 내 다양한 부서에서 사용하는 데이터를 하나의 일관된 방식으로 분석할 수 있게 됩니다.
- 3. 데이터웨어하우스는 데이터의 시간적 변화를 추적하여, 시간에 따라 변화하는 값들을 저장하는 특성이 있다.
- 설명: 데이터웨어하우스는 데이터를 시간에 따라 축적하며, 과거 데이터를 보존하고 분석할 수 있는 기능을 제공합니다. 이를 통해 시간에 따른 변화 추세를 파악할 수 있습니다.
- 4. 데이터웨어하우스는 특정 주제나 분야에 따라 데이터를 분류하고 저장하여 관리하는 방식을 취한다.
- 설명: 데이터웨어하우스는 주로 특정 주제나 비즈니스 영역(예: 판매, 고객, 재무 등)에 따라 데이터를 분류하고 저장합니다. 이를 통해 특정 비즈니스 목적에 맞게 데이터를 효율적으로 분석할 수 있습니다.
- 1. 데이터웨어하우스에서는 데이터의 지속적 갱신이 일어나며, 이 과정에서 데이터의 무결성을 유지하는 것이 중요하다.
- 추가 설명
- 데이터웨어하우스는 주로 정적인 데이터를 저장하는 공간으로, 데이터의 비휘발성이 중요한 특성 중 하나이다. 데이터웨어하우스는 일정 기간 동안 안정적으로 정보를 보관하는 것을 목적으로 하기 때문에, 지속적인 갱신보다는 정해진 시간에 따라 주기적으로 데이터를 업데이트하는 것이 일반적이다. 따라서 데이터웨어하우스에서 데이터의 지속적 갱신과 무결성 유지는 주요한 특성이 아니다. 반면, 데이터웨어하우스의 데이터들은 일관된 형식으로 정의되고, 시간의 흐름에 따라 변화하는 값을 저장하며, 특정 주제에 따라 분류, 저장, 관리되는 것이 특징이다.
03. 빅데이터 시대가 도래하면서 발생할 수 있는 부정적인 측면의 하나로 "책임원칙의 훼손"의 이슈가 있다. 다음 중 이에 대한 사례로 가장 적절한 것은?
① 사이버 보안 프로그램에 의한 미연의 해킹 시도 차단
② 사회적 네트워크에서의 개인 정보 무분별한 공유
③ 위치 추적 기술을 이용한 불법적인 개인 감시
④ 알고리즘에 의한 콘텐츠 필터링으로 정보 접근성 감소
해설
- 책임원칙의 훼손이란?
- 책임원칙의 훼손은 빅데이터 시대에서 발생할 수 있는 문제 중 하나로, 자동화된 시스템이나 알고리즘이 의사결정을 내릴 때, 책임 소재가 불분명해지거나 책임을 회피하는 상황을 의미합니다. 이는 특히 인공지능(AI)이나 자동화된 의사결정 시스템에서 많이 발생할 수 있습니다. 시스템이 잘못된 결정을 내리거나 예기치 않은 결과를 초래했을 때, 그 책임이 누구에게 있는지 명확하지 않은 경우가 발생할 수 있습니다.
- 각 선택지 분석
- ① 사이버 보안 프로그램에 의한 미연의 해킹 시도 차단
- 설명: 사이버 보안 프로그램은 자동화된 방식으로 해킹 시도를 차단하는 역할을 합니다. 이러한 자동화된 프로그램이 잘못된 판단을 내리거나 무고한 사용자에게 피해를 줄 경우, 그 책임 소재가 불분명해질 수 있습니다. 예를 들어, 정상적인 사용자를 해커로 오인하여 접근을 차단하면 그 결과에 대한 책임이 누구에게 있는지 모호해질 수 있습니다. 이는 책임원칙의 훼손과 관련이 있습니다.
- 적절한 이유: 자동화된 보안 시스템에서 잘못된 판단으로 인해 발생하는 문제는 책임원칙의 훼손과 관련이 있습니다. 따라서 이 선택지는 적절합니다.
- ② 사회적 네트워크에서의 개인 정보 무분별한 공유
- 설명: 개인 정보가 무분별하게 공유되는 것은 주로 프라이버시 침해와 관련된 문제입니다. 이는 개인정보 보호와 관련된 문제이지, 책임원칙의 훼손과는 직접적인 관련이 없습니다.
- ③ 위치 추적 기술을 이용한 불법적인 개인 감시
- 설명: 위치 추적 기술을 이용한 불법 감시는 주로 프라이버시 침해 및 불법 감시와 관련된 문제입니다. 이는 데이터 윤리와 관련된 문제이지, 책임원칙의 훼손과는 직접적인 연관이 없습니다.
- ④ 알고리즘에 의한 콘텐츠 필터링으로 정보 접근성 감소
- 설명: 알고리즘에 의해 자동으로 콘텐츠가 필터링되면서 정보 접근성이 제한될 수 있지만, 이는 주로 정보 편향이나 접근성 감소 문제와 관련됩니다.
- ① 사이버 보안 프로그램에 의한 미연의 해킹 시도 차단
2과목
01. 비즈니스 분야별로 도출된 다양한 분석 과제들에 대해 회사 전체의 관점에서 우선순위를 정한 뒤, 조직에 맞는 분석체계를 구축한다. 다음 중 분석체계를 구축하는 과정에 대한 설명으로 가장 부적합한 것은?
① 분석체계 구현은 설계 -> 구현 ->테스트 -> 이행 등 순차적(Waterfall) 방식을 적용하여 수행 한다.
② 필요한 데이터를 수집하고 확보하는 것으로 시작하여 분석 모델을 설계한다.
③ 준비된 데이터를 분석 모델에 적용하고, 그 결과를 분석하여 평가한다.
④ 분석 모델을 지속적으로 개선하여 분석 모델의 정확성을 높인다.
해설
- 문제 분석
- 이 문제는 비즈니스 분석체계를 구축하는 과정에서 부적합한 설명을 찾는 문제입니다. 현대의 데이터 분석 프로젝트는 빠르게 변화하는 비즈니스 환경에 대응하기 위해 순차적(Waterfall) 방식보다는 반복적(Iterative) 방식이나 애자일(Agile) 방법론을 더 많이 사용합니다. 이를 고려하여 각 선택지를 분석하겠습니다.
- 각 선택지 분석
- ① 분석체계 구현은 설계 -> 구현 -> 테스트 -> 이행 등 순차적(Waterfall) 방식을 적용하여 수행한다.
- 설명: 순차적(Waterfall) 방식은 전통적인 소프트웨어 개발 방법론으로, 각 단계를 순차적으로 진행하는 방식입니다. 하지만 데이터 분석 프로젝트에서는 빠르게 변화하는 요구 사항에 대응해야 하므로, 반복적(Iterative) 또는 애자일(Agile) 방식이 더 적합합니다. 애자일 방식은 각 단계를 반복적으로 수행하면서 점진적으로 개선해 나가는 방식입니다.
- ② 필요한 데이터를 수집하고 확보하는 것으로 시작하여 분석 모델을 설계한다.
- 설명: 데이터 분석 프로젝트는 먼저 필요한 데이터를 수집하고 확보한 후, 이를 바탕으로 분석 모델을 설계하는 것이 일반적인 과정입니다. 데이터가 없으면 올바른 모델을 설계할 수 없기 때문에, 데이터 수집이 첫 번째 단계로 적절합니다.
- ③ 준비된 데이터를 분석 모델에 적용하고, 그 결과를 분석하여 평가한다.
- 설명: 데이터를 수집하고 모델을 설계한 후, 준비된 데이터를 모델에 적용하여 결과를 도출하고 이를 평가하는 과정은 필수적인 단계입니다. 이는 데이터 분석 프로젝트에서 중요한 단계 중 하나입니다.
- ④ 분석 모델을 지속적으로 개선하여 분석 모델의 정확성을 높인다.
- 설명: 데이터 분석 프로젝트에서는 한 번의 모델링으로 끝나는 것이 아니라, 결과를 바탕으로 모델을 지속적으로 개선하여 정확도를 높이는 것이 중요합니다. 이는 반복적인 과정이며, 특히 애자일 방법론에서 강조되는 부분입니다.
- ① 분석체계 구현은 설계 -> 구현 -> 테스트 -> 이행 등 순차적(Waterfall) 방식을 적용하여 수행한다.
02. 다음 중 Activity System Map에 대한 설명으로 가장 적절한 것은?
① Activity System Map을 통해 고객에게 제공할 효용 가치와 실행요소들을 도출함
② Activity System Map을 통해 고객이 제공받기를 원하는 효용에 대해 자사 및 경쟁사가 제공하 고 있는 가치수준을 비교 평가한 후, 경쟁사와 차별화 된 고객 효용 제공을 위한 가치요소를 정 의함
③ Activity System Map을 통해 고객 효용 제공을 위한 실행요소들을 파악한 후, 이를 선택-가정결과의 일련의 비즈니스 시나리오 흐름으로 비즈니스 모델을 구체화 하여 정의함
④ Activity System Map을 통해 구체화 된 전략테마와 이를 실현하기 위한 일련의 실행 활동들을 CLD(Casual Loop Diagram)의 선택-가정-결과의 일련의 스토리와 상호연관관계로 표현하여 비즈니스 모델을 구체화/정교화 할 수 있음
해설
- Activity System Map에 대한 개념 정리
- Activity System Map은 기업이 전략적 테마와 이를 실현하기 위한 실행 활동 간의 상호 연관성을 시각적으로 표현하는 도구입니다. 이를 통해 기업은 전략적 목표를 달성하기 위해 어떤 활동들이 어떻게 연결되어 있는지, 그리고 각 활동이 전략적 목표에 어떻게 기여하는지를 명확히 파악할 수 있습니다. 이 도구는 단순히 개별 활동을 나열하는 것이 아니라, 활동들 간의 상호작용과 시너지 효과를 강조합니다. 이를 통해 기업은 전략적 일관성을 유지하고, 조직 내에서 모든 활동이 동일한 목표를 향해 나아가도록 조정할 수 있습니다.
- 각 선택지 분석
- ① Activity System Map을 통해 고객에게 제공할 효용 가치와 실행요소들을 도출함
- 설명: 이 설명은 Activity System Map의 일부 기능만을 언급하고 있습니다. Activity System Map은 고객에게 제공할 가치와 실행 요소를 도출하는 데 그치지 않고, 이들 요소들이 어떻게 상호 연결되어 있는지를 시각적으로 표현하고, 전략적 테마와의 관계를 정의하는 데 중점을 둡니다.
- 부적절한 이유: 이 설명은 Activity System Map의 기능을 충분히 설명하지 못하고 있으며, 전략적 테마와 실행 활동 간의 상호 연관성을 강조하지 않았습니다.
- ② Activity System Map을 통해 고객이 제공받기를 원하는 효용에 대해 자사 및 경쟁사가 제공하고 있는 가치수준을 비교 평가한 후, 경쟁사와 차별화된 고객 효용 제공을 위한 가치요소를 정의함
- 설명: 이 설명은 주로 경쟁사 분석과 관련된 내용입니다. Activity System Map은 경쟁사와의 비교보다는, 기업 내부에서 전략적 테마와 실행 활동 간의 상호 연관성을 구체화하고 정교화하는 데 중점을 둡니다.
- 부적절한 이유: 경쟁사와의 비교는 Activity System Map의 주요 목적이 아니며, 이는 주로 경쟁사 분석에서 다루는 내용입니다.
- ③ Activity System Map을 통해 고객 효용 제공을 위한 실행요소들을 파악한 후, 이를 선택-가정-결과의 일련의 비즈니스 시나리오 흐름으로 비즈니스 모델을 구체화하여 정의함
- 설명: 이 설명은 Activity System Map이 비즈니스 모델을 구체화하는 데 사용된다는 점을 강조하지만, 이 도구의 핵심 기능인 전략적 테마와 실행 활동 간의 상호 연관성에 대한 설명이 부족합니다.
- 부적절한 이유: Activity System Map의 핵심 기능인 전략적 테마와 실행 활동 간의 상호 연관성을 충분히 설명하지 않았습니다.
- ④ Activity System Map을 통해 구체화된 전략 테마와 이를 실현하기 위한 일련의 실행 활동들을 CLD(Causal Loop Diagram)의 선택-가정-결과의 일련의 스토리와 상호연관관계로 표현하여 비즈니스 모델을 구체화/정교화 할 수 있음
- 설명: 이 설명은 Activity System Map이 전략적 테마와 실행 활동 간의 상호 연관성을 시각적으로 표현하는 데 중점을 둔다는 점을 잘 설명하고 있습니다. 특히, CLD(Causal Loop Diagram)를 활용하여 이러한 상호작용을 더욱 명확하게 표현할 수 있으며, 이를 통해 비즈니스 모델을 구체화하고 정교화할 수 있습니다.
- 적절한 이유: 이 설명은 Activity System Map이 기업 내부에서 전략적 테마와 실행 활동 간의 상호작용을 시각적으로 표현하고, 이를 CLD 방식으로 구체화할 수 있다는 점에서 매우 적절합니다.
- ① Activity System Map을 통해 고객에게 제공할 효용 가치와 실행요소들을 도출함
03. 분석과제의 우선순위를 결정하는 요소로서 다음 중 가장 부적합한 것은?
① 과제의 시급성과 난이도
② 비즈니스 효과
③ 투자비용 요소
④ 전술적 중요도와 MBO
해설
- 분석 과제의 우선순위를 결정할 때는 비즈니스 효과, 시급성, 난이도, 투자비용 등이 중요한 고려 요소입니다. 그러나 MBO(Management by Objectives, 목표에 의한 관리)와 같은 전술적 중요도는 분석 과제의 우선순위 결정과는 직접적인 연관이 적을 수 있습니다.
- 각 선택지 분석
- ① 과제의 시급성과 난이도
- 설명: 분석 과제를 우선순위로 정할 때, 해당 과제가 얼마나 시급한지, 그리고 그 과제를 해결하는 데 얼마나 어려운지(난이도)를 고려하는 것은 매우 중요합니다. 시급한 과제는 우선적으로 처리되어야 하며, 난이도가 높은 과제는 추가적인 자원이나 시간이 필요할 수 있습니다.
- ② 비즈니스 효과
- 설명: 분석 과제가 기업에 미치는 비즈니스 효과는 매우 중요한 고려 요소입니다. 분석 결과가 기업의 성과나 수익에 큰 영향을 미친다면, 그 과제는 높은 우선순위를 가져야 합니다.
- ③ 투자비용 요소
- 설명: 분석 과제를 수행하는 데 필요한 투자비용도 중요한 요소입니다. 비용 대비 효과가 높은 과제는 우선적으로 처리될 가능성이 큽니다. 반대로, 비용이 많이 들지만 효과가 적은 과제는 낮은 우선순위를 가질 수 있습니다.
- ④ 전술적 중요도와 MBO
- 설명: MBO(Management by Objectives)는 경영 목표를 설정하고 그 목표를 달성하기 위한 관리 방법론입니다. 이는 주로 조직 내에서 목표를 설정하고 성과를 평가하는 데 사용됩니다. 그러나 MBO와 같은 전술적 중요도가 분석 과제의 우선순위를 직접적으로 결정하는 데 중요한 요소라고 보기에는 부적합합니다. 분석 과제의 우선순위는 주로 비즈니스 효과, 시급성, 투자비용 등을 기반으로 결정됩니다.
- ① 과제의 시급성과 난이도
3과목
01. 다음 프로그램을 통해 생성된 벡터 xy에 대한 설명으로 옳지 않은 것은?
xy <- c('1', 'x', 2, 'y', 3, 'z')
① xy는 문자형 벡터이다.
② xy의 길이는 6이다.
③ xy[1] + xy[2]의 결과는 '1x'이다.
④ xy[4:6]의 길이는 3이다.
해설
- 이 코드는 c() 함수를 사용하여 벡터 xy를 생성합니다. 벡터에는 문자형 값 '1', 'x', 'y', 'z'와 숫자형 값 2, 3이 포함되어 있습니다. R에서는 벡터 내의 요소들이 동일한 데이터 타입을 가져야 하므로, 숫자형 값인 2와 3도 자동으로 문자형으로 변환됩니다. 따라서, xy는 문자형 벡터로 처리됩니다.
- 각 선택지 분석
- ① xy는 문자형 벡터이다.
- 설명: R에서는 벡터 내의 데이터 타입이 통일되어야 하므로, 숫자형 값인 2와 3도 문자형으로 변환됩니다. 따라서 xy는 문자형 벡터입니다.
- ② xy의 길이는 6이다.
- 설명: 벡터 xy는 6개의 요소('1', 'x', '2', 'y', '3', 'z')로 구성되어 있으므로, 길이는 6입니다.
- ③ xy + xy의 결과는 '1x'이다.
- 설명: R에서 문자형 데이터를 더하는 연산(+)은 지원되지 않습니다. 문자형 데이터를 결합하려면 paste() 또는 paste0() 함수를 사용해야 합니다. 따라서 xy + xy는 오류가 발생하게 됩니다.
- ④ xy[4:6]의 길이는 3이다.
- 설명: xy[4:6]은 벡터의 4번째부터 6번째 요소('y', '3', 'z')를 추출한 부분 벡터이며, 이 부분 벡터의 길이는 3입니다.
- ① xy는 문자형 벡터이다.
02. 표본조사의 유의점에 대한 설명 중 부적절한 것은?
① 표본편의는 표본추출 과정에서 특정 대상이 다른 대상에 비해 우선적으로 추출될 때 생기는 오차를 의미한다.
② 표본편의(sampling bias)는 통계적 모델링을 통해 최소화하거나 없앨 수 있다.
③ 표본값으로 모집단의 모수를 추정할 때 표본오차와 비표본오차가 발생할 수 있다.
④ 응답오차, 유도질문 등은 표본조사에서 유의할 점이다.
해설
- 표본조사에서는 표본편의(sampling bias), 표본오차(sampling error), 비표본오차(non-sampling error) 등 다양한 오차가 발생할 수 있으며, 이를 최소화하는 것이 중요합니다. 그러나 일부 오차는 통계적 모델링만으로는 완전히 제거할 수 없습니다.
- 각 선택지 분석
- ① 표본편의는 표본추출 과정에서 특정 대상이 다른 대상에 비해 우선적으로 추출될 때 생기는 오차를 의미한다.
- 설명: 표본편의(sampling bias)는 표본추출 과정에서 특정 집단이 과도하게 대표되거나, 다른 집단이 과소대표될 때 발생하는 오차입니다. 이는 표본이 모집단을 제대로 반영하지 못하게 만드는 중요한 문제입니다.
- ② 표본편의(sampling bias)는 통계적 모델링을 통해 최소화하거나 없앨 수 있다.
- 설명: 표본편의(sampling bias)는 주로 잘못된 표본추출 방법에서 발생하며, 이는 통계적 모델링만으로 완전히 제거하기 어렵습니다. 표본편의를 줄이기 위해서는 무작위 표본추출(random sampling)과 같은 적절한 표본추출 방법을 사용하는 것이 중요합니다. 통계적 모델링은 일부 편향을 보정할 수 있지만, 근본적인 편향 문제를 해결하지는 못합니다.
- ③ 표본값으로 모집단의 모수를 추정할 때 표본오차와 비표본오차가 발생할 수 있다.
- 설명: 표본조사에서는 항상 어느 정도의 오차가 발생할 수 있습니다. 표본오차(sampling error)는 무작위로 추출된 표본이 모집단을 정확히 반영하지 못할 때 발생하는 오차이며, 비표본오차(non-sampling error)는 조사 과정에서 발생하는 응답 오류, 데이터 입력 오류 등과 관련된 오차입니다.
- ④ 응답오차, 유도질문 등은 표본조사에서 유의할 점이다.
- 설명: 응답자가 질문에 대해 잘못된 답변을 하거나 질문 자체가 응답자를 특정 방향으로 유도하는 경우, 이는 조사 결과에 영향을 미칠 수 있습니다. 이러한 오류를 방지하기 위해 질문 설계와 조사 과정에서 주의를 기울여야 합니다.
- ① 표본편의는 표본추출 과정에서 특정 대상이 다른 대상에 비해 우선적으로 추출될 때 생기는 오차를 의미한다.
03. 이익도표(Lift)에서 %Captured Response를 계산하는 공식은?
① 해당집단의 빈도 / 전체 빈도 x 100
② 해당집단에서 목표변수의 특정범주 빈도 / 해당집단에서 전체 빈도 x 100
③ 전체 목표변수의 특정범주 빈도 / 전체 빈도 x 100
④ 해당집단의 %Response / BASE line Lift x 100
해설
- 이익도표(Lift Chart)란?
- 이익도표(Lift Chart)는 분류 모델의 성능을 평가하는 데 사용되는 도구입니다. 특히, 마케팅 캠페인이나 고객 타겟팅과 같은 상황에서 모델이 얼마나 효과적으로 목표 고객을 찾아내는지를 평가할 때 유용합니다.
- Lift(리프트)란?
- Lift는 모델이 예측한 결과가 무작위로 선택한 것보다 얼마나 더 나은지를 나타내는 지표입니다. 예를 들어, 마케팅 캠페인에서 고객을 타겟팅할 때, 리프트 값이 높으면 모델이 무작위로 선택한 것보다 더 많은 긍정적인 응답자를 찾아낸다는 뜻입니다.
- % Captured Response란?
- % Captured Response는 특정 집단에서 목표 변수(예: 긍정 응답자)의 비율을 나타냅니다. 이는 해당 집단에서 얼마나 많은 목표 응답을 달성했는지를 백분율로 나타낸 것입니다.
- 예를 들어, 마케팅 캠페인에서 긍정적인 응답(구매 등)을 목표로 할 때, % Captured Response는 특정 집단에서 얼마나 많은 긍정 응답을 얻었는지를 보여줍니다.
- 예시
- 만약 100명의 고객 중 20명이 구매를 했고, 이 100명은 특정 집단에 속한다면:
- 목표 변수의 특정 범주는 "구매"입니다.
- 해당 집단에서 목표 변수의 특정 범주 빈도는 "20명"입니다.
- 해당 집단의 전체 빈도는 "100명"입니다.
- 만약 100명의 고객 중 20명이 구매를 했고, 이 100명은 특정 집단에 속한다면:
'[자격증] > ADsP 문제 풀이' 카테고리의 다른 글
[오답 정리] ADsP (0) | 2024.11.02 |
---|---|
[ADsP 문제풀이] 스파르타코딩클럽 오답 정리 (0) | 2024.11.01 |
[3과목 예상문제] ADsP 오답 풀이 (3) | 2024.10.31 |
[3과목 기출문제] ADsP 오답 풀이 (0) | 2024.10.31 |
[39회 기출 변형 문제] (0) | 2024.10.27 |