전체보기
-
[ADsP] 3과목 데이터 분석 - 기출문제 해설(1.데이터 분석 개요, 2.R프로그래밍 기초, 3.데이터 마트)ADsP 2021. 2. 27. 21:02
기출문제 해설(1.데이터 분석 개요, 2.R프로그래밍 기초, 3.데이터 마트)* 탐색적 자료 분석(EDA)- 데이터가 가지고 있는 특성을 파악하기 위해 해당 변수의 분포 등을 시각화하여 분석하는 분석 방식- 다양한 차원과 값을 조합해가며 특이한 점이나 의미있는 사실을 도출하고 분석의 최종목적을 달성해나가는 과정 * 데이터마이닝- 데이터마이닝 모델링은 통계적 모델링이 아니므로 지나치게 통계적 가설이나 유의성에 집착하지 말아야 한다.- 반드시 다양한 옵션을 줘서 모델링을 수행하지 않고, 충분한 시간이 있으면 다양한 옵션을 줘서 시도하는 것이고 일정 성과가 나오면 해석과 활용 단계로 진행할 수 있도록 의사결정을 해야 한다.- 분석데이터를 학습 및 테스트 데이터로 6:4, 7:3, 8:2 비율로 상황에 맞게 실..
-
[ADsP] 2과목 데이터 분석 기획 - 기출문제 해설ADsP 2021. 2. 27. 21:00
기출문제 해설* 통찰(Insight)은 데이터 분석 방법(How)은 충분히 이해하고 있으나, 분석 대상(What)이 무엇인지 인지하지 못하는 유형이다. * 분석 대상이 명확하게 무엇인지 모르는 경우에는 기존분석 방식을 활용하여 통찰을 도출 해냄으로써 문제의 도출 및 해결에 기여하거나 발견 접근법으로 분석 대상 자체를 새롭게 도출할 수 있다. * 분식 기획 고려사항 중 장애요소에 대한 설명1. 비용대비 효과의 적정한 비용2. 분석 모형의 안정적 성능 확보3. 조직 역량으로 내재화를 위한 변화 관리 * 성공적인 분석을 위해서 고려해야 할 요소1. 관련 데이터의 파악 - 분석의 기본이 되는 데이터에 대한 고려가 필요2. 비즈니스 케이스 확보 - 분석을 통해서 가치가 창출될 수 있는 적절한 활용방안과 활용 가능..
-
[ADsP] 1과목 데이터 이해 - 기출문제 해설ADsP 2021. 2. 27. 20:59
기출문제 해설* 정량적 데이터는 형태 수치, 도형, 기호 등올 기술이 되며, 정성적 데이터의 형태는 언어, 문자 등으로 기술된다. * 암묵지와 상호작용은 공통화, 내면화이고 형식지와 상호작용은 표출화, 연결화이다. * 개인정보 비식별화 기법에 대한 설명1. 총계처리 - 데이터의 총합 값을 보임으로써 개별 데이터의 값을 보이지 않도록 함2. 데이터 마스킹 - 데이터의 길이, 유형, 형식과 같은 속성을 유지한 채, 새롭고 읽기 쉬운 데이터를 익명으로 생성하는 기술3. 가명처리 - 개인 식별에 중요한 데이터를 식별 할 수 없는 다른 값으로 변경4. 범주화 - 데이터의 값을 범주의 값으로 변환하여 값을 감춤 * 데이터에 대한 설명1. 양질의 데이터를 확보하지 못하면 잘못된 분석 결과를 얻음2. 창의적인 데이터 ..
-
[ADsP] 3과목 데이터 분석_요약 정리(5.정형 데이터 마이닝)ADsP 2021. 2. 27. 20:57
5. 정형 데이터 마이닝5_1. 데이터 마이닝의 개요* 데이터마이닝- 데이터마이닝은 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법이다. * 통계분석과의 차이점- 통계분석은 가설이나 가정에 따른 분석이나 검증을 하지만 데이터마이닝은 다양한 수리 알고리즘을 이용해 데이터베이스의 데이터로부터 의미있는 정보를 찾아내는 방법으로 통칭한다. * 데이터마이닝의 종류1) 정보를 찾는 방법론에 따른 종류- 인공지능(Artificial Intelligence), 의사결정나무(Decision Tree), K-평균군집합(K-means Clustering), 연관분석(Association Rule), 회귀분석(Regression), 로짓분석(Logit Analysis), 최근접이웃(Nearest..
-
[ADsP] 3과목 데이터 분석_요약 정리(4.통계분석)ADsP 2021. 2. 27. 20:56
4. 통계분석4_1. 통계분석의 이해* 총 조사/전수 조사(census)- 대상 집단 모두를 조사하는데 많은 비용과 시간이 소요되므로 특별한 경우를 제외하고는 사용 되지 않는다. (ex. 인구주택 총 조사) * 표본조사- 대부분의 설문조사가 표본조사로 진행되며 모집단에서 샘플을 추출하여 진행하는 조사이다.- 모집단(population) : 조사하고자 하는 대상 집단 전체- 원소(element) : 모집단을 구성하는 개체- 표본(sample) : 조사하기 위해 추출한 모집단의 일부 원소- 모수(parameter) : 표본 관측에 의해 구하고자 하는 모집단에 대한 정보- 모집단의 정의, 표본의 크기, 조사방법, 조사기간, 표본추출방법을 정확히 명시해야 한다. * 표본 추출 방법 4가지- 표본조사의 중요한 점..
-
[ADsP] 3과목 데이터 분석_요약 정리(1.데이터 분석 개요, 2.R 프로그래밍 기초, 3.데이터 마트)ADsP 2021. 2. 27. 20:53
1. 데이터 분석 개요1_1. 데이터 분석 기법의 이해* 시각화(시각화 그래프)- 시각화는 가장 낮은 수준의 분석이지만 잘 사용하면 복잡한 분석보다도 더 효율적이다.- 대용량 데이터를 다루는 빅데이터 분석에서 시각화는 필수이다.- 탐색적 분석을 할 때 시각화는 필수이다.- SNA 분석(사회연결망 분석)을 할 때 자주 활용된다.* 공간분석(GIS)- 공간분석(Spatial Analysis)은 공간적 차원과 관련된 속성들을 시각화하는 분석이다.- 지도 위에 관련 속성들을 생성하고 크기, 모양, 선 굵기 등으로 구분하여 인사이트를 얻는다.* 탐색적 자료 분석 (EDA)- 탐색적 분석은 다양한 차원과 값을 조합해가며 특이한 점이나 의미 있는 사실을 도출하고 분석의 최종 목적을 달성해가는 과정으로 데이터의 특징과..
-
[ADsP] 2과목 데이터 분석 기획 - 요약 정리ADsP 2021. 2. 27. 20:50
1. 데이터 분석 기회의 이해 1_1. 분석 기획 방향성 도출* 데이터 사이언티스트 3가지 영역1) 수학/통계학적 지식2) 정보 기술(IT기술, 해킹기술, 통신기술 등)3) 비즈니스* 분석의 대상(What)과 분석의 방법(How)에 따른 분석 유형 4가지1) 최적화(Optimization) What-known, How-known2) 통찰(Insight) What-unknown, How-known3) 해법(Solution) What-known, How-unknown4) 발견(Discovery) What-unknown, How-unknown* 목표 시점별 분석 기획 방안1) 과제 중심적인 접근 방식 : 당면한 과제를 빠르게 해결목표 - Speed & Test, 과제유형 - Quick-Win, 접근방식 - P..
-
[ADsP] 1과목 데이터 이해 - 요약 정리ADsP 2021. 2. 27. 20:47
1. 데이터의 이해1_1. 데이터와 정보* 데이터의 정의1) 데이터(Data)라는 용어는 1646년 영국 문헌에 처음 등장하였으며 라틴어인 dare(주다)의 과거 분사형으로 ‘주어진 것’이란 의미로 사용되었다.2) 1940년대 이후 컴퓨터 시대 시작과 함께 자연 과학뿐만 아니라 경영학, 통계학 등 다양한 사회 과학이 진일보하며, 데이터의 의미는 과거의 관념적이고 추상적인 개념에서 기술적이고 사실적인 의미로 변화되었다.3) 데이터는 추론과 추정의 근거를 이루는 사실이다. ㅂ(옥스퍼드 대사전)4) 데이터는 단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호관계 속에서 가치를 갖는 것으로 설명되고 있다. * 데이터의 유형1) 정성적 데이터(Qualitative Data)- 저장, 검색, 분석에 많은 비용이 ..
-
[Java] 11주차 과제 : 자바의 열거형Java/온라인 자바 스터디 2021. 1. 24. 15:52
목표자바의 열거형에 대해 학습하세요. 학습할 것 (필수)enum 정의하는 방법enum이 제공하는 메소드 (values()와 valueOf())java.lang.EnumEnumSet enum 정의하는 방법자바에서는 enum 키워드를 사용하여 열거체를 정의할 수 있다. 문법enum 열거체이름 {상수1이름, 상수2이름, ...}예제enum Rainbow {RED, ORANGE, YELLOW, GREEN, BLUE, INDIGO, VIOLET} 사용열거체이름.상수이름예제Rainbow.RED 열거체의 상수 값 정의 및 추가정의된 열거체의 첫 번째 상수 값은 0부터 설정되며, 그 다음은 바로 앞의 상수 값보다 1만큼 증가되면 설정된다. 또한, 불규칙한 값을 상수 값으로 설정하고 싶으면 상수의 이름 옆에 괄호(())..
-
[Java] 10주차 과제 : 자바의 멀티쓰레드 프로그래밍Java/온라인 자바 스터디 2021. 1. 23. 20:10
목표자바의 멀티쓰레드 프로그래밍에 대해 학습하세요. 학습할 것 (필수)Thread 클래스와 Runnable 인터페이스쓰레드의 상태쓰레드의 우선순위Main 쓰레드동기화데드락 Thread 클래스와 Runnable 인터페이스쓰레드를 구현하는 방법은 Thread클래스를 상속받는 방법과 Runnable인터페이스를 구현하는 방법, 모두 2가지가 있다. 이 두 가지 방법 중 어는 쪽을 사용해도 별 차이는 없지만 Thread클래스를 상속받으면 다른 클래스를 상속받을 수 없기 때문에, Runnable인터페이스를 구현하는 방법이 일반적이다. Runnable인터페이스를 구현하는 방법은 재사용성(rEeusability)이 높고 코드의 일관성(consistency)을 유지할 수 있다는 장점이 있기 때문에 보다 객체지향적인 방법..