자격증
-
SQL자격증/SQLD 2023. 11. 16. 22:31
연산 순서 From -> Where Group by -> Having Select -> Order by DISTINCT - Select distinct A, B from table -> {a,b} 둘 다 같아야 제거됨 Alias - Select col1 as A from table - as 생략 가능 - 별칭은 where절에서 사용 불가 ex) select A+B as SUM from table where SUM > 1000 에러발생 Limit * RANK() = 1,1,3,4 DENSE_RANK = 1,1,2,3 ROW_NUMBER = 1,2,3,4 Order by - 느림 - order by a2, a1 desc -> a2 오름차순 이후 a1 내림차순 - order by 2,1 desc - 컬럼명, ..
-
데이터 모델링자격증/SQLD 2023. 11. 15. 19:16
데이터 모델링 - 현실 세계를 단순화하여 표현하는 것 - 추상화, 단순화, 정확화 + 명확성 - 중복, 비유연성(데이터의 정의와 사용 분리), 비일관성(데이터간의 상호 연관관계), * 데이터 모델링은 단순히 db 구축뿐만 아니라 이후 업무 분석에서도 사용됨 데이터 모델링 = 개념 -> 놀리 -> 물리 스키마 = 외부 -> 개념 -> 내부 (사용자 -> 설계자 -> 개발자 관점) 데이터 모델링 3요소 - 엔터티 (사각형) - 관계 (마름모) - 속성 (타원) 엔터티의 필수 조건 1. 업무에서 필요해야함 2. 속성이 무조건 있어야 함 3. 다른 엔터티와 관계가 무조건 있어야 함 4. 유일한 식별자를 지님 5. 영속적으로 존재하는 인스턴스 어쩌구 = 한개가 아닌 2개 이상 싱글톤 엔터티의 종류 기본 엔터티 =..
-
3-3. 분류 / 군집 / 연관성 분석자격증/ADSP 2023. 10. 20. 18:22
데이터 마이닝 - 대용량 데이터에서 의미있는 패턴을 찾아내는 것 - 목적 설정 -> 데이터 준비 -> 데이터 가공 -> 기법 적용 -> 검증 데이터 마이닝의 6가지 기능 - 분류, 추정, 예측, 연관분석, 군집, 기술 * 분류 = 범주, 이산 추정 = 연속, 수치 에측 = 미래를 분류, 추정 데이터 마이닝의 5단계 1) 목적 설정 : (필요) 데이터 정의 2) 데이터 준비 : 데이터 정제 3) 데이터 가공 : 데이터 가공 + 목적변수 4) 기법 적용 : 정보 추출 (데이터 마이닝) 5) 검증 : ROI 분석 방법 지도 학습 - 의사 결정 나무 - 인공 신경망 (ANN) - 일반화 선형 모형 (GLM) - 회귀분석 - 로지스틱 회귀분석 - 사례 기반 추론 - 최근접 이웃법 (KNN) 비지도학습 - OLAP..
-
3-2. 통계자격증/ADSP 2023. 10. 20. 09:38
전수 조사(census) 표본 조사 - 모집단(population) - 조사하고자 하는 집단의 전체 - 원소(element) - 모집단을 구성하는 개체 - 표본(sample) - 모집단으로부터 추출한 일부 원소 - 모수(parameter) - 표본 관측을 통해 구하고자 하는 모집단의 정보 (평균, 분산) 표본 추출 방법 1) 단순 랜덤 추출법 2) 계통 추출법 - k개씩 n개의 구간을 나눔 3) 집락 추출법 - 군집을 구분하고 일부 집락을 랜덤 추출 4) 층화 추출법 - 유사한 원소끼리 층을 나누고 각 층에서 랜덤 추출 집락 추출 - 3학년생 중 1반 설문 -> 한 반은 한 학년을 대표할 수 있음 층화 추출 - 1,2,3학년 대표를 뽑아 설문 -> 한 학년은 전체 학년을 대표할 수 없음 측정 척도 1)명..
-
3-1. R 프로그래밍자격증/ADSP 2023. 10. 19. 12:24
새 R 프로그램 만들기 - 마이컴파일러 - myCompiler 실행 코드 코드 저장 기존 코드를 유지하시겠습니까? 에디터에 코드가 있는 동안 언어를 전환하려고 합니다. 이를 유지하려면 “기존 코드 유지”를 선택합니다. 예제로 바꾸려면 “예제로 바 www.mycompiler.io 1) 자료구조 데이터 유형 - 숫자, 논리, 문자 데이터 구조 - 스칼라: 값이 하나 - 벡터 : 값이 하나 또는 여러개, 1차원 - 행렬 : @ + 2차원 - 배열 : @ + n차원 - 데이터 프레임 : 행렬, 단 열마다 다른 자료형을 지닐 수 있음 - 리스트 : 해적왕 - 팩터 : 범위값 * NA = 결측치, 결측값 벡터나 행렬은 모두 같은 자료형을 지닌다. 논리 벡터 + 숫자 벡터 = 숫자 벡터 논리 + 숫자 + 문자 벡터 ..
-
2. 데이터 분석 기획자격증/ADSP 2023. 10. 19. 01:00
2-1 분석 기획 분석 기획 - 분석 수행 전 과제를 정의하고, 의도한 결과 도출을 위한 관리 방안을 사전에 계획 분석의 4가지 유형 목표 시점별 분석 기획 방안 - 과제 중심적인 접근 방식 - Speed, Test, Quick, Win + Problem Solving - 장기적인 마스터 플랜 방식 - Accuracy(정확성), Deploy(전개), Long Term View + Problem Definition *둘을 융합하여 적용하는 것이 중요 분석 기획시 고려 사항 - 가용 데이터 (Available Data) - 유즈케이스 탐색 - 장애 요소에 대한 사전 계획 수립 (Low Barrier of Execution) ===============================================..
-
1.데이터 이해자격증/ADSP 2023. 10. 18. 11:58
1-1 데이터 데이터 유형 - 정성적 데이터: 언어, 문자 = 비정형(주관적) = 통계 분석 어려움 - 정량적 데이터: 수치, 도형, 기호 = 정형(객관적) = 통계 분석 용이 지식 경영 - 암묵지: 학습과 경험을 통해 개인에게 축적/내면화된 지식 -> 조직의 지식으로 공통화 (개인 -> 조직) - 형식지: 문서나 매뉴얼처럼 표출화(형상화)된 지식 = 공유가 쉬움 = 개인의 지식으로 연결화 (조직 -> 개인) (공통 -> 표출 -> 연결 -> 내면) DIKW Data = 객관적인 사실 연필이 A마트는 100원 B마트는 200원 Information = 의미를 부여한 데이터 A마트가 더 싸다 Knowledge(지식) = 예측한 결과물 A마트에서 사야겠다 Widsom(지혜) = 창의적인 아이디어 A마트가 다..
-