반응형
반응형
모집단에서 복수의 표본을 무작위로 추출하면 모집단과 표본집단의 성질이 달라진다.예를 들어 한 고등학교의 학생들을 추출하는데 우연히 몸무게 상위10% 학생만 뽑힐 수도 있다. 이 경우 모집단과 표본집단의 평균, 표준편차 등의 성질이 달라진다는 것은 쉽게 알 수 있다.이러한 차이를 극복하기 위하여 확률의 개념이 이용된다.사상 : 시행 결과 중 조건에 맞는 집합.전사상 : 모든 시행 결과의 집합.ex) 주사위를 1번 던졌을 때 짝수가 나올 확률은?사상 : 2, 4, 6 ->3개전사상 : 1, 2, 3, 4, 5, 6 -> 6개즉 3/6=1/2(다만 위와같이 사상의 개수/전사상의 개수로 확률을 구할 때에는 모든 결과의 확률이 같아야 함. 마치 로또에 당첨될 확률은 1/2이다! 라고 주장하지 말아야 한다는 뜻) ..
숫자함수 - 엑셀을 써봤다면 익숙한 함수들round(반올림), trunc(버림), mod(나머지) 날짜함수sysdate : 데이터베이스 서버의 날짜 및 시간 반환.select sysdate from dual; 로 간단히 조회.months_between(date1, date2) : date1이 date2보다 늦으면 양수, 빠르면 음수add_months(date, n) : 날짜에 n만큼의 개월을 추가. 연수를 추가하는 건 없고 12개월로 계산하면 됨.next_day(date,x) : 미국방식의 날짜 정하기. 우리나라에서 쓸 일이 있는지는 모르겠는데 특이해서 다뤄봄.'오늘로부터 다가오는 x요일까지 마감을 해라.' 라는 뜻.-> 가장 가까운 x요일을 출력.(오늘의 요일과 x요일이 같다면 다음주 n요일인 것)1:..
시작하기전 ...현재 삼성멀티캠퍼스의 청년취업아카데미에서 데이터베이스를 배우고 있다. 이 과정에 대해 구글링해보았는데 아무런 정보가 없어 수강하는데 고민을 조금 했다. 과정이 끝나고 나면 간단히 후기를 올리겠다.지금까지 수업에서 리눅스(오라클 리눅스)에 오라클DB를 설치하여 SQL Developer에서 SQL문을 공부했다. 기초적인 SQL문 진도는 다 나갔다고 판단하여 블로그에 정리를 해보려고 한다. 다만 이 수업이 실습위주의 수업이라 데이터베이스 이론(모델링, 설계)는 충분히 다루지 못했다. 이 강좌가 다 끝나고 나면 스스로 독학할 생각이고, 그 내용도 정리해보는 시간을 가질 것이다. 다만 너무 쉽거나 정말로 기초적인 내용은 데이터베이스 교재를 보면 나오는 내용이므로 포스팅에서 제외하려고 했다.공부하면..
전 포스트에서 다루었듯이 기술통계는 수치, 그래프를 통하여 그 경향성과 성질을 살펴본다. 따라서 수치, 그래프에 대해서 어떤 용어가 사용중이고 어떤 의미가 있는지 알아보겠다. 1. 표와 그래프 기본 도수분포표 계급 도수(명) 51점~60점 0 61점~70점 10 71점~80점 25 81점~90점 11 91점~100점 4 합계 50 변량은 조사대상의 특징이나 성질을 문자나 숫자로 나타냄. 여기서 변량은 도수 계급은 데이터의 각 구간을 나타내고 도수는 빈도수와 같은 의미 히스토그램은 계급을 x축으로 하여 그린 그래프 상대도수분포표 총계를 1로 정하여 해당 계급의 상대적인 비율을 나타낸 표 계급 상대도수 51점~60점 0 61점~70점 0.2 71점~80점 0.5 81점~90점 0.22 91점~100점 0.0..
내가 배운 통계, 확률은 고등학교 시절 달달외운 분산, 표준편차, 콤비네이션 정도가 기억난다. 데이터 분석을 하려면 필수적으로 통계지식이 필요해서 처음부터 공부하고 있다. 현재는 , 을 이용하여 공부하고 있다. 나중에는 수리통계학도 다뤄보고싶다. 1. 통계학의 분류 통계학은 다음과 같이 분류할 수 있다. 1) 기술 통계학 : 수치, 그래프를 통하여 그 경향성과 성질을 살펴본다. 2) 수리 통계학 : 통계적인 현상을 확률적으로 받아들인다. 또 다음과 같이 분류할 수 있다. (1) 추측 통계학 : 빈도론(추정, 검정)과 베이즈통계로 이루어져 있다. 일부를 가지고 전체의 성질을 조사한다. (2) 다변량 해석 : 벡터와 행렬을 이용하여 조사 항목의 관계를 살펴본다. 2. 통계학의 탐구방법 통계학은 PPDAC 사..