결측값 처리하기
na.omit() : NA 가 있는 행 전체 삭제
na.rm() : NA 가 있는 연산에서 해당 값 제외
boxplot() : 시각화 하기
boxplot(수치형 자료 ~ 범주형 자료, 데이터명)
0/0 의 R 출력값 : NaN
인덱싱
iris[1]irirs$Sapal.Lengthiris[,1]벡터의 연산
x <- c(1,2,3)
y <- c(1,2,3,4,5,6)
x + y # = 2, 4, 6, 5, 7, 9
데이터의 종류
한가지 유형 데이터 타입만 가능한 것은? 벡터, 행렬, 배열
복수의 데이터 타입(복합형)? 리스트, 데이터프레임, 데이터 테이블
NA, NaN, NULL
NA : 결측값
NaN : 수학적으로 불가한 수를 표시
NULL : 데이터 유형과 자료가 비어있는 값
set.seed() : 난수 발생시 동일한 난수가 발생되도록 초기화하는 R 함수
데이터 분포의 흩어짐 (산포)
대푯값의 비교 (평균, 중위수, 최빈치)

평균 = 중위수 = 최빈치boxplot(상자그림) ***

melt(), cast() 만을 사용하여 데이터를 재구성하거나 밀집화된 데이터를 유연하게 생성해줌
melt() : 데이터의 구조를 바꿈정규분포 관련 함수
*r* norm (난수 함수)*d* norm (확률 밀도 함수)*p* norm (누적 분포 함수)*q* norm (분위수 함수)ESD 의 경우 평균으로부터 3배 표준편차만큼 떨어져 있는 값을 이상값으로 판단조건부 확률과 독립법칙
조건부 확률의 정의

응용 및 독립 배반


→ 수식변환 베이즈의 정리
확률변수 : 표본공간 내에 있는 각 원소의 **실수값**을 대응시키는 함수
