6장 R 기초와 데이터 마트

R기초

  1. 결측값 처리하기

    na.omit() : NA 가 있는 행 전체 삭제

    na.rm() : NA 가 있는 연산에서 해당 값 제외

    boxplot() : 시각화 하기

    boxplot(수치형 자료 ~ 범주형 자료, 데이터명)

    0/0 의 R 출력값 : NaN

  2. 인덱싱

  3. 벡터의 연산

    x <- c(1,2,3)
    y <- c(1,2,3,4,5,6)
    x + y # = 2, 4, 6, 5, 7, 9
    
  4. 데이터의 종류

  5. 데이터 분포의 흩어짐 (산포)

  6. 대푯값의 비교 (평균, 중위수, 최빈치)

    Untitled

  7. boxplot(상자그림) ***

    Untitled

데이터 마트

  1. plyr 패키지
  2. reshape 패키지
  3. R의 특수한 기능 - 4가지 정규분포 관련 함수
  4. 자료의 척도 ***
  5. 이상값 ***

7장 통계분석

  1. 조건부 확률과 독립법칙

    Untitled

    Untitled

    → 수식변환 베이즈의 정리

  2. 확률변수 : 표본공간 내에 있는 각 원소의 **실수값**을 대응시키는 함수

    Untitled