[R 기초] Command #명령어 #R 기초 #R 구문 #R studio #Command #함수
R 구문 중에 필수, 자주 사용하는 명령어들을 계속해서 업데이트 할 예정입니다.
Ctrl + Enter 또는 Alt + Enter
R 스튜디오에서 각 라인별 또는 드래그 앤 드랍으로 블럭을 지정한 후 Ctrl + Enter 시 스크립트를 실행함
Tab
R 스튜디오에서 자동완성 기능 제공
#
R 스튜디오에서 주석 (라인)
Operators
+, -, *, ^, %*%(matrix muliplication 행렬곱), %/%(remainder) |
mathematical |
>, >=, <, <=, ==, != |
relational |
!, &, | |
logical |
<-, = |
assignment |
$ |
List indexing |
: |
sequencing |
- 변수에 assign은 <- 연산자를 많이 사용함
- List의 인덱싱 예를 들면 리스트 list$name 로 해당 리스트내의 원소에 접근
- 1씩 증가하는 시퀀스 값을 만듬 예를 들어 1:3 은 1 2 3
기본 함수들 *파란색은 스크립트, 검정색은 결과값입니다
print() 변수에 있는 값을 확인 예) a <- 1 print(a) [1] 1 |
save() |
rm() 생성된 R 객체 삭제 예) rm(a) |
load() 외부에 저장된 .RData파일에서 R 객체를 읽어와 메모리에 올림 예) load("C:/adata.RData") print(a) [1] 1 |
write.csv() 외부 csv파일로 현재 객체를 data frame형태로 변형하여 저장 예) write.csv(a, file="c:/adata.csv") | read.csv() 외부 csv파일 데이터를 data frame형태로 읽어와 메모리에 올림 예) a <- read.csv("c:/adata.csv") |
str() R 객체의 구조 표현함 예) str(a) num 1 |
summary() 최소값, 최대값, 중간값, 평균값 등을 계산해줌 numeric vector만 가능 예) a <- c(1:3) summary(a) Min. 1st Qu. Median Mean 3rd Qu. Max. 1.0 1.5 2.0 2.0 2.5 3.0 |
boxplot() 변수의 범위와 쏠림을 다른 변수와 비교 표현 예) a <- c(1,2,3) boxplot(a)
|
hist() numeric vector에 대해 히스토그램을 그려줌 예) a<-c(1,2,3) hist(a)
|
var() 평균 주변으로 널리 퍼진 데이터를 의미함 예) a <- c(1,2,3,4) var(a) [1] 1.666667 |
sd() 값이 얼마나 다른가를 의미함 예) a <- c(1,2,3,4) sd(a) [1] 1.290994 |
table() 일원배치표 입력한 항목의 빈도수를 계산해줌 예) names <- c("Yoon","Kim","Park") genders<- factor(c("Male","Female","Male")) subjectDF <- data.frame(names,genders) table(subjectDF$genders) Female Male 1 2 | prop.table() 예) names <- c("Yoon","Kim","Park") genders<- factor(c("Male","Female","Male")) subjectDF <- data.frame(names,genders) model_table M <- table(subjectDF$genders) prop.table(model_table) Female Male 0.3333 0.6666 |
plot() R 객체의 데이터를 x y 좌표상의 점으로 시각화 예) eng <- c(80,90,100) math<-c(75,85,95) subjectDF1 <- data.frame(eng,math) plot(subjectDF1$eng, subjectDF1$math) | head() 벡터, 매트릭스, 테이블, 데이터 프레임 등의 첫번째 6 라인 보여줌 예) head(iris) Sepal.Length Sepal.Width Petal.Length Petal.Width Species 1 5.1 3.5 1.4 0.2 setosa 2 4.9 3.0 1.4 0.2 setosa 3 4.7 3.2 1.3 0.2 setosa 4 4.6 3.1 1.5 0.2 setosa 5 5.0 3.6 1.4 0.2 setosa 6 5.4 3.9 1.7 0.4 setosa tail() 뒤에서부터 6개 데이터 보여줌 |
install.package() 4200여개의 다양한 패키지들을 선택하여 다운받는 함수 예) install.package("gmodels") | library() 예) library(gmodels) |
typeof() 데이터 형태 확인 예) x<-3 typeof(x) "double" | class() 예) x<-3 class(x) "numeric" |
is.integer() 데이터가 정수형인지 확인 예) is.integer(x) FALSE | as.integer() 예) typeof(as.integer(x)) "integer" |
ls() 예) ls() "x" | sum() 전달인자의 합 계산 예) sum(c(1,2,3)) 6 |
seq() , 1:5 예) seq(from=1, to=10, by=2) 1 3 5 7 9 1:5 1 2 3 4 5 | help() 또는 ? help.search() 또는 ?? 해당 키워드를 쓰는 함수들 찾아줌 예) help(seq) 또는 ?seq 또는 help(package ="datasets") helphearch("mean") 또는 ??mean R 스튜디오의 Help 탭 본인 PC의 웹브라우저가 열리며 도움말 |
example() 해당 키워드를 사용하는 예제 찾아줌 예) example("mean") mean> x <- c(0:10, 50) mean> xm <- mean(x) mean> c(xm, mean(x, trim = 0.10)) [1] 8.75 5.50 | c() combine, 기존 벡터를 결합하여 새로운 벡터를 생성하는 함수 예) c(1, 2, c(3, 4)) 1, 2, 3, 4 |
rep() 벡터를 반복시켜 새로운 벡터를 생성 예) x <-c(1,2,3) rep(x, times=2) 1 2 3 1 2 3 rep(x, each=2) 1 1 2 2 3 3 | names() 벡터의 이름을 확인하거나 수정함 예제) height <- c(80,90,100) names(height) <- c("A", "B", "C") height A B C 80 90 100 names(height) "A" "B" "C" |
sample() 랜덤수 예제) sample(45, 6) 7 35 43 21 24 5 sample(10, 3, prob=(1:10)/55) 5 2 10 | sort() 예제) sort(sample (45, 6) 5 7 21 24 35 43 |
length() 벡터의 원소 갯수 예제) x<-c(1,2,3) length(x) 3 | which() 조건에 맞는 벡터의 원소 인덱스를 알려줌 예제) x<- c(1,2,3,4) which(x>2) 3 4 |
* 위 명령어들을 테스트하기 위해서는 예)에 들어있는 변수 선언 및 데이터 할당을 순서대로 입력해야 합니다.
안되거나 궁금한 점이 있으면 댓글 남겨주세요
'Data > R' 카테고리의 다른 글
[R]4.소셜 네트워크 감정 분석 sentiment analysis (6) | 2016.02.19 |
---|---|
[R]3. 결정 트리 Classification (9) | 2016.02.10 |
[R]2. 데이터 클러스터링 k-means 알고리즘 (4) | 2016.02.10 |
[R]1. 문서의 유사도 tdm, cosine similarity (2) | 2016.02.09 |
[R 기초] 개요, 기초 데이터 구조 (0) | 2016.02.09 |