본문 바로가기

빅데이터과정/R

#48_140821_R_COUNT

728x90

# COUNT



 

count를 위한 환경설정


 

1.     홈페이지 접속

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

 

2.     windows x64 다운

 

3.     library 설치

install.packages("KoNLP")

install.packages("wordcloud")

install.packages("plyr")

library(KoNLP)

library(wordcloud)

library(plyr)

 

4.     프로그램 다시 시작

 

 

 




예제 활용


> emp <- read.csv("emp.csv",header=TRUE)

> count(emp$job)

          x freq

1   ANALYST    2

2     CLERK    5

3   MANAGER    3

4 PRESIDENT    1

5  SALESMAN    4

 

useSejongDic()

사전활용

mergeUserDic(data.frame(c('안철수', '박근혜', '문제인'), c('nqpc')))  #  추가 시키고 싶은

없는 단어 추가

nouns <- extractNoun(ahn)  

단어단위로 추출

nouns <- nouns[nchar(nouns)>=2]

2번 잇아 반복되는 단어를 변수에 담는다

cnouns <- count(nouns)

단어의 개수를 센다

> cnouns

               x freq

1             18    1

2             30    1

3       가계부채    1

4           가능    2

5         가능성    1

6           가장    1

7           가치    1

8           각자    1

9           감당    1

10          강력    1

11          개인    1

 

useSejongDic()

mergeUserDic(data.frame(c('안철수', '박근혜', '문제인'), c('nqpc')))  #  추가 시키고 싶은

nouns <- extractNoun(ahn)  

nouns <- nouns[nchar(nouns)>=2]

cnouns <- count(nouns)

 

pal <- brewer.pal(6,"Dark2")

pal <- pal[-(1)]

 

windowsFonts(malgun=windowsFont("맑은 고딕"))

data.table(words=cnouns$x, freq=cnouns$freq)

 

wordcloud(words=cnouns$x, freq=cnouns$freq, colors=pal, min.freq=3,

          random.order=F, family="malgun")

 


 

 

 

 

'빅데이터과정 > R' 카테고리의 다른 글

#49_140822_R_BAR PLOT  (0) 2014.08.22
#48_140821_R_SUBQUERY  (0) 2014.08.21
#48_140821_R_JOIN  (0) 2014.08.21
#48_140821_R_GROUP 함수  (1) 2014.08.21
#47_140819_R_함수  (0) 2014.08.19