#48_140821_R

728x90

# COUNT

l count를 위한 환경설정

1. 홈페이지 접속

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

2. windows x64 다운

3. library 설치

install.packages("KoNLP")

install.packages("wordcloud")

install.packages("plyr")

library(KoNLP)

library(wordcloud)

library(plyr)

4. R 프로그램 다시 시작

n 예제 활용

> emp <- read.csv("emp.csv",header=TRUE)

> count(emp$job)

x freq

1 ANALYST 2

2 CLERK 5

3 MANAGER 3

4 PRESIDENT 1

5 SALESMAN 4

useSejongDic()

- 사전활용

mergeUserDic(data.frame(c('안철수', '박근혜', '문제인'), c('nqpc'))) # 추가 시키고 싶은

- 없는 단어 추가

nouns <- extractNoun(ahn)

- 단어단위로 추출

nouns <- nouns[nchar(nouns)>=2]

- 2번 잇아 반복되는 단어를 변수에 담는다

cnouns <- count(nouns)

- 단어의 개수를 센다

> cnouns

x freq

1 18 1

2 30 1

3 가계부채 1

4 가능 2

5 가능성 1

6 가장 1

7 가치 1

8 각자 1

9 감당 1

10 강력 1

11 개인 1

useSejongDic()

mergeUserDic(data.frame(c('안철수', '박근혜', '문제인'), c('nqpc'))) # 추가 시키고 싶은

nouns <- extractNoun(ahn)

nouns <- nouns[nchar(nouns)>=2]

cnouns <- count(nouns)

pal <- brewer.pal(6,"Dark2")

pal <- pal[-(1)]

windowsFonts(malgun=windowsFont("맑은 고딕"))

data.table(words=cnouns$x, freq=cnouns$freq)

wordcloud(words=cnouns$x, freq=cnouns$freq, colors=pal, min.freq=3,

random.order=F, family="malgun")

저작자표시 비영리 변경금지 (새창열림)

'빅데이터과정 > R' 카테고리의 다른 글

#49_140822_R_BAR PLOT (0)	2014.08.22
#48_140821_R_SUBQUERY (0)	2014.08.21
#48_140821_R_JOIN (0)	2014.08.21
#48_140821_R_GROUP 함수 (1)	2014.08.21
#47_140819_R_함수 (0)	2014.08.19

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

.

#48_140821_R_COUNT

# COUNT

'빅데이터과정 > R' 카테고리의 다른 글

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역

#48_140821_R_COUNT

# COUNT

'빅데이터과정 > R' 카테고리의 다른 글

'빅데이터과정/R' Related Articles

티스토리툴바

단축키

내 블로그

블로그 게시글

모든 영역