본문 바로가기

하나. 빅데이터 머신러닝 /> R3

[R] 워드 클라우드 만들기 텍스트 마이닝이란? (Text mining) install.packages("rJava") #r에서 Java를 사용한 패키지 사용 install.packages("memoise") #koNLP패키지가 사용하는 패키지 install.packages("KoNLP") #한국어 자연어 처리 install.packages("stringr") #문자열을 처리하는 여러가지 함수를 가지고 있는 패키지 install.packages("wordcloud") #워드클라우드를 그려주는 패키지 - 문자로 된 데이터에서 가치 있는 정보를 얻어 내는 분석 기법 - 분석절차 형태소 분석 명사, 동사, 형용사 등 의미를 지는 품사 단어 추출 빈도표 만들기 시각화 텍스트 마이닝 준비하기 Java 다운로드 및 설치 자바 다운로드 : ht.. 2019. 10. 1.
[R] ggplot2 활용하여 막대그래프 그리기 막대그래프란? - 데이터의 크기를 막대의 길이로 표현한 그래프. - 집단간의 차이를 표현할 때 활용 막대그래프 그리기 R코드 search() # 라이브러리 로드 사항 확인 library(dplyr) library(ggplot2) #ggplot2 ::mpg 데이터 프레임 사용 str(mpg) # 자동차 구동방식 (drv)별 연비차가 있는지 비교. df_mpg% group_by(drv) %>% summarise(mean_cty = mean(cty)) df_mpg # 막대그래프 그리기 # X축의 데이터 순서를 y축의 값에 따라서 정렬하면 # 막대 그래프를 크기 순서로 보여줄 수 있음. ggplot(data = df_mpg, mapping = aes(x = reorder(drv,-mean_cty), y = me.. 2019. 9. 27.
박스플롯 (Box Plot) 박스플롯이란? 최댓값, 최솟값, 중앙값, 사분편차를 사용하여 자료의 측정값들이 어떤 모양으로 분포되어 있으며, 극단값들은 어떠한지 등을 쉽게 알 수 있도록 하는 그림이다. 정확한 명칭은 skeletal box-and-whisker plot. 박스플롯 구성요소 박스플롯은 박스와 박스 바깥의 선 (Whisker)로 이루어져 있다. > 박스플롯을 그리는 방법에 대해서는 여러가지 설명이 있지만, R에서 그려지는 박스플롯에 대한 값은 위의 표가 가장정확하게 나타내어주는 듯 하다. 구분 설명 Whisker 상자의 좌우, 또는 상하로 뻗어나간 선 박스 내부의 가로선 중앙값 (median) Lower whisker Maximum observation below upper fence Upper whisker Minimu.. 2019. 9. 26.