Gerando nuvem de palavras no R

Gerando nuvem de palavras no R

As nuvens de palavras têm sido utilizadas em trabalhos acadêmicos para a realização de análises qualitativa que consiste em usar tamanhos e fontes de letras diferentes de acordo com a frequência das ocorrências das palavras no texto analisado (CARVALHO; 2012). Neste post demonstraremos um exemplo da geração da nuvem de palavras no R.

Os dados foram gerados a partir de uma consulta realizada na base Scopus, onde utilizaremos as palavras-chave presentes nos trabalhos , e podem ser acessados aqui.

Com os dados em mãos é necessário gerar a frequência das palavras, onde foi desenvolvido um arquivo CSV através do Excel, futuramente demonstraremos como gerar a frequência no R para a nuvem de palavras. O arquivo com a  frequência das palavras pode ser acessado aqui.

Com os dados prontos, agora basta executar poucos comandos no R. Primeiramente é necessário a utilização da biblioteca wordcloud através do comando:

library(wordcloud)

Caso a biblioteca não esteja instalada, execute o comando a seguir:

library(wordcloud)
install.packages("wordcloud")

Posteriormente será gerada gerada a variável nuvem. onde será escolhido o arquivo de frequências:

library(wordcloud)
install.packages("wordcloud")
nuvem = read.csv(file.choose(), header =T, sep=";")

Para gerar a nuvem é necessário só um comando:

library(wordcloud)
install.packages("wordcloud")
nuvem = read.csv(file.choose(), header =T, sep=";")
wordcloud(words = nuvem$palavra, freq = nuvem$frequencia)
Figura 1: Nuvem de palavras gerada

Figura 1: Nuvem de palavras gerada

Para uma melhor visualização pode ser executado o comando a seguir:

library(wordcloud)
install.packages("wordcloud")
nuvem = read.csv(file.choose(), header =T, sep=";")
wordcloud(words = nuvem$palavra, freq = nuvem$frequencia
wordcloud(words = nuvem$palavra, freq = nuvem$frequencia,min.freq = 1, random.order = TRUE,colors=brewer.pal(8,"Dark2"), use.r.layout=TRUE, rot.per= 0.5)

Que pode ser visualizada na Fig. 2:

Figura 2: Nuvem de palavras gerada

Figura 2: Nuvem de palavras gerada

 

Muito simples não é mesmo? Por hoje é só.

 

REFERÊNCIAS

CARVALHO JR, Paulo Marcodes et al. Avaliação do programa de residência multiprofissional em saúde da família: uma análise qualitativa através de duas técnicas. Revista Hospital Universitário Pedro Ernesto, Rio de Janeiro, v. 11, n. supl 1, p. 114-119, 2012.

wordcloud – CRAN: https://cran.r-project.org/web/packages/wordcloud/wordcloud.pdf

Cristiano Manhães de Oliveira

Engenheiro/ Desenvolvedor Mestre em Engenharia de Produção e Doutorando em Cognição e Linguagem Contato: cristiano@destart.com.br

Deixe uma resposta