Aula muito boa, Samuel. Obrigada pelo conteúdo! Estou com uma dúvida sobre a ACP. Tem alguma recomendação acerca do quantidade de observações e variaveis para que se tenha um resultado confiavel?
Obrigado Débora. Sobre o tamanho da amostra, o ideal seria de 10 vezes mais observações do que o número de variáveis. É aceitável uma relação de 5 observações para cada variável, segundo Hair et al. (2009, p. 108), Análise Multivariada de Dados, 6 ed.
Muito didática sua aula professor, mas infelizmente ainda não consegui sanar minhas dúvidas com relação a análise multivariada, caso eu quisesse que os dados dos Estados (UF) também fossem relacionados com os outros dados (pib...), ou seja, um gráfico biplot ou análise de correspondência?
Bianca, não entendi muito bem a sua pergunta. Qual o seu objetivo? Se você quer relacionar dados talvez a regressão múltipla seja uma alternativa em que você pode ter o PIB como variável dependente e os escores/fatores podem ser utilizados para explicar o PIB.
Boa noite, Samuel Campos, desde já, parabéns pelo vídeo, muito bom mesmo. No momento minha dificuldade está sendo em formatar os gráficos. No caso, no vídeo o senhor mostrou muito bem como formatar o gráfico que tem o circulo, que eu conheço como gráfico de loadings, mas antes dele, se clicarmos na seta da janela onde mostra os "plots", tem um outro gráfico que mostraria os principais agrupamentos da PCA, que conheço como gráfico de Scores. Gostaria de saber se poderias me dizer como formatar ele para aparecer, por exemplo, os nomes dos meus respectivos pontos amostrais?? Já tentei de todo jeito mas não consigo. Eu consegui aprender a realizar a projeção em 3D e formatar perfeitamente, mas para o 2D (PC1 x PC2) não consegui.
Emerson, bom dia. Primeiramente obrigado. Sobre sua dúvida, não tenho certeza se entendi muito bem. Por favor, veja se algumas das opções abaixo te ajudam: #1 library(factoextra) fviz_pca_ind(res.pca, pointsize = "cos2", pointshape = 21, fill = "#E7B800", repel = TRUE # Evita sobreposição do texto ) #2 library(factoextra) fviz_pca_ind(res.pca, col.ind = "cos2", gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"), repel = TRUE # # Evita sobreposição do texto (lento com muitos pontos) ) #Nomeie as linhas com os nomes das suas variáveis. #Usando a UF da rotina de exemplo: pib.r
@@SamuelCampos009 muito obrigado, professor. Irei usar os comandos que me enviou. Qualquer coisas se tiveres algum e-mail para que eu poça lhe enviar os gráficos para o senhor dar uma olhada, agradeço muito.
Maria, obrigado! Que bom que gostou. Sobre sua dúvida, considerando todas as variáveis e nomes utilizados no vídeo, o gráfico padrão é obtido por meio do comando: fviz_pca_var(res.pca, #nome do objeto que foi salvo os resultados col.var = "black" , repel = TRUE, # Evita que o texto se sobreponha title = "Círulo de correlação, variáveis x PC" #título ) Para colorir basta utilizar a opção gradient.cols = c() e modificar o valor em col.var, que pode ser alterado para "cos2", "contrib", "coord", "x" or "y". Na documentação de ajuda do pacote/função explica que "Neste caso, as cores para indivíduos / variáveis são automaticamente controladas por suas qualidades de representação ("cos2"), contribuições ("contrib"), coordenadas (x ^ 2 + y ^ 2, "coord"), valores x (" x ") ou valores y (" y "). Para usar a coloração automática (por cos2, contrib, ....), certifique-se de que habillage = "none"." Na rotina acima, poderíamos ter, por exemplo fviz_pca_var(res.pca, #nome do objeto que foi salvo os resultados col.var ="x" , repel = TRUE, # Evita que o texto se sobreponha gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"), title = "Círulo de correlação, variáveis x PC" #título ) Os três elementos c("#00AFBB", "#E7B800", "#FC4E07") são as cores em código hexadecimal. Você pode acessar outras cores em celke.com.br/artigo/tabela-de-cores-html-nome-hexadecimal-rgb e trocar o código pelo que achar melhor. Você pode retirar e trabalhar com apenas dois códigos (cores) ou incluir mais cores se preferir. Abs.
Cara, como eu faço para padronizar os dados no R? Outra pergunta: Na literaturara recomenda usar a matriz de correlação ao invés da matriz de covariância para encontrar o PCA. Por quê?
Oi, quando eu jogo: fviz_pca_var(res col.var = "cos2", gradiente.cols = c("#00AFBB", "E7B800", "FC4E07"), repel = TRUE Diz que tem um erro inesperado, você poderia me ajudar? Até antes eu consegui fazer, mas quando chega nessa parte dá erro no símbolo.
Olá, acredito que esteja faltando uma vírgula entre o "res" e o "col.var" em "fviz_pca_var(res col.var ". Tente fviz_pca_var(res, col.var = "cos2", gradiente.cols = c("#00AFBB", "E7B800", "FC4E07"), repel = TRUE)
@@meugeniaaso está correto. Coloque seu email aqui que eu envio um email dele pra você e você responde a ele. Talvez você tenha colocado "ponto" no final do e-mail. Tente: samuelcampos@id.uff.br (sem ponto final)
Excelente, muito conciso e didático!
Obrigado 😃
Muito obrigado. Estou tendo aulas de econometria com R e ver o seu vídeo com o passo-a-passo ajudou muito. Vlw!
Que bom que ajudou
Muito bom, Samuel. Gostei da sua clareza e didática. Obrigado por compartilhar o seu conhecimento conosco.
Disponha!
Vídeo muito bom, bem explicado. Parabéns pelo trabalho.
Muito legal!! Bastante didático!!!
Parabéns pelo trabalho!!
Obrigado!
Excelente!! Obrigada pela aula
Obrigado!
Excelente, claro e conciso. Obrigado.
Muitissimo Obrigado man, esse video ajudou muito e muito mesmo/ Gratis ya
Que bom que ajudou :)
Aula excelente. Poderia me ajudar a alterar a fonte dos rótulos das variáveis dentro do círculo para 'Times New Roman'?
Muito bom!!!!
Aula muito boa, Samuel. Obrigada pelo conteúdo! Estou com uma dúvida sobre a ACP. Tem alguma recomendação acerca do quantidade de observações e variaveis para que se tenha um resultado confiavel?
Obrigado Débora. Sobre o tamanho da amostra, o ideal seria de 10 vezes mais observações do que o número de variáveis. É aceitável uma relação de 5 observações para cada variável, segundo Hair et al. (2009, p. 108), Análise Multivariada de Dados, 6 ed.
Muito didática sua aula professor, mas infelizmente ainda não consegui sanar minhas dúvidas com relação a análise multivariada, caso eu quisesse que os dados dos Estados (UF) também fossem relacionados com os outros dados (pib...), ou seja, um gráfico biplot ou análise de correspondência?
Bianca, não entendi muito bem a sua pergunta. Qual o seu objetivo? Se você quer relacionar dados talvez a regressão múltipla seja uma alternativa em que você pode ter o PIB como variável dependente e os escores/fatores podem ser utilizados para explicar o PIB.
muito bom!
Boa noite, Samuel Campos, desde já, parabéns pelo vídeo, muito bom mesmo. No momento minha dificuldade está sendo em formatar os gráficos. No caso, no vídeo o senhor mostrou muito bem como formatar o gráfico que tem o circulo, que eu conheço como gráfico de loadings, mas antes dele, se clicarmos na seta da janela onde mostra os "plots", tem um outro gráfico que mostraria os principais agrupamentos da PCA, que conheço como gráfico de Scores. Gostaria de saber se poderias me dizer como formatar ele para aparecer, por exemplo, os nomes dos meus respectivos pontos amostrais?? Já tentei de todo jeito mas não consigo. Eu consegui aprender a realizar a projeção em 3D e formatar perfeitamente, mas para o 2D (PC1 x PC2) não consegui.
Emerson, bom dia. Primeiramente obrigado.
Sobre sua dúvida, não tenho certeza se entendi muito bem.
Por favor, veja se algumas das opções abaixo te ajudam:
#1
library(factoextra)
fviz_pca_ind(res.pca, pointsize = "cos2",
pointshape = 21, fill = "#E7B800",
repel = TRUE # Evita sobreposição do texto
)
#2
library(factoextra)
fviz_pca_ind(res.pca, col.ind = "cos2",
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
repel = TRUE # # Evita sobreposição do texto (lento com muitos pontos)
)
#Nomeie as linhas com os nomes das suas variáveis.
#Usando a UF da rotina de exemplo:
pib.r
@@SamuelCampos009 muito obrigado, professor. Irei usar os comandos que me enviou. Qualquer coisas se tiveres algum e-mail para que eu poça lhe enviar os gráficos para o senhor dar uma olhada, agradeço muito.
Emerson, meu e-mail é samuelcampos@id.uff.br.
Oi Samuel. Parabéns pelo canal e aula maravilhosa. Tenho uma dúvida, como posso "colorir" os gráficos de círculo? Abraço.
Maria, obrigado! Que bom que gostou. Sobre sua dúvida, considerando todas as variáveis e nomes utilizados no vídeo, o gráfico padrão é obtido por meio do comando:
fviz_pca_var(res.pca, #nome do objeto que foi salvo os resultados
col.var = "black" ,
repel = TRUE, # Evita que o texto se sobreponha
title = "Círulo de correlação, variáveis x PC" #título
)
Para colorir basta utilizar a opção gradient.cols = c() e modificar o valor em col.var, que pode ser alterado para "cos2", "contrib", "coord", "x" or "y". Na documentação de ajuda do pacote/função explica que "Neste caso, as cores para indivíduos / variáveis são automaticamente controladas por suas qualidades de representação ("cos2"), contribuições ("contrib"), coordenadas (x ^ 2 + y ^ 2, "coord"), valores x (" x ") ou valores y (" y "). Para usar a coloração automática (por cos2, contrib, ....), certifique-se de que habillage = "none"."
Na rotina acima, poderíamos ter, por exemplo
fviz_pca_var(res.pca, #nome do objeto que foi salvo os resultados
col.var ="x" ,
repel = TRUE, # Evita que o texto se sobreponha
gradient.cols = c("#00AFBB", "#E7B800", "#FC4E07"),
title = "Círulo de correlação, variáveis x PC" #título
)
Os três elementos c("#00AFBB", "#E7B800", "#FC4E07") são as cores em código hexadecimal. Você pode acessar outras cores em celke.com.br/artigo/tabela-de-cores-html-nome-hexadecimal-rgb e trocar o código pelo que achar melhor. Você pode retirar e trabalhar com apenas dois códigos (cores) ou incluir mais cores se preferir. Abs.
Cara, como eu faço para padronizar os dados no R?
Outra pergunta: Na literaturara recomenda usar a matriz de correlação ao invés da matriz de covariância para encontrar o PCA. Por quê?
Marcos, para padronizar os dados use a função scale.
novo_objeto
@@SamuelCampos009 Muito bom, seu vídeo. Depois irei testar.
Obrigado!
Faltou você mostrar de forma manual como calcular as contribuições. Como eu faço isso?
#Calculando os autovalores e autovetores para cor.c
#Banco de dados de nome "caatinga.q
cor.c
@@SamuelCampos009 obrigado cara!!
Oi, quando eu jogo:
fviz_pca_var(res col.var = "cos2", gradiente.cols = c("#00AFBB", "E7B800", "FC4E07"), repel = TRUE
Diz que tem um erro inesperado, você poderia me ajudar? Até antes eu consegui fazer, mas quando chega nessa parte dá erro no símbolo.
fviz_pca_var(res col.var = "cos2", gradiente.cols = c("#00AFBB", "#E7B800", "#FC4E07"), repel = TRUE
Faltou ou # nas cores.
library(FactoMineR)
aminoacidos
Olá, acredito que esteja faltando uma vírgula entre o "res" e o "col.var" em "fviz_pca_var(res col.var ".
Tente
fviz_pca_var(res, col.var = "cos2", gradiente.cols = c("#00AFBB", "E7B800", "FC4E07"), repel = TRUE)
@@SamuelCampos009 Erro: ',' inesperado in "fviz_pca_var
Maria, por favor, envie o print da janela com o erro, o script e o banco de dados para meu e-mail que darei uma olhada: samuelcampos@id.uff.br.
@@SamuelCampos009 Oi Samuel, seu email está correto? Quando eu enviei a você o email voltou. Bjos
@@meugeniaaso está correto. Coloque seu email aqui que eu envio um email dele pra você e você responde a ele. Talvez você tenha colocado "ponto" no final do e-mail. Tente: samuelcampos@id.uff.br (sem ponto final)