por que, na regressão linear, o erro padrão do coeficiente estimado é igual ao desvio padrão?
4 роки тому
Olá Lúcio, como vai? Em uma regressão linear, nós temos os erros padrão dos coeficientes e o erro padrão residual da regressão. Estas são quantias distintas e seus valore não são iguais. Você poderia me dizer onde você leu que eles são iguais? Assim eu poderei ler e avaliar. Um abraço.
@ Me expressei mal. Refiro-me aos erros dos coeficientes apenas. São a raiz da variância, e não a raiz da variância sobre a raiz de n. O que li foi "Este erro padrão é o desvio padrão da distribuição de pontos em torno da reta de regressão" . Faz sentido pensar que só tenho n = 1, por que só tenho um coeficiente e, portanto, o erro fica igual ao desvio?
4 роки тому
@@lucioflaviodasilvafreitas762 Vamos por partes: 1 - "Refiro-me aos erros dos coeficientes apenas. São a raiz da variância, e não a raiz da variância sobre a raiz de n" Resposta: Mas a variância dos coeficientes é dividida pelo n amostral e pela soma dos desvios ao quadrado da variável preditora. Logo, o desvio padrão estará dividido pela raiz quadrada do n amostral. 2 - O que li foi "Este erro padrão é o desvio padrão da distribuição de pontos em torno da reta de regressão" Resposta: Esta é a interpretação do erro padrão da regressão e não do erro padrão dos coeficientes. São coisas diferentes. 3 - "Faz sentido pensar que só tenho n = 1, por que só tenho um coeficiente e, portanto, o erro fica igual ao desvio?" Resposta: Nós dividimos pela raiz quadrada do n amostral e o "n" é o número de observações e não de parâmetros. Além disso, o número de parâmetros estimados na regressão é igual a 3 (intercepto, inclinação e variância da regressão) Na regressão linear simples, se somarmos os resíduos ao quadrado e dividirmos pelos graus de liberdade (n-2), obteremos o quadrado médio residual, que seria o correspondente à variância. A raiz quadrada deste valor é chamada de Erro Padrão da Regressão e ele seria o correspondente do desvio padrão. Nesse sentido, eu concordo com você que para mantermos o padrão, deveríamos chamá-lo de Desvio Padrão da Regressão. Principalmente devido ao fato de que este Erro Padrão da Regressão não diminui quando o tamanho amostral aumenta. Ou seja, a diferença de nomenclatura só confunde mais as pessoas. Para o caso dos Erros Padrão dos coeficientes, a situação é diferente. Estes são calculados a partir do valor do Erro Padrão da Regressão, descrito acima, dividido pela raiz quadrada do número amostral e pela raiz quadrada da soma dos quadrados dos resíduos da variável preditora x. Assim, quanto maior o n amostral, menores serão os erros padrão dos coeficientes e logo eles correspondem bem à ideia de erro padrão.
Porque essa fórmula é da variância amostral. Se fosse variância populacional, seria apenas o "n"
9 місяців тому
Olá Luis Paulo, obrigado pelo seu comentário. Pode parecer contraintuitivo, mas para o cálculo da variância amostral precisamos dividir pelo número de graus de liberdade, que nesse caso é igual a 4 (5 - 1). Se quiser entender melhor, veja meu vídeo sobre Graus de liberdade em um minuto (ua-cam.com/video/RX-vvhCng48/v-deo.htmlsi=UuIGh7VnRaI3MuBk).
Aula excelente e objetiva. Parabéns pelo conteúdo e obrigado!
Maravilhoso. Obrigada pelo vídeo.
Olá Isis, ficamos muito felizes com seu comentário!! Isso nos estimula a continuar produzindo mais vídeos. Obrigado! Um abraço.
Valeuuuu ótima explicação, direto ao ponto... salvou meu estudo!
Olá Davi, muito obrigado pelo seu retorno. Isso nos mostra que estamos no caminho certo. Um abraço.
por que, na regressão linear, o erro padrão do coeficiente estimado é igual ao desvio padrão?
Olá Lúcio, como vai? Em uma regressão linear, nós temos os erros padrão dos coeficientes e o erro padrão residual da regressão. Estas são quantias distintas e seus valore não são iguais. Você poderia me dizer onde você leu que eles são iguais? Assim eu poderei ler e avaliar. Um abraço.
@ Me expressei mal. Refiro-me aos erros dos coeficientes apenas. São a raiz da variância, e não a raiz da variância sobre a raiz de n. O que li foi "Este erro padrão é o desvio padrão da distribuição de pontos em torno da reta de regressão" . Faz sentido pensar que só tenho n = 1, por que só tenho um coeficiente e, portanto, o erro fica igual ao desvio?
@@lucioflaviodasilvafreitas762 Vamos por partes:
1 - "Refiro-me aos erros dos coeficientes apenas. São a raiz da variância, e não a raiz da variância sobre a raiz de n"
Resposta: Mas a variância dos coeficientes é dividida pelo n amostral e pela soma dos desvios ao quadrado da variável preditora. Logo, o desvio padrão estará dividido pela raiz quadrada do n amostral.
2 - O que li foi "Este erro padrão é o desvio padrão da distribuição de pontos em torno da reta de regressão"
Resposta: Esta é a interpretação do erro padrão da regressão e não do erro padrão dos coeficientes. São coisas diferentes.
3 - "Faz sentido pensar que só tenho n = 1, por que só tenho um coeficiente e, portanto, o erro fica igual ao desvio?"
Resposta: Nós dividimos pela raiz quadrada do n amostral e o "n" é o número de observações e não de parâmetros. Além disso, o número de parâmetros estimados na regressão é igual a 3 (intercepto, inclinação e variância da regressão)
Na regressão linear simples, se somarmos os resíduos ao quadrado e dividirmos pelos graus de liberdade (n-2), obteremos o quadrado médio residual, que seria o correspondente à variância. A raiz quadrada deste valor é chamada de Erro Padrão da Regressão e ele seria o correspondente do desvio padrão. Nesse sentido, eu concordo com você que para mantermos o padrão, deveríamos chamá-lo de Desvio Padrão da Regressão. Principalmente devido ao fato de que este Erro Padrão da Regressão não diminui quando o tamanho amostral aumenta. Ou seja, a diferença de nomenclatura só confunde mais as pessoas.
Para o caso dos Erros Padrão dos coeficientes, a situação é diferente. Estes são calculados a partir do valor do Erro Padrão da Regressão, descrito acima, dividido pela raiz quadrada do número amostral e pela raiz quadrada da soma dos quadrados dos resíduos da variável preditora x. Assim, quanto maior o n amostral, menores serão os erros padrão dos coeficientes e logo eles correspondem bem à ideia de erro padrão.
@ Super esclarecedor! Muitíssimo obrigado!
No cálculo da variância vc dividiu pelo número de observações menos 1, pq?
Porque essa fórmula é da variância amostral. Se fosse variância populacional, seria apenas o "n"
Olá Luis Paulo, obrigado pelo seu comentário.
Pode parecer contraintuitivo, mas para o cálculo da variância amostral precisamos dividir pelo número de graus de liberdade, que nesse caso é igual a 4 (5 - 1). Se quiser entender melhor, veja meu vídeo sobre Graus de liberdade em um minuto (ua-cam.com/video/RX-vvhCng48/v-deo.htmlsi=UuIGh7VnRaI3MuBk).