헷갈리는 통계용어 정리

Поділитися
Вставка
  • Опубліковано 18 вер 2022
  • 논준모대학원 입학(멤버십 가입)은 아래 링크주소를 클릭하면 됩니다.
    / @nonjunmo

КОМЕНТАРІ • 12

  • @user-yt1vd4qk3t
    @user-yt1vd4qk3t Рік тому +1

    퇴근길~.
    반갑습니다 ^

  • @user-km4tp5rs7v
    @user-km4tp5rs7v Рік тому +2

    고맙습니다 ㅎㅎ 혹시.. 통계표 읽는 방법도 업로드 가능하실까요? ㅠㅠ

    • @nonjunmo
      @nonjunmo  Рік тому +2

      네~ 논준모연구소 유투브 채널 재생목록에 들어가시면 논문통계표 읽는 요령을 학과별 논문으로 설명해 놓았습니다~ 참고하시기 바랍니다.

  • @user-nc2jx4cy5c
    @user-nc2jx4cy5c Рік тому +2

    천재!

  • @user-is3fs3vg2j
    @user-is3fs3vg2j 20 днів тому +1

    죄송한데, 조금은 위험한 컨텐츠라 댓글을 남깁니다. 우선 분산(variance)과 변량(Variable)은 다른 개념으로 사용됩니다. 일부 인터넷 글이나 경영통계 서적에는 변량을 variance로 잘못 번역한 경우도 있지만, 대부분의 공학통계서적(또는 수리통계)에서는 변량을 Variable로 나타내고 있으며 이는 변수라는 뜻과 같습니다. 즉, 분산과 변량은 전혀 다른의미 입니다.
    분산분석을 변량분석이라고 표현하는 것도 일반적인 오류에서 기인하는 것 같습니다. 물론 ANOVA를 변량분석이라 부르는 분들도 있지만, 이는 옳바른 표현이 아니며 반드시 분산분석이라고 칭해야 합니다.
    Oneway ANOVA의 경우 예전에는 일원배치법이라 부르는 경우가 많았으나, 이는 잘못된 표현이기에 요즘은 일원분산분석으로 부르고 있습니다.
    공분산과 공변량을 Covariance라고 표현하셨는데, 이는 잘못된 표현입니다.
    공분산은 Covariance이나 공변량은 Covariate라고 하며 둘은 전혀 다른 개념입니다. 글로 설명하기 어렵기에 다르다는 것만 밝히고 넘어갑니다.
    공분산분석(ANCOVA : Analysis of Covariance)는 내용상 공분산이 아니라 공변량에 대한 분석이기에 처음부터 잘못된 이름을 사용하고 있었습니다. 그래서 일부 서적에서는 공변량분석이라고 번역하고 있기는 합니다.
    결론적으로 분산과 변량은 다른 뜻임을 말씀드리고 싶습니다.

    • @nonjunmo
      @nonjunmo  20 днів тому

      @@user-is3fs3vg2j 아~ 그렇군요. 좋은 정보를 알게 되었습니다~ 감사합니다~

    • @nonjunmo
      @nonjunmo  20 днів тому

      @@user-is3fs3vg2j 참고로.. 제가 알고 있었기로는.. 변량은 원래 영어로 range였어야 했고, 공변량(covariate)은 종속변수와의 관계상에서 나타나는 분산의 의미로써 사실상 독립변수를 의미하는 것으로 알고 있습니다만.. 실제 데이터분석하는 사람들이 아마도 이렇게 이해하고 있지 않을까 싶습니다. 용어의 어원이라든가 더 깊은 단어적(학문적)의미는 좀 다를지라도요~

    • @user-is3fs3vg2j
      @user-is3fs3vg2j 18 днів тому +1

      @@nonjunmo range는 범위로서 산포를 나타내는 또다른 지표입니다. 변량과는 매우 다른의미입니다. 그리고 공변량은 실험설계 시 독립변수로 설정되어 있지 않지만, 종속변수(결과값)에 영향을 미칠 수 있기에 통제되어야 할 변수입니다. 절대로 독립변수가 아니죠.

    • @nonjunmo
      @nonjunmo  18 днів тому

      @@user-is3fs3vg2j 1. IQR에서의 Range처럼 ‘양’이나 ‘범위’를 말하는 것이라면, 변량을 차라리 Range와 같은 단어로 사용했으면 좋지 않았을까? 라고 생각도 해 본 적이 있다는 의미였으므로 그렇게 이해해 주시고요.
      2. ‘공변량은 독립변수가 될 수 없다’는 연구설계나 분석이 완전히 확정되었을 때의 얘기입니다. “닭이 먼저냐? 계란이 먼저냐?”의 문제처럼 보일 수 있지만, 연구설계 과정에서 연구자의 의도나 목적에 따라 공변량이었던 변수가 독립변수로 바뀌거나 독립변수와의 상호작용으로 사용될 수도 있기 때문입니다. 이런 이유 때문인지는 모르겠지만 통계분석 SW들도 Independent Variable이라는 용어와 Covariates을 혼용해서 쓴다는 느낌도 있습니다. 예컨대, Covariates에 독립변수와 공변량을 투입해 놓고 상세설정에서 역할 분리를 한다든가 말이죠(JAMOVI의 혼합모델의 경우). 저의 경우에는 연구설계 과정에서 선행연구 조사에 의해 공변량으로 취급될 가능성이 있는 변수들을 모아 놓고, 내 연구모형에서 일단 ‘공변량’으로 분리해 놓습니다. 그런 후 사전분석 과정에서 이게 실제로 공변량으로써 통제변수의 역할을 하는지를 파악하기 위해 종속변수와의 관계를 분석하고(일명 통제변수 선발대회라고 부릅니다. 제가요), 내 데이터에서 공변량의 역할을 하지 않을 것이라고 판단되는 변수들은 빼 버릴 건지? 독립변수로 투입할 건지?를 결정하기도 합니다. JAMOVI가 그런 과정을 별도로 하지 말고 그냥 이 코너에서 다 해보라고 Covariates라고 이름을 지었나? 라고 생각이 들 정도이기도 합니다. 실제 연구를 하고 데이터를 파악하는 일련의 과정상에서 보면 정말 공변량이 그 의미 그대로 공변량처럼 보이지 않을 때가 있습니다. 그런 의미에서 개인적인 생각을 말씀드렸습니다.
      3. 추가적으로 실제 통계를 도구로 삼고 진행하는 다양한 타 학문분야에서 해당 연구의 재귀모델을 분석하기 위해서는 ‘오용, 남용’이라기보다는 ‘활용’의 측면에서 통계를 바라볼 필요도 있습니다. 물론 ‘오용, 남용’의 경우도 분명이 있습니다. 하지만 각각의 학문에서 추구하고자 하는 바가 조금씩 다르기 때문에 그것을 증명하기 위해서 그들은 그 학문의 관점에서 최선을 다 하는 측면에서 ‘통계’를 도구로 사용합니다. 이때, 통계학 차원에서 심하게 문제가 되지 않는 정도의 ‘용어’에 대한 조작적 정의는 달라질 수도 있다고 생각됩니다. 사실 이러한 부분에 대해서 연구를 진행해 보자는 통계학과 교수님의 제안도 있었습니다만, 어째어째 해서 무산되었습니다.