[핵심 머신러닝] K-nearest neighbors & Distance Measures

Поділитися
Вставка
  • Опубліковано 2 січ 2025

КОМЕНТАРІ • 33

  • @고은선-o8g
    @고은선-o8g 2 роки тому +2

    강의 정말 재미 있었습니다. 시간 가는 줄 몰랐습니다. 감사합니다.

  • @MZ-pj4eq
    @MZ-pj4eq 4 роки тому

    교수님, 감사합니다!!

  • @haikuandbeth
    @haikuandbeth 3 роки тому

    교수님 감사합니다 😊

  • @labs-v6l
    @labs-v6l 4 роки тому +1

    처음 3NN 할 때 내분점 처럼 가중치를 안 두고 산술평균만 적용해서 의아해 했었는데 마지막에 해결해 주셨네요! 좋은 강의 감사합니다.

  • @JJHyeok
    @JJHyeok 4 роки тому

    좋은 강의 해주셔서 감사합니다

  • @kai_blue14
    @kai_blue14 5 років тому

    좋은 자료 감사합니다

  • @김동규-h5p
    @김동규-h5p 4 роки тому

    교수님 강의 너무 잘들었습니다 :)

  • @namuni67541
    @namuni67541 3 роки тому

    감사합니다!

  • @dsadassad21310dsa
    @dsadassad21310dsa 4 роки тому

    좋은 강의 너무 감사합니다 :)

  • @윤희상-o2m
    @윤희상-o2m 4 роки тому

    감사합니다!!

  • @JIYOUNGMIN-xp2wm
    @JIYOUNGMIN-xp2wm Рік тому

    교수님. 좋은 강의 감사합니다. 궁금한 점이 있는데요. 영상 17:30에 k값을 정하기 위한 misclasserror와 sse 식이 나오는데 시크마 윗부분k와 1/k에서 k가 데이터 개수인 n이 아닌가요? k-nearest의 k라면 식의 의미가 완전히 달라지는 것 같아서요.

  • @qkrtntjdalsrks
    @qkrtntjdalsrks 3 роки тому

    비 컴공전공과 학생입니다
    괜히 CPU를 알아들으려고 한것 같습니다

  • @elijahpark7958
    @elijahpark7958 2 роки тому

    교수님, 강의 감사합니다. 강의 시청하다가 갑자기 궁금한게 생겨서 질문드립니다. 그러면 kmeans 의 경우는 model-based 와 instance-based 중 어디에 속한다고 할 수 있을까요? Clustering 방식은 따로 model-based 와 instance-based 로 구분하지 않는건가요?

    • @김성범교수산업경영공
      @김성범교수산업경영공  2 роки тому +4

      Clustering은 model-based 와 instance-based로 구별하지 않습니다. Clustering은 일반적으로 계층적(hierarchical), 분리형(partitioning), 분포기반(density based), 자기조직화(self organizing)으로 나누고 각각의 대표 알고리즘은 다음과 같습니다.
      계층적(hierarchical): hierarchical clustering algorithm (based on dendrogram)
      분리형(partitioning): k-means clustering algorithm
      분포기반(density based): DBSCAN algorithm
      자기조직화(self organizing): self-organizing map

  • @jungkunyoung1
    @jungkunyoung1 5 років тому +1

    c언어도 모르는 초보입니다. 머신러닝을 배울수 있을까요?

    • @xg3571
      @xg3571 5 років тому

      고민할시간에 c언어 기본정도는 공부하는게 백배나음

    • @kokoro33250
      @kokoro33250 5 років тому

      c랑 별 관계 없어요. 파이썬이나 자바스크립트로도 가능해요.

    • @김성범교수산업경영공
      @김성범교수산업경영공  4 роки тому +2

      머신러닝은 이론과 컴퓨터언어를 함께 공부하시면 좋습니다. 초보이시면 c 언어 보다는 파이썬으로 시작하시는 걸 추천합니다~

  • @김대현-t8c4k
    @김대현-t8c4k 4 роки тому

    질문이 있습니다. 그럼 knn은 모든 training set에 대하여 test data로 부터의 거리를 구하나여?

    • @김성범교수산업경영공
      @김성범교수산업경영공  4 роки тому

      그렇습니다~

    • @김대현-t8c4k
      @김대현-t8c4k 4 роки тому

      @@김성범교수산업경영공 엌 빠른 답변 감사드립니다. 저 한가지만 더 질문 드려도 될까요? 그럼 Training set의 규모가 크다면 test data로부터 모든 training data까지의 거리를 구하는게 비효율적일 것같다는 생각이 드는데 test data로 부터 일정 반경내에 있는 Training set만 따로 뽑아내어서 거리 계산을 하는게 더 효율적이지 않나여? 그리고 knn에서는 그런 일부 Training set만 뽑아내서 거리를 계산하는 알고리즘이 따로 구현 되어있는건가여?

    • @김성범교수산업경영공
      @김성범교수산업경영공  4 роки тому +1

      @@김대현-t8c4k 좋은 질문입니다. 일단 기본적으로 knn은 testing data가 들어왔을때 모든 training data와의 거리를 계산해서 k개의 이웃을 결정합니다. 하지만 아웃라이어나 명백한 오류가 있는 데이터의 경우 전처리를 통해 이를 제거한 후 knn을 적용합니다. 최근 컴퓨팅 파워를 감안하면 데이터수는 knn에서 아무런 문제가 되지 않습니다. 다만 차원을 클 경우 (변수의 수가 많은 경우) 제대로 거리 계산을 하지 못하는 단점이 있습니다. 거리를 기반으로 하는 모든 기법에 문제이기는 합니다.

    • @김대현-t8c4k
      @김대현-t8c4k 4 роки тому

      @@김성범교수산업경영공 아! 데이터수는 현대 컴퓨팅 파워에서는 문제가 되지 않는 답변 감사드립니다!! 짧은 시간이었지만 정말 감사드립니다. ☺️

  • @tknam3278
    @tknam3278 2 роки тому

    감사합니다!!