텍스트마이닝 논문 작성으로 토픽모델링 분석시, 실패하는 이유

해외 유학 없이 영어를 유창하게 하는 방법 (CIA가 받는 언어교육법)

"미국은 벌써 끝났어요" AI 전문가가 예견하는 가장 먼저 사라질 직업들.. (김상균 교수 1화)

У Миколаєві для військових виготовляють човни, які не тонуть навіть при пошкодженнях #shorts

Жителі Курської області ДИВЛЯТЬСЯ ФІЛЬМ ПРО БУЧУ

On Track To A World’s First

TFIDF 값이 틀리게 나온 경험해본 대학원생

박사 논문통계 5일 완성

Переглядів 12

Додати в
- Мій плейлист
- Переглянути пізніше
Поділитися

Поділитися

Вставка

Розмір відео:

Показувати елементи керування програвачем

Автоматичне відтворення

Автоповтор

Опубліковано 16 вер 2024
📚 TF-IDF 분석에서 TF값이 단순 빈도와 같다고? 걱정 마세요! 이건 가장 기본적인 TF 계산법을 사용했다는 뜻이에요. 단어가 문서에 등장한 횟수를 그대로 사용하는 방식이죠. 간단하고 직관적이에요!
예를 들어, '사과'가 5번 나왔다면 TF도 5예요. 쉽죠? 하지만 문서 길이에 따른 편향이 생길 수 있어요.
더 정교한 방법을 원한다면 정규화된 빈도를 사용해보세요. 문서 길이를 고려해 TF 값을 조정하는 방법이에요.
로그 정규화는 tf(t,d) = log(1 + ft,d) 수식을 사용해요. 긴 문서에서의 과도한 TF 값을 줄여줘요.
증가 빈도는 문서 내 최대 빈도로 나누고 0.5를 더해 조정해요. 문서 길이의 영향을 줄이는 데 효과적이죠.
TF 계산 방식 선택은 중요해요! 단순 빈도는 구현이 쉽고, 정규화 방식은 더 정확할 수 있어요. 데이터 특성과 분석 목적을 고려해 선택하세요.
TF는 시작일 뿐! IDF와 곱해져 최종 TF-IDF 점수를 만들어내요. 이 조합으로 단어의 중요성을 평가하죠.
결론적으로, TF 값이 빈도와 같아도 괜찮아요. 기본 방법도 충분히 유효해요. 하지만 더 정확한 분석을 원한다면, 다양한 정규화 방식을 고려해보세요. 여러분의 연구에 딱 맞는 방법을 찾길 바라요! 💪🔬
#대학원생 #학위논문 #텍스트마이닝 #데이터분석 #텍스톰 #textom

КОМЕНТАРІ •

Наступне

Автоматичне відтворення

텍스트마이닝 논문 작성으로 토픽모델링 분석시, 실패하는 이유

텍스트마이닝 논문 작성으로 토픽모델링 분석시, 실패하는 이유

해외 유학 없이 영어를 유창하게 하는 방법 (CIA가 받는 언어교육법)

해외 유학 없이 영어를 유창하게 하는 방법 (CIA가 받는 언어교육법)

"미국은 벌써 끝났어요" AI 전문가가 예견하는 가장 먼저 사라질 직업들.. (김상균 교수 1화)

"미국은 벌써 끝났어요" AI 전문가가 예견하는 가장 먼저 사라질 직업들.. (김상균 교수 1화)

У Миколаєві для військових виготовляють човни, які не тонуть навіть при пошкодженнях #shorts

У Миколаєві для військових виготовляють човни, які не тонуть навіть при пошкодженнях #shorts

Жителі Курської області ДИВЛЯТЬСЯ ФІЛЬМ ПРО БУЧУ

Жителі Курської області ДИВЛЯТЬСЯ ФІЛЬМ ПРО БУЧУ

On Track To A World’s First

On Track To A World’s First

БЕЛКА РОЖАЕТ? #cat

БЕЛКА РОЖАЕТ? #cat

미국, 한국 명문대 둘 다 경험해보고 느낀 부모들의 결정적 차이 (조벽 교수 1부)

미국, 한국 명문대 둘 다 경험해보고 느낀 부모들의 결정적 차이 (조벽 교수 1부)

커서AI로 문서 편집하기 (Cursor로 코딩만 할수있는게 아닙니다!)

커서AI로 문서 편집하기 (Cursor로 코딩만 할수있는게 아닙니다!)

나는 솔로에서 확인한 토픽모델링에서 자주 하는 실수 1가지

나는 솔로에서 확인한 토픽모델링에서 자주 하는 실수 1가지

오픈AI는 돈 한 푼 못받고 왜 애플과 손을 잡았을까? (30년 개발자 박종천)

오픈AI는 돈 한 푼 못받고 왜 애플과 손을 잡았을까? (30년 개발자 박종천)

좋아하는 일도 없고 잘하는 일도 모를 때, 적성에 맞는 직업 찾는 법 | 지식인 콘서트 (이헌주 교수)

좋아하는 일도 없고 잘하는 일도 모를 때, 적성에 맞는 직업 찾는 법 | 지식인 콘서트 (이헌주 교수)

텍스트마이닝 데이터 정제 실패? 이 영상 하나로 해결하세요

텍스트마이닝 데이터 정제 실패? 이 영상 하나로 해결하세요

챗GPT로 이 기능들 안 쓰면 진짜 손해보는 겁니다 | GPT로 삶의 질을 200% 올리는 방법 | 일상에서 쓸 수 있는 GPT 꿀팁

챗GPT로 이 기능들 안 쓰면 진짜 손해보는 겁니다 | GPT로 삶의 질을 200% 올리는 방법 | 일상에서 쓸 수 있는 GPT 꿀팁

당신의 문해력 플러스 - 읽었다고 확신하는 사람들_#001

당신의 문해력 플러스 - 읽었다고 확신하는 사람들_#001

복잡한 개념, 설명하기 어려우셨죠? (사례와 기능 소개 - napkin.ai, 냅킨 AI)

복잡한 개념, 설명하기 어려우셨죠? (사례와 기능 소개 - napkin.ai, 냅킨 AI)

Никогда не Спасай АДМИНА на Сервере и Вот Почему... #майнкрафт

Никогда не Спасай АДМИНА на Сервере и Вот Почему... #майнкрафт

Пришёл к другу на ночёвку 😂

Пришёл к другу на ночёвку 😂

ЗВЕРНЕННЯ ДО МЕНЕДЖЕРІВ YouTube!

ЗВЕРНЕННЯ ДО МЕНЕДЖЕРІВ YouTube!

Василиса пошла В ПЕРВЫЙ класс! А что у вас в рюкзаке)))?

Василиса пошла В ПЕРВЫЙ класс! А что у вас в рюкзаке)))?

А ВЫ ЛЮБИТЕ ШКОЛУ?? #shorts

А ВЫ ЛЮБИТЕ ШКОЛУ?? #shorts

Ребёнка ЗАБРАЛИ ИЗ ДЕТСКОГО ДОМА | Зови меня мамой

Ребёнка ЗАБРАЛИ ИЗ ДЕТСКОГО ДОМА | Зови меня мамой

ЖІНОЧИЙ ЛІКАР. НОВЕ ЖИТТЯ. Сезон 2. Серія 14. Драма. Мелодрама. Серіал про Лікарів.

ЖІНОЧИЙ ЛІКАР. НОВЕ ЖИТТЯ. Сезон 2. Серія 14. Драма. Мелодрама. Серіал про Лікарів.

Хто зверху? 2024 - Випуск 1 від 05.09.2024 | ПРЕМ'ЄРА

Хто зверху? 2024 – Випуск 1 від 05.09.2024 | ПРЕМ'ЄРА