질문 주셔서 정말 감사합니다. 제 의견으로는.... 세개 중에 하나를 고르라면 markdown 형태가 가장 좋을 것 같습니다. 왜냐하면 현재 NLP 는 문장들의 의미를 파악하는 훈련을 받았기 때문에 Markdown 형태가 NLP 모델이 쉽게 처리할 수 있는 형태일 것이가 때문입니다. 반면에 표 형태는 숫자나 특정 값들이 명확하게 구분 돼 있어 특정 정보를 빠르게 추출하는데는 유리할 겁니다. 하지만 NLP 모델이 context 정보를 이해하는데는 한계가 있을 수 있습니다. 그리고 이미지 정보는 NLP 모델이 처리할 수 없습니다. 그 안에 있는 text 정보를 추출해서 사용해야 되는데 이 과정에서 정확도가 떨어질 수 있습니다.
좋은 강의 감사드립니다!!! 혹시 document의 어떤 형태가 가장 리트리버나 답변이 좋을까요? 마크다운 형태, 표, ,이미지 등..
질문 주셔서 정말 감사합니다. 제 의견으로는.... 세개 중에 하나를 고르라면 markdown 형태가 가장 좋을 것 같습니다. 왜냐하면 현재 NLP 는 문장들의 의미를 파악하는 훈련을 받았기 때문에 Markdown 형태가 NLP 모델이 쉽게 처리할 수 있는 형태일 것이가 때문입니다. 반면에 표 형태는 숫자나 특정 값들이 명확하게 구분 돼 있어 특정 정보를 빠르게 추출하는데는 유리할 겁니다. 하지만 NLP 모델이 context 정보를 이해하는데는 한계가 있을 수 있습니다. 그리고 이미지 정보는 NLP 모델이 처리할 수 없습니다. 그 안에 있는 text 정보를 추출해서 사용해야 되는데 이 과정에서 정확도가 떨어질 수 있습니다.