anh ơi cho em hỏi, như anh nói về bệnh ung thư thì có thể có tới 99% là bệnh và chỉ có 1% là không bệnh, vậy chúng ta có nên oversampling hay undersampling không anh, hay chúng ta chỉ nên tập trung vào mô hình để làm sao hạn chế mất mát dữ liệu và học được các đặc trưng nhiều nhất vậy anh.
balance data trong trường hợp này là gần như bắt buộc rồi em ạ (oversample class bị bệnh và undersample class khỏe). Ý thứ 2 của em thì chung chung quá em ạ
anh ơi cho em hỏi, như anh nói về bệnh ung thư thì có thể có tới 99% là bệnh và chỉ có 1% là không bệnh, vậy chúng ta có nên oversampling hay undersampling không anh, hay chúng ta chỉ nên tập trung vào mô hình để làm sao hạn chế mất mát dữ liệu và học được các đặc trưng nhiều nhất vậy anh.
balance data trong trường hợp này là gần như bắt buộc rồi em ạ (oversample class bị bệnh và undersample class khỏe). Ý thứ 2 của em thì chung chung quá em ạ
@@vietnh1009 dạ em cảm ơn anh, vậy mình vẫn có thể balance data trong trường hợp dữ liệu hiển nhiên bị mất cân bằng đúng không anh.
5:06 hơi ồm nhẹ ở mic anh ạ