Fornieli Gulo
Fornieli Gulo
  • 97
  • 44 186
Cara Preprocessing Data menggunakan google colab | Update Oktober 2024
Preprocessing data teks di Google Colab adalah proses mengubah teks mentah menjadi format yang dapat digunakan oleh model machine learning.
Dalam video ini kamu diterapkan langkah-langkah :
1. hapus data duplikat
2. cleaning data
3. case folding
4. tokenization
5. stopword removall
6. steaming data
7. hapus data kosong
Hasil Visualisasi : after before, wordcloud dan diagram batang ffrekuensi kata, data csv hasil preprocessing dan tambahan kamus kata tidak baku.
Langkah ini penting untuk memastikan data teks lebih bersih dan siap untuk dianalisis atau digunakan dalam model prediksi.
Google Colab (085329781284)
colab.research.google.com/drive/1h4jxHxS3Tf1U0dCUjL6hPgATEydxbkvU?usp=sharing
#PreprocessingText #DataCleaning #GoogleColab #MachineLearning #TextData #AILink #nbc #svm #naivebayes
Переглядів: 163

Відео

Sentiment Analysis Using Naive Bayes Classifier (NBC) Algorithm | #Version-1
Переглядів 12621 день тому
Analisis Sentimen menggunakan Algoritma Naive Bayes merupakan metode yang efektif untuk mengklasifikasikan teks ke dalam kategori positif, negatif, atau netral berdasarkan data historis. Algoritma ini bekerja dengan menghitung probabilitas dari kata-kata dalam teks yang sudah diberi label sentimen, sehingga dapat memprediksi sentimen dari teks baru. Naive Bayes sangat populer karena kesederhana...
Membuat visualisasi data teks dengan Wordcloud, diagram batang, dan pie chart di Google Colab
Переглядів 2821 день тому
Membuat visualisasi data teks dengan Wordcloud, diagram batang, dan pie chart di Google Colab memberikan wawasan tentang distribusi kata dalam teks. Wordcloud digunakan untuk menampilkan kata-kata yang sering muncul dengan ukuran yang lebih besar. Sementara itu, frekuensi kata juga dapat divisualisasikan menggunakan diagram batang untuk menampilkan jumlah kemunculan setiap kata secara lebih ter...
10 Kode Dasar Bagi Pemula dalam Google Colab | Preprocessing Data
Переглядів 5828 днів тому
10 kode dasar untuk memahami isi dataset di Google Colab. Pertama, kita perlu mengimpor library pandas dan membaca file dataset menggunakan pd.read_csv(). Setelah itu, kita bisa melihat sekilas data dengan df.head() untuk menampilkan baris pertama, serta df.tail() untuk baris terakhir. Informasi umum tentang dataset, seperti jumlah baris, kolom, dan tipe data, bisa didapatkan dengan df.info() d...
Cara Menghapus Simbol, Angka, Username di Google Colab | Preprocessing Data
Переглядів 58Місяць тому
Cara Menghapus Simbol, Angka, Username di Google Colab | Preprocessing Data
Analisis Sentimen Ulasan Aplikasi INDODAX di google play store Menggunakan Algoritma SVM
Переглядів 712Місяць тому
Analisis Sentimen Ulasan Aplikasi INDODAX di google play store Menggunakan Algoritma SVM
Cara Menghapus Emoji dari Dataset di Google Colab | Preprocessing Data
Переглядів 42Місяць тому
Cara Menghapus Emoji dari Dataset di Google Colab | Preprocessing Data
cara menghapus URL dari dataset di Google Colab | Preprocessing Data
Переглядів 16Місяць тому
cara menghapus URL dari dataset di Google Colab | Preprocessing Data
Menghapus duplikat dataset Google Colab | Preprocessing Data
Переглядів 52Місяць тому
Menghapus duplikat dataset Google Colab | Preprocessing Data
Cara Mengatur DataFrame atau Menyusun Ulang Kolom Dataset di Google Colab | Preprocessing Data
Переглядів 39Місяць тому
Cara Mengatur DataFrame atau Menyusun Ulang Kolom Dataset di Google Colab | Preprocessing Data
Cara memisahkan kolom date dan time di dataset | Preprocessing Data
Переглядів 38Місяць тому
Cara memisahkan kolom date dan time di dataset | Preprocessing Data
Cara Menerjemahkan Tweet dengan Google Sheets dan Google Colab - Tutorial Mudah
Переглядів 1272 місяці тому
Cara Menerjemahkan Tweet dengan Google Sheets dan Google Colab - Tutorial Mudah
cara melakukan labeling ribuan data untuk analisis sentimen menggunakan library TextBlob
Переглядів 2912 місяці тому
cara melakukan labeling ribuan data untuk analisis sentimen menggunakan library TextBlob
How to Visualize Labeling Results Data using Google Colab
Переглядів 643 місяці тому
How to Visualize Labeling Results Data using Google Colab
Cara labelling data menggunakan textblob tweet english
Переглядів 2184 місяці тому
Cara labelling data menggunakan textblob tweet english
Cara membuat kamus tidak baku untuk normalisasi kata
Переглядів 4834 місяці тому
Cara membuat kamus tidak baku untuk normalisasi kata
Cara melakukan pembobotan kata menggunakan fitur TF-IDF
Переглядів 9095 місяців тому
Cara melakukan pembobotan kata menggunakan fitur TF-IDF
Cara Lebelling Dataset Vadersentiment, NLTK, Textblob dan Lexicon 2 dan 3 Class
Переглядів 1,1 тис.5 місяців тому
Cara Lebelling Dataset Vadersentiment, NLTK, Textblob dan Lexicon 2 dan 3 Class
Cara Lebelling tweet menggunakan Lexicon Based
Переглядів 1,4 тис.6 місяців тому
Cara Lebelling tweet menggunakan Lexicon Based
Cara melakukan preprocessing data VERSI#4 | analysis sentiment
Переглядів 1,4 тис.7 місяців тому
Cara melakukan preprocessing data VERSI#4 | analysis sentiment
Cara membuat dan export frekuensi kata menggunakan google colab | #colab #googlecolab
Переглядів 1867 місяців тому
Cara membuat dan export frekuensi kata menggunakan google colab | #colab #googlecolab
Cara Melakukan Normalisasi Kata | CEK KATA BAKU DAN TIDAK BAKU
Переглядів 5638 місяців тому
Cara Melakukan Normalisasi Kata | CEK KATA BAKU DAN TIDAK BAKU
Cara melakukan preprocessing text menggunakan dataset hasil crawling x dengan editor google colab
Переглядів 2,2 тис.9 місяців тому
Cara melakukan preprocessing text menggunakan dataset hasil crawling x dengan editor google colab
ANALYSIS SENTIMENT MENGGUNAKAN DATA ULASAN DARI APK PLAY STORE
Переглядів 5219 місяців тому
ANALYSIS SENTIMENT MENGGUNAKAN DATA ULASAN DARI APK PLAY STORE
CARA ANALYSIS SENTIMENT MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE (SVM)
Переглядів 3 тис.10 місяців тому
CARA ANALYSIS SENTIMENT MENGGUNAKAN ALGORITMA SUPPORT VECTOR MACHINE (SVM)
CARA ANALYSIS SENTIMENT MENGGUNAKAN NAIVE BAYES CLASSIFIER MULTINOMIAL | DATASET KASUS FS
Переглядів 4,9 тис.10 місяців тому
CARA ANALYSIS SENTIMENT MENGGUNAKAN NAIVE BAYES CLASSIFIER MULTINOMIAL | DATASET KASUS FS
CARA MELAKUKAN LEBELING DATA ❗❗ PELEBELAN DATA (SENTIMENT [POSITIF, NEGATIF, NETRAL])
Переглядів 7 тис.10 місяців тому
CARA MELAKUKAN LEBELING DATA ❗❗ PELEBELAN DATA (SENTIMENT [POSITIF, NEGATIF, NETRAL])
CARA MELAKUKAN PRE-PROCESSING MENGGUNAKAN DATA HASIL CRAWLING DATA DARI X (TWITTER)
Переглядів 5 тис.11 місяців тому
CARA MELAKUKAN PRE-PROCESSING MENGGUNAKAN DATA HASIL CRAWLING DATA DARI X (TWITTER)
Gabungkan File CSV Hasil Crawling Data Twitter menggunakan CMD
Переглядів 818Рік тому
Gabungkan File CSV Hasil Crawling Data Twitter menggunakan CMD

КОМЕНТАРІ

  • @Aandhikads
    @Aandhikads 6 днів тому

    Untuk data crawling komentar youtube sama bang caranya? Untuk kometar yang banyak singkatan,typo itu bagaimana ya kemudian komentar yg terlalu panjang bolehkah dipotong?

  • @nabilasoraya4_
    @nabilasoraya4_ 7 днів тому

    untuk analisis sentiment nya, bagaimana ya kak?

  • @hanindiyaputri3198
    @hanindiyaputri3198 9 днів тому

    kak request dong untuk analisis sentimen tapi pakai 2 metode klasifikasi yaitu Naive Bayes dan SVM, 🙏🏻

  • @pinkblooms2882
    @pinkblooms2882 10 днів тому

    bg tf-idfnya mana

  • @pinkblooms2882
    @pinkblooms2882 10 днів тому

    Bg ini proses TF-IDFnya gada?

  • @bagusap2174
    @bagusap2174 11 днів тому

    Pagi kak Izin kak jika berkenan bisa meminta file colabnya, kebetukan saya membutuhkannya untuk keperluan tugas akhir saya, mohon maaf merepotkan dan terima kasih kak :) saya sudah kirim permintaan izin akses collabnya. Terima kasih

  • @abangadek646
    @abangadek646 11 днів тому

    Kalo data ini di exploratory(EDA) bisa gk sih? , bingung aku sumpah nyari sana sini, + ini tweeter knp dh mau crawling data aja susah banget.

  • @sintanorfadila4400
    @sintanorfadila4400 14 днів тому

    Halo bang kalau pakai metode LSTM apakah sama step step nya ?

  • @22_lutviarahmakumala38
    @22_lutviarahmakumala38 16 днів тому

    Bang cara crawling data gimana ya

  • @bangbanghidayat4010
    @bangbanghidayat4010 16 днів тому

    halo kak, jika berkenan bisa meminta file colabnya, kebetukan saya membutuhkannya untuk keperluan skripsi saya, mohon maaf merepotkan dan terima kasih kak :) (saya sudah mengirim request ke google drivenya kak) sekali lagi terima kasih banyak

  • @AhmadFirman-uv3yl
    @AhmadFirman-uv3yl 21 день тому

    kak bikinin kalau pakai metode lstm dong 🙏 udah like & subrek nih

  • @ragnar1560
    @ragnar1560 23 дні тому

    kak mau tanya, lexicon inset ini setelah dilihat2 ternyata ada banyak kata2 yang ada skor baik positif & negatif, misalnya kata "bagus", itu punya skor -4 di file negative.tsv sama skor 2 di file positive.tsv. Nah ini gimana jadinya cara handle nya kak? makasih

  • @mikazora423
    @mikazora423 25 днів тому

    mantap penjelasan simpel jelas,,, sub

  • @ZzzYyy-l1h
    @ZzzYyy-l1h Місяць тому

    Kak tolong buatin tutorial analisis sentimen pake bert kak, trimakasih🙏

  • @caticopyang6834
    @caticopyang6834 Місяць тому

    izin nanya saya rencananya mau scrape beberapa aplikasi mobile banking bank syariah. apakah saya harus menggunakan api terdahulu atau tidak? terus berapa maksimal data yamg bisa di scrape dari kode ini mqkasih

    • @sentiment.analysis
      @sentiment.analysis Місяць тому

      @@caticopyang6834 hanya perlu id, bisa srapper berapapun

  • @rudimsi5341
    @rudimsi5341 Місяць тому

    Sudah jelas aplikasi indodax buatan kode keamanan dibentuk secara sembarangan dan asal asalan masih memiliki kode keamanan library kegunaan pintu masuk untuk hacker maling mencuri akun pribadi seperti email nomor telepon sampai KYC KTP NIK anda tujuan mengambil pinjaman atau pembobolan rekening bank anda

    • @sentiment.analysis
      @sentiment.analysis Місяць тому

      Iya kah?

    • @rudimsi5341
      @rudimsi5341 Місяць тому

      Benar bang soal ada informasi penyampaian IDA Singapura tentang cara buatan aplikasi developer dari AppStore mengembang aplikasi tidak boleh menggunakan kode keamanan library keunggulan tidak ada bisa lagi serangan dari luar peretas dan serangan ekploitasi. Aplikasi AppStore baik baik saja hingga sekarang tujuan memutuskan jembatan library terhubung akun hacker dan eksploitasi supaya maling tidak bisa membaca data rahasia lagi.

    • @sentiment.analysis
      @sentiment.analysis Місяць тому

      ​Semoga aja segera selesai

  • @ahsananadya3342
    @ahsananadya3342 Місяць тому

    kak ini bisa dipake untuk metode K-NN gak ya?

  • @albirannisa8733
    @albirannisa8733 2 місяці тому

    kak, sudah minta akses. tolong acc ya kak🙏

  • @ikhlas6969
    @ikhlas6969 2 місяці тому

    Bang mau tanya, cara translate data yg banyak gimna? Enak nya pake library apa?

    • @sentiment.analysis
      @sentiment.analysis 2 місяці тому

      besok saya upload tutor untuk translate ya kak, silahkan ditunggu

  • @adeintankomalasari638
    @adeintankomalasari638 3 місяці тому

    kak tolong acc ya 🙏

  • @farhanrivanka2412
    @farhanrivanka2412 3 місяці тому

    Bang maaf, boleh kah saya minta akses gdrivenya?

  • @yudcaesaris3459
    @yudcaesaris3459 3 місяці тому

    itu datanya ada tulisan score caranya gimana kak biar muncul

  • @hendar9918
    @hendar9918 4 місяці тому

    Bang ini ga melalui perhitungab TF IDF ?

  • @doctrash-yooo
    @doctrash-yooo 4 місяці тому

    Terima kasih banyak atas ilmunya, bang. Saya mau tanya, itu kenapa pakai .tsv ya? Kemudian, Implementasi InsetLexicon nya yg di bagian mana ya, bang? Maaf masih beginner banget :"

  • @ahsananadya3342
    @ahsananadya3342 4 місяці тому

    bang mau tanya kalo pake metode knn gimana ya?

  • @arobirotwiranto2079
    @arobirotwiranto2079 4 місяці тому

    min kamus buat kata baku dapet dari mana

  • @abdums1404
    @abdums1404 4 місяці тому

    kak apakah datanya harus bahasa inggris? atau bisa bahasa indonesia jg?

  • @thezarreviansyah6108
    @thezarreviansyah6108 4 місяці тому

    Bang di bagian cleaning tidak bisa,apa boleh minta kodenya?

  • @rachelmargarethsimamora
    @rachelmargarethsimamora 4 місяці тому

    hai kak, jika ingin mengubah tweet menjadi eng kodingannya apa ya kak? trimakasih

  • @ekarahma9285
    @ekarahma9285 4 місяці тому

    Halo kak mau tanya untuk memunculkan nilai kata yang jadi patokan positive dan negativenya gimana ya kak ? Terimakasih sebelumnya 🙏

  • @sitiamaliah4593
    @sitiamaliah4593 4 місяці тому

    terimakasih banyak kak, sangat membantu saya yg skripsinya tentang analisis sentimen. suksess selalu

  • @triulfadianawulandari4312
    @triulfadianawulandari4312 4 місяці тому

    Halo kak selamat malam, aku baru saja melihat postingan youtube kakak untuk pelabelan inset lexicon. Kebetulan saya sekarang sedang skripsi dg tema analisis sentimen pelabelannya menggunakan inset lexicon, tadi saya coba ingin mengkakses source codenya tapi masih belum disetujui, jika boleh, saya minta tolong sebesar-besarnya untuk diberikan akses terkait mengakses dan menggunakan source code milik kakak. jika memungkinkan kakak mengirim file source code melalui email ini kakak Terima kasih😃

    • @sentiment.analysis
      @sentiment.analysis 4 місяці тому

      sudah saya upload yang terbaru link akses sudah dibuka

  • @Gurusingaa6777
    @Gurusingaa6777 5 місяців тому

    bang kok gabisa ya saya wa

  • @azuresakamichi96
    @azuresakamichi96 5 місяців тому

    bang, cara crawling dari twitter bagaimana yah?

  • @abdums1404
    @abdums1404 5 місяців тому

    terima kasih banyak mas sangat membantu sekali, semoga sukses selalu

  • @abdums1404
    @abdums1404 5 місяців тому

    mas mau tanya kok saya crawling data ulasan aplikasi di google play store cuma mentok di 199 data saja ya? itu solusinya bagaimn ya mas?

    • @rahmanmaheri6792
      @rahmanmaheri6792 5 місяців тому

      kebijakan baru dari Google tuh bang, dibatasi cuman bisa ambil sebanyak 200 data

    • @Miawwwwww-v4g
      @Miawwwwww-v4g 3 місяці тому

      ​@@rahmanmaheri6792 lalu misal butuh data 2000 gitu solusinya gimana ya kak

  • @hendar02_71
    @hendar02_71 5 місяців тому

    Apa nama web nya?

  • @AleviaMentari
    @AleviaMentari 5 місяців тому

    Kak buatin tutorial analisis sentimen naive bayes dan adaboost dong 🙏

  • @nurullfau
    @nurullfau 5 місяців тому

    bang buatin yang ada tf idfnya dong

  • @bindarama7875
    @bindarama7875 5 місяців тому

    Bukan nya vader khusus bhs inggris?

    • @sentiment.analysis
      @sentiment.analysis 5 місяців тому

      vader, nltk, textblob harus pake tweet engliah ini hanya contoh

  • @bindarama7875
    @bindarama7875 5 місяців тому

    Untuk proses stemming nya makan waktu berapa lama?

  • @imhrzzn2342
    @imhrzzn2342 5 місяців тому

    Wih apa ada codenya

  • @raniandriwati3490
    @raniandriwati3490 6 місяців тому

    tutoooorrrr

  • @adeksetiawan3568
    @adeksetiawan3568 6 місяців тому

    Izin bertanya bg. Ada beberapa bagian yg nggak keluar hasilnya, saat hasil dari korelasi sama nilai akurasi dari data testingnya. Itu solusinya gimana bg?

  • @kzerenity4
    @kzerenity4 6 місяців тому

    Sangat membantu. Boleh minta tolong di acc untuk akses ke kodeprogramnya mas?

  • @dyahoctavia984
    @dyahoctavia984 6 місяців тому

    Wahh😊😊

  • @ashabaljannahtv
    @ashabaljannahtv 6 місяців тому

    Kak mau tutorialny dg, lg btyh ni