Apa itu Web Scraping? | Sigit Dewanto | Python Developer | Scrapinghub

Поділитися
Вставка
  • Опубліковано 15 вер 2024

КОМЕНТАРІ • 52

  • @boodlebsd
    @boodlebsd 3 роки тому +4

    Terimakasih sekali. Bagus sekali cerita dr Mas Sigit Dewanto, dan pancingan2 Mas Budi. Membuka wawasan bahwa ada lapangan pekerjaan lain untuk web programmer :-). Apakah berarti kita harus berhati2 dalam menyimpan secret keys, passwords API dan database yg digunakan di web portal kita supaya nggak ke crawler?

    • @belajaridn
      @belajaridn  3 роки тому +1

      Sama-sama, semoga sesi ini bisa bermanfaat.
      Untuk proteksi terhadap bot, kita perlu menerapkan anti bot protection; salah satunya dengan recapcha :)

    • @sigitdewanto6702
      @sigitdewanto6702 3 роки тому +4

      Sama2. Kalau penyimpanan secret keys/password biasanya diset sebagai environment variables dan tidak disimpan dalam file dev.to/biplov/handling-passwords-and-secret-keys-using-environment-variables-2ei0

    • @boodlebsd
      @boodlebsd 3 роки тому

      @@sigitdewanto6702 Terimakasih linknya. Kl gitu makin mantap pakai .env sj. Saya add di LinkedIn ya Mas.

    • @boodlebsd
      @boodlebsd 3 роки тому

      @@belajaridn Mantap, tepat banget waktunya. Terimakasih sekali lg. Semakin sukses sesi podcastnya.

  • @indrapurna532
    @indrapurna532 3 роки тому +1

    Menarik banget isi podcast nya bang, terimakasih banyak, semoga sehat selalu dan sebarkan terus ilmu yang bermanfaat bang 🙏

    • @belajaridn
      @belajaridn  3 роки тому

      Banyak informasi berharga yang dibagikan oleh Mas Sigit di sesi ini :)

  • @DimasSadiman
    @DimasSadiman 2 роки тому +1

    Sangat bermanfaat... 👍👍

    • @belajaridn
      @belajaridn  2 роки тому

      Banyak insight menarik yang disampaikan oleh Mas Sigit dalam sesi ini 😊☕

  • @cintarasuryaelidanto1942
    @cintarasuryaelidanto1942 3 роки тому +1

    Wah mantep, auto nonton ^_^

    • @belajaridn
      @belajaridn  3 роки тому +1

      Semoga bisa dinikmati dan memberikan manfaat :)

  • @SuwandaKurnia
    @SuwandaKurnia 3 роки тому +2

    ini nih bg, aku lagi butuh banget metode iniiii
    makasih bang 😊
    alhamdulillah

    • @belajaridn
      @belajaridn  3 роки тому +1

      Syukurlah, bisa pass banget ya :)

    • @SuwandaKurnia
      @SuwandaKurnia 3 роки тому +2

      @@belajaridn iyaa bg, aku lagi butuh metode utk ngambil data website gitu bg...
      metode yg aku temui itu baru ngambil data melalui web service atau web API nya website itu kak

    • @SuwandaKurnia
      @SuwandaKurnia 3 роки тому +2

      eh bg, wkwk

    • @belajaridn
      @belajaridn  3 роки тому +1

      Ingat pesan Mas Sigit ya, polite scraping dan jangan excessive scraping :)

    • @SuwandaKurnia
      @SuwandaKurnia 3 роки тому +2

      @@belajaridn okee bang, siapp.. makasih bg

  • @hady7152
    @hady7152 2 роки тому +1

    asyiik sekali Mas diskusinya...
    salam kenal Mas Budi

    • @belajaridn
      @belajaridn  2 роки тому +1

      Semoga bermanfaat ya sesi bincang2 ini ☺️☕🙏

  • @gianshugie
    @gianshugie Рік тому

    Mau tanya mas, kalo untuk programmer pemula bagus nya cari kerja on-site atau freelance/remote ? Minta arahan road map nya

  • @kunying4037
    @kunying4037 3 роки тому +1

    Sukses selalu bang

    • @belajaridn
      @belajaridn  3 роки тому

      Sesi podcast ini rilis di Hari Senin pukul 10 pagi :)

    • @kunying4037
      @kunying4037 3 роки тому +1

      @@belajaridn okee😁

    • @belajaridn
      @belajaridn  3 роки тому

      Gimana sesinya? Semoga bermanfaat ya :)

    • @kunying4037
      @kunying4037 3 роки тому +1

      @@belajaridn sangat menginspirasi bang, mantap :)

  • @MuhamadFuad
    @MuhamadFuad 3 роки тому +1

    bang, next podcast boleh how to become QA manual/automations gak :D

    • @belajaridn
      @belajaridn  3 роки тому +2

      Topik QA belum pernah dibahas di sesi podcast Indonesia Belajar. Nanti kami akan carikan narasumber yang memiliki keahlian di bidang ini ya :)

    • @MuhamadFuad
      @MuhamadFuad 3 роки тому +1

      @@belajaridn sip makasih bang XD

  • @hady7152
    @hady7152 2 роки тому

    kalau boleh tahu web browser yang tidak mempunyai GUI bisa didownload dimana ya?
    mungkin Mas Budi ada refrensi
    Terimakasih Mas Budi atas info dan ilmunya

    • @caareystore4858
      @caareystore4858 2 роки тому

      Ada phantom JS bikinan mas ariya hidayat setauku

  • @sosrobahu2485
    @sosrobahu2485 3 роки тому +1

    Yg ngisi pycon id kemarin bukan ya ini?

    • @belajaridn
      @belajaridn  3 роки тому

      Betul, mas Sigit pernah menjadi pembicara di PyconID 2019 dan menjadi moderator di PyconID 2020 :)

  • @bimagv
    @bimagv 3 роки тому +1

    Saya mau melakukan web scrapping, untuk mencari bahan contekan dari suatu website saat lagi di Ubuntu Server. Ada tool yang sekiranya bagus untuk saya korek-korek tidak mas budi?

    • @belajaridn
      @belajaridn  3 роки тому

      Sudah pernah coba Scrapy atau BeautifulSoup?

    • @bimagv
      @bimagv 3 роки тому +1

      @@belajaridn Terimakasih mas budi sarannya saya lagi coba, tapi belum eksplorasi lebih lanjut, saat ini masih memakai gitlab.com/gardenappl/readability-cli untuk mendapatkan artikel via CLI.

    • @belajaridn
      @belajaridn  3 роки тому

      @@bimagv Terus semangat mas dalam bereksplorasi :)

    • @cangguk10
      @cangguk10 3 роки тому +1

      Bagus materinya, saya ingin belajar lebih jauh lagi mengenai scrapinghub, dimana saya harus belajar dengan mas Sigit, mungkin ada CP atau fan pagenya? Trimksh

    • @belajaridn
      @belajaridn  3 роки тому

      Tamu kita kali ini memang sudah 7 tahun berpengalaman secara profesional dalam bidang web scraping. Mantap memang Mas Sigit ini.

  • @sosrobahu2485
    @sosrobahu2485 3 роки тому +1

    Scraping berantem sama perimeter x baru puyeng 😁

    • @belajaridn
      @belajaridn  3 роки тому

      LoL, makanya solusi untuk common problems dalam scraping gak dibahas dalam sesi podcast ini :)

  • @rexosjr4230
    @rexosjr4230 3 роки тому +2

    print("keren bang")

    • @belajaridn
      @belajaridn  3 роки тому

      Mas Sigit banyak berbagi informasi berharga di sesi podcast ini :)

  • @endremurti
    @endremurti 3 роки тому +1

    untuk stalking email address bisa ya gan?

    • @belajaridn
      @belajaridn  3 роки тому

      Lebih tepatnya untuk scrape data email addresses dari halaman web secara otomatis 😊

    • @endremurti
      @endremurti 3 роки тому +1

      @@belajaridn nah penting skali brti ya om, bkin tutor nya dong hehe

    • @belajaridn
      @belajaridn  3 роки тому

      @@endremurti kebetulan saat ini kami sedang berfokus pada materi terkait Machine Learning :)

    • @endremurti
      @endremurti 3 роки тому +1

      @@belajaridn wah keren apakah ada kontak mas atau forum tertentu ? sy ingin ikutan terlibat hehe sy jg pngn bljr big data untuk marketing

    • @belajaridn
      @belajaridn  3 роки тому

      Bisa bergabung dengan komunitas Python ID mas. Biasa aktif di group Telegram :)

  • @elissilviani6775
    @elissilviani6775 2 роки тому

    Bedanya scraper sama crawler apa yaa?

    • @binixsinematografi
      @binixsinematografi Рік тому

      Scraper untuk mengambil data spesifik dari satu website, sedangkan Crawler untuk menjelajahi dan mengambil data dari berbagai halaman website.

  • @ekosetiawan_indo
    @ekosetiawan_indo 3 роки тому +1

    keropi