Pakai Browser TOR untuk Anonim di Akses Web
Istilah TOR diambil dari singkatan kata “The Onion Router” yang tidak lain merupakan sebuah jaringan virtual untuk meningkatkan keamanan dan kerahasiaan data di dunia maya. Selayaknya browser pada umumnya yang berfungsi untuk browsing. Namun, browser ini dibuat dan diptimalkan untuk tujuan privasi dan keamanan pengguna.
Browser TOR menggunakan jaringan dari terowongan-terowongan virtual yang memungkinkan user untuk meningkatkan privasi dan keamanan dalam Internet. Tor bekerja dengan mengirim lalu lintas user melalui tiga server acak (juga dikenal sebagai relay) dalam jaringan Tor. Relay yang terakhir dalam sirkuit (“relay keluar”) lalu mengirim lalu lintas keluar menuju Internet publik.
Salah satu cara melacak user/pengguna internet yaitu IP addres yang digunakan! Kalian bisa menggunakan https://www.myip.com/ untuk mengecek IP yang sedang saat ini dipakai. Melalui IP tersebut histori aktifitas dapat ditelusuri. Cara menggunakan TOR Browser cukup mudah, kalian bisa download di https://www.torproject.org/download/
Nanti pas browser itu setiap startup akan diminita konfirmasi agar terhubung ke jaringan TOR. Kita bisa cek alamat IP yang berubah-ubah menggunakan https://www.myip.com/
Harap diperhatikan untuk menggunakan Browser TOR untuk secara hati-hati seperti mengisi form login harus HTTPS dan pastikan ada logo gembok agar semua data terenekripsi dengan baik.
Geckodriver dan TOR untuk IP Rotate
Selain bisa digunakan untuk mengaburkan IP yang digunakan, maka kita bisa juga memadukan dengan selenium dan TOR agar proses scraping sebuah website berjalan dengan baik. Karena terkadang ada server yang akan menolak untuk di scrap terus-menerus.
Untuk Scraping website bisa menggukana selenium, misalkan saja geckodriver.exe dari firefox di https://github.com/mozilla/geckodriver/releases
Setelah di download letakan saja di C:/geckodriver.exe dan jangan lupa set path – Set Path di Windows. Langkah selanjutnya install selenium dan via pip install selenium
Sekarang kita coba panggil
from selenium import webdriver from selenium.webdriver.firefox.options import Options import os def create_torbrowser_webdriver_instance(): tor_binary_path_driver = 'C:\\Users\\User\\Desktop\\Tor Browser\\Browser\\firefox.exe' #'C:\\Users\\User\\Desktop\\Tor Browser\\Browser\\TorBrowser\\Tor\\tor.exe' geckodriver_path = 'C:\\geckodriver.exe' os.popen(tor_binary_path_driver) options = Options() options.headless = True firefox_capabilities = webdriver.DesiredCapabilities.FIREFOX firefox_capabilities['proxy'] = { "proxyType": "MANUAL", 'socksProxy': '127.0.0.1:9150', "socksVersion": 5 } driver = webdriver.Firefox(capabilities=firefox_capabilities, firefox_options=options, executable_path=geckodriver_path) return driver driver = create_torbrowser_webdriver_instance() driver.get("https://www.myip.com/")
Nanti kalian bisa lihat IP addres nya akan berubah-ubah.
Nanti ketika run akan ada 2 browser yaitu untuk melakukan connect ke jaringan TOR dan satunya lagi digunakan di Python
Koneksi TOR yang lambat
TOR Browser beroperasi di jaringan khusus yang terdiri dari banyak server. Maka setiap terkoneksi, sistem akan memilih secara rancom tiga buah relay untuk menyambungkan koneksi ke Internet serta melewati proses enkripsi sehingga masng-masing relay tersebut hanya bisa melihat IP dari tiap ujung-ujungnya saja, karena lintasan jaringan sepenuhnya membentuk pola simpul.
Hal ini berdampak pada kecepatan akses internet karena adanya relay menuju beberapa server sekaligus yang tersebar di seluruh belahan dunia sebelum akhirnya sampai ke situs tujuan.
Berkat pola keamanan berlapis tersebut, hasilnya lalu lintas internet pengguna tidak akan mudah dilacak oleh orang lain melalui alamat IP. Sementara disisi lain, pengguna bisa menembus filter atau pemblokian terhadap suatu konten yang dimuat di dalam website.
Contohnya, ketika kita akan akses website indonesia maka jaringan harus di relay dulu melewati beberapa negara di dunia secara acak lebih dulu sebelum sampai ke tujuan. Maka dari itulah setip konten yang diakses melalui Tor browser bisa dipastikan datang lebih lambat dari kecepatan normal.
ref:
https://otariglonti.medium.com/scraping-websites-with-tor-and-selenium-and-python-part-1-c38bc803e379