Este blog ya no está activo, sigue informándote aquí:

miércoles, 22 de junio de 2016

Evadiendo Cloudfare con Python.

Me juego un euro a que alguna vez os habeis topado con la típica página web que al acceder nos indica lo siguiente: "Checking your browser before accessing website.com. This process is automatic. Your browser will redirect to your requested content shortly. Please allow up to 5 seconds... " A mi siempre me ha parecido una desconfianza tremenda hacia mi persona. Pues ahora con el modulo de Python cloudflare-scrape de Anorov podemos dotar a nuestros scripts de la capacidad de bypasear estas medida de protección


Eso si, usad el modulo con ojo ya que este código ejecuta código JavaScript de manera arbitraria, lo que potencialmente puede ser perjudicial en algunos entornos de ejecución. Debido a esto, los únicos motores de JavaScript que permite el módulo son PyV8 y Node.js. Con Node, todo el código se ejecutará en un entorno limitado, por lo que la biblioteca estándar de Node es inaccesible. Con PyV8, el sistema de archivos y la shell no se puede acceder en absoluto.

Es uso es del módulo es tan fácil como llamar a la función create_scraper() en nuestro script y seguir el siguiente ejemplo:
 
import cfscrape 
scraper = cfscrape.create_scraper() # returns a CloudflareScraper instance # Or: scraper = cfscrape.CloudflareScraper() # CloudflareScraper inherits from requests.Session print scraper.get("http://somesite.com").content # => "<!DOCTYPE html><html><head>..."


Aquí tenéis el enlace a módulo que si sois como yo ya tendréis ganas de jugar con el:
Sed Buenos ;) 

No hay comentarios:

Publicar un comentario