Este blog ya no está activo, sigue informándote aquí:

viernes, 4 de abril de 2014

PDF-Parser.- Bendito Sea Python

No muchos sabrán que las entradas a este blog son totalmente improvisadas, (Supongo que lo habréis supuesto xD) pero la verdad es que tampoco me gusta echar mano de los borrados los evito a no ser que sea imprescindible. Pues hoy ha sido uno de esos días que no tenia ni idea de que escribir, hasta que he visto la entrada de [Seifreed] en [DragonJar] donde presentaba la herramienta PDF-Parser. Una herramienta la mar de útil ni no queremos recurrir a sanboxs o a meterlo en el PeePDF, hecha en Python (Seee e.e) llamada PDF-Parser. Así que he decidido fusilarle la entrada. 


Aquí tenéis todas las opciones con las que podemos jugar con esta herramienta: 
Usage: pdf-parser.py [options] pdf-file|zip-file|url
pdf-parser, use it to parse a PDF document

Options:
  • --version show program's version number and exit
  • -h, --help show this help message and exit
  • -s SEARCH, --search=SEARCH
  • string to search in indirect objects (except streams)
  • -f, --filter pass stream object through filters (FlateDecode,
  • ASCIIHexDecode, ASCII85Decode, LZWDecode and
  • RunLengthDecode only)
  • -o OBJECT, --object=OBJECT
  • id of indirect object to select (version independent)
  • -r REFERENCE, --reference=REFERENCE
  • id of indirect object being referenced (version
  • independent)
  • -e ELEMENTS, --elements=ELEMENTS
  • type of elements to select (cxtsi)
  • -w, --raw raw output for data and filters
  • -a, --stats display stats for pdf document
  • -t TYPE, --type=TYPE type of indirect object to select
  • -v, --verbose display malformed PDF elements
  • -x EXTRACT, --extract=EXTRACT
  • filename to extract malformed content to
  • -H, --hash display hash of objects
  • -n, --nocanonicalizedoutput
  • do not canonicalize the output
  • -d DUMP, --dump=DUMP filename to dump stream content to
  • -D, --debug display debug info
  • -c, --content display the content for objects without streams or
  • with streams without filters
  • --searchstream=SEARCHSTREAM
  • string to search in streams
  • --unfiltered search in unfiltered streams
  • --casesensitive case sensitive search in streams
  • --regex use regex to search in streams
Source code put in the public domain by Didier Stevens, no Copyright
Use at your own risk https://DidierStevens.com
Espero que os guste y si queréis descargarlo o ver el código fuente de esta herramienta en la fuente:

Sed Buenos ;) 

2 comentarios:

  1. ¬¬ y me consta lo vagal que eres con entradas previas o borradores todo improvisas xD pero eso tiene ventaja en mi blog andan 100 en borrador :|

    ResponderEliminar
    Respuestas
    1. Si, no digo que lo que haga yo sea bueno ni malo. Solo que lo hago así xD

      Eliminar