martes, 25 de noviembre de 2014

PdftoText + Python = Diccionario v2.0

Como os comenté [en el vídeo de ayer] al script, que cree para hacer slipt de palabras de un txt y guardarlas en lineas para crear diccionarios, le faltaban unos cuantos retoques. Por ejemplo, quitar prints absurdos, incluirle un bucle while para poderle pasar txts de una forma mas ágil y/o hacer funciones. 


Así que me he puesto a ello después de hacer todos mi "que haceres" de hoy y la verdad es que estoy contento con el resultado. Sigue siendo un script algo cutre, pero estoy orgulloso.

def abrirguardar(txt):
with open(txt,'r') as f:
for line in f:
for word in line.split():
if word + "\n" in comp:
pass
else:
dic.write(word+"\n")
print "Done"   

while True: 
d1 = raw_input("Dame el archivo: ")
dic = open("dicslipt.txt","a+")
comp =[]
for word in dic:
comp.append(word) 
abrirguardar(d1)  

Descarga: 
Como veis ahora el script es capaz de abrir, leer y crear una lista con cada palabra del archivo dicslipt.txt. La cual, después utilizaremos para general la condición if word + "\n" in comp: para que, en el caso de que sean palabras iguales no las vuelva a escribir. 

Pues, aquí lo tenéis y espero que os sirva mucho.

Sed Buenos ;)  

No hay comentarios:

Publicar un comentario en la entrada