Monday, July 26, 2010

PDF Icinde Kelime Aramak

Linux uzerindeki PDF dosyalari icinde bir anahtar kelimeyi aramak icin soyle bir Python script kullanilabilir
import os
list = os.popen("find . -name '*.pdf'").read().split("\n")
for f in list:
f = f.replace(" ", "\\ ")
if "bu cumleyi ara" in os.popen("pdftotext " + f + " -").read():
print f
Bu script pdftotext adli bir yardimci programi cagiriyor, program yoksa kurulmasi lazim. Script, bir ust dizinden onun altindaki her alt dizine (recursive) olarak girerek aramayi yapiyor. Kelime bulunursa dosya ismi ekrana basiliyor.

No comments: