Thursday, July 14, 2011

Data Science Toolkit

Imajdan metin (text) cikarma (OCR) komutlari (ve pek cok diger kabiliyet) iceren bir paket: Data Science Toolkit. Kurmak icin siteden python_tools.zip indirilir. Unzip edip sudo ./install ile kurulur. OCR icin kullanilacak komut file2text komutu. Turkce karakter biraz problemli, fakat Ingilizce karakterleri iyi taniyor. Imajdaki harflerin buyuklugu, goruntunun netligi vs gibi isleri file2text kendisi hallediyor. Komut kullanimi basit, file2text [dosya]. Sonuc ekrana basiliyor.

No comments: