2012-01-17 Sane Ocr Mysql Drupal

Opmerkingen:

* Steven heeft dit eens toepast om een 30tal blz tellend boek om te zetten in tekst:

inscannen als "pdf" door multifunctional op een "usb stick"...deze omzetten naar "tif" zwart/wit foto bestanden...en dan tessaract elke tif laten verwerken met Nederlandse woordenboek:

convert -colorspace RGB -depth 8 -density 150 -verbose 13923493-30-jaar-beroepsrennerswedstrijd-te-izegem.pdf[1]

tesseract p1.tif p1 -l nld

* Via google docs kan je een bestand tot 2mbyte uploaden en vink dan "scan pdf of beeldbestand naar google documenten" aan. Als je je bestand naar "zwart/wit" omzet kun je het vaak verkleinen in "kilobytes" .

    • www.hotscripts.com

  • Drupal 7 content managment system door Ingrid

Foto's: