WikiPrint - from Polar Technologies

==Instalacja OCRa dla faktur w systemie eDokumenty

Poniższa instrukcja przedstawia uruchomienie mechanizmu OCRowania faktur w systemie eDokumenty działających na systemie Linux.

Poniższa instrukcja została przygotowana na bazie systemu Linux Debian8

apt-get update
apt-get install autoconf-archive automake g++ libtool libleptonica-dev pkg-config
apt-get install git
apt-get install poppler-utils
apt-get install libjpeg-dev libtiff-dev libpng-dev

Jeśli pakiety leptonica 1.74+ nie są dostępne w dystrybucji w takim przypadku kompilujemy ze źródeł

mkdir /usr/lib/leptonica
cd /usr/lib/leptonica
wget http://www.leptonica.com/source/leptonica-1.74.4.tar.gz
gunzip leptonica-1.74.4.tar.gz
tar -xf leptonica-1.74.4.tar
cd leptonica-1.74.4
./configure
make
make install
mkdir /usr/lib/tesseract
cd /usr/lib/tesseract
git clone https://github.com/tesseract-ocr/tesseract.git tesseract-ocr
cd tesseract-ocr/
./autogen.sh
./configure
make
make install
ldconfig
cd /usr/local/share/tessdata/
wget https://github.com/tesseract-ocr/tessdata_fast/raw/master/script/Latin.traineddata
wget https://github.com/tesseract-ocr/tessdata_fast/raw/master/pol.traineddata
wget https://github.com/tesseract-ocr/tessdata_fast/raw/master/eng.traineddata
wget https://github.com/tesseract-ocr/tessdata_fast/raw/master/osd.traineddata

define('USE_NEW_OCR_FOR_EINVOICE', TRUE);