OCR2SearchableMultipagePDF

Scanner ActiveX Control

Convert all pages from image buffer to Searchable Multipage PDF/A file. It support full page or on zone of the image defined by OCRSetRect method.

Public Function OCR2SearchableMultipagePDF( _
   ByVal strPDFFile  As String, _
   ByVal iDictionaryType As Integer, _
   ByVal strDictionaryPath As String
) As Integer

Parameter

strPDFFile
The output PDF file name.

iDictionaryType
0 - English language data: eng.traineddata, eng.tesseract_cube.nn, eng.cube.word-freq, eng.cube.size, eng.cube.params, eng.cube.nn, eng.cube.lm,eng.cube.fold, eng.cube.bigrams files.
1 - German language data: deu.traineddata
2 - Fraktur (Old German) language data: deu-frak.traineddata
3 - Italian language data: ita.traineddata
4 - Dutch language data: nld.traineddata
5 - Portuguese language data: por.traineddata
6 - Spanish language data: spa.traineddata
7 - Chinese (Simplified) language data:chi_sim.traineddata
8 - Chinese (Traditional) language data:chi_tra.traineddata
9 - Arabic language data:ara.traineddata, ara.cube.bigrams, ara.cube.fold, ara.cube.lm, ara.cube.nn, ara.cube.params, ara.cube.size, ara.cube.word-freq
10 - Bulgarian language data: bul.traineddata
11 - Catalan language data: cat.traineddata
12 - Czech language data: ces.traineddata
13 - Cherokee language data: chr.traineddata
14 - Danish language data: dan.traineddata
15 - Danish (Fraktur) language data: dan-frak.traineddata
16 - Greek language data: ell.traineddata
17 - Finnish language data: fin.traineddata
18 - French language data: fra.traineddata
19 - Hebrew language data: heb.traineddata
20 - Hindi language data: hin.traineddata, hin.cube, hin.cube.fold, hin.cube.lm, hin.cube.nn, hin.cube.params, hin.cube.word-freq, hin.tesseract_cube.nn
21 - Hungarian language data : hun.traineddata
22 - Indonesian language data: ind.traineddata
23 - Japanese language data: jpn.traineddata
24 -Korean language data: kor.traineddata
25- Latvian language data: lav.traineddata
26- Lithuanian language data: lit.traineddata
27 - Norwegian language data: nor.traineddata
28 - Polish language data: pol.traineddata
29 - Romanian language data: ron.traineddata
30 - Russian language data: rus.traineddata
31 - Slovakian language data: slk.traineddata
32 - Slovakian Fraktur Language data: slk-frak.traineddata
33- Slovenian language data: slv.traineddata
34 - Serbian (Latin) language data: srp.traineddata
35 - Swedish language data: swe.traineddata
36 - Swedish (Fraktur) language data: swe-frak.traineddata
37 - Tagalog language data: tgl.traineddata
38 - Thai language data: tha.traineddata
39 - Turkish language data: tur.traineddata
40 - Ukrainian language data: ukr.traineddata
41 -Vietnamese language data: vie.traineddata

The language files need include in dictfiles/tessdata folder. Assume The path of dictionary files is "dictfiles" Please refer Optional OCR Language Dictionaries Files section in Distributing your Applications.

The demo version installer will not include all language file. For additional languages, you need download the language pack from http://www.viscomsoft.com/ocrlanguage.zip

strDictionaryPath
The path of dictionary files. It need same as the ocx folder. e.g. If the ocx file locate on c:\test folder
if the dictionary files locate on c:\test\dictfiles , you need set "dictfiles" in strDictionaryPath parameter.

Return Value

Return 1 - Successful
Return -1 - Cannot start, because it is recognizing.
Return -2 - General Error.
Return -3 - No Scanned image in buffer.
Return -4 - Cannot get the image.

Example

Visual Basic Syntax
Scanner1.OCRRecognizeMode=0
Scanner1.OCRSetRect 0,0,100, 100
iResult=Scanner1.OCR2SearchableMultipagePDF("c:\searchablepdf.tif", 0,"dictfiles")