71
Tesseract.js je knjižnica javascripta, ki besedam v skoraj katerem koli jeziku pridobi slike.Motor Tesseract OCR je bil eden najboljših 3 motorjev na testu UNLV-ove natančnosti leta 1995.Med letoma 1995 in 2006 je bilo na njem malo opravljenega dela, vendar je verjetno eden najbolj natančnih odprtokodnih OCR motorjev na voljo.Izvorna koda bo prebrala binarno, sivo ali barvno sliko in izhodno besedilo.Vgrajen je tiff bralnik, ki bo prebral nestisnjene TIFF slike, ali pa lahko za branje stisnjenih slik dodal libtiff.Obstajajo jezikovne datoteke za številne jezike, tudi za besedilo v Fraktur in črkovnih vrstah ....