Thư viện Java cung cấp khả năng nhận dạng ký tự quang học (optical character recognition - OCR) cho các dạng ảnh PDF, TIFF, JPEG, GIF, PNG, và BMP. Hỗ trợ Unicode, gồm cả Tiếng Việt và nhiều ngôn ngữ khác.

http://tess4j.sf.net