Site da Caminova - DocumentExpress with DjVu













DocumentExpress with DjVu é um software para criar e manipular representações altamente comprimidas de documentos escanerizados no formato aberto DjVu. As taxas de compressão típicas variam de 250:1 a 1.000:1, oferecendo nova vida e usabilidade a documentos coloridos escanerizados. Por exemplo, uma página colorida no tamanho A4 escanerizada a 300 ou 400 dpi ficaria em apenas 50 Kb no formato DjVu.

As imagens de um documento DjVu tem o menor tamanho quando comparadas com outros formatos disponiveis no mercado. Os arquivos DjVu são 1.000 vezes menores que TIFF e de 10 até 100 vezes menores que JPEG ou PDF, dependendo de como os arquivos JPEG e PDF foram criados, conforme ilustrado na figura abaixo.

O formato DjVu utiliza um processo de segmentação chamado Mixed Raster Content (MRC) pelo qual uma imagem original é segmentada em duas camadas (layers) chamadas background e foreground, conforme ilustrado abaixo.

A camada de background é utilizada para amazenar fotografias, gráficos e texturas. A camada foreground inclui texto, desenhos lineares e outros elementos finos. Para fins de eficiência de armazenamento a camada foreground é separada em outras duas camadas conhecidas como camada selector preto-e-brando e camada foreground colorida que captura a côr dos elementos da página na camada selector. DocumentExpress with DjVu inclui a mais avançada tecnologia de segmentação de imagem de documentos já desenvolvida. Esta é a chave da habilidade do software em produzir altas taxas de compressão e ao mesmo tempo preservar a aparência visual sem perda do documento original. Graças a habilidade de separar texto de fotografias, texturas e gráficos esta tecnologia avançada de segmentação resulta em uma melhora dramática nos resultados de OCR (Optical Character Recognition) quando trabalhando com complexos documentos coloridos escanerizados.

DocumentExpress with DjVu é fornecido com uma OCR engine da ExperVision, que está entre as três melhores OCR engines disponiveis no mercado internacional. Esta OCR engine inclui o Português. A informação de OCR é armazenada no arquivo DjVu em uma camada chamada hidden text. Esta camada contém ambas informações sobre word bounding boxes eword order. Esses dados podem ser utilizados para fazer buscas com DjVu plugins e visualizadores. Esta camada de texto pode ser exportada ou acessada diretamente por engines de busca e indexação.

DocumentExpress with DjVu pode ser facilmente integrado ao workflow existente conforme ilustrado abaixo.

REQUISITOS DO SISTEMA

Requisitos Mínimos

Requisitos Recomendados

Existem duas modalidades do DocumentExpress with DjVu:

Uma comparação das capacidades de cada modalidade do DocumentExpress with DjVu é apresentada na tabela abaixo.

Também existem os seguintes módulos do DocumentExpress with DjVu:

Versão de avalição do software DocumentExpress with DjVu está disponível para download no site da Caminova.

Para obter informação adicional ou orçamento:


Perguntas ou Comentários? Dados para Contato ou Ligue: 012-3153-5115


Copyright © 2009 GeoDesign Internacional. Todos direitos reservados.