Transcripción de documentos
AVISOS
LEGALES
Copyright © 2002 ScanSoft, Inc. Reservados todos los derechos. Se prohíbe transmitir,
transcribir, reproducir, almacenar en cualquier sistema de recuperación o traducir a cualquier
idioma o lenguaje informático esta publicación o parte de ella, de ninguna forma ni por
ningún medio, ya sea mecánico, electrónico, magnético, óptico, químico, manual u otro, sin
la autorización previa por escrito del departamento legal de ScanSoft, Inc., 9 Centennial
Drive, Peabody, Massachusetts 01960, U.S.A.
El software descrito en esta publicación se otorga bajo licencia y sólo se puede usar o copiar
según los términos establecidos en dicha licencia.
AV I S O
IMPORTANTE
ScanSoft, Inc. proporciona esta publicación "tal cual" sin garantías de ninguna índole, ya sean
expresas o implícitas, incluyendo, pero sin limitación alguna, las garantías implícitas de
comerciabilidad o idoneidad para fines particulares. Algunos estados o jurisdicciones no
permiten la renuncia a garantías expresas o implícitas en ciertas transacciones, por lo tanto,
esta afirmación puede no aplicarse a su caso particular. ScanSoft se reserva el derecho de
actualizar esta publicación y de hacer cambios de vez en cuando en el contenido actual sin
verse obligada a notificar a ninguna persona de dichas actualizaciones o cambios.
MARCAS
COMERCIALES Y CRÉDITOS
ScanSoft, OmniPage, OmniPage Pro, OmniPage SE, PaperPort, Pagis, True Page, Direct OCR,
AutoOCR y OCR Proofreader son marcas registradas o comerciales de ScanSoft, Inc., en los
Estados Unidos u otros países.
Todas las demás marcas o denominaciones comerciales se reconocen en el presente
documento y pueden estar registradas por sus respectivos titulares.
ScanSoft Inc.
9 Centennial Drive
Peabody, MA 01960
U.S.A.
Ref.N°. 58-28001-04A
C
O N T E N I D O
BIENVENIDO
VII
Uso de este manual
viii
Obtener ayuda en línea
Ayuda en línea HTML
ix
Ayuda contextual
ix
Notas técnicas
x
Glosario
x
OmniPage SE
1
2
ix
x
INSTALACIÓN Y CONFIGURACIÓN
11
Requisitos del sistema
12
Instalación de OmniPage SE
13
Configuración del escáner con OmniPage SE
14
Cómo iniciar el programa
16
Registro del software
17
Nuevas características de OmniPage Pro 11
18
OmniPage SE y OmniPage Pro 11
19
INTRODUCCIÓN
21
Qué es el reconocimiento óptico de caracteres?
Funciones de OCR de OmniPage SE
22
22
Documentos en OmniPage SE
23
Pasos básicos de procesamiento
23
El escritorio de OmniPage SE
24
Barra de herramientas Estándar
OMNIPAGE SE MANUAL
25
DEL USUARIO
iii
Barra de menús
25
Barra de herramientas Imagen
26
Barra de herramientas de formato
26
Caja de herramientas de OmniPage
27
Administración de documentos
28
Vista de miniatura
28
Vista de detalles
29
Personalizar columnas en la vista de detalles
30
Eliminar páginas de un documento
30
Imprimir un documento
30
Cerrar un documento
31
Documentos OmniPage
31
Por qué guardar el documento como tipo OPD 32
Cómo guardar un archivo en formato OPD
Parámetros
3
TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
Guía de inicio rápido
iv
CONTENIDO
32
33
35
36
Carga y reconocimiento de archivos de
imágenes de ejemplo
36
Exploración y reconocimiento de una
sola página
36
Procesamiento de documentos utilizando el
Asistente de OCR
39
Procesamiento automático de documentos
42
Botones de comandos
43
Procesamiento manual de documentos
44
Procesamiento automático de un documento
y terminación manual
46
Procesamiento a partir de otras aplicaciones
47
Cómo configurar Direct OCR
47
Cómo usar Direct OCR
48
Cómo usar OmniPage SE con el software
PaperPort
4
49
Procesamiento de documentos con Programar OCR
50
Definición del origen de imágenes de las páginas
51
Entrada desde archivos de imagen
51
Entrada desde escáner
52
Exploración con un alimentador automático
de documentos
54
Explorar documentos extensos sin un
alimentador automático de documentos
54
Descripción del diseño del documento
55
Separación manual de zonas
56
Trabajo con zonas
57
Propiedades de zona
58
Cuadrículas de tablas en la imagen
59
Uso de plantillas de zonas
61
VERIFICACIÓN Y EDICIÓN
63
Verificación de los resultados de OCR
64
Verificación del texto reconocido en comparación
con el original
65
Diccionarios del usuario
66
IntelliTrain
67
Pantalla y vistas del editor
70
Edición de texto e imágenes
71
Lectura de texto en voz alta
72
Contorno de página
74
OMNIPAGE SE MANUAL
DEL
USUARIO
v
5
6
GUARDAR Y EXPORTAR
75
Preparar resultados del reconocimiento para
la exportación
76
Guardar en un archivo
77
Guardar imágenes originales
77
Guardar los resultados del reconocimiento
78
Guardar un documento mientras trabaja
79
Copia de un documento al Portapapeles
80
Enviar un documento adjunto a un mensaje
de correo electrónico
81
INFORMACIÓN TÉCNICA
Resolución de problemas
83
84
Soluciones iniciales
84
Probar OmniPage SE
85
Problemas de memoria insuficiente
86
Problemas de espacio de disco insuficiente
87
Tipos de archivos compatibles
88
Tipos de archivos para abrir y guardar
imágenes
88
Tipos de archivos para guardar los resultados
del reconocimiento
89
Guardar en PDF
90
Problemas de OCR
91
El texto no se reconoce correctamente
91
Problemas con el reconocimiento de fax
92
Problemas de sistema o rendimiento durante el
OCR
93
Desinstalación del software
INDEX
vi
CONTENIDO
94
95
Bienvenido
Bienvenido a OmniPage SE™ y gracias por usar nuestro software. La
siguiente documentación se proporciona a modo de ayuda para comenzar y
como resumen del programa.
Este manual del usuario
Este manual es una introducción al uso de OmniPage SE. Incluye las
instrucciones de instalación y configuración, una descripción de los
comandos y áreas de trabajo del programa, instrucciones específicas de tareas,
métodos para personalizar y controlar el procesamiento e información
técnica. El formato PDF de la Guía permite utilizar hipervínculos en un
visor de archivos PDF, para referencias cruzadas así como otras herramientas
de navegación.
Ayuda en línea
La ayuda en línea de OmniPage SE contiene información acerca de las características, parámetros y procedimientos. La ayuda en línea viene en formato
HTML, y ha sido diseñada para acceder a la información de manera rápida y
sencilla. La completa ayuda contextual brinda la asistencia suficiente para
permitirle seguir trabajando sin perder tiempo. Consulte la sección Obtener
ayuda en línea.
Archivo Léame
El archivo Léame contiene la información más reciente acerca del software.
Léalo antes de usar OmniPage SE. Para abrir este archivo HTML,
selecciónelo en el Instalador de OmniPage SE o bien más adelante en el
menú Ayuda.
Exploración y otra información
En el sitio web www.scansoft.com de ScanSoft encontrará la información
más reciente acerca del programa. En la guía de escáneres encontrará
información actualizada acerca de los escáneres compatibles y temas afines.
También es posible acceder al sitio web de ScanSoft desde el Instalador de
OmniPage SE o bien más adelante en el menú Ayuda.
OMNIPAGE SE MANUAL
DEL USUARIO
vii
USO DE ESTE MANUAL
Este manual está escrito dando por sentado que usted sabe cómo trabajar en
el entorno de Microsoft Windows. Consulte la documentación de Windows
si tiene dudas acerca de cómo usar los cuadros de diálogo, comandos de
menú, barras de desplazamiento, funciones de arrastrar y colocar, menús
rápidos, etc.
También suponemos que está familiarizado con su escáner y el software del
mismo, y que dicho equipo está instalado y funcionando correctamente antes
de configurarlo con OmniPage SE. Consulte la documentación respectiva
del escáner según sea necesario.
En este manual se utilizan las siguientes convenciones:
viii
BIENVENIDO
Negrita
Introduce nuevos términos y presenta subapartados.
Cursiva
Sirve para nombrar las secciones de este manual (a menos
que se establezca lo contrario, la sección está ubicada en el
mismo capítulo que la referencia).
Sirve para nombrar los botones principales utilizados en el
procesamiento automático: Iniciar, Detener, Terminar,
Adicional.
Non-serif
Sirve para presentar nombres de archivos: sample.tif
Nota
Presenta un elemento de información adicional.
Consejo
Presenta ideas para usar características del programa a fin de
efectuar tareas específicas.
OBTENER AYUDA EN LÍNEA
Además de usar este manual, se puede utilizar la ayuda en línea de OmniPage
SE para informarse sobre nuevas características, parámetros y procedimientos.
La ayuda en línea está disponible tras instalar OmniPage SE.
Ayuda en línea HTML
Abra la ayuda en línea de OmniPage SE en el nivel superior escogiendo
Temas de ayuda de OmniPage SE en la parte superior del menú Ayuda. Esto
permite ver los temas dispuestos en una Tabla de contenido, buscar en una
lista alfabética de palabras clave o hacer búsquedas de texto completo en los
temas. Otros elementos del menú Ayuda permiten acceder a temas o páginas
web relevantes.
Pulse F1 mientras trabaja con el programa para ver un tema de la ayuda en
línea que guarde relación con el área de la pantalla, cuadro de diálogo o
mensaje de advertencia actual.
Ayuda contextual
Es posible ver una ventana emergente con información concisa y puntual
sobre un elemento de menú, botón de la barra de herramientas, área de la
pantalla o cuadro de diálogo particulares de OmniPage SE, de las siguientes
maneras:
Haga clic en el botón Ayuda en la barra de herramientas Estándar para
invocar el icono de ayuda. Haga clic en cualquier elemento del escritorio
fuera del cuadro de diálogo o mensaje de advertencia.
Pulse Mayús + F1 para invocar el mismo icono de ayuda.
Haga clic en el signo de interrogación situado en la esquina superior derecha
de un cuadro de diálogo y luego haga clic en un elemento de dicho cuadro de
diálogo para ver una ventana emergente.
Algunos cuadros de diálogo o mensajes de advertencia tienen su propio
botón o texto de ayuda. Haga clic en el botón o texto para obtener
información acerca del cuadro de diálogo o de mensaje.
OMNIPAGE SE MANUAL
DEL USUARIO
ix
Haga clic en cualquier lugar para que desaparezca la ventana emergente de
ayuda contextual.
Notas técnicas
En el sitio web www.scansoft.com de ScanSoft encontrará notas técnicas
sobre temas comúnmente mencionados al usar OmniPage SE.
Las páginas web también pueden ofrecer asistencia acerca del proceso de
instalación y resolución de problemas.
Glosario
Esta manual no contiene un glosario. La ayuda en línea tiene un completo
glosario, con su propio índice alfabético y una tabla de contenido.
Consúltelo si desea averiguar el significado de algún término utilizado en este
manual o en el programa.
OMNIPAGE SE
El producto de que dispone es la versión Special Edition del mundialmente
conocido programa OmniPage Pro™. Esta versión, desarrollada para ser
distribuida con fabricantes de escáneres seleccionados, cuenta con un
conjunto reducido de las funciones incluidas en el producto
OmniPage Pro 11. Esta Guía así como la Ayuda en línea describen las
funciones del producto completo, y un icono SE señala en el documento las
diferencias entre las dos versiones.
Si le resultan ventajosas las funciones adicionales de la versión profesional,
utilice las facilidades en línea para actualizar su versión Special Edition a
OmniPage Pro 11.
x
BIENVENIDO
1 Instalación y
configuración
Este capítulo contiene información acerca de la instalación e inicio de
OmniPage SE. Se presentan los siguientes temas:
u Requisitos del sistema
u Instalación de OmniPage SE
u Configuración del escáner con OmniPage SE
u Cómo iniciar el programa
u Registro del software
u Nuevas características de OmniPage Pro 11
u OmniPage SE y OmniPage Pro 11
OMNIPAGE SE MANUAL
DEL USUARIO
11
REQUISITOS DEL SISTEMA
Se necesitan los siguientes requisitos mínimos de sistema para instalar y
ejecutar OmniPage SE:
u Un ordenador con procesador Pentium o superior
u Microsoft Windows 95, Windows 98, Windows Me,
Windows 2000 o Windows NT 4.0
u 32MB de memoria (RAM), se recomiendan 64MB
u 75MB de espacio libre en el disco duro para los archivos de la
aplicación, más 10MB de espacio de trabajo durante la instalación
u 9MB para Microsoft Installer (MSI) si no está presente y 44MB
para Internet Explorer si tampoco lo está. (Éstos se encuentran
como parte del sistema operativo en Windows 98, Windows Me y
Windows 2000.)
u Monitor SVGA con 256 colores y resolución de 800 x 600 píxeles
u Dispositivo señalador compatible con Windows
u Unidad de CD-ROM para la instalación
u Un escáner compatible si tiene pensado explorar documentos. En la
guía de escáneres en el sitio web de ScanSoft (www.scansoft.com)
encontrará una lista de todos los escáneres compatibles.
Nota
El rendimiento y velocidad aumentarán si el procesador, memoria y
espacio disponibles en su equipo son superiores a los requisitos mínimos.
12
INSTALACIÓN Y CONFIGURACIÓN
INSTALACIÓN DE OMNIPAGE SE
El programa de instalación de OmniPage SE le guiará a través de la
instalación mediante instrucciones en cada pantalla.
Antes de instalar OmniPage SE:
u Cerciórese de que el escáner esté conectado, encendido y sea
compatible con su sistema.
u Cierre todas las demás aplicaciones, especialmente programas
antivirus.
u Regístrese en su equipo con privilegios de administrador si ha de
instalar el programa en Windows 2000 o Windows NT.
u Si su sistema ya tiene instalada una versión anterior del programa
OmniPage, el programa de instalación le pedirá confirmación para
desinstalarla primero.
t Para instalar OmniPage SE:
1. Introduzca el CD-ROM de OmniPage SE en la unidad de CD-ROM.
El programa de instalación debe iniciarse automáticamente. De no ser
así, busque la unidad de CD-ROM en el Explorador de Windows y haga
doble clic en el programa Autorun.exe que aparece en el nivel superior del
CD-ROM.
2. Elija el idioma a usar durante la instalación. Este idioma se utilizará para
el sistema texto a lenguaje y como el idioma de la interfaz del programa.
El idioma de la interfaz del programa se utiliza para presentar los
elementos de menú, cuadros de diálogo, mensajes de advertencia, etc. Es
posible cambiar el idioma de la interfaz posteriormente en OmniPage
SE, pero su elección al momento de la instalación determina qué sistema
de texto a lenguaje se instalará en el programa.
Las referencias a la función de lectura en voz alta no se aplican a
OmniPage SE.
INSTALACIÓN
DE
OMNIPAGE SE
13
3. Siga las instrucciones en cada pantalla para instalar el software. Todos los
archivos necesarios para la exploración se copian automáticamente
durante la instalación.
Nota En algunas ocasiones la solución puede consistir en desinstalar y
luego volver a instalar OmniPage SE. Consulte el apartado Desinstalación del
software al final del capítulo 6.
Nota
En OmniPage Pro 11, la función de lectura en voz alta está
disponible para alemán, español, francés, inglés (británico y estadounidense),
italiano o portugués. No está disponible en OmniPage SE. Consulte también
la sección Lectura de texto en voz alta en el capítulo 4.
CONFIGURACIÓN DEL ESCÁNER CON OMNIPAGE SE
Todos los archivos necesarios para la configuración y respaldo del escáner se
copian automáticamente durante la instalación del programa. Antes de usar
OmniPage SE para la exploración, el escáner debe estar correctamente
instalado y se debe haber verificado su correcto funcionamiento.
La instalación y configuración del escáner se efectúan mediante el Asistente
del escáner. Lo puede iniciar por su cuenta, tal como se describe a
continuación. De otro modo, el Asistente del escáner aparece al tratar de
efectuar la primera exploración con OmniPage SE.
Siga estos pasos a fin de utilizar el Asistente del escáner para configurar su
equipo con OmniPage SE:
u Elija InicioÉProgramasÉScanSoft OmniPage SEÉ Asistente del
escáner,
o bien, haga clic en el botón de configuración en el panel Escáner del
cuadro de diálogo Opciones.
O, en último caso, elija un comando de exploración en la lista
desplegable Obtener página en la Caja de herramientas de
OmniPage.
u Elija Seleccionar el origen de exploración y luego haga clic en
Siguiente.
14
INSTALACIÓN Y CONFIGURACIÓN
u Haga clic una vez en el controlador TWAIN de su escáner para
u
u
u
u
u
u
u
u
u
u
u
u
u
u
seleccionarlo y luego haga clic en Siguiente.
Seleccione Sí para probar la configuración de su escáner y luego
haga clic en Siguiente.
El asistente probará la conexión desde el ordenador al escáner.
Haga clic en Siguiente.
Inserte una página de prueba en el escáner.
El asistente está preparado para efectuar una exploración básica
usando el software del fabricante del escáner. Haga clic en Siguiente.
Aparecerá la interfaz del usuario propia del escáner. Haga clic en el
botón u opción para explorar a fin de comenzar una exploración de
muestra.
Si fuese necesario, haga clic en Imagen invertida… o bien en
Imagen faltante… y haga las selecciones correspondientes.
Una vez que la imagen aparezca correctamente en la ventana, haga
clic en Siguiente.
Seleccione el elemento que describa más adecuadamente su escáner
y luego haga clic en Siguiente.
Haga clic en Siguiente para seguir con el tamaño de página.
En la ventana aparecen los tamaños de página que el Asistente del
escáner considera compatibles con su escáner. Para efectuar cambios
en los tamaños de página, haga clic en Avanzadas, efectúe los
cambios y luego haga clic en Siguiente.
Inserte una página con texto pero sin imágenes en su escáner.
Haga clic en Siguiente para comenzar a explorar en el modo blanco
y negro.
Si fuese necesario, haga clic en Imagen invertida… o bien en
Imagen faltante… y haga las selecciones correspondientes.
Una vez que la imagen aparezca correctamente en la ventana, haga
clic en Siguiente.
Si tiene un escáner a color, inserte en él una fotografía en colores o
una página con una imagen en colores. Haga clic en Siguiente para
comenzar a explorar en el modo en colores. Si fuese necesario, haga
clic en Imagen invertida… o bien en Imagen faltante… y haga las
selecciones correspondientes. Una vez que la imagen aparezca
correctamente en la ventana, haga clic en Siguiente. Si el escáner no
puede explorar en colores, omita este paso.
CONFIGURACIÓN
DEL ESCÁNER CON
OMNIPAGE SE
15
u Inserte en el escáner una fotografía o página que contenga una
imagen. Haga clic en Siguiente para comenzar una exploración en
escala de grises. Si fuese necesario, haga clic en Imagen invertida… o
bien en Imagen faltante… y haga las selecciones correspondientes.
Una vez que la imagen aparezca correctamente en la ventana, haga
clic en Siguiente.
u Ha configurado satisfactoriamente su escáner para que funcione con
OmniPage SE. Haga clic en Terminar.
Para cambiar los parámetros del escáner posteriormente, configurar otro
escáner, o bien probar y reparar un escáner instalado, lleve a cabo uno de los
dos siguientes métodos a fin de volver a abrir el Asistente del escáner:
u Pulse InicioÉProgramasÉScanSoft OmniPage SEÉAsistente del
escáner o bien
u Pulse InicioÉProgramasÉScanSoft OmniPage SEÉOmniPage
SEÉmenú HerramientasÉOpcionesÉEscáner…Ébotón
Configuración.
Nota Para probar y reparar un escáner que no funcione correctamente, siga
el procedimiento anterior, seleccionando ‘Probar y configurar el origen de
exploración actual’ al iniciar el proceso.
CÓMO INICIAR EL PROGRAMA
Para iniciar OmniPage SE, lleve a cabo uno de los siguientes procedimientos:
u Haga clic en Inicio en la barra de tareas de Windows y seleccione
ProgramasÉScanSoft OmniPage SEÉOmniPage SE.
u Haga doble clic en el icono OmniPage SE en la carpeta de
instalación del programa o bien en el escritorio de Windows si lo
colocó ahí.
u Haga doble clic en el icono o nombre de archivo de un documento
de OmniPage (OPD); el documento se carga en el programa.
Consulte la sección Documentos OmniPage en el capítulo 2.
Al abrirlo, aparece la pantalla de título de OmniPage SE y luego su escritorio.
En el capítulo 2 encontrará una introducción al escritorio de OmniPage SE.
16
INSTALACIÓN Y CONFIGURACIÓN
Hay muchos modos de ejecutar el programa con una interfaz limitada:
u Utilice el programa Programar OCR. Haga clic en Inicio en la barra
de tareas de Windows y elija ProgramasÉScanSoft OmniPage SEÉ
Programar OCR. Consulte la sección Procesamiento de documentos
con Programar OCR en el capítulo 3.
u Haga clic en Obtener texto en el menú Archivo de una aplicación
registrada con la función Direct OCR™. Consulte la sección Cómo
configurar Direct OCR en el capítulo 3.
u Haga clic con el botón derecho del ratón en el nombre o icono de
un archivo de imagen para obtener un menú rápido. Seleccione un
elemento de submenú de ‘Convertir a...’ a fin de definir un destino.
u En productos de administración para documentos PaperPort ® o Pagis ®
de ScanSoft, utilice OmniPage SE a fin de obtener los servicios OCR.
Consulte el capítulo 3 (Cómo usar OmniPage SE con el software
PaperPort).
REGISTRO DEL SOFTWARE
El Asistente para el registro de ScanSoft se ejecuta al final de la instalación.
Se proporciona un sencillo formulario electrónico que se puede completar en
menos de cinco minutos.
Una vez lleno el formulario, y tras enviarlo, el programa buscará una
conexión a Internet para efectuar inmediatamente el registro en línea.
Si no registra el software durante la instalación, se le solicitará
periódicamente que lo haga más adelante. También puede registrarse en línea
en nuestro sitio www.scansoft.com en Internet. Haga clic en Support y en la
pantalla principal de apoyo técnico elija la opción para registrarse, situada en
la columna izquierda.
Para conocer la declaración sobre el uso de los datos de registro, revise la
política de confidencialidad de ScanSoft.
REGISTRO
DEL SOFTWARE
17
NUEVAS CARACTERÍSTICAS DE OMNIPAGE PRO 11
La familia de productos OmniPage® ha sido ampliada con OmniPage Pro 11
y OmniPage SE. Esta sección enumera las mejoras introducidas en el
producto profesional OmniPage Pro 11. Algunas se encuentran también en
OmniPage SE, tal y como describe la siguiente sección.
Nuevas características de OmniPage Pro 11 comparadas con
OmniPage Pro 10 son:
u Mayor exactitud - los motores de reconocimiento con un diseño
mejorado hacen que OmniPage Pro 11 sea el OmniPage de mayor
exactitud.
u Diseño de página mejorado - OmniPage Pro 11 permite conservar el
formato real del original, incluso en páginas con tablas no
cuadriculadas, encabezados y pies de página y mayúsculas
embutidas.
u Verificación ortográfica más inteligente - La nueva característica
IntelliTrain utiliza automáticamente correcciones previas para
generar mejores resultados de OCR.
u Capacidad de PDF - Ahora se pueden importar archivos PDF
(incluso de sólo lectura) y convertirlos en archivos de su programa
favorito (Word, Excel, etc.). También se pueden crear archivos PDF
a partir de cualquier documento en papel o archivo de imagen.
u HTML de mejor calidad - La nueva salida de HTML tipo
“WYSIWYG” (que significa “lo que se ve es lo que se obtiene”)
permite manipular gráficos, texto y fondos para que el archivo web
de salida quede igual que el documento original.
u Compatibilidad de idiomas - OmniPage Pro 11 es compatible ahora
con más de 100 idiomas e incluye los alfabetos griego y cirílico.
u Vista detallada - Permite personalizar más información acerca de
cada página, facilitando la manipulación de páginas en un
documento.
u Editor de texto - Un nuevo y completo editor tipo “WYSIWYG”
que brinda un mejor reconocimiento, con una gran variedad de
herramientas de edición, compatibilidad de colores y una gama de
cuatro niveles de formato para visualización y exportación.
18
INSTALACIÓN Y CONFIGURACIÓN
u Mejores resultados en texto en mal estado - Un nuevo módulo de
refinamiento reduce considerablemente los errores en fondos con
manchas, sombreados y en color.
OMNIPAGE SE Y OMNIPAGE PRO 11
El listado siguiente enumera características que no han sido incluidas en
OmniPage SE. Puede disponer de ellas cuando actualiza a la versión
OmniPage Pro 11:
u Mejora significativa de la precisión en el reconocimiento.
u Acceso a la característica de capacitación IntelliTrain para
reconocimiento de caracteres.
u Posibilidad de abrir y leer el contenido de archivos PDF.
u Posibilidad de guardar documentos reconocidos a formato PDF.
u Posibilidad de abrir archivos de imagen en formato TIFF FX.
u Reconocimiento de archivos de imagen en formato LZW TIFF y
GIF en la entrada y en la salida.
u Compatibilidad con el formato HTML 4.0 para salida WYSIWYG.
u El número de idiomas reconocidos asciende de unos 50 a un
centenar.
u Acceso a software de lectura en voz alta, que permite leer en voz alta
los textos reconocidos.
Para obtener más información o actualizar su versión, visite la dirección
www.scansoft.com.
OMNIPAGE SE
Y
O M N I P A G E P R O 11
19
2 Introducción
Probablemente usted utiliza su ordenador para procesar correspondencia
comercial, elaborar informes, manipular datos y llevar a cabo un número
cada vez mayor de tareas. El desafío es que, a pesar de la revolución digital,
ciertas fuentes de información aún circulan en papel o formato impreso, por
lo que no se pueden procesar inmediatamente en un ordenador.
Por ejemplo, si desea incorporar información acerca del artículo de una
revista en un informe que esté preparando, de algún modo tiene que
incorporar el texto del artículo en su equipo. Ciertamente, la engorrosa
redigitación del artículo no es la solución más atractiva.
Este capítulo le presenta la solución ideal: reconocimiento óptico de
caracteres (OCR). Describe la forma en que OmniPage SE utiliza la
tecnología OCR para transformar texto de páginas exploradas o archivos de
imágenes en texto que podrá editar con sus aplicaciones informáticas
favoritas.
Los temas tratados son los siguientes:
u Qué es el reconocimiento óptico de caracteres?
u Documentos en OmniPage SE
u Pasos básicos de procesamiento
u El escritorio de OmniPage SE
u Administración de documentos
u Documentos OmniPage
OMNIPAGE SE MANUAL
DEL USUARIO
21
QUÉ ES EL RECONOCIMIENTO ÓPTICO DE CARACTERES?
El reconocimiento óptico de caracteres es el proceso de extracción de texto de
una imagen. Esta imagen puede obtenerse a partir de la exploración de un
documento en papel o de la apertura del archivo electrónico de una imagen.
Las imágenes no tienen caracteres editables de texto, sino muchos puntos
diminutos (píxeles) que en conjunto producen formas de caracteres. Éstos
presentan una imagen del texto en una página.
Durante el OCR, OmniPage SE analiza las formas de los caracteres presentes
en una imagen y define las soluciones para producir texto editable. Tras el
OCR, se puede guardar el texto resultante en una gran variedad de
aplicaciones de procesamiento de texto, autoedición u hojas de cálculo.
Funciones de OCR de OmniPage SE
Además del reconocimiento de texto, OmniPage SE puede mantener los
siguientes elementos en un documento mediante el procedimiento de OCR.
Gráficos
Ejemplos de gráficos son las fotografías, logotipos y diagramas.
Formato de texto
Tipos, tamaños y estilos de fuente (tales como negrita, cursiva y subrayado)
son ejemplos de formato de caracteres. Sangrías, tabuladores, márgenes y
espaciado entre líneas son ejemplos de formato de párrafo.
Formato de página
Estructura de columnas, formatos de tablas y colocación de gráficos y
encabezados son ejemplos de formato de página.
Los elementos de formato de gráficos, texto y página que mantiene
OmniPage SE se determinan según los parámetros que seleccione el usuario.
En la sección de Pautas de parámetros de la Ayuda en línea encontrará más
información acerca de la selección de parámetros.
Nota OmniPage SE sólo reconoce caracteres generados por máquina tales
como impresoras offset o láser, o texto digitado en una máquina de escribir.
Sin embargo, puede mantener texto manuscrito, tal como una firma, como
un gráfico.
22
INTRODUCCIÓN
DOCUMENTOS EN OMNIPAGE SE
OmniPage SE puede trabajar con un solo documento a la vez. Cuando
obtenga la primera imagen (del escáner o a partir de un archivo) se generará
un nuevo documento. Las imágenes subsiguientes se irán agregando al
mismo documento, hasta que lo guarde y lo cierre.
Un documento en OmniPage SE consta de una imagen por cada página del
documento. Tras efectuar el OCR, el documento también contendrá el texto
reconocido, visualizado en el Editor de texto, posiblemente junto con los
gráficos y tablas. En la sección El escritorio de OmniPage SE encontrará más
información acerca de las áreas de las pantallas.
PASOS BÁSICOS DE PROCESAMIENTO
Hay dos formas principales de manipular los documentos: con procesamiento automático o procesamiento manual. Consulte Procesamiento automático de documentos y Procesamiento manual de documentos en el capítulo 3.
Los pasos básicos para ambos métodos de procesamiento son muy similares:
1. Abra un conjunto de imágenes con OmniPage SE.
Podrá explorar un documento en papel con o sin un alimentador automático de documentos, o bien cargar uno o más archivos de imágenes.
Las imágenes resultantes aparecerán en miniatura en la vista de miniatura del Administrador de documentos y las páginas resumidas en su
vista de detalles. La imagen de la página actual se ve en el área de la imagen original.
2. Realice el OCR para generar texto editable.
Durante el OCR, OmniPage SE crea zonas alrededor de los elementos
en la página que se procesará, y luego interpreta los caracteres de texto o
gráficos en cada zona. También es posible efectuar una separación de
zonas manual o por plantilla. Después del OCR, se puede revisar y
corregir los errores en el documento utilizando el Verificador de OCR y
editar el documento mediante el Editor de texto.
3. Exportar el documento a la ubicación deseada.
Al guardar el documento se le puede designar un tipo y nombre de
archivo específicos, colocarlo en el Portapapeles, o bien adjuntarlo a un
mensaje de correo electrónico. Se puede guardar como documento de
OmniPage (OPD), tal como se describirá más adelante. Se puede
guardar el mismo documento varias veces en diferentes destinos, como
diferentes tipos de archivo y con diferentes parámetros y niveles de
formato. Consulte el capítulo 5.
DOCUMENTOS
EN
OMNIPAGE SE
23
EL ESCRITORIO DE OMNIPAGE SE
El escritorio de OmniPage SE tiene una barra de título y una barra de menús
en su parte superior, y una barra de estado en la parte inferior. Tiene tres
áreas de trabajo principales, separadas por divisores: el Administrador de
documentos, el área Imagen original y el Editor de texto. El Administrador
de documentos tiene dos paneles separados: vista de miniatura y vista de
detalles. El área Imagen original tiene una barra de herramientas Imagen y el
Editor de texto tiene una barra de herramientas de formato.
Barra de herramientas de formato
Barra de herramientas
Estándar
Caja de herramientas
de OmniPage
La página actual tiene
un borde pálido.
Esta página ya ha
sido reconocida.
La vista de miniatura
muestra una imagen de
cada página en el
documento.
Botones de navegación
de páginas
Botones para mostrar,
ocultar o reorganizar
las áreas de trabajo.
Barra de
herramient
as Imagen
Arrastre este divisor a la
izquierda o a la derecha para
cambiar el tamaño de las
áreas de trabajo.
Área Imagen original
Aquí aparece la imagen de la página actual,
junto con las zonas que se coloquen automática
o manualmente en dicha imagen.
Nota
Los botones de la vista
del Editor de texto
ofrecen cuatro niveles de
formato.
Editor de texto Sirve para
mostrar los resultados del
reconocimiento para la página
actual en la vista True Page™.
Para controlar cuál de las tres vistas (Administrador de documentos,
Imagen original y Editor de texto) aparecerá, active o desactive cada vista en
el menú Ver o bien los botones de la barra de estado.
24
INTRODUCCIÓN
La Caja de herramientas de OmniPage permite controlar el procesamiento.
Puede tener tres estados, dependiendo de cuál de las tres fichas de la
izquierda estén seleccionadas. En la figura, se aprecia el aspecto de OCR
manual. El programa aparece con un documento de tres páginas. La página
uno es la página actual, que se ha reconocido y verificado. La página dos se
ha reconocido pero aún no se ha verificado. La página tres se ha obtenido y
separado manualmente por zonas, pero aún no se ha reconocido. Los iconos
situados en la parte inferior derecha de las imágenes de miniatura muestran
el estado de la página.
Los botones de la barra de estado permiten mostrar, ocultar o reorganizar las
áreas de la pantalla principal y desplazarse a otras páginas del documento.
Al hacer clic con el botón derecho del ratón en cualquier área de la pantalla
se obtiene un menú rápido con los comandos más útiles para dicha área.
Barra de herramientas Estándar
La barra de herramientas Estándar contiene botones y una lista desplegable
para efectuar las tareas más comunes. Se puede desplazar y acoplar a
cualquier borde del escritorio de OmniPage SE. También es posible acceder
a estas funciones mediante menús.
Nuevo
abre un
documento
nuevo.
Guardar
el documento actual
con el nombre y tipo
que tenía la última vez
que fue guardado.
Abrir un
Documento
OmniPage
Imprimir
imágenes o resultados
de reconocimiento de
todas las páginas o
sólo de las
seleccionadas.
Verificar
el texto
reconocido.
Cortar
la selección
actual en el Editor
de texto.
Copiar
la selección actual
del Editor de texto.
Pegar
la selección en el
Editor de texto.
Deshacer
la última
acción de
edición.
Zoom en el área activa:
Imagen original o Editor de
texto.
Abrir
el cuadro de diálogo
Opciones.
Ayuda
contextual
Barra de menús
Para obtener información concisa acerca de algún elemento de menú, haga
clic en el botón de ayuda contextual y luego en el elemento de menú que
desee. El texto emergente le explicará la función del elemento de menú en
cuestión. Haga clic en cualquier lugar para cerrar el cuadro emergente.
EL
ESCRITORIO DE
OMNIPAGE SE
25
Barra de herramientas Imagen
La barra de herramientas Imagen contiene botones que permiten acercarse o
alejarse de la imagen actual, o bien girarla. También permiten trabajar con
zonas y divisores de tablas en la página. Consulte Separación manual de zonas
y Cuadrículas de tablas en la imagen el en capítulo 3. Aquí hemos resumido
las funciones de los botones. La barra de herramientas Imagen se puede
desplazar (es decir, desacoplar y mover a cualquier otro lugar del escritorio).
Se puede acoplar a cualquier borde del área Imagen original.
Dibujar
zonas rectangulares.
Dibujar
zonas irregulares.
Agregar
a una zona o
combinar
zonas.
Quitar de una
zona o zonas
individuales.
Reordenar
zonas.
Mover
separadores de
fila o columna en
una tabla.
Propiedades
de zona
Insertar
separadores
de fila en una
tabla.
Insertar
separadores de
columna en una
tabla.
Acercar
Eliminar/
Reemplazar todos la imagen de
una página.
los separadores de
fila y columna.
Girar
Eliminar
separadores de fila imágenes.
o columna uno por
uno.
Alejar
la imagen de
una página.
Consejo
También se puede cambiar el tamaño o girar la imagen original
con un menú rápido. Haga clic con el botón derecho del ratón en el área de
Imagen original fuera de una zona y seleccione un valor de zoom o giro.
Barra de herramientas de formato
La barra de herramientas de formato contiene botones que permiten modificar el texto reconocido en el Editor de texto. Esto se describe en detalle en el
capítulo 4 (Edición de texto e imágenes). Aquí presentamos un resumen de la
función de los botones. La barra de herramientas de formato siempre permanece en la parte superior del Editor de texto.
Estilos de
párrafo
Nombre de la
fuente
Tamaño de
la fuente
Negrita
Subrayado
Cursiva
26
INTRODUCCIÓN
Alineación
de párrafo
Mostrar/Ocultar
caracteres no imprimibles.
Viñetas
Caja de herramientas de OmniPage
Esta caja de herramientas permite controlar el procesamiento. De forma
predeterminada, está situada en la parte superior del escritorio de OmniPage
SE, justo sobre las áreas de trabajo. Se puede desplazar y acoplar a la parte
inferior del escritorio.
Tiene tres fichas a la izquierda: AutoOCR™, OCR manual y Asistente de
OCR. Haga clic en una de ellas para ver sus controles en la Caja de
herramientas. En la imagen al principio de esta sección se aprecia el escritorio
de OmniPage con la barra de herramientas OCR manual. La barra de
herramientas AutoOCR tiene el siguiente aspecto.
El procesamiento Automático se inicia, se puede detener y reiniciar con los
botones situados a la derecha de la barra de herramientas. El uso de estos
botones y todos los parámetros se describen en la sección Procesamiento
automático de documentos, en el capítulo 3.
Se puede alternar entre el procesamiento automático y manual en cualquier
momento en que el programa no esté ocupado en algún tipo de
procesamiento. Eso significa que se puede alternar entre ambos modos
mientras esté trabajando en algún documento. Es posible procesar
automáticamente algunas páginas, y luego agregar más páginas con el
procesamiento manual. Tras procesar un grupo de páginas en forma
automática, se pueden revisar los resultados y volver a procesar ciertas
páginas manualmente. Este procedimiento también se describe en el
capítulo 3, Procesamiento automático de un documento y terminación manual.
OmniPage SE debe estar vacío al iniciar el Asistente de OCR. Cuando lo
haya utilizado para procesar y guardar un documento, permanece en el
programa y se puede utilizar posteriormente (agregar más páginas, reconocer
páginas, etc.) con el procesamiento manual o automático. Consulte
Procesamiento de documentos utilizando el Asistente de OCR en el capitulo 3.
EL
ESCRITORIO DE
OMNIPAGE SE
27
ADMINISTRACIÓN DE DOCUMENTOS
El Administrador de documentos está situado a la izquierda del escritorio de
OmniPage SE. Tiene dos paneles separados: vista de miniatura y vista de
detalles. Haga clic en una ficha para apreciar cómo se ve. Ambas vistas resumen las páginas del documento y están sincronizadas: la página actual y las
seleccionadas permanecen invariables cuando se cambia de vista. Nuestras
imágenes muestran las dos vistas con el mismo documento de cuatro páginas. Las páginas 1 y 2 están seleccionadas y la página 4 es la página actual, es
decir, la que aparece en el área Imagen original. El Administrador de documentos muestra el estado de la página con los siguientes iconos:
Icono de
miniatura
Icono de
detalle
Página
Estado
La imagen de página se ha...
1
Obtenido
2
Separado
por zonas
3
Reconocido
Reconocido, pero no verificado, o bien la verificación se interrumpió en la página.
4
Verificado
Reconocido, y la verificación ha llegado al final de la
página.
Obtenido sin zonas manuales ni de plantilla y aún
no se ha reconocido.
—
—
Obtenido y se han colocado zonas manuales o de
plantilla; pero aún no se ha reconocido.
Vista de miniatura
Esta vista presenta un conjunto vertical de imágenes en miniatura numeradas,
una para cada página del documento. Desplácese para ver las páginas según sea
necesario. La página actual tiene un fondo más pálido y su número de página
aparece en negrita. Se pueden seleccionar varias páginas en el documento; éstas
tendrán un aspecto ‘embutido’. El icono de estado aparece en la parte inferior
derecha de cada página, tal como se describió anteriormente.
Pasar a una página: haga clic en el icono de la página deseada.
Reordenar una página: haga clic en la miniatura de la página que desee
mover, luego arrástrela y colóquela sobre el número de la página deseada.
Las páginas se vuelven a numerar automáticamente.
Eliminar una página: seleccione la miniatura de la página que desee
suprimir y pulse la tecla Suprimir.
Seleccionar varias páginas: mantenga pulsada la tecla Mayús y haga clic en
dos miniaturas para seleccionar todas las páginas entre ellas (inclusive). Mantenga pulsada la tecla Ctrl cuando haga clic en las miniaturas para agregar
páginas individualmente a la selección. Es posible mover o eliminar las páginas seleccionadas como grupo, o bien enviarlas para su reconocimiento.
28
INTRODUCCIÓN
Vista de detalles
Esta es una nueva función de OmniPage SE. Proporciona una vista general
del documento con una tabla. Cada fila representa una página. Las columnas
presentan información estadística o de estado para cada página, y (cuando
corresponde) los totales del documento. En la imagen que aparece a
continuación se aprecian las columnas predeterminadas a la izquierda y
cuatro columnas especificadas por un usuario.
Coloque el cursor en
el icono de estado
de la página para
ver una miniatura de
la misma.
Esto muestra el
número de zonas
de cada tipo en la
página.
La página actual aparece resaltada. Se puede usar la vista de detalles para las
operaciones de la página, tal como se indica a continuación:
Pasar a una página: haga clic en una fila de la página deseada.
Reordenar una página: haga clic en la fila de la página que desee mover y
arrástrela a la ubicación deseada. Un indicador de flecha en la izquierda
muestra dónde se insertará la página. Las páginas se vuelven a numerar
automáticamente.
Eliminar una página: seleccione la fila de la página que desee suprimir y
pulse la tecla Suprimir.
Seleccionar varias páginas: mantenga pulsada la tecla Mayús y haga clic en
dos filas de página para seleccionar todas las páginas entre ellas (inclusive).
Mantenga pulsada la tecla Ctrl cuando haga clic en las filas para agregar
páginas individualmente a la selección. Es posible mover o eliminar las
páginas seleccionadas como grupo, o bien enviarlas para su reconocimiento.
Cuando se seleccionen varias páginas, la página indicada como actual no
cambiará. Todas las páginas seleccionadas quedan resaltadas.
Consejo
Es posible obtener información del tamaño de la imagen
colocando el cursor sobre una miniatura o fuera de una zona en una imagen
original. El texto emergente mostrará el tamaño de la imagen en píxeles y en
la unidad de medición del programa. También aparece la resolución de la
imagen.
ADMINISTRACIÓN
DE DOCUMENTOS
29
Personalizar columnas en la vista de detalles
Es posible especificar cuáles columnas de información desea apreciar en la
vista de detalles. Haga clic en Personalizar detalles... en el menú Ver para
invocar el siguiente cuadro de diálogo:
Este elemento se
resalta.
Haga clic en la
casilla de
verificación de un
elemento para
seleccionarlo.
Resalte un
elemento y utilice
estas flechas
para cambiar el
orden de las
columnas.
Los tamaños de las
imágenes se
expresan en
píxeles.
Defina el ancho de
un elemento
resaltado.
Defina cuáles columnas deben aparecer, sus anchos y el orden. En el
apartado sobre Personalización de columnas en la vista de detalles de la
ayuda en línea se clarifica lo que se presenta en cada columna. Es posible
cambiar fácilmente el ancho de las columnas en la vista de detalles; para ello
arrastre los separadores de columna en la barra de título.
Eliminar páginas de un documento
La eliminación de páginas se debe confirmar y se puede deshacer. Suprima la
página actual sólo mediante el elemento Eliminar la página actual en el menú
Editar. Para suprimir todas las páginas seleccionadas en el Administrador de
documentos (en cualquier vista) se debe pulsar la tecla Suprimir o bien usar
el comando de menú rápido Borrar.
Imprimir un documento
Es posible imprimir el documento con el elemento Imprimir en el menú
Archivo. Elija si desea imprimir imágenes o texto (es decir, los resultados del
reconocimiento tal como aparecen en el Editor de texto). Se pueden impri-
30
INTRODUCCIÓN
mir todas las páginas o un rango de páginas. El botón Imprimir en la barra
de herramientas Estándar permite imprimir imágenes o texto, dependiendo
de si está activa el área de la Imagen original o del Editor de texto.
Cerrar un documento
Seleccione Cerrar en el menú Archivo para cerrar un documento. Se le
solicitará que guarde el documento si no lo ha hecho o bien si lo ha
modificado desde la última vez que lo guardó. Consulte la siguiente sección
sobre cómo guardarlo como documento de OmniPage (*.opd). También se
le solicitará guardar los datos de capacitación que no se hayan guardado si es
que seleccionó ‘Interrogar antes de guardar datos de IntelliTrain al cerrar un
documento’ en el panel Verificación del cuadro de diálogo Opciones.
La frase anterior no se aplica a OmniPage SE.
DOCUMENTOS OMNIPAGE
El documento de OmniPage es el tipo de archivo original del programa, y
que tiene extensión .opd. Es uno de los tipos de archivo ofrecidos al guardar
un documento como archivo. Guarde el documento como archivo tipo
OPD si desea trabajar con él nuevamente en OmniPage SE durante una
sesión futura. Luego puede procesar páginas sin terminar, agregar más
páginas y verificar o editar resultados reconocidos.
Un documento de OmniPage contiene imágenes de las páginas originales
con las zonas que éstas contengan. Tras el reconocimiento, el documento
OPD también contendrá los resultados del reconocimiento. Los caracteres
reconocidos se almacenan junto con sus datos de coordenadas e índices de
certeza. Ello conserva los vínculos entre imagen y texto, de modo que la
verificación esté disponible al volver a abrir el documento OPD en sesiones
futuras.
Al guardar un documento de OmniPage, también se almacenan los parámetros actuales (y la información de capacitación no guardada). Al abrir un
documento de OmniPage, se aplican sus parámetros, reemplazando temporalmente los existentes en el programa.
DOCUMENTOS OMNIPAGE
31
Por qué guardar el documento como tipo OPD
No es necesario guardar los documentos como archivos tipo OPD. Esto se
hace normalmente por las siguientes razones:
No se puede terminar de trabajar con el documento en la sesión actual.
Es necesario pasar el documento a otros usuarios que tienen la versión
Omnipage SE o Pro 11. Por ejemplo, se puede pasar un archivo OPD a
un especialista para su verificación. En la red de una oficina, se puede
contar con un escáner que genere imágenes para reconocimiento y
realizar la verificación en diversas estaciones de trabajo.
Se desea archivar los documentos reconocidos cuyas imágenes originales
continúen siendo accesibles. Los textos reconocidos permiten buscar por
palabras clave y otras técnicas de recuperación de documentos.
Nota
Los resultados del reconocimiento se deben guardar a partir de
archivos OPD antes de instalar una actualización de OmniPage. Puede que
estos archivos no sean compatibles con las versiones más recientes de los
formatos de archivo OPD, o posiblemente sólo se conserven las imágenes al
actualizar los archivos.
Cómo guardar un archivo en formato OPD
Si desea crear un documento OPD, puede guardarlo en este formato desde
un comienzo, para fines de protección. Utilice el botón Guardar para irlo
guardando periódicamente a medida que vaya trabajando. Guárdelo
nuevamente al final de la sesión.
El botón Guardar permite grabar el documento con el mismo nombre y tipo
de archivo que tenía la última vez que se almacenó. Se puede guardar el
documento varias veces en diferentes formatos. Si lo almacenó la primera vez
en otro formato (por ejemplo .DOC), utilice el elemento Guardar como...
en el menú Archivo para guardarlo como OPD. Si un documento se guarda
como OPD, y luego lo guarda con otro formato, no se volverá a almacenar
automáticamente como OPD. Al cerrar el documento o salir del programa,
se le solicitará guardar el documento como OPD.
32
INTRODUCCIÓN
PARÁMETROS
El cuadro de diálogo Opciones es la ubicación central para los parámetros de
OmniPage SE. Tiene siete paneles. La ayuda contextual proporciona
información sobre cada parámetro. En general, los paneles de parámetros son
los siguientes:
OCR
Utilice este último para especificar el idioma o idiomas de reconocimiento, el
diccionario del usuario, un carácter de rechazo, un método de OCR
(optimícelo para mayor velocidad o precisión) y la coincidencia de fuentes.
Escáner
Utilice esta opción para definir el tamaño de página y la orientación de
exploración. También se pueden fijar ajustes de brillo y contraste, y definir
opciones para explorar documentos de varias páginas, sin importar si se
cuenta o no con un alimentador automático de documentos (ADF).
Es posible cambiar los parámetros de configuración del escáner, instalar un
nuevo escáner, o bien cambiar el escáner predeterminado.
Direct OCR™
Esta característica proporciona servicios de OCR directamente desde su
procesador de texto favorito u otra aplicación similar. Utilice este panel para
registrar y eliminar el registro de las aplicaciones para Direct OCR, así como
para habilitar o inhabilitar este servicio. También se puede especificar la
separación de zonas automática o manual y si se desea o no la verificación.
PARÁMETROS
33
Proceso
Utilice esta opción para definir dónde se colocarán nuevas imágenes en el
documento y para fijar otras preferencias que regirán el procesamiento. Aquí
también se puede cambiar el idioma de la interfaz.
Verificación
Utilice esta opción para definir si la verificación debe comenzar
automáticamente tras el reconocimiento. Defina también si se debe ejecutar
IntelliTrain, y utilícela para cargar o trabajar con un archivo de capacitación.
Encontrará más detalles en la sección Verificación de los resultados de OCR del
capítulo 4.
Las referencias a la función IntelliTrain no se aplican a OmniPage SE.
Diseño personalizado
Utilice esta opción para describir en forma precisa el diseño de las páginas del
documento de entrada. Esto permite el máximo control sobre el proceso de
separación automática de zonas, indicándole que busque o ignore las
columnas, gráficos y tablas.
Editor de texto
Utilice esta opción para mostrar u ocultar ciertas características en el Editor
de texto, para definir la unidad de medición que se va a utilizar y para activar
o desactivar la acomodación de texto.
Nota
Algunos parámetros surten efecto sólo en el reconocimiento futuro.
Se pueden citar como ejemplos los idiomas de reconocimiento, un archivo
de capacitación y el brillo del escáner. Estos parámetros se deben ajustar
correctamente antes de comenzar el procesamiento. Para aplicar los cambios
en estos parámetros a páginas ya reconocidas, se deberá volver a reconocerlas.
Los demás parámetros surten efecto inmediatamente en todas las páginas
existentes. Ello ocurre por ejemplo con parámetros del Editor de texto tales
como la acomodación de texto y las unidades de medición.
34
INTRODUCCIÓN
3 Tutorial: Procesamiento
de documentos
En este capítulo se describen diferentes formas en que se puede procesar un
documento, y además se proporciona información acerca de los aspectos
fundamentales de estos tipos de procesamiento.
u
u
u
u
u
u
Guía de inicio rápido
Procesamiento de documentos utilizando el Asistente de OCR
Procesamiento automático de documentos
Procesamiento manual de documentos
Procesamiento automático de un documento y terminación manual
Procesamiento a partir de otras aplicaciones
(Direct OCR, PaperPort)
u Procesamiento de documentos con Programar OCR
Los temas detallados son:
u
u
u
u
u
Definición del origen de imágenes de las páginas
Descripción del diseño del documento
Separación manual de zonas
Cuadrículas de tablas en la imagen
Uso de plantillas de zonas
OMNIPAGE SE MANUAL
DEL USUARIO
35
GUÍA DE INICIO RÁPIDO
Esta sección muestra paso a paso el proceso básico de OCR.
Carga y reconocimiento de archivos de imágenes de ejemplo
Encontrará ejemplos de archivos de imágenes en la carpeta del programa,
tanto archivos de una página como de varias páginas. Primero intente leer
estos archivos utilizando el procedimiento que se indica a continuación, pero
ignorando las referencias al escáner. En la sección Entrada desde archivos de
imagen encontrará más información sobre la obtención de imágenes. Los
resultados le proporcionarán un parámetro sobre la calidad del
reconocimiento que puede esperar a partir de sus propios archivos de calidad
similar.
A continuación, intente explorar una página con su escáner.
Exploración y reconocimiento de una sola página
Encienda el escáner y cerciórese de que funciona correctamente. Seleccione
una página con texto nítido de buena calidad para esta prueba.
Se da por sentado que se fijaron los parámetros predeterminados de
OmniPage SE y que el documento está en el idioma que se especificó para la
interfaz durante la instalación. Abra el cuadro de diálogo Opciones en el
menú Herramientas y elija la opción Predeterminados si no está utilizando el
programa por primera vez.
Procesará el documento en forma automática y se guardarán los resultados de
reconocimiento en un archivo. Podrá verificar el documento pero no editar el
contenido en el Editor de texto de OmniPage SE.
36
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
Acción
Resultado
1.
Configure el escáner utilizando el Asistente del
escáner, si aún no lo ha hecho.
Configura OmniPage SE para que funcione con su
escáner.
2.
Seleccione InicioÉProgramasÉScanSoft
OmniPage SE É OmniPage SE
Abre OmniPage SE en su equipo.
3.
Coloque el documento correctamente en el
escáner.
4.
Revise los tres botones de ficha a la izquierda de
la Caja de herramientas de OmniPro. El botón
AutoOCR debe estar seleccionado. De no ser
así, haca clic en él.
Especifica que desea que OmniPage SE procese el
documento automáticamente según los parámetros fijados.
5.
En el menú desplegable Obtener página, seleccione una opción de exploración para el documento: blanco y negro, escala de grises o color.
Permite determinar la forma en que se verán las imágenes, texto de color y fondos en el documento exportado.
La exploración en colores necesita un escáner en color.
6.
En el menú desplegable Describir el original,
verifique que esté seleccionada la opción Automático. Esta es la mejor opción para procesar
una gran variedad de documentos.
Configura OmniPage SE para que coloque zonas en la
página y decide sus propiedades en forma automática.
7.
En el menú desplegable Exportar resultados,
verifique que esté seleccionada la opción Guardar como archivo.
Esto significa que podrá nombrar el archivo de exportación tras haber verificado el documento.
8.
Haga clic en Iniciar.
OmniPage SE comenzará a explorar el documento.
9.
Aparecerá el Verificador de OCR y le solicitará
modificar los términos que el programa sospeche que no se han reconocido correctamente.
El Verificador de OCR funciona como el corrector ortográfico de un procesador de texto, pero además contiene ciertas características específicas de OCR.
10.
Haga clic en el Editor de texto. Seleccione las
vistas del Editor de texto una tras otra, para ver
el aspecto que tendrá la página en cada una de
ellas. Elija la vista que desee para la exportación.
Cada vista del Editor de texto define un nivel de formato.
La vista fijada al momento de guardar el documento se
aplica al texto en el archivo guardado.
11.
Haga clic en Continuar para reiniciar la verificación. Cuando aparezca el mensaje La verificación del reconocimiento está completa, haga clic
en Aceptar.
Con esto termina el proceso del Verificador de OCR.
Aparecerá el cuadro de diálogo Guardar como.
12.
Elija la ubicación y el tipo de archivo para guardar el documento reconocido. Haga clic en
Aceptar.
De forma predeterminada, está activada la opción Guardar e iniciar, de modo que el documento se abrirá automáticamente en el procesador de texto asociado con el
tipo de archivo que seleccione.
13.
Revise el documento en el procesador de texto.
Ha utilizado satisfactoriamente OmniPage SE para
reconocer el documento y abrirlo en la aplicación de
destino
GUÍA
DE INICIO RÁPIDO
37
Consejo
Si obtuvo resultados satisfactorios a partir de los archivos de
imágenes de ejemplo, pero no con una página explorada, revise la instalación
y parámetros del escáner: en especial el brillo y la resolución de la imagen. En
la sección Entrada desde escáner encontrará un modelo de brillo óptimo.
Consulte también los temas de la ayuda en línea sobre Configuración del
escáner y Resolución de problemas del escáner.
A continuación aparece un resumen de los métodos de procesamiento que se
pueden utilizar. En las siguientes páginas, encontrará una guía detallada para
cada uno de ellos.
Uso del Asistente de OCR
El Asistente de OCR le guiará a través de la selección de parámetros y
comandos mediante una serie de preguntas. Luego iniciará el procesamiento
automático. Esta es una buena manera de comenzar si aún no tiene mucha
experiencia en el uso de OmniPage SE.
Automáticamente
La manera más rápida y sencilla de procesar documentos es dejar que
OmniPage SE lo haga automáticamente. Seleccione los parámetros en el
cuadro de diálogo Opciones y los comandos en la barra de herramientas
AutoOCR y luego haga clic en Iniciar. El programa procesará cada página
por todo el procedimiento de principio a fin, efectuando pasos en paralelo
cada vez que sea posible. Generalmente separará de manera automática las
zonas de las páginas.
Manualmente
El procesamiento manual le brinda un control más preciso sobre la forma de
manipulación de las páginas. Podrá procesar el documento página por página
con diferentes parámetros para cada una de ellas. El programa también se
detiene entre paso y paso: obtención de imágenes, reconocimiento,
exportación. Esto permite, por ejemplo, dibujar zonas manualmente o
cambiar el idioma o idiomas de reconocimiento. Para iniciar cada paso, se
debe hacer clic en los botones de la barra de herramientas OCR manual.
Automáticamente con terminación manual
Podrá procesar un documento automáticamente y ver los resultados en el
Editor de texto. Si la mayoría de las páginas están en orden, pero algunas no
quedaron como se esperaba, podrá pasar al procesamiento manual para
ajustar los parámetros y efectuar el reconocimiento sólo de las páginas
problemáticas.
38
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
En otras aplicaciones
Podrá usar la característica Direct OCR para recurrir a los servicio de
reconocimiento de OmniPage SE mientras trabaja en su procesador de texto
usual u otra aplicación similar. OmniPage SE se vincula automáticamente
con los programas de administración de documentos PaperPort y Pagis de
ScanSoft.
Posteriormente
Podrá programar trabajos de OCR para que se efectúen posteriormente de
manera automática, incluso sin que sea necesaria su presencia ante el equipo.
El Asistente para Programar OCR permite especificar los parámetros y una
hora de inicio.
PROCESAMIENTO DE DOCUMENTOS UTILIZANDO EL
ASISTENTE DE OCR
El Asistente de OCR le lleva por los seis paneles de parámetros para ayudarle
a fijar los parámetros del documento, y luego inicia el procesamiento
automático. Existe ayuda contextual en todos los paneles del asistente. El
Asistente de OCR puede funcionar solamente cuando no haya un
documento abierto con OmniPage SE.
Haga clic en la ficha Asistente de OCR en la Caja de herramientas de
OmniPage y luego en el botón del asistente para ver su primera pantalla:
PROCESAMIENTO
DE DOCUMENTOS UTILIZANDO EL
ASISTENTE
DE
OC R
39
1. El primer panel permite definir el origen del documento: escáner o
archivo de imagen. Encontrará más información en la sección Definición
del origen de imágenes de las páginas. Responda a las preguntas de la
primera pantalla y haga clic en Siguiente.
2. El segundo panel le solicita que describa el diseño del documento de
entrada, para ayudarle en la separación automática de zonas. Encontrará
más información en la sección Descripción del diseño del documento.
3. El tercer panel (que aparece a continuación) permite definir los idiomas
de reconocimiento y decidir el método de OCR. Los idiomas que
cuenten con diccionario tienen el icono
.
4. El cuarto panel permite definir el nivel de formato que se aplicará al
documento para su presentación y exportación. En el capítulo 4,
Pantalla y vistas del editor, encontrará más información al respecto.
5. El quinto panel le pregunta si desea verificar el texto antes de exportarlo.
Si elige Sí también podrá editar el texto antes de guardar el documento.
También podrá decidir si desea crear y utilizar datos de IntelliTrain
durante la verificación. En el capítulo 4,Verificación de los resultados de
OCR, encontrará más información al respecto.
La referencia a la función IntelliTrain no se aplica a OmniPage SE.
6. El último panel le solicita que defina la alternativa de exportación:
guardar en un archivo o copiar al Portapapeles. Tras fijar la opción, haga
40
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
clic en Terminar para cerrar el asistente y comenzar el procesamiento
automático.
7. Si solicitó verificar y el texto contiene caracteres dudosos, aparecerá el
cuadro de diálogo OCR Proofreader™. Cuando haya concluido la
verificación, los resultados del reconocimiento irán directamente al
Portapapeles, o bien se abrirá el cuadro de diálogo Guardar como para
que se puedan especificar los parámetros de exportación de archivos.
8. El documento permanece en OmniPage SE. Podrá editar los resultados
del reconocimiento y volver a guardarlos en otros formatos. Podrá
cambiar las zonas manualmente o bien modificar otros parámetros y
luego utilizar el procesamiento manual para reconocer páginas
independientes del documento. También podrá agregar páginas
mediante el procesamiento automático o manual.
Nota Los paneles del asistente presentan los parámetros tal como estaban la
última vez que se modificaron en el programa. Además, OmniPage SE
recordará los parámetros que se configuren en los paneles del Asistente de
OCR y los aplicará a los procesamientos futuros, ya sean automáticos o
manuales, hasta que los vuelva a cambiar. De modo que si tiene más
documentos para los cuales sean adecuados los parámetros del Asistente de
OCR, basta con cambiar a la barra de herramientas AutoOCR y hacer clic en
Iniciar.
Nota
Los parámetros pertinentes que no ofrece el Asistente de OCR
adoptan los valores que se fijaron la última vez en el programa. Esto
concierne principalmente a los parámetros del escáner, un diccionario del
usuario o un archivo de capacitación. No es posible usar plantillas de zonas
con el Asistente de OCR. Si al iniciarse el Asistente de OCR se estableció un
archivo de plantilla, éste se descargará y se fijará la opción Automático como
descripción de entrada. No es posible exportar un documento reconocido
adjunto a un mensaje de correo electrónico. En ese caso, utilice el
procesamiento automático o manual.
PROCESAMIENTO
DE DOCUMENTOS UTILIZANDO EL
ASISTENTE
DE
OC R
41
PROCESAMIENTO AUTOMÁTICO DE DOCUMENTOS
El procesamiento automático constituye una manera eficiente de manipular
documentos, especialmente aquéllos de gran tamaño. Primero seleccione
todos los parámetros necesarios, luego podrá usar la barra de herramientas
AutoOCR™ de la Caja de herramientas de OmniPage para procesar un
nuevo documento de principio a fin, o bien reiniciar y terminar el
procesamiento de un documento abierto.
1. Haga clic en la ficha AutoOCR de la Caja de herramientas de OmniPage
para ver la barra de herramientas AutoOCR.
2. Seleccione en la lista desplegable el comando deseado de Obtener
página. Podrá definir el origen del documento, el cual puede provenir de
archivos de imágenes o un escáner. Encontrará más detalles en la sección
Definición del origen de imágenes de las páginas.
3. Seleccione un comando de la lista desplegable Describir el original, tal
como se indicó anteriormente. Esto guía el programa para la separación
automática de zonas de las páginas. Podrá describir las páginas entrantes
o especificar un archivo de plantilla de zonas. Encontrará más información acerca de las opciones en la sección Descripción del diseño del documento.
4. Seleccione un comando de la lista desplegable Exportar resultados. Podrá
guardar el documento reconocido en un archivo, copiarlo al
Portapapeles o bien enviarlo adjunto a un mensaje de correo electrónico.
En el capítulo 5 encontrará información acerca de estas alternativas.
5. Elija Opciones en el menú Herramientas y compruebe que los
parámetros son adecuados para su documento. Es posible, por ejemplo,
especificar los idiomas de reconocimiento y si desea verificar o no el
documento. Consulte la sección Parámetros al final del capítulo 2.
42
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
6. Haga clic en Iniciar o bien seleccione Inicio en el menú Proceso. Cada
página del documento se procesará y terminará una tras otra. El programa puede efectuar tareas individualmente, por ejemplo puede iniciar
la carga y reconocimiento de una nueva página a medida que vaya verificando la página anterior.
Botones de comandos
Iniciar: permite comenzar el procesamiento automático de un nuevo
documento.
Detener: permite interrumpir el procesamiento automático. Le convendrá
hacer esto si encuentra que se deben cambiar algunos parámetros. Luego el
botón Iniciar cambia a Terminar.
El botón de inicio adopta diferentes valores cuando el procesamiento se
detiene o termina.
Terminar: este botón aparece si el procesamiento está incompleto. Permite:
u Terminar de procesar páginas inconclusas.
u Exportar el documento, ignorando las páginas no reconocidas.
Adicional: este botón aparece si todas las páginas existentes se procesaron y
se exportaron una vez. Permite:
u Exportar el documento nuevamente, tal vez con cambios, a
otro tipo, nombre o ubicación de archivo, o bien con otro nivel
de formato.
u Agregar más páginas del mismo origen o de otro, con
parámetros cambiados o intactos.
u Volver a procesar todas las páginas: desecha todos los
resultados de reconocimiento y reconoce todas las páginas del
documento con parámetros distintos. Podrá especificar la
separación automática de zonas o un archivo de plantilla.
Consejo Podrá volver a procesar todas las páginas si un parámetro no
adecuado provocó resultados deficientes en todas las páginas. Un ejemplo
es la elección del idioma incorrecto, lo que puede hacer que aparezcan casi
todos los caracteres marcados como dudosos durante la verificación.
La opción de ‘volver a procesar’ permite efectuar nuevamente el reconocimiento sin tener que explorar, cargar ni efectuar nuevamente la separación
de zonas de todas las imágenes.
PROCESAMIENTO
AUTOMÁTICO DE DOCUMENTOS
43
PROCESAMIENTO MANUAL DE DOCUMENTOS
El procesamiento manual le brinda un control más preciso sobre la forma de
manipular las páginas. Podrá procesar el documento página por página con
diferentes parámetros para cada una de ellas. El programa también se detiene
entre paso y paso: obtención de imágenes, reconocimiento, exportación. Esto
permite, por ejemplo, dibujar zonas manualmente en cada página. Para
iniciar cada paso del proceso, deberá clic en los botones de la barra de
herramientas OCR manual.
1. Haga clic en la ficha OCR manual en la Caja de herramientas de
OmniPage para ver la barra de herramientas OCR manual.
2. Haga clic
en la barra de herramientas Estándar o en Opciones en el
menú Herramientas para marcar o seleccionar los parámetros del cuadro
de diálogo Opciones. Consulte la sección Parámetros al final del
capítulo 2.
3. Seleccione el valor deseado para el botón Obtener página. Podrá definir
el origen del documento, el cual puede provenir de archivos de imágenes
o de un escáner. Acceda al cuadro de diálogo con los parámetros del
escáner y modifíquelos según desee. Encontrará más detalles en la
sección Definición del origen de imágenes de las páginas.
4. Haga clic en el botón Obtener página. Esto invoca el cuadro de diálogo
Cargar archivo, permitiéndole nombrar archivos de imágenes, o bien
inicia la exploración. Como resultado de lo anterior, aparecen una o más
imágenes en el Administrador de documentos, y una en el área Imagen
original.
44
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
5. Ahora podrá dibujar manualmente y modificar zonas en una o más
imágenes y asignar propiedades. Los botones de la barra de estado
permiten pasar a otras páginas. Al solicitarse el reconocimiento, se
efectuará la separación automática de zonas a todas las imágenes que no las
tengan. En la sección Separación manual de zonas encontrará más detalles
al respecto.
6. Seleccione un valor para el botón Realizar OCR. Podrá describir el
diseño de las páginas entrantes. Este valor influye si la separación
automática de zonas se efectúa en un número determinado de páginas.
También se puede seleccionar una plantilla para colocar sus zonas en la
página actual. Encontrará más detalles en las secciones Descripción del
diseño del documento y Uso de plantillas de zonas.
7. Haga clic en el botón Realizar OCR para reconocer la página actual.
Para reorganizar las páginas seleccionadas, haga una selección múltiple
en el Administrador de documentos (consulte el capítulo 2,
Administración de documentos) y luego haga clic en el botón Realizar
OCR.
8. Aparecerá el cuadro de diálogo Instrucciones de separación de zonas, a
menos que lo haya desactivado.
Cuando elija una de sus opciones, comenzará el reconocimiento.
9. Si solicitó verificación, el cuadro de diálogo Verificador de OCR
mostrará los caracteres dudosos uno tras otro en la página o páginas
reconocidas. Podrá verificar y editar el texto reconocido. Consulte el
capítulo 4, Verificación de los resultados de OCR.
10. Continúe cargando páginas, efectuando el OCR, editando y verificando
según desee.
PROCESAMIENTO
MANUAL DE DOCUMENTOS
45
11. Seleccione un valor para el botón Exportar resultados. Podrá guardar el
documento reconocido en un archivo (también como un documento de
OmniPage), copiarlo al Portapapeles, o bien enviarlo adjunto a un
mensaje de correo electrónico. Podrá guardar el documento más de una
vez. Encontrará más información en el capítulo 5.
Nota
Si anula la selección de ‘Buscar zonas además de zonas de plantilla/
actuales’ en el panel Proceso del cuadro de diálogo Opciones, no aparecerá el
cuadro de diálogo Instrucciones de separación de zonas y el reconocimiento
siempre se efectuará sólo con las zonas actuales.
PROCESAMIENTO AUTOMÁTICO DE UN DOCUMENTO Y
TERMINACIÓN MANUAL
Cuando tenga un documento de gran tamaño que contenga sólo algunas
páginas a las que se deba prestar especial atención, no es necesario procesar
manualmente todo el documento. Podrá procesarlo automáticamente y ver
los resultados en el Editor de texto. Luego podrá determinar qué páginas
están en orden, y cuáles necesitan parámetros diferentes o separación manual
de zonas. Finalmente podrá pasar al procesamiento manual para ajustar los
parámetros y zonas, y luego volver a efectuar el reconocimiento de sólo esas
páginas.
1. Prepare el documento y efectúe el procesamiento automático, tal como
ya se describió.
2. Si cierra o termina la verificación, se le solicitará que guarde el
documento. Esto es lo que se recomienda hacer, aun cuando no sea su
forma final.
3. Seleccione una página que necesite parámetros distintos o una nueva
separación de zonas, y haga clic en la ficha OCR manual a la izquierda
de la Caja de herramientas de OmniPage.
4. Elimine o modifique las zonas existentes en el área Imagen original.
También podrá cargar una plantilla para dejar que sus zonas reemplacen
46
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
las existentes. Dibuje nuevas zonas según desee. Consulte la sección
Separación manual de zonas.
5. Cambie otros parámetros según sea necesario para la página actual.
Consulte la sección Parámetros al final del capítulo 2.
6. Haga clic en el botón Realizar OCR para volver a reconocer la página
actual. Confirme que se deben sobreescribir los resultados del reconocimiento anterior. Aparecerá al cuadro de diálogo Instrucciones de separación de zonas, a menos que lo haya desactivado.
7. Para volver a efectuar el reconocimiento de más de una página, seleccione las páginas necesarias en el Administrador de documentos antes de
hacer clic en el botón Realizar OCR.
8. Cuando haya vuelto a reconocer todas las páginas con resultados aceptables, guarde el documento nuevamente.
PROCESAMIENTO A PARTIR DE OTRAS APLICACIONES
Puede usar la característica Direct OCR para recurrir a los servicios de
reconocimiento de OmniPage SE mientras trabaja en su procesador de texto
usual u otra aplicación similar. Primero se debe establecer la conexión directa
con la aplicación. Luego, dos elementos del menú Archivo dan paso a las
funciones de OCR.
Cómo configurar Direct OCR
1. Inicie la aplicación que quiere conectar a OmniPage SE. Inicie
OmniPage SE, abra el cuadro de diálogo Opciones en el panel Direct
OCR y seleccione ‘Activar Direct OCR’.
2. Aparece el panel Sin registrar que muestra las aplicaciones registradas
anteriormente o en ejecución. Seleccione las que desee y haga clic en
Agregar. Podrá examinar en busca de una aplicación que no aparezca en
la lista. Seleccione las opciones de proceso según desee, para que
funcionen según sus preferencias.
PROCESAMIENTO
A PARTIR DE OTRAS APLICACIONES
47
Cómo usar Direct OCR
1. Abra la aplicación registrada y trabaje en un documento. Para obtener
resultados de reconocimiento a partir de páginas exploradas, colóquelas
correctamente en el escáner.
2. Utilice el elemento de menú Obtener parámetros del texto... del menú
Archivo para especificar los parámetros que se utilizarán durante el
reconocimiento. Los parámetros que no se presenten, adoptan sus
valores según los últimos que se utilizaron con OmniPage SE. Los
parámetros cambiados para Direct OCR se cambian también en
OmniPage SE.
3. Utilice el elemento de menú Obtener texto del menú Archivo para
obtener imágenes provenientes del escáner o archivo.
4. Si seleccionó ‘Zonas automáticas’ en el panel Direct OCR del cuadro de
diálogo Opciones, o bien en Obtener parámetros del texto..., el
reconocimiento se efectuará de inmediato.
5. Si no seleccionó ‘Zonas automáticas’, se presentará la imagen de cada
página, permitiéndole dibujar zonas manualmente. Haga clic en el
botón Realizar OCR para comenzar el reconocimiento.
6. Si se especificó la verificación, ésta se llevará a cabo tras el
reconocimiento. Luego el texto reconocido se colocará en la posición del
cursor en la aplicación, con el nivel de formato especificado en Obtener
parámetros del texto... .
Nota
Si se está ejecutando OmniPage SE al momento de invocar Direct
OCR desde una aplicación de destino, se iniciará una segunda instancia de
OmniPage SE.
48
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
Cómo usar OmniPage SE con el software PaperPort
PaperPort® es un software de ScanSoft para la administración de
documentos. Permite vincular páginas con aplicaciones afines. Las
páginas pueden contener imágenes, texto o ambas cosas. Si PaperPort se
encuentra instalado en un equipo en el momento de instalar OmniPage
SE, sus servicios de OCR quedarán disponibles y ampliarán la capacidad
de PaperPort. Podrá elegir un programa de OCR haciendo clic con el
botón derecho del ratón en un enlace de PaperPort para aplicaciones de
texto, seleccionando Preferencias y luego OmniPage SE como paquete
de OCR. Los parámetros de OCR se pueden especificar, tal como en el
caso de Direct OCR.
:
Aquí se ha seleccionado OmniPage SE como el paquete de OCR para
MS Word 2000. Ahora puede arrastrar imágenes de páginas desde el
escritorio de PaperPort al vínculo de MS Word en PaperPort. Mientras se
reconoce el texto, sólo aparecerá un monitor indicando el progreso de
dicho procedimiento. Si se solicita, aparecerán la ventana de separación
manual de zonas de OmniPage SE o la función de verificación. Los
resultados de reconocimiento se colocan en un nuevo documento sin
nombre en la aplicación de destino.
PROCESAMIENTO
A PARTIR DE OTRAS APLICACIONES
49
PROCESAMIENTO DE DOCUMENTOS CON PROGRAMAR
OCR
Podrá programar trabajos de OCR para que se efectúen automáticamente en
cualquier momento dentro de las próximas 24 horas. En cada trabajo se procesa
un documento. Las páginas del documento pueden provenir de archivos de
imágenes o bien de un escáner con alimentador automático de documentos.
No es necesario estar frente a al ordenador en el momento de iniciar el trabajo,
ni tampoco que OmniPage SE esté en funcionamiento. No importa si su
equipo se apaga después de configurar el trabajo, siempre y cuando esté
funcionando a la hora de inicio. Si se han de explorar páginas, el escáner debe
estar funcionando en el momento de iniciar el trabajo, con las páginas cargadas
en el alimentador automático de documentos. A continuación se indica cómo
configurar un trabajo:
1. Haga clic en Programar OCR en el menú Proceso o en el menú Inicio de
Windows: seleccione ProgramasÉScanSoftÉOmniPage SEÉ
Programar OCR.
2. Aparecerá el cuadro de diálogo Programar OCR. Haga clic en Agregar
trabajo... a fin de invocar el Asistente para Agregar trabajo. El programa
le guiará por seis paneles, similares al Asistente de OCR.
3. En el primer panel podrá definir el origen de la imagen. Una
característica adicional le permite procesar todos los archivos de imagen
compatibles en una carpeta definida.
4. Los siguientes tres paneles son similares a los del Asistente de OCR, pero
también podrá especificar un diccionario del usuario. OmniPage Pro 11
permite especificar un archivo de capacitación y ejecutar la función
IntelliTrain. Estas posibilidades no existen en OmniPage SE.
5. El quinto panel permite especificar el nombre, tipo y ubicación de un
archivo de exportación y una opción de separación para dicho archivo.
6. El último panel permite definir la hora de inicio del trabajo, mantener o
eliminar los archivos de entrada tras el procesamiento, y especificar el uso
de un archivo de registro para indicar la finalización del trabajo y los
problemas que se hayan presentado. Haga clic en Terminar para cerrar el
asistente.
50
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
Nota
El cuadro de diálogo Programar OCR enumera cada trabajo e indica
si su estado es Esperando, Ejecución, Error o Completo. Utilice la opción
Modificar trabajo... para cambiar los parámetros de un trabajo en espera.
Podrá modificar y volver a utilizar los trabajos terminados para procesar
nuevos trabajos que necesiten parámetros similares. También podrá eliminar
los trabajos finalizados cuando ya no los necesite.
Encontrará más información en la sección sobre Programación de OCR en la
ayuda en línea.
DEFINICIÓN DEL ORIGEN DE IMÁGENES DE LAS PÁGINAS
Hay dos posibles orígenes de imágenes: desde archivos de imágenes y desde
un escáner. Existen dos tipos principales de escáneres: plano o con
alimentación de hojas. Un escáner puede tener un alimentador automático
de documentos incorporado o agregado, el cual facilita la exploración de
documentos con varias páginas. Las imágenes de los documentos explorados
se pueden introducir directamente en OmniPage SE o bien guardar con el
propio software del escáner en un archivo de imagen, que se puede abrir
posteriormente con OmniPage SE.
Entrada desde archivos de imagen
Podrá crear archivos de imágenes con su propio escáner, o recibirlos por
correo electrónico o como archivos de fax. OmniPage SE puede abrir una
gran variedad de tipos de archivos de imagen; en el capítulo 6 encontrará una
lista de ellos, Tipos de archivos para abrir y guardar imágenes. Los archivos de
imagen se especifican en el cuadro de diálogo Cargar archivo, el cual aparece
al iniciar el procesamiento automático. En el procesamiento manual, haga
clic en el botón Cargar archivo o bien use el menú Proceso. En la parte
inferior del cuadro de diálogo aparecerán los parámetros avanzados, los
cuales se pueden dejar a la vista u ocultar. A continuación aparece su aspecto.
DEFINICIÓN
DEL ORIGEN DE IMÁGENES DE LAS PÁGINAS
51
Haga clic mientras pulsa
la tecla Mayús o bien la
tecla Ctrl a fin de colocar
más de un archivo en el
cuadro de texto Nombre
de archivo.
Ésta es la carpeta actual.
Especifique el tipo o tipos
de archivo que desea ver.
Haga clic en Avanzadas
para abrir el panel inferior
y en Básicas para
cerrarlo.
Esto se puede usar para
archivos TIFF y DCX de
varias páginas.
Utilice esta opción para
agregar individualmente
archivos de carpetas
diferentes y controlar de
manera precisa el orden
de los archivos.
Este es un archivo de
imagen en blanco para la
opción de guardar:
"Archivo nuevo después
de cada página en
blanco".
Normalmente el botón Agregar coloca cada archivo en la parte inferior de la
lista de archivos. Para colocar un archivo en alguna otra posición, resalte el
archivo en la lista. El nuevo archivo se agregará justo a continuación del
archivo resaltado que esté más abajo.
Entrada desde escáner
Se debe contar con un escáner en buen estado, compatible e instalado
correctamente con OmniPage SE. Consulte Configuración del escáner con
OmniPage SE en el capítulo 1. Se ofrecen varios modos de exploración. Al
elegir uno, se deben considerar dos aspectos fundamentales:
u El tipo de salida que se desea para el documento de exportación
u El modo que proporcionará la mayor exactitud de OCR
Explorar en blanco y negro
Seleccione esta opción para explorar en blanco y negro. Esta opción no es la
más idónea si desea color en el documento de salida, ni tampoco si desea que
las imágenes tengan un aspecto similar al de fotografías “en blanco y negro”:
en ese caso se recomienda la exploración en escala de grises. Para una mayor
exactitud de OCR, utilice esta opción para texto oscuro nítido o sobre un
fondo blanco o pálido. Las imágenes en blanco y negro se pueden explorar y
manipular más rápidamente que las demás y ocupan menos espacio de disco.
52
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
Explorar en escala de grises
Seleccione esta opción para usar la exploración en escala de grises. Elija esta
opción para conservar fotografías “blanco y negro” en el documento de
salida. Para una mayor exactitud de OCR, utilice esta opción en páginas con
contraste variable o bajo (donde no haya mucha diferencia entre tonos claros
y oscuros) y con el texto sobre fondos de color o sombreados.
Explorar en color
Seleccione esta opción para explorar en color. Sólo está disponible para
escáneres a color. Elija esta opción si desea obtener gráficos, texto o fondos en
color en el documento de salida. Para mayor exactitud de OCR, esta opción
no ofrece mayores beneficios que la escala de grises (para una resolución
determinada), pero exigirá mucho más tiempo, recursos de memoria y
espacio de disco.
Brillo y contraste
Los parámetros correctos de brillo y contraste juegan un importante papel en
la exactitud de OCR. Fije estos parámetros en el panel Escáner del cuadro de
diálogo Opciones. El diagrama ilustra un ajuste óptimo de brillo. Tras cargar
una imagen, revise su aspecto. Si los caracteres son gruesos y se superponen,
aclare el brillo. Si los caracteres son finos y difusos, oscurezca el brillo. Luego
vuelva a explorar la página.
Deficiente
Tolerable
Buena
Óptima
Buena
Tolerable
Deficiente
DEFINICIÓN
DEL ORIGEN DE IMÁGENES DE LAS PÁGINAS
53
Exploración con un alimentador automático de documentos
La mejor manera de explorar documentos de varias páginas es con un
alimentador automático de documentos. Basta con cargar las páginas en el
orden correcto en el alimentador. Coloque las páginas en blanco si desea
guardar su documento en varios archivos de salida, utilizando la opción
‘Crear un archivo nuevo después de cada página en blanco’. Consulte
Guardar en un archivo en el capítulo 5.
Si tiene un documento que supere la capacidad del alimentador automático
de documentos, seleccione ‘Pedir automáticamente más páginas’ en el panel
Proceso del cuadro de diálogo Opciones. Luego un cuadro de diálogo le
permitirá agregar más lotes de páginas e indicar cuando se hayan explorado
todas las páginas.
Podrá explorar documentos por ambas caras con un alimentador automático
de documentos. Un escáner dúplex administrará esta función de manera
automática. Para los escáneres sencillos, seleccione la opción ‘Explorar
páginas de dos caras’ en el panel Escáner del cuadro de diálogo Opciones.
Luego podrá explorar el documento en apenas algunas pasadas, agrupando
las páginas pares e impares. OmniPage SE fusionará las páginas de manera
automática.
Explorar documentos extensos sin un alimentador automático de
documentos
También es posible explorar eficazmente documentos de varias páginas en un
escáner plano, incluso sin contar con un alimentador automático de
documentos. Seleccione la opción ‘Explorar páginas automáticamente’ en el
panel Escáner del cuadro de diálogo Opciones y defina un valor de pausa en
segundos. Luego el escáner efectuará las pasadas de exploración de manera
automática, haciendo pausas entre cada exploración según el número de
segundos que usted haya definido, lo que le dará tiempo de colocar la página
siguiente. Un cuadro de diálogo le permitirá terminar la pausa antes o bien
solicitar una pausa más prolongada y especificar cuándo explorar la última
página.
54
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
DESCRIPCIÓN DEL DISEÑO DEL DOCUMENTO
Antes del reconocimiento se le solicitará que describa el diseño de las páginas
entrantes para ayudar al proceso de separación automática de zonas. Cuando
utilice el Asistente de OCR, siempre se ejecutará la separación automática de
zonas. Cuando efectúe el procesamiento automático, siempre se ejecutará la
separación automática de zonas a menos que se especifique la utilización de
una plantilla propia. Cuando efectúe el procesamiento manual, a menudo se
ejecutará la separación automática de zonas. Encontrará más detalles en la
ayuda en línea.
A continuación aparecen las opciones de descripción de entradas:
Automático
Elija esta opción para que el programa tome todas las decisiones de separación automática de zonas. El programa decide si el texto está o no en columnas, si un elemento es un gráfico o texto que se reconocerá y si se deben
colocar tablas o no. Elija Automático si el documento contiene páginas con
diseños distintos o desconocidos. Elija esta opción para una página con varias
columnas y una tabla, y para páginas que tengan más de una tabla.
Columna única, sin tabla
Elija este parámetro si las páginas contienen sólo una columna de texto, pero
no una tabla. Las cartas comerciales o páginas de un libro normalmente
tienen estas características. Elija esta opción también para una página con
palabras o números dispuestos en columnas si no desea que éstos se coloquen
en una tabla, que se pierdan las columnas o dejarlos como columnas
independientes. Es posible detectar gráficos.
Varias columnas, sin tabla
Escoja esta opción si algunas de las páginas contienen texto en columnas y
desea hacer desaparecer las columnas o bien conservarlas en columnas independientes, similares al diseño original. Las columnas se pueden conservar en
el documento de salida, ya sea con marcos (si está activada la vista True Page)
o sin ellos (si está activada la vista Mantener flujo de columnas). Si hay datos
tabulados, es probable que se traten como texto de corrido. Es posible detectar gráficos.
Columna única, con tabla
Elija esta opción si la página contiene sólo una columna de texto y una tabla.
La separación automática de zonas no buscará columnas pero tratará de buscar una tabla y colocarla en una cuadrícula en el Editor de texto. Posteriormente se puede especificar si desea exportarla en una cuadrícula o como
columnas de texto separadas por tabulaciones. Es posible detectar gráficos.
DESCRIPCIÓN
DEL DISEÑO DEL DOCUMENTO
55
Hoja de cálculo
Elija esta opción si desea que toda la hoja quede convertida en una tabla que
se exportará a un programa de hojas de cálculo, o tratarla como una sola
tabla. No se detectará flujo de texto ni zonas de gráficos.
Personalizado
Elija esta opción para tener el máximo control sobre la separación automática
de zonas. Podrá evitar o estimular la detección de columnas, gráficos y tablas.
Fije los parámetros en el panel Diseño personalizado del cuadro de diálogo
Opciones.
Plantilla
Elija un archivo de plantilla de zonas si desea aplicar sus zonas y propiedades
a todas las páginas obtenidas de aquí en adelante. En el procesamiento
manual las zonas de plantillas también se aplican a la página actual, reemplazando las zonas existentes. Se permiten otras zonas además de las zonas de
plantillas. Encontrará más detalles en la sección Uso de plantillas de zonas.
Si la separación automática de zonas produjo resultados de reconocimiento
inesperados, utilice el procesamiento manual para volver a efectuar la
separación de zonas en páginas individuales y llevar a cabo nuevamente su
reconocimiento.
SEPARACIÓN MANUAL DE ZONAS
Las zonas definen las áreas de la página que se ha de procesar. Las zonas son
rectangulares o irregulares (con lados formados por líneas verticales y
horizontales). Las zonas no se pueden superponer. Tienen un número de
zona en la esquina superior izquierda y un icono para indicar el tipo de zona
en la parte superior derecha. Haga clic en una zona para seleccionarla. Haga
clic mientras mantiene pulsada la tecla Mayús para hacer una selección
múltiple. La zonas actual y las seleccionadas aparecen sombreadas. Haga clic
fuera de una zona para eliminar la selección. Las zonas aparecen en una
imagen original en los siguientes casos:
u La página ha sido reconocida.
u Se especificó un archivo de plantilla de zonas en el procesamiento
manual mientras la página estaba vigente.
u Ha dibujado zonas manuales en la imagen.
56
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
Trabajo con zonas
La barra de herramientas Imagen proporciona herramientas para la edición
de zonas. Siempre hay una seleccionada. Cuando ya no desee utilizar una
herramienta, haga clic en otra. Normalmente la herramienta que se utiliza es
Dibujar zonas rectangulares.
Dibujar zonas rectangulares.
Haga clic en esta opción y arrastre el cursor para definir zonas rectangulares.
La nueva zona adopta sus propiedades a partir de la última zona dibujada o
seleccionada. También podrá mover o cambiar el tamaño de las zonas
existentes cuando esta herramienta esté activa.
Dibujar zonas irregulares
Haga clic en esta opción para utilizar la herramienta que permite dibujar
zonas irregulares. Haga clic y arrastre el ratón para dibujar una sola línea.
Repita el procedimiento hasta que sólo falte por dibujar una línea. Haga
doble clic para cerrar la forma. Las zonas irregulares encajan en rectángulos si
las fija como zonas tipo tabla. También podrá mover o cambiar el tamaño de
las zonas existentes cuando esta herramienta esté activa.
Agregar a zona
Haga clic en esta opción para agregar zonas irregulares a una zona existente o
combinar varias zonas en una sola. No podrá mover ni cambiar el tamaño de
las zonas existentes cuando esta herramienta esté activa. Tampoco podrá usar
esta opción con una zona tipo tabla.
Quitar de zona
Haga clic en esta opción para quitar partes irregulares de una zona existente o
dividir una zona en otras más pequeñas. No podrá mover ni cambiar el
tamaño de las zonas existentes cuando esta herramienta esté activa. Tampoco
podrá usar esta opción con una zona tipo tabla.
Reordenar zonas
Haga clic en esta opción para utilizar la herramienta que sirve para reordenar
zonas. Luego haga clic en las zonas en el orden de lectura deseado. Para que
se respete el orden que determinó, elija ‘Utilizar solamente zonas actuales’ y
evite tener en la página zonas de varias columnas o tipos de zona de detección
automática.
Propiedades de zona
Haga clic en esta opción para que aparezca el cuadro de diálogo Propiedades
de zona. Esto permite definir el tipo de zona y el contenido que tendrán las
zonas actualmente seleccionadas en la página. También podrá efectuar este
procedimiento en el menú rápido de una zona. Consulte la próxima sección.
SEPARACIÓN
MANUAL DE ZONAS
57
Propiedades de zona
Cada zona es de un tipo determinado. Las zonas que contienen texto
también pueden tener un parámetro que describe su contenido:
alfanumérico o numérico. El tipo y el contenido de la zona constituyen sus
propiedades. Haga clic con el botón derecho del ratón en una zona para usar
el menú rápido que permite cambiar sus propiedades. Seleccione varias zonas
para cambiar sus propiedades de una sola vez. También se puede usar para
este fin el botón de propiedades de zonas, situado en la barra de herramientas
Imagen. Se dispone de los siguientes tipos de zonas:
Zona de flujo de texto de columna única
Utilice esta opción para que el contenido de la zona sea tratado como texto
de corrido, sin columnas.
Zona de flujo de texto de varias columnas
Utilice esta opción para que el contenido de la zona sea tratado como texto de
corrido. El programa tratará de detectar columnas dentro de la zona. Al texto se
le quitarán o mantendrán las columnas, dependiendo de la vista Editor de
texto. Durante el reconocimiento, una zona de múltiples columnas se puede
reemplazar por zonas individuales para cada columna. Para ello, debe estar
activada la función de separación automática de zonas, la cual también puede
producir un cambio en el orden de las zonas.
Zona de tabla
Utilice esta opción para que el contenido de la zona sea tratado como una
tabla. Es posible detectar automáticamente las cuadrículas de la tabla, o bien
colocarlas en forma manual tal como se describe en la siguiente sección. Las
zonas de tablas deben ser rectangulares. El Editor de texto muestra la tabla en
una cuadrícula editable. Podrá elegir si desea exportar tablas en cuadrículas o
en columnas separadas por tabulaciones.
Zona de detección automática
Utilice esta opción para dejar que el programa decida el tipo de zona. Para
ello, debe estar activada la función de separación automática de zonas, la cual
también puede producir un cambio en el orden de las zonas de la página.
Tras el reconocimiento podrá ver el tipo que se aplicó. Si utiliza una zona de
detección automática para cubrir el área de una página con diversos
contenidos, el programa puede reemplazar la zona de detección automática
por varias otras zonas más pequeñas.
58
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
Zona gráfica
Utilice esta opción para encerrar una imagen, diagrama, dibujo, firma o
cualquier otro elemento que desee transferir al Editor de texto como una
imagen incrustada, y no como texto reconocido. Una zona de gráficos tiene
un borde verde. Las imágenes incrustadas se pueden exportar con el
documento a aplicaciones de destino que permitan el uso de gráficos.
Ignorar zona
Utilice esta opción para definir el área de una página que no desee procesar
en el Editor de texto. La separación automática de zonas no colocará zonas
aquí. Para excluir un área determinada en muchas páginas (por ejemplo un
encabezado o los números de página), coloque las zonas ignoradas en una
plantilla y seleccione ‘Buscar zonas además de zonas de plantilla/actuales’ en
el panel Proceso del cuadro de diálogo Opciones.
Contenido de zona
Esta opción está disponible para los tipos de zonas que contienen texto. El
contenido alfanumérico valida todos los caracteres necesarios para el idioma
elegido. Los resultados del reconocimiento de una zona numérica
contendrán sólo cifras y la puntuación que les sea pertinente. No se
colocarán letras.
Nota
Haga clic con el botón derecho del ratón fuera de una zona para
obtener un menú rápido diseñado para toda la imagen. Éste permite acercar,
alejar o girar la imagen. Al girar una imagen, se eliminan todas las zonas que
ésta contiene.
CUADRÍCULAS DE TABLAS EN LA IMAGEN
Tras el procesamiento automático es posible que vea las zonas de tablas
colocadas en una página. Éstas se indican con un icono de una zona de tabla
en la esquina superior derecha de la zona. Para conferir o quitar la
designación de zona de tabla a una zona dada, utilice su menú rápido.
También podrá dibujar una zona tipo tabla. Si ya hubiera una zona de tabla
en la página, selecciónela, y luego dibuje la nueva zona rectangular. Ésta
“heredará” el tipo de tabla. De otro modo, dibuje una zona rectangular y
utilice su menú rápido para designarla como tipo tabla.
CUADRÍCULAS
DE TABLAS EN LA IMAGEN
59
Los separadores de tabla se dibujan o mueven para determinar dónde
aparecerán las líneas de las cuadrículas al colocar la tabla en el Editor de
texto. Podrá utilizar las herramientas Agregar o Quitar para agrandar o
reducir una zona de tabla, pero la zona debe conservar su forma rectangular.
Puede hacerlo para eliminar columnas o filas innecesarias de una tabla.
Las cinco herramientas para la manipulación de tablas de la barra de
herramientas Imagen se activan si la página actual contiene una zona tipo
tabla. Utilícelas de la siguiente manera:
Mover separadores de fila o columna
Haga clic en la herramienta y mueva el cursor al separador que se ha de
mover. Aparecerá una flecha de dos puntas. Arrastre el borde según se desee.
No podrá arrastrarla más allá de la zona vecina. Evite colocar separadores de
modo que se superpongan entre sí o que corten texto. Pulse la tecla Ctrl
mientras arrastra un separador de columna, para moverlo sólo en la fila
actual.
Introducir separadores de columna
Haga clic en esta herramienta y luego en la posición de una zona de tabla
donde desee colocar un separador de columna. Pulse la tecla Ctrl mientras
hace clic para colocar el separador sólo en la fila actual.
Introducir separadores de fila
Haga clic en esta herramienta y luego en la posición de una zona de tabla
donde desee colocar un separador de fila. Evite colocar un separador encima
de otro, o de modo que corte texto.
Eliminar separadores de fila o columna
Haga clic en esta herramienta y luego en un solo separador que desee
eliminar. Hágalo si un separador está colocado incorrectamente, o si desea
cambiar el aspecto de la tabla en el documento final. Por ejemplo, puede
colocar dos columnas de datos en una sola columna, eliminando el separador
entre las dos columnas originales.
Eliminar/reemplazar todos los separadores
Haga clic en esta herramienta y luego dentro de una zona de tabla. Todos sus
separadores desaparecerán. Haga clic nuevamente para detectar (o volver a
detectar) automáticamente los separadores. La colocación de separadores
generalmente se produce durante el reconocimiento; al hacer clic dos veces
con esta herramienta podrá ver y editar los separadores antes del
reconocimiento.
60
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
USO DE PLANTILLAS DE ZONAS
Una plantilla es un conjunto de zonas, con unas propiedades y un orden de
lectura, almacenado en un archivo. Un archivo de plantilla de zonas se puede
cargar para usar las zonas de la plantilla durante el reconocimiento. Cargue
un archivo de plantilla en la lista desplegable Realizar OCR o en el menú
Herramientas.
Cuando cargue una plantilla utilizando la barra de herramientas OCR
manual, sus zonas aparecerán inmediatamente en la página actual,
reemplazando las que ésta contenga. Las páginas existentes no sufrirán
alteración alguna. Las zonas de plantilla se colocarán en todas las páginas
obtenidas posteriormente hasta descargar la plantilla. Podrá modificar las
zonas de plantilla y agregar nuevas zonas antes de efectuar el reconocimiento.
Al cargar una plantilla con la barra de herramientas AutoOCR, no se verán
afectadas la página actual ni las existentes. Las zonas de plantilla se colocarán
en todas las páginas obtenidas posteriormente hasta descargar la plantilla. En
el panel Proceso del cuadro de diálogo Opciones se encuentra la opción
‘Buscar zonas además de zonas de plantilla/actuales’. Si está activada durante
el procesamiento automático, la separación automática de zonas se ejecutará
en las áreas de las páginas fuera de las zonas de plantilla.
Cómo guardar una plantilla de
zona
Prepare zonas en una página. Revise
sus posiciones, propiedades y orden
de lectura. Haga clic en Archivos de
plantilla de zonas... en el menú
Herramientas. En el cuadro de
diálogo, seleccione [zonas en la
página] y haga clic en Guardar.
Cómo modificar una plantilla de zona
Cargue la plantilla y obtenga una imagen adecuada mediante procesamiento
manual. Aparecerán las zonas de la plantilla. Modifique las zonas y/o
propiedades según desee. Abra el cuadro de diálogo Archivos de plantilla de
zonas. Se seleccionará la plantilla actual. Haga clic en Guardar y luego en
Cerrar.
USO
DE PLANTILLAS DE ZONAS
61
Cómo descargar una plantilla
Seleccione un parámetro sin plantilla para la descripción del diseño en la lista
desplegable Realizar OCR. Las zonas de plantilla no se eliminan de las
páginas actuales o existentes, pero tampoco se utilizarán para procesamientos
futuros. También puede abrir el cuadro de diálogo Archivos de plantilla de
zonas, seleccionar [ninguno] y hacer clic en el botón Establecer como actual.
En este caso, el parámetro de la descripción del diseño vuelve a Automático.
Cómo reemplazar una plantilla por otra
Seleccione una plantilla diferente en la lista desplegable Realizar OCR, o
bien abra el cuadro de diálogo Archivos de plantilla de zonas, seleccione la
plantilla deseada y haga clic en el botón Establecer como actual. Cuando esté
activada la barra de herramientas AutoOCR, no se cambiarán zonas existentes y se utilizará la nueva plantilla para los procesamientos futuros. Cuando
esté activada la barra de herramientas OCR manual, las zonas de la nueva
plantilla se aplicarán a la página actual, reemplazando las zonas existentes.
Cómo eliminar un archivo de plantilla
Abra el cuadro de diálogo Archivos de plantilla de zonas. Seleccione una
plantilla y haga clic en el botón Eliminar. Las zonas ya colocadas por esta
plantilla no se eliminarán.
Consejo
Las plantillas aceptan los tipos de zonas ignoradas y de detección
automática. Por lo tanto, una plantilla podrá ser de gran utilidad para definir
qué partes de la página se leerán, y cuáles se ignorarán.
Nota Las zonas de detección automática provenientes de una plantilla se
pueden reemplazar por otras más pequeñas durante el reconocimiento; se
asignarán tipos de zona específicos a estas zonas. Las zonas de varias columnas también se dividirán en zonas más pequeñas de una sola columna, una
para cada columna detectada.
Nota
Las plantillas y la característica adicional de separación automática de
zonas están disponibles en Programar OCR y Direct OCR, pero no en el
Asistente de OCR.
62
TUTORIAL: PROCESAMIENTO
DE DOCUMENTOS
4 Verificación y edición
Los resultados del reconocimiento se colocan en el Editor de texto. El nuevo
editor tipo “WYSIWYG” (que significa “lo que se ve es lo que se obtiene”)
ofrece las siguientes características, que se detallan en el presente capítulo:
u Verificación de los resultados de OCR
u Verificación del texto reconocido en comparación con el original
u Diccionarios del usuario
u IntelliTrain
u Pantalla y vistas del editor
u Edición de texto e imágenes
u Contorno de página
u Lectura de texto en voz alta
El Editor de texto ofrece cuatro vistas para apreciar sus páginas. Podrá
alternar libremente de una vista a otra. Éstas proporcionan diversos niveles
de formato. Las vistas son:
Vista Sin formato
Muestra el texto normal sin columnas, con un solo tipo y tamaño de fuente.
Vista Mantener fuentes y párrafos
Muestra el texto sin columnas con estilo de fuente y párrafo
Vista True Page
Trata de conservar lo más posible el formato del documento original. Se
mantienen los estilos de caracteres y párrafo. Todos los elementos de las
páginas, incluyendo las columnas, se colocan en marcos.
Vista Mantener flujo de columnas
Es idéntica a la vista True Page, salvo que el orden de lectura de las zonas se
muestra mediante flechas. La diferencia entre esta vista y True Page se refiere
principalmente a la exportación, tal como se explica en la sección Preparar
resultados del reconocimiento para la exportación en el capítulo 5.
OMNIPAGE SE MANUAL
DEL USUARIO
63
VERIFICACIÓN DE LOS RESULTADOS DE OCR
Tras el reconocimiento de una página, los resultados aparecerán en el Editor
de texto. La verificación comienza automáticamente si se solicitó en el panel
Verificación del cuadro de diálogo Opciones en el Asistente de OCR. Podrá
comenzar manualmente la verificación en cualquier momento en que no esté
ocupando el programa. Funciona de la siguiente manera:
1. Haga clic en el botón Verificar OCR en la barra de herramientas
Estándar, o bien seleccione Verificar OCR... en el menú Herramientas.
2. La verificación se inicia al comienzo del documento, pero se salta el texto
ya revisado. Si se detecta un posible error, el cuadro de diálogo Verificador de OCR mostrará el error y una imagen del aspecto original en la
imagen.
Esta es la palabra
que OmniPage
SE pensó que
era.
Esto indica por qué la
palabra es dudosa.
La imagen de la
palabra dudosa
aparece
resaltada.
Esta ventana muestra la
parte pertinente de la
imagen original. Haga
clic dentro de ella para
agrandar o reducir la
pantalla.
Arrastre una
esquina o la parte
inferior del
cuadro de
diálogo para
cambiar su
tamaño.
3. Si la palabra reconocida es correcta, haga clic en Ignorar o Ignorar todo
para pasar a la siguiente palabra dudosa. Haga clic en Agregar para
añadirla al diccionario actual del usuario y pasar a la siguiente palabra
dudosa.
4. Si la palabra reconocida no es correcta, modifíquela en el cuadro de
edición Cambiar a o escriba la palabra deseada, o bien seleccione una
sugerencia del diccionario. Haga clic en Cambiar o en Cambiar todo
para que el cambio surta efecto y poder pasar a la palabra dudosa
siguiente. Haga clic en Agregar para añadir el término del cuadro de
edición Cambiar al diccionario actual del usuario y poder pasar a la
palabra dudosa siguiente.
64
VERIFICACIÓN
Y EDICIÓN
5. Los marcadores de color se eliminan de las palabras en el Editor de texto
a medida que son verificadas. Podrá pasar al Editor de texto durante la
verificación para hacer las correcciones allí. Utilice el botón Continuar
para reiniciar la verificación. Haga clic en Cerrar para detener la
verificación antes de llegar al final del documento.
Nota
Si la verificación se ejecutó hasta el final de una página, ésta se marca
con los iconos de verificación
documentos.
y
en el Administrador de
VERIFICACIÓN DEL TEXTO RECONOCIDO EN COMPARACIÓN
CON EL ORIGINAL
Tras efectuar el OCR, podrá comparar cualquier parte del texto reconocido
con su correspondiente en la imagen original a fin de verificar que el texto se
haya reconocido correctamente. Funciona de la siguiente manera:
1. Haga doble clic en cualquier palabra del Editor de texto o bien
seleccione una palabra y elija Verificar texto en el menú Herramientas.
Se abrirá la ventana Verificar texto y aparecerá una imagen de la palabra
original y el área que la rodea. Modifique la palabra en el Editor de texto
según sea necesario.
2. Haga clic dentro de la ventana para agrandar o reducir la imagen. La
imagen se agranda con los dos primeros clics y se reduce con los dos
siguientes.
Botón Cerrar
Esta es la imagen
original de la
palabra que se
está verificando.
Esta es la palabra que se
seleccionó en el Editor de
texto.
3. Continúe seleccionando palabras que desee verificar, corrigiéndolas
según sea necesario. La pantalla cambia a medida que se van
seleccionando nuevas palabras.
VERIFICACIÓN
DEL TEXTO RECONOCIDO EN COMPARACIÓN CON EL ORIGINAL
65
4. Haga clic en el botón Cerrar para cerrar la ventana del verificador.
Consejo
Deberá verificar el texto antes de volver a editar a gran escala. Si
corta y pega grandes bloques de texto, se pueden alterar los vínculos entre el
texto e imagen.
Consejo
La facilidad ofrecida por OmniPage Pro de lectura en voz alta del
texto reconocido es otro modo de comprobar el texto. Es posible escuchar
cada vez una letra, una palabra, una línea, una frase, o bien una página
completa del texto. Consulte la sección Lectura de texto en voz alta. Esta
función no está disponible en OmniPage SE.
DICCIONARIOS DEL USUARIO
El programa contiene diccionarios incorporados para numerosos idiomas.
Estos diccionarios ayudan al reconocimiento y pueden ofrecer sugerencias
durante la verificación. Pueden ser complementados por otros diccionarios
del usuario. Podrá guardar la cantidad de diccionarios del usuario que desee,
pero podrá cargar sólo uno a la vez. También están disponibles los
diccionarios del usuario de Microsoft Word; el diccionario denominado
Personalizado es el predeterminado para Microsoft Word.
Iniciar un diccionario del usuario
Haga clic en Agregar en el cuadro de diálogo Verificador de OCR sin tener
cargado ningún diccionario del usuario o abra el cuadro de diálogo Archivos
del diccionario del usuario en el menú Herramientas, y luego haga clic en
Nuevo. Se le solicitará que nombre el diccionario de inmediato.
Cargar o descargar un diccionario del usuario
Esto se realiza en el panel OCR del cuadro de diálogo Opciones, o desde el
cuadro de diálogo Archivos del diccionario del usuario. Seleccione un
archivo de diccionario para cargarlo o bien [ninguno] para descargar un
diccionario del usuario.
Editar un diccionario del usuario
Para añadir palabras debe cargar un diccionario del usuario y luego hacer clic
en Agregar en el Verificador de OCR. Podrá agregar y eliminar palabras en el
cuadro de diálogo Archivos del diccionario del usuario.
66
VERIFICACIÓN
Y EDICIÓN
Consejo
Al editar un diccionario del usuario, podrá importar una lista de
palabras desde un archivo de texto para agregar palabras rápidamente al
diccionario.
INTELLITRAIN
IntelliTrain es una forma de capacitación nueva y automática recientemente
diseñada. Analiza las correcciones que usted haga durante la verificación.
Cuando haga un cambio, esta función recordará la forma del carácter en
cuestión y el cambio en la verificación. Buscará otras formas de caracteres
similares en el documento, especialmente en palabras dudosas; y evaluará si
corresponde o no aplicar la corrección del usuario.
OmniPage SE no es compatible con la función IntelliTrain ni con los
archivos de capacitación. Estas características sólo están disponibles en
OmniPage Pro 11. Al abrir un archivo OPD, OmniPage SE pasa por alto
cualquier información de capacitación incluida el archivo.
Puede activar o desactivar IntelliTrain en el panel de OCR en el cuadro de
diálogo Opciones. Es muy útil para documentos en mal estado o cuando se
usa un tipo de letra poco común en todo el documento. IntelliTrain será
menos útil para textos con distorsiones esporádicas. A continuación aparece
un ejemplo, basado en la letra “g”, que se puede imprimir de diferentes
maneras:
Los primeros dos ejemplos no requieren de IntelliTrain, ya que ambas formas
son normales para la letra “g” y el programa las puede manejar. En el tercer
ejemplo se podría aprovechar IntelliTrain ya que la forma de la “g” es poco
común, y es probable que todas las veces que aparezca la “g” en el texto se
parezcan a ésta. El cuarto ejemplo no es bueno para el uso de IntelliTrain, ya
que la primera “g” no está bien impresa, y es poco probable que aparezca esa
forma nuevamente en el documento.
INTELLITRAIN
67
El siguiente ejemplo muestra cómo funciona IntelliTrain, utilizando la
imagen original. En nuestro ejemplo se utilizan las letras c y e. Con algunos
tipos de letra y parámetros de exploración, la línea horizontal en la e puede
quedar muy delgada, induciendo a OCR a cometer errores que IntelliTrain
puede reparar.
OmniPage Pro leerá esta
palabra inglesa como
rcsultados.
Usted la cambió durante la
verificación a resultados.
IntelliTrain recordará esta
forma y la regla:
e
Esta no es una “c”.
Es una “e”.
IntelliTrain cambiará:
cspañol a español
lcycs a leyes
sclccción a selección
etc.
IntelliTrain recordará los datos de capacitación que recopile, y usted podrá
guardarlos en un archivo de capacitación para uso futuro en documentos
similares. Si desea que se le consulte si desea guardar los datos de capacitación al cerrar el documento, seleccione dicha opción en el panel Verificación
del cuadro de diálogo Opciones. Los datos de capacitación no guardados se
almacenan en un documento de OmniPage.
Las operaciones para guardar la capacitación en un archivo, así como cargar,
editar y descargar archivos de capacitación se efectúan en el cuadro de
diálogo Archivos de capacitación. Ábralo en el panel Verificación del cuadro
de diálogo Opciones o el menú Herramientas.
68
VERIFICACIÓN
Y EDICIÓN
Seleccione esta
opción, haga clic en
Guardar y escriba
un nombre para
guardar un nuevo
archivo de
capacitación.
Haga clic aquí para
editar el archivo de
capacitación
seleccionado
(ver a continuación).
Utilice esta opción
para guardar la nueva
capacitación en un
archivo de
capacitación cargado.
Aparecerá como:
Nombre del archivo
[modificado]
Seleccione esta
opción para
descargar un
archivo de
capacitación.
Los datos de capacitación no guardados se pueden editar en el cuadro de
diálogo Editar capacitación; aparecerá un asterisco en la barra de título en vez
del nombre del archivo de capacitación. Permanecerá sin guardar cuando
cierre el cuadro de diálogo.
Un archivo de capacitación también se puede editar; su nombre aparecerá en
la barra de título. Si se le han agregado datos de capacitación sin guardar,
aparecerá un asterisco a continuación de su nombre. Tanto los datos de
capacitación no guardados como los modificados se guardarán al cerrar el
cuadro de diálogo.
El cuadro de diálogo muestra marcos que contienen la forma de un carácter y
una solución de OCR asignada a dicha forma. Haga clic en un marco para
seleccionarlo. Luego podrá suprimirlo con la tecla Suprimir, o bien cambiar
la asignación. Utilice las teclas de dirección para pasar al marco siguiente o al
anterior.
Está editando los
datos de
capacitación no
guardados.
Este marco aparece
en gris. Significa que
se ha eliminado. Para
recuperarlo,
selecciónelo
nuevamente y pulse
la tecla Suprimir. Los
caracteres marcados
como eliminados se
borrarán
efectivamente al
cerrar el cuadro de
diálogo.
Este marco está seleccionado. En la parte
superior aparece la forma tomada de la
imagen. En la parte inferior aparece la
solución de OCR asignada.
Haga doble clic en
un marco o bien
pulse Intro para
cambiar su solución
OCR. Introduzca la
nueva solución en el
cuadro de texto que
aparece y pulse Intro.
Las asignaciones
cambiadas
aparecerán en rojo.
INTELLITRAIN
69
PANTALLA Y VISTAS DEL EDITOR
El editor muestra los textos reconocidos y puede marcar las palabras que se
consideraron dudosas durante el reconocimiento. El marcado se hace con un
subrayado ondulado; subrayado rojo para las palabras que no se encontraron
en un diccionario (esto es válido sólo para los idiomas que tienen diccionarios) y subrayado azul para las palabras que contengan caracteres dudosos o
rechazados. Estos marcadores pueden aparecer o estar ocultos según lo que se
haya seleccionado en el panel Editor de texto, dentro del cuadro de diálogo
Opciones. También podrá mostrar u ocultar caracteres no imprimibles e
indicadores de encabezado y pie de página. El panel Editor de texto también
permite definir una unidad de medición para el programa y un parámetro de
acomodación de texto en todas las vistas del Editor de texto salvo en la vista
Sin formato.
A continuación se mencionan las principales diferencias entre las vistas:
Vista Sin formato
Muestra el texto normal sin columnas y alineado en la izquierda con un solo
tipo y tamaño de fuente, con los mismos saltos de línea que el documento
original. La mayoría de los botones de formato y cuadros de diálogo están
desactivados. Tampoco se ven las reglas. Esta vista puede resultar práctica para
verificar y editar el texto.
Vista Mantener fuentes y párrafos
Muestra pantallas con texto sin columnas y con estilo de fuente y párrafo.
Aparece la regla horizontal. Esta vista puede resultar práctica para verificar,
editar y modificar el texto junto con su estilo.
Vista True Page
Trata de conservar lo más posible el formato del documento original. Se
mantienen los estilos de caracteres y párrafo. Todos los elementos de las
páginas, incluyendo las columnas, se colocan en marcos. Puede que sea más
difícil verificar y editar texto en esta vista, por lo que tal vez tenga que
desplazarse por el interior de un marco para ver todo su contenido. Una fila
de flechas indica que el contenido se prolonga más allá de los bordes del
marco.
70
VERIFICACIÓN
Y EDICIÓN
Vista Mantener flujo de columnas
Es idéntica a la vista True Page, salvo que el orden de lectura de las zonas se
muestra mediante flechas. Esta vista se diferencia de True Page durante la
exportación, consulte la sección Preparar resultados del reconocimiento para la
exportación en el capítulo 5.
Seleccione una vista con los cuatro botones de la parte inferior izquierda del
Editor de texto o del menú Ver. Los gráficos y tablas pueden aparecer en las
cuatro vistas.
EDICIÓN DE TEXTO E IMÁGENES
Este es un Editor de texto tipo “WYSIWYG” (lo que se ve es lo que se
obtiene), que proporciona muchas funciones de edición. Éstas funcionan de
manera muy similar a las de los principales procesadores de texto.
Editar atributos de caracteres
En todas las vistas salvo en Sin formato, es posible cambiar el tipo, tamaño y
atributos de fuente (negrita, cursiva, subrayado) del texto seleccionado.
Utilice la barra de herramientas de formato o bien el cuadro de diálogo
Fuente en el menú Formato. Este último también ofrece caracteres de
subíndice, superíndice, así como texto o fondo en color.
En la vista Sin formato se puede usar la barra de herramientas de formato
para especificar un tipo y tamaño de fuente y aplicarla a todo el documento.
Estos atributos no se transfieren a otras vistas, sino que se restauran sus
parámetros anteriores.
Abra el cuadro de diálogo Coincidencia de fuentes en el panel OCR del
cuadro de diálogo Opciones para especificar qué fuentes se usarán en los
textos que se introduzcan en el Editor de texto.
Editar atributos de párrafo
En todas las vistas salvo en la Sin formato, podrá cambiar el alineamiento de
los párrafos seleccionados y aplicar viñetas a los párrafos. Utilice la barra de
herramientas de formato o bien el cuadro de diálogo Párrafo en el menú Formato. Este último permite modificar sangrías, espaciado entre líneas y entre
párrafos. La regla horizontal del Editor de texto permite definir fácilmente
las posiciones de sangrías y tabuladores. Los ajustes avanzados de tabulación
se efectúan en el cuadro de diálogo Tabuladores en el menú Formato.
EDICIÓN
DE TEXTO E IMÁGENES
71
Estilos de párrafo
Los estilos de párrafo se detectan automáticamente durante el
reconocimiento. En un cuadro de selección situado a la izquierda de la barra
de herramientas de formato se acumula y presenta una lista de estilos.
Utilícela para asignar un estilo a los párrafos seleccionados. Utilice el cuadro
de diálogo Estilo del menú Formato para cambiar de nombre o modificar un
estilo y definir otro nuevo. Al guardar un documento en un archivo, podrá
elegir si exportar o no los estilos de párrafo con el documento. Esto es válido
sólo si la aplicación de destino es compatible con los estilos de párrafo.
Gráficos
Podrá editar el contenido de una zona de gráfico seleccionado si cuenta con
un editor de imágenes en su equipo. Haga clic en Editar imagen en el menú
Herramientas. Esto activará el editor de imágenes asociado con los archivos
BMP en su sistema Windows, y cargará el gráfico. Edite el gráfico y luego
cierre el editor para volver a incrustar la imagen en el Editor de texto de
OmniPage SE. No cambie el tamaño del gráfico ni su resolución o tipo, ya
que esto impedirá la reincrustación.
Tablas
Las tablas aparecen en el Editor de texto en forma de cuadrículas. Mueva el
cursor al área de una tabla. Cambiará su aspecto, permitiéndole mover las
líneas de las cuadrículas. También podrá usar las reglas del Editor de texto
para modificar una tabla. Modifique la colocación de texto en las celdas con
los botones de alineación de la barra de herramientas de formato y los
controles de tabulación de la regla. Al guardar el documento en un archivo,
podrá elegir si va a exportar las tablas en cuadrículas o como columnas
separadas por tabuladores.
LECTURA DE TEXTO EN VOZ ALTA
La función de texto a lenguaje se activa o desactiva en el elemento Modo de
lenguaje hablado del menú Herramientas o con la tecla F5. Un segundo elemento de menú Parámetros de lenguaje hablado... permite seleccionar una
voz (por ejemplo, hombre o mujer para un determinado idioma), una velocidad de lectura y el volumen. La facilidad de lectura en voz alta no está
incluida en OmniPage SE. Está disponible en OmniPage Pro 11.
Esta función de lenguaje está diseñada para discapacitados visuales, pero
también puede ser muy útil para cualquier persona durante la revisión y
verificación de texto. El habla se controla mediante movimientos del punto
de inserción en el Editor de texto, ya sea mediante el ratón o el teclado.
72
VERIFICACIÓN
Y EDICIÓN
Para escuchar texto:
Utilice estas teclas:
Un carácter a la vez, hacia adelante o hacia atrás
Flecha derecha o izquierda. Se nombran las
letras, números o signos de puntuación.
Palabra actual
Ctrl + teclado numérico 1
Una palabra a la derecha
Ctrl + flecha derecha *
Una palabra a la izquierda
Ctrl + flecha izquierda *
Una sola línea
Coloque el punto de inserción en la línea
Línea siguiente
Flecha abajo
Línea anterior
Flecha arriba
Oración actual
Ctrl + teclado numérico 2
Desde el punto de inserción al final de la oración
Ctrl + teclado numérico 6
Desde el inicio de la oración al punto de inserción
Ctrl + teclado numérico 4
Página actual
Ctrl + teclado numérico 3
Desde el inicio de la página al punto de inserción
Ctrl + Inicio
Desde el punto de inserción al final de la página
actual
Ctrl + Fin
Página anterior, siguiente o cualquier otra
Ctrl + RePág, AvPág o botones de navegación
Caracteres mecanografiados
Cada carácter mecanografiado se pronuncia, uno
por uno, incluyendo la puntuación.
* Si el cursor está en el medio de una palabra, se escuchará primero un fragmento de la
palabra, pero de ahí en adelante se escucharán las palabras completas.
Las tres teclas básicas para el lenguaje hablado están juntas en el teclado
numérico.
+
1
Leer
palabra
actual
2
Leer
oración
actual
3
Leer
página
actual
LECTURA
DE TEXTO EN VOZ ALTA
73
También contará con los siguientes controles de teclado:
Para hacer esto:
Utilice lo siguiente:
Pausa/Reanudar
Ctrl + teclado numérico 5
Aumentar la velocidad
Ctrl + teclado numérico
Disminuir velocidad
Ctrl + teclado numérico
Restablecer velocidad
Ctrl + asterisco, teclado numérico (*)
Esta previsto proporcionar programas de lenguaje hablado para los siguientes
idiomas: inglés, francés, alemán, italiano, portugués y español. En el archivo
Léame encontrará la información más reciente. Sólo se instalará un sistema
de lenguaje hablado en OmniPage Pro, dependiendo del idioma elegido al
comienzo de la instalación. Si especifica un idioma que no disponga de un
sistema de lenguaje hablado, se instalará el inglés.
Si tiene otros sistemas de lenguaje compatibles con SAPI en su equipo, serán
detectados y quedarán disponibles para su uso. Sus voces quedarán
disponibles en el cuadro de diálogo Parámetros de lenguaje hablado. Una vez
que ha asociado una voz con un idioma, OmniPage Pro lo recordará y
cambiará las voces según el idioma de reconocimiento del documento.
CONTORNO DE PÁGINA
La ventana Contorno de página permite cambiar el orden de las áreas en una
página o de los párrafos dentro de las áreas. También permite definir cómo
fluirá el texto si se realiza la exportación con la vista Mantener flujo de
columnas. Abra la ventana de contorno de página en el menú Ver. Las áreas
corresponden a las zonas utilizadas durante el reconocimiento y también a
los marcos empleados en el Editor de texto. Haga clic en un elemento y
arrástrelo a la ubicación deseada. Los párrafos reordenados aparecen
inmediatamente en el Editor de texto y se exportan. Las áreas reordenadas
aparecen y se exportan en las vistas Sin formato y Mantener fuentes y
párrafos. En la vista True Page no surten efecto práctico. En la vista
Mantener flujo de columnas, las flechas muestran el orden del flujo de texto.
Muevas las áreas para cambiar su orden. Las posiciones de las áreas no
cambian, pero las flechas muestran el cambio en el texto de corrido.
74
VERIFICACIÓN
Y EDICIÓN
5 Guardar y exportar
Una vez que haya obtenido por lo menos una imagen para un documento,
podrá exportarla a un archivo. Una vez que haya reconocido al menos una
página, podrá exportar los resultados del reconocimiento a una aplicación de
destino, para lo cual deberá:
1. Guardar en un archivo
2. Copia de un documento al Portapapeles
3. Enviar un documento adjunto a un mensaje de correo
electrónico.
El documento permanece en OmniPage SE tras la exportación. Esto permite
guardar, copiar o enviarlo varias veces, por ejemplo con diferentes niveles de
formato, utilizando diferentes tipos de archivos, nombres o ubicaciones.
También podrá agregar o volver a reconocer las páginas, o bien modificar el
texto ya reconocido.
Con el procesamiento automático y utilizando el Asistente de OCR, usted
especifica el primer destino donde se guardará el archivo antes de comenzar
dicho proceso. Cuando se reconoce (o se verifica, si ello fue solicitado) la
última página disponible, comienza la exportación.
Podrá especificar la exportación en cualquier momento en que no esté
ocupando el programa. Si solicita exportar un documento con páginas no
reconocidas, se le consultará si primero desea reconocerlas. Si su respuesta es
No, sólo se exportarán los resultados de las páginas reconocidas. Si se han
modificado zonas en las páginas reconocidas, se le solicitará que reconozca
dichas páginas antes de exportar.
OMNIPAGE SE MANUAL
DEL USUARIO
75
PREPARAR RESULTADOS DEL RECONOCIMIENTO PARA LA
EXPORTACIÓN
El texto se exporta a un archivo, al Portapapeles, o al correo electrónico con
el nivel de formato definido por la vista fijada en el Editor de texto en el
momento de la exportación, si ello es posible. Sin embargo, algunos tipos de
archivos de exportación y aplicaciones de destino no son compatibles con
todos los elementos de formato. Puede que se le advierta si hay una
incompatibilidad y se le ofrezca la mejor vista disponible. Puede aceptarla, o
bien cancelar la exportación, fijar otra vista y reiniciar la exportación.
La tabla de la sección Tipos de archivos para guardar los resultados del
reconocimiento en el capítulo 6 le indica qué tipos de archivos son
compatibles con qué niveles de formato.
A continuación se indica cómo se pueden usar las vistas para la exportación:
Vista Sin formato
Esta vista es necesaria para exportar a ASCII, Unicode u otros formatos con
extensión .TXT. Estos tipos de archivo no pueden aceptar gráficos o tablas.
Evidentemente, podrá exportar texto normal a cualquier tipo de archivo y
aplicación de destino.
Vista Mantener fuentes y párrafos
Esta vista es muy práctica para todos los formatos salvo los que tienen extensiones TXT o PDF. Todos estos formatos pueden contener gráficos y tablas.
Vista True Page
Esta vista es apta sólo para los tipos de archivos y aplicaciones de destino en
las que se pueden manipular marcos o cuadros de texto. Al exportar a PDF,
True Page se utiliza como origen, sin importar la vista del editor (El formato
PDF no se aplica a OmniPage SE). El orden de lectura de las zonas, o las
áreas reordenadas en la ventana Contorno de página, no influyen cuando se
utiliza True Page para la exportación.
Vista Mantener flujo de columnas
Fije esta opción en el momento de la exportación para mantener el diseño
original de las páginas, incluyendo las columnas. Esto se efectúa cada vez que
es posible con parámetros de columnas, no con marcos. El texto fluirá de una
columna a otra, lo que no ocurre cuando se utilizan marcos. Las flechas
muestran el orden del flujo de texto. Podrá cambiar este orden con la
ventana Contorno de página, tal como se describe al final del capítulo 4.
76
GUARDAR
Y EXPORTAR
GUARDAR EN UN ARCHIVO
Podrá guardar páginas reconocidas e imágenes originales en el disco en una
gran variedad de tipos de archivos. En el capítulo 6 encontrará una completa
lista de los tipos de archivos compatibles para guardar imágenes y resultados
de reconocimiento.
Guardar imágenes originales
1. Seleccione Guardar imagen... en el menú Archivo. En el cuadro de
diálogo que aparece, seleccione la ubicación de la carpeta y un tipo de
archivo para las imágenes. Escriba un nombre de archivo.
2. Seleccione guardar sólo la imagen actual o bien todas las imágenes del
documento. En el segundo caso puede guardar todas las imágenes en un
solo archivo de imagen de varias páginas, siempre y cuando elija TIFF o
DCX como tipo de archivo. De lo contrario cada imagen se colocará en
un archivo independiente. OmniPage SE agregará sufijos numéricos al
nombre de archivo que se proporcione, para generar nombres de archivo
exclusivos.
3. Haga clic en Aceptar para guardar las imágenes según se especifique. Las
zonas y el texto reconocidos no se guardan con el archivo. Si es posible,
el archivo se guarda tal como se ve: es decir, en blanco y negro, escala de
grises o en color. Las imágenes en blanco y negro se guardan con su
resolución original. Las imágenes en escala de grises y en color se
reducen aproximadamente a 150 ppp.
Consejo Para ver el tamaño y la resolución original de una imagen,
coloque el cursor sobre la imagen en el área de Imagen original o bien sobre
su miniatura en el Administrador de documentos.
Nota
OmniPage Pro permite guardar un documento con las cuatro
variantes de formato PDF, incluido el formato “sólo imagen”. Este último
guarda como imagen los resultados del reconocimiento, no la imagen
original. No está disponible la opción guardar a PDF en OmniPage SE.
GUARDAR
EN UN ARCHIVO
77
Guardar los resultados del reconocimiento
1. Seleccione Guardar como... en el menú Archivo, o bien haga clic en el
botón Exportar resultados en la barra de herramientas OCR manual con
la opción Guardar como archivo seleccionada en la lista desplegable.
2. Aparecerá el cuadro de diálogo Guardar como, tal como se indica en su
forma expandida.
Haga clic en Avanzadas
para abrir el panel
inferior y en Básicas
para cerrarlo.
Seleccione esta
opción para abrir
automáticamente el
archivo guardado en
su aplicación de
destino.
Elija entre:
Seleccione esta
opción para que los
estilos de párrafo del
Editor de texto se
exporten junto con el
texto reconocido.
Crear un solo archivo para todas las páginas
Crear un archivo por página
Crear un archivo nuevo después de cada
página en blanco.
3. Seleccione una ubicación de carpeta y un tipo de archivo para el
documento. El tipo de archivo OPD especial es el último en la lista de
tipos de archivo.
4. Escriba un nombre de archivo. Haga clic en el botón Avanzadas a fin de
ver todas las opciones para guardar. Seleccione la opción deseada.
5. Haga clic en Aceptar. El documento se guardará en el disco según se
especifique. Si se selecciona ‘Guardar e iniciar’, el archivo exportado
aparecerá en la aplicación de destino, que es la asociada con el tipo de
archivo seleccionado en su sistema Windows.
78
GUARDAR
Y EXPORTAR
Nota
Los gráficos y formato se guardan en el documento sólo si el tipo de
archivo seleccionado es compatible. El nivel de formato para la exportación
corresponde a la vista del Editor que se fijó al momento de guardar. Se le
advertirá si el nivel de formato no es compatible con el tipo de archivo de
exportación.
Nota Si se crea más de un archivo de exportación, OmniPage SE agregará
un sufijo numérico al nombre de archivo a fin de crear nombres de archivo
exclusivos. Si selecciona ‘Crear un archivo nuevo después de cada página en
blanco’ con la entrada desde archivos de imagen, consulte la sección Entrada
desde archivos de imagen en el capítulo 3 para averiguar cómo colocar
imágenes en blanco.
GUARDAR UN DOCUMENTO MIENTRAS TRABAJA
Haga clic en el botón Guardar en la barra de herramientas Estándar o bien
seleccione Guardar en el menú Archivo para guardar los cambios en el
documento actual mientras trabaja. Si lo hace con un documento sin título,
aparecerá el cuadro de diálogo Guardar como.
Con un documento con nombre, el comando Guardar lo almacena con el
nombre y formato de la última vez que se guardó, tal como se aprecia en la
barra de título. Si el documento se guardó la última vez como documento de
OmniPage, el comando para guardar lo actualizará: se guardarán las
imágenes nuevas o cambiadas, las separación de zonas modificada, los
resultados del reconocimiento y los datos de capacitación. Si el documento se
guardó por última vez como tipo de archivo de texto, sólo se guardarán los
cambios de los resultados del reconocimiento.
Si desea trabajar nuevamente con su documento en OmniPage SE en una
sesión futura, guárdelo como documento de OmniPage. Este es un tipo
especial de archivo de salida. Guarda las imágenes originales del archivo
junto con los resultados del reconocimiento, los parámetros y los datos de
capacitación. Consulte la sección Documentos OmniPage en el capítulo 2. El
cuadro de diálogo Guardar como enumera los tipos de archivo disponibles
en la lista desplegable Guardar como archivo de tipo. El documento de
OmniPage es el último formato de esa lista.
GUARDAR
UN DOCUMENTO MIENTRAS TRABAJA
79
Si guarda el documento por primera vez como documento de OmniPage
(por ejemplo llamándolo memo.opd), lo puede modificar guardándolo
posteriormente como archivo de texto (por ejemplo memo.txt), y volver a
hacerle cambios, para luego hacer clic en Guardar, y los cambios recientes se
guardarán en el archivo memo.txt, no en el archivo OPD. Al cerrar el
documento o salir del programa, se le solicitará que guarde el documento si
no lo ha guardado como un documento de OmniPage, o si hay cambios
desde la última vez que lo almacenó como OPD.
Sus documentos OmniPage pueden cambiarse de OmniPage SE a
OmniPage Pro 11 e inversamente. En OmniPage SE, todos los datos de
capacitación de los archivos OPD se pasan por alto, y no puede realizarse la
capacitación.
COPIA DE UN DOCUMENTO AL PORTAPAPELES
Podrá copiar al Portapapeles los resultados del reconocimiento de cualquier
página reconocida de un documento. El proceso de copia se indica mediante
un monitor que refleja su progreso. Podrá pegar el contenido del
Portapapeles en otra aplicación.
El formato del texto, como negrita y cursiva, se mantiene al pegar el
contenido en otra aplicación compatible con la información RTF. De lo
contrario, sólo se pegará el texto normal. Los gráficos se mantienen si la
aplicación es compatible con la inserción de imágenes.
t Para copiar un documento al Portapapeles
80
GUARDAR
•
Con el procesamiento automático, seleccione el comando Copiar al
Portapapeles de la lista desplegable Exportar resultados en la barra de
herramientas AutoOCR o en el Asistente de OCR. El texto se envía al
Portapapeles apenas se reconozca o verifique la última página disponible.
•
Con el procesamiento manual, seleccione el comando Copiar al
Portapapeles en la lista desplegable Exportar resultados y luego haga clic
en su botón en la barra de herramientas OCR manual. El proceso de
copia comienza de inmediato.
Y EXPORTAR
ENVIAR UN DOCUMENTO ADJUNTO A UN MENSAJE DE
CORREO ELECTRÓNICO
Podrá enviar los resultados del reconocimiento como uno o más archivos
adjuntos a un mensaje de correo electrónico si tiene instalada una aplicación
de correo compatible con MAPI, como por ejemplo, Microsoft Outlook.
t Para enviar un documento por correo electrónico
•
Con el procesamiento automático, seleccione el comando Enviar como
correo en la lista desplegable Exportar resultados en la barra de
herramientas AutoOCR. Aparecerá el cuadro de diálogo Enviar correo
apenas se reconozca o verifique la última página disponible del
documento.
•
Con el procesamiento manual, seleccione el comando Enviar como
correo en la lista desplegable Exportar resultados y luego haga clic en su
botón en la barra de herramientas OCR manual. Aparecerá de
inmediato el cuadro de diálogo Enviar correo.
En cualquier momento en que no esté ocupado el programa, seleccione
Enviar como correo en el menú Archivo para invocar el cuadro de diálogo
Enviar correo.
1. El cuadro de diálogo Enviar correo permite especificar un tipo de
archivo y las opciones para adjuntar documentos: un adjunto para todas
las páginas, un adjunto por cada página, un nuevo adjunto cada vez que
haya una página en blanco. Fije todas las opciones y haga clic en
Aceptar.
2. Regístrese en su aplicación de correo electrónico si se le solicita hacerlo.
ENVIAR
UN DOCUMENTO ADJUNTO A UN MENSAJE DE CORREO ELECTRÓNICO
81
3. La aplicación de correo aparecerá con el documento o documentos
adjuntos en un nuevo mensaje vacío. Los adjuntos toman el mismo
nombre utilizado la última vez que se guardó el documento en
OmniPage SE, o bien aparecen como ‘Sin título desde OmniPage’. Se
agrega la correspondiente extensión de archivo y los sufijos numéricos en
caso de haber más de un documento adjunto.
4. Escriba la dirección de destino de su mensaje de correo, agregue texto al
mensaje si lo desea y luego haga clic en el botón Enviar.
82
GUARDAR
Y EXPORTAR
6 Información técnica
En este capítulo se proporciona información sobre resolución de problemas y
demás información técnica acerca del uso de OmniPage SE.
Consulte también el archivo en línea Léame y los demás temas de la ayuda, o
bien visite las páginas web de ScanSoft. La página web con información
sobre escáneres contiene información detallada y actualizada regularmente
acerca de la configuración y asistencia técnica de escáneres. El archivo Léame
contiene la información más reciente acerca de OmniPage SE. Podrá acceder
al archivo Léame y a las páginas web de ScanSoft mediante el menú Ayuda.
Este capítulo contiene la siguiente información:
u Resolución de problemas
•
•
•
•
Soluciones iniciales
Probar OmniPage SE
Problemas de memoria insuficiente
Problemas de espacio de disco insuficiente
u Tipos de archivos compatibles
• Tipos de archivos para abrir y guardar imágenes
• Tipos de archivos para guardar los resultados del
reconocimiento
• Guardar en PDF
u Problemas de OCR
• El texto no se reconoce correctamente
• Problemas con el reconocimiento de fax
• Problemas de sistema o rendimiento durante el OCR
u Desinstalación del software
OMNIPAGE SE MANUAL
DEL USUARIO
83
RESOLUCIÓN DE PROBLEMAS
Si bien OmniPage SE está diseñado para un fácil uso, en ocasiones ocurren
problemas. Muchos de los mensajes de error contienen descripciones
autoexplicativas de lo que se debe hacer: revisar las conexiones, cerrar otras
aplicaciones para liberar memoria, etc. En ocasiones bastará con esas
indicaciones.
En la documentación de Windows encontrará información para optimizar su
sistema y el rendimiento de las aplicaciones.
Soluciones iniciales
Intente estas soluciones si experimenta problemas al iniciar o usar
OmniPage SE:
u Cerciórese de que el sistema cumpla todos los requisitos
mencionados en la lista Requisitos del sistema del capítulo 1.
u Cerciórese de que el escáner esté enchufado y que todas las
conexiones de cables estén fijas.
u En la sección de asistencia técnica del sitio web www.scansoft.com
de ScanSoft encontrará notas técnicas sobre temas comúnmente
mencionados al usar OmniPage SE. Nuestras páginas web también
pueden ofrecer asistencia acerca del proceso de instalación y
resolución de problemas.
u Apague su equipo y el escáner, encienda nuevamente este último y
luego reinicie su equipo. Cerciórese de que las demás aplicaciones
estén funcionando correctamente.
u Utilice el software que viene con el escáner para verificar que éste
funciona correctamente antes de usarlo con OmniPage SE.
u Cerciórese de contar con los controladores correctos para el escáner,
la impresora y la tarjeta de vídeo. Encontrará más información sobre
escáneres en la página web de ScanSoft, a la cual se puede acceder
mediante el menú Ayuda.
u Ejecute ScanDisk para Windows 95, 98 o Me, o bien Check Disk
para Windows NT y Windows 2000 a fin de revisar si la unidad de
disco duro presenta errores. Encontrará más información en la
ayuda en línea de Windows.
84
INFORMACIÓN
TÉCNICA
u Haga una defragmentación en el disco duro. Encontrará más
información en la ayuda en línea de Windows.
u Desinstale y reinstale OmniPage SE, tal como se describe en la
última sección, Desinstalación del software.
Probar OmniPage SE
Al reiniciar Windows 95, 98, 2000 o Me en el modo a prueba de errores o
Windows NT en el modo VGA se podrá probar OmniPage SE en un sistema
simplificado. Esto se recomienda si no puede resolver problemas de bloqueo
del sistema o si OmniPage SE ha dejado de funcionar por completo.
Encontrará más información en la ayuda en línea de Windows.
Nota El escáner no funcionará con OmniPage SE en el modo a prueba de
errores o en el modo VGA, de modo que no intente diagnosticar problemas
con el escáner en esta configuración.
t
Para probar OmniPage SE en el modo a prueba de errores (Windows
95, 98, 2000 o Me):
1. Reinicie su equipo en el modo a prueba de errores pulsando F8
inmediatamente después de que aparezca el mensaje que indica que se
está reiniciando Windows.
2. Inicie OmniPage SE y trate de efectuar el OCR con una imagen. Utilice
un archivo de imagen conocido, por ejemplo uno de los archivos de
imagen de ejemplo suministrados.
• Si OmniPage SE no se inicia ni funciona correctamente en el
modo a prueba de errores, puede que haya un problema en la
instalación. Desinstale y reinstale OmniPage SE (consulte la
parte final de este capítulo), y luego ejecútelo en el modo a
prueba de errores de Windows.
• Si OmniPage SE se ejecuta correctamente en el modo a prueba
de errores, entonces puede que un controlador de dispositivos
del sistema esté interfiriendo con el funcionamiento de
OmniPage SE. Solucione el problema reiniciando Windows en
el modo de confirmación paso a paso. Encontrará más
información en la ayuda en línea de Windows.
RESOLUCIÓN
DE PROBLEMAS
85
t
Para probar OmniPage SE en el modo VGA (Windows NT):
1. Reinicie su ordenador.
2. Seleccione la estación de trabajo Windows NT versión 4.00 [modo
VGA] y pulse Intro.
3. Pulse Ctrl+Alt+Supr y seleccione el Administrador de tareas.
4. En el cuadro de diálogo Administrador de tareas, seleccione todas las
aplicaciones en segundo plano y haga clic en la opción para terminar el
proceso. Encontrará más información en la ayuda en línea de Windows.
5. Inicie OmniPage SE y trate de efectuar el OCR con una imagen. Utilice
un archivo de imagen conocido, por ejemplo uno de los archivos de
ejemplo suministrados.
Nota
También puede ejecutar OmniPage SE desde una línea de comando
en su propio modo a prueba de errores. Seleccione Inicio É Ejecutar,
explore en busca del archivo OmniPage.exe y agregue la opción /safe a la
línea de comandos. Esto iniciará el programa, pero ignorará los parámetros
almacenados anteriormente y no intentará recuperar un documento
proveniente de la finalización anormal del programa.
Problemas de memoria insuficiente
OmniPage SE puede ejecutarse deficientemente en condiciones de memoria
insuficiente. Esto se puede indicar mediante diversos mensajes de error o si
OmniPage SE funciona lentamente y accede al disco duro con mucha
frecuencia. Intente las siguientes soluciones para los casos de memoria
insuficiente:
u Reinicie su equipo.
u Cierre las demás aplicaciones para liberar memoria.
u Cierre aplicaciones innecesarias de OmniPage SE.
u Defragmente el disco duro para liberar bloques contiguos de espacio
en el disco. Encontrará más instrucciones en la ayuda en línea de
Windows.
u Aumente la cantidad de espacio libre en el disco.
86
INFORMACIÓN
TÉCNICA
u Aumente la memoria física (RAM) de su equipo.
u De esa manera podrá optimizar el rendimiento de OCR. En la
sección Requisitos del sistema en el capítulo 1 encontrará más
información al respecto.
Problemas de espacio de disco insuficiente
Si al sistema le queda poco espacio libre en el disco duro, se pueden producir
problemas. Intente las siguientes soluciones en caso de que surjan problemas
por espacio de disco insuficiente:
u Vacíe la Papelera de reciclaje de Windows.
u Cierre todas las aplicaciones y elimine los archivos *.tmp en la
carpeta Temp. Ésta generalmente se encuentra dentro de la carpeta
Windows.
u Ejecute ScanDisk para Windows 95, 98 o Me, o bien Check Disk
para Windows NT o Windows 2000 a fin de revisar si hay errores
que estén utilizando espacio en el disco. Encontrará más
instrucciones en la ayuda en línea de Windows.
u Realice una copia de seguridad de los archivos que no necesite en
disquetes o en otros medios y elimínelos del disco duro.
u Elimine aplicaciones de Windows que no use.
u Haga una defragmentación en el disco duro. Encontrará más
instrucciones en la ayuda en línea de Windows.
u Borre la caché para el explorador web y limite su tamaño.
RESOLUCIÓN
DE PROBLEMAS
87
TIPOS DE ARCHIVOS COMPATIBLES
El programa admite una amplia gama de formatos de archivo. Numerosos
formatos importantes han sido incluidos en OmniPage SE.
Tipos de archivos para abrir y guardar imágenes
Tipo de archivo
Extensión
Varias
páginas
Abrir / Guardar
Blanco y negro,
escala de grises, color
BMP, mapa de bits
*.bmp
No
Abrir y guardar
Todos
DCX
*.dcx
Sí
Abrir y guardar
Todos
GIF
*.gif
N/A
N/A
N/A
JPEG
*.jpg
No
Abrir y guardar
Escala de grises,
color
PCX
*.pcx
No
Abrir y guardar
Todos
PDF
*.pdf
N/A
N/A (ver nota)
N/A
PNG
*.png
No
Abrir y guardar
Todos
TIFF comprimido G3
*.tif
Sí
Abrir
Blanco y negro
TIFF comprimido G4
*.tif
Sí
Abrir y guardar
Blanco y negro
TIFF comprimido LZW
*.tif
N/A
N/A
N/A
TIFF FX
*.xif
N/A
N/A
N/A
TIFF PackBits (bits empaquetados)
*.tif
Sí
Abrir y guardar
Todos
TIFF sin comprimir
*.tif
Sí
Abrir y guardar
Todos
Los archivos de imagen de entrada pueden tener resoluciones de hasta 600
ppp, pero se recomiendan 300 ppp (tanto horizontal como verticalmente)
para una exactitud óptima de OCR. El programa almacena imágenes en
blanco y negro con su resolución original, pero las imágenes en escala de
grises y en color generalmente no se guardan con más de 150 ppp. Coloque
el cursor sobre una imagen para que aparezca una ventana emergente
mostrando el tamaño y la resolución de la imagen original.
Nota
Si intenta guardar una imagen en blanco y negro con formato JPEG,
el programa le sugerirá la conversión a escala de grises. Con TIFF G3 y G4 le
sugerirá la conversión a blanco y negro.
88
INFORMACIÓN
TÉCNICA
Nota
OmniPage Pro 11 permite guardar un documento con las cuatro
variantes de formato PDF, uno de los cuales permite exportar con formato
de sólo imagen. Este último exporta como imagen los resultados del
reconocimiento, no las imágenes originales, en el Guardar como cuadro de
diálogo. No está disponible la opción guardar a PDF en OmniPage SE.
OmniPage SE tampoco puede utilizar los formatos de archivo GIF, LZW
TIFF and TIFF FX.
Tipos de archivos para guardar los resultados del reconocimiento
Tipo de archivo
Extensión
Niveles de formato
(vistas del Editor de texto)
Compatibilidad con
gráficos
Adobe PDF con imagen en texto
*.pdf
N/A
N/A
Adobe PDF con sustitutos de imagen
*.pdf
N/A
N/A
Adobe PDF, normal
*.pdf
N/A
N/A
Adobe PDF, sólo imagen
*.pdf
N/A
N/A
*.opd
Todos
Sí
Excel (3.0 a 7.0, 97, 2000)
*.xls
NFV, RFP (hoja de cálculo)
Sí
Formato de texto enriquecido (RTF)
6.0/95 3
*.rtf
Todos
Sí
FrameMaker 5.5.3
*.mif
Todos
Sí
Freelance Graphics
*.txt
Vista Sin formato (NFV)
No
Harvard Graphics
*.txt
Vista Sin formato (NFV)
No
*.htm
Todos
Sí 2
Microsoft Publisher 98
*.rtf
Todos
Sí
PageMaker (6.5.2)
*.doc
Todos
Sí
PowerPoint 97
*.rtf
Todos
Sí
Quattro Pro para Windows 4.0, 8
*.xls
NFV, RFP (hoja de cálculo)
No
*.txt/.csv
Vista Sin formato (NFV)
No
Texto Unicode 1 4
*.txt/.csv
Vista Sin formato (NFV)
No
Ventura Publisher
*.doc
Todos
Sí
Word para Windows (6.0, 97, 2000)
*.doc
Todos
WordPad
*.rtf
NFV, RFP
WordPerfect (5.1, 5.2, 6.0, 6.1, 8, 9, 10)
*.wpd
Todos
Documento de OmniPage
HTML (3.2 ó 4.0)
Texto ASCII
6
2
1
TIPOS
Sí
5
Sí
Sí
DE ARCHIVOS COMPATIBLES
89
1
El texto ASCII y Unicode puede incluir texto de corrido, con saltos de línea o
separado por comas. Este último tiene extensión .csv y se utiliza para
introducir tablas con texto normal en programas de hojas de cálculo.
2
Al guardar archivos en formato HTML, se almacenan todos los gráficos como
archivos de imagen independientes con el formato JPEG. La compatibilidad
con el formato HTML 4.0 sólo existe en OmniPage Pro 11. La compatibilidad
de OmniPage SE está limitada a HTML 3.2.
3
Los resultados del reconocimiento se envían al Portapapeles y en este
formato se pegarán en RTF si ello es posible o, de lo contrario, como texto
Unicode o ASCII.
4
El texto Unicode acepta la máxima variedad de caracteres acentuados.
5
Las vistas True Page o Mantener flujo de columnas no se rechazarán, pero
aparecerán en la vista Mantener fuentes y párrafos, es decir, sin columnas.
6
OmniPage SE es capaz de abrir documentos creados con OmniPage SE y
con OmniPage Pro 11. También puede abrir archivos OPD creados con
OmniPage Pro 10 así como los archivos MET (equivalentes) creados con
OmniPage Pro 9. OmniPage SE realiza la conversión a partir de una copia
de estos archivos, que conservan su formato anterior.
Guardar en PDF
Esta sección no se aplica a OmniPage SE. En OmniPage Pro 11, contará con
cuatro opciones al guardar resultados de reconocimiento en archivos de
Formato de documento portátil (conocido como PDF).
Normal:
Las páginas se exportan tal como aparecieron en el Editor de texto en la vista
True Page. Este archivo PDF se puede ver con el visor de PDF y modificar
en un editor de PDF.
Con sustitutos de imagen:
Tal como en el caso anterior, pero los caracteres rechazados y dudosos tienen
superposiciones de imagen, de modo que estos caracteres inciertos aparecen
como estaban en el documento original. El archivo PDF se puede ver y
editar.
Sólo imagen:
El archivo en PDF sólo se puede ver pero no modificar en un editor de PDF
y tampoco es posible buscar texto.
90
INFORMACIÓN
TÉCNICA
Imagen en texto:
El archivo PDF sólo se puede ver pero no modificar en un editor de PDF.
No obstante hay un archivo de texto vinculado detrás de cada imagen, lo
cual sí permite buscar texto. La palabra buscada se resalta en la imagen.
PROBLEMAS DE OCR
Esta sección contiene información y soluciones para los posibles problemas
de OCR. En primer lugar proporcionamos soluciones para mejorar la
exactitud del reconocimiento, y luego para obtener buenos resultados al
manipular documentos de fax y, finalmente, soluciones para los problemas
de sistema o rendimiento que pudieran surgir durante el OCR.
El texto no se reconoce correctamente
Intente estas soluciones si parte del documento original no se convierte en
texto correctamente durante el OCR:
u Observe la imagen de la página original y cerciórese de que todas las
áreas de texto queden delimitadas por zonas de texto. Si un área no
queda delimitada en una zona, generalmente será ignorada durante
el OCR. Consulte la sección acerca de cómo crear y modificar
zonas, Trabajo con zonas en el capítulo 3.
u Cerciórese de identificar correctamente las zonas de texto. Vuelva a
identificar tipos y contenidos de zonas, si fuese necesario, y vuelva a
llevar a cabo el OCR en el documento. Consulte la sección
Propiedades de zona en el capítulo 3.
u Cerciórese de no haber cargado una plantilla incorrecta por error. Si
los bordes de la zona cortan texto, el reconocimiento será deficiente.
u Ajuste los controles deslizantes del brillo y el contraste en el panel
Escáner del cuadro de diálogo Opciones. Puede que sea necesario
experimentar con diferentes combinaciones de parámetros para
obtener los resultados deseados.
u Compruebe la resolución de la imagen original. Coloque el cursor
sobre el área Imagen original para ver una pantalla emergente. Si la
resolución es considerablemente superior o inferior a 300 ppp, es
probable que el reconocimiento sea deficiente.
PROBLEMAS
DE
OC R
91
u Cerciórese de seleccionar los idiomas correctos para los documentos
en el panel OCR del cuadro de diálogo Opciones. Sólo se deben
incluir los idiomas incluidos en el documento.
u Active IntelliTrain y efectúe algunas correcciones de verificación.
Es probable que esto ayude más en el caso de fuentes estilizadas o
documentos que estén deteriorados uniformemente. Si ya estaba
activado IntelliTrain, intente desactivarlo; en algunos tipos de
documentos deteriorados puede que esta aplicación no resulte de
gran ayuda. Esto último no se aplica a OmniPage SE.
u Si utiliza True Page como vista del Editor de texto o para la
exportación, el texto reconocido se colocará en marcos (cuadros de
formato). Parte del texto puede quedar oculto si un marco es muy
pequeño. Para ver el texto, coloque el cursor en el marco del texto y
utilice las teclas de dirección del teclado para desplazarse hacia
arriba, hacia abajo a la izquierda o a la derecha del marco.
u Verifique que el cristal, espejos y lentes del escáner no tengan polvo,
manchas ni estén rayados. Límpielos si fuese necesario.
Nota
OmniPage SE sólo reconoce caracteres de texto impresos, tales como
mecanografiados o generados en una impresora láser. Puede manejar caracteres impresos mediante matriz de puntos, aun cuando el nivel de exactitud
puede disminuir en el caso de texto con calidad de borrador; pero no tiene la
capacidad para leer impresión manual o texto manuscrito. Sin embargo, sí
puede mantener firmas u otro texto manuscrito, en forma de gráfico.
Problemas con el reconocimiento de fax
Intente estas soluciones para mejorar la exactitud del OCR en imágenes de
fax:
u Solicite a los remitentes que en lo posible usen documentos limpios
y originales.
u Solicite a los remitentes que seleccionen el modo Fino u Óptimo
cuando le envíen un fax. Esto produce una resolución de
200 x 200 ppp.
92
INFORMACIÓN
TÉCNICA
u Solicite a los remitentes que transmitan los archivos directamente a
su equipo vía fax módem si cuenta con dicho aparato. Podrá
guardar imágenes de fax como archivos de imagen y luego cargarlos
en OmniPage SE. Consulte la sección Entrada desde archivos de
imagen en el capítulo 3.
Problemas de sistema o rendimiento durante el OCR
Intente estas soluciones si se produce un bloqueo durante el OCR o si el
procesamiento tarda demasiado:
u Resuelva problemas de memoria insuficiente. Consulte la sección
Probar OmniPage SE.
u Resuelva problemas de espacio de disco insuficiente. Consulte la
sección Probar OmniPage SE.
u Minimice todas las aplicaciones o bien haga clic en Alt+Tab para ver
si hay mensajes de error de Windows.
u Revise la calidad de la imagen que está reconociendo.
u Consulte la documentación del escáner para averiguar formas de
mejorar la calidad de las imágenes exploradas.
u Divida imágenes de páginas complejas (mucho texto y gráficos o
formato complicado) en trabajos más pequeños. Dibuje zonas
manualmente o bien modifique las zonas creadas automáticamente
y efectúe el OCR en un área de una página a la vez. Consulte la
sección del capítulo 3 acerca de cómo crear y modificar zonas.
u Reinicie Windows 95, 98, Me y 2000 en el modo a prueba de
errores, o bien en Windows NT en el modo VGA y pruebe
OmniPage SE efectuando un OCR en los archivos de imágenes de
ejemplo incluidos. Consulte la sección Probar OmniPage SE.
Si está efectuando varias tareas simultáneamente, tales como reconocer e
imprimir, puede que el OCR tarde más.
PROBLEMAS
DE
OC R
93
DESINSTALACIÓN DEL SOFTWARE
En algunas ocasiones la solución puede consistir en desinstalar y luego volver
a instalar OmniPage SE. También conviene desinstalar OmniPage SE antes
de instalar OmniPage Pro 11 o cualquier programa OmniPage de
evaluación. El programa de desinstalación de OmniPage SE no eliminará
ninguno de los siguientes archivos creados por el usuario:
Plantillas de zonas (*.zon)
Archivos de capacitación (*.otd) (No se aplica a OmniPage SE)
Diccionarios del usuario (*.ud)
Documentos de OmniPage (*.opd)
Para desinstalar el producto en Windows NT o Windows 2000, debe
registrarse en su equipo con privilegios de administrador.
t
Para desinstalar o reinstalar OmniPage SE:
u Cierre OmniPage SE.
u Haga clic en Inicio en la barra de tareas de Windows y seleccione
Configuración É Panel de control É Agregar o quitar programas.
u Seleccione OmniPage SE y haga clic en Cambiar.
u Haga clic en Siguiente en el cuadro de diálogo que aparecerá a
continuación.
u Seleccione la opción para eliminar o reparar y luego Siguiente.
u Siga las instrucciones hasta terminar el procedimiento.
94
INFORMACIÓN
TÉCNICA
I
A
Abrir archivos de imagen, 88
Acercar o alejar pantallas, 25
Acomodación de texto, 34
Actualización a la versión OmniPage
Pro, 19
ADF, 33
Administración de documentos, 28
Administrador
documentos, 24, 28
tareas, 86
Agregar
a zonas, 57
páginas a un documento, 43
palabras a un diccionario del
usuario, 64
Alimentador automático de
documentos, 33, 51, 54
Alineación de párrafos, 26
Alternar
entre el procesamiento manual y
automático, 27, 46
entre las vistas del Editor de
texto, 71
Archivos
adjuntos a mensajes de correo
electrónico, 81
capacitación, 69
como destino de exportación,
77
como origen de imagen, 51
imagen, 22
imagen de ejemplo, 85
imagen de varias páginas, 51,
77, 88
imágenes TIFF, 88
nuevo para cada página en
blanco, 51
OPD, 31
N D E X
C
retenidos durante la
desinstalación, 94
Áreas
Imagen original, 24
reordenar, 74
Asistente
Agregar trabajo, 50
escáner, 14
OCR, 38, 39, 41
Atributos
caracteres, 71
párrafo, 72
AutoOCR, 27
Ayuda
contextual, ix, 25, 33
en línea, ix
en línea HTML, ix
B
Barra de herramientas
AutoOCR, 42
Estándar, 24, 25
formato, 24, 26
Imagen, 26
Barra de menús, 25
Blanco y negro, explorar, 52, 77
Botones
comandos para el
procesamiento automático,
43
Obtener página, 42, 44
Realizar OCR, 42, 45
Brillo, 53, 91
escáner, 33
Buscar
palabras dudosas, 64
palabras que no están en el
diccionario, 64
salida en PDF, 90
Caja de herramientas de OmniPage,
24, 27, 42
Calidad de las imágenes, 53
Cambiar
flujo de texto entre columnas,
74
orden de las áreas, 74
orden de las zonas, 26
orden de los párrafos, 74
tamaño de zonas, 26, 57
tipos de zonas, 59
Capacitación, 67
Caracteres no imprimibles, 26
Características nuevas en la versión
11 de OmniPage Pro, 18
Cargar
archivo de capacitación, 69
diccionario del usuario, 66
Cerrar un documento, 31
Colocar
divisores en las tablas, 26
gráficos desde la exportación, 78
Color, explorar, 53
Columnas
cambiar flujo de texto, 74
en tablas, 60
Comandos del teclado para escuchar
texto, 73
Comparación de las palabras
reconocidas con las originales,
65
Compatibilizar la vista del editor
con el tipo de archivo, 76, 89
Configuración
Direct OCR, 47
escáner, 14
Contenido
documentos de OmniPage, 79
OMNIPAGE SE MANUAL
DEL USUARIO
95
zonas, 58
Contorno de página, 74
Contraste, 53, 91
escáner, 33
Control sobre el reconocimiento, 44
Controladores para escáneres, 15
Conversión de imágenes, 88
Copiar
documento al Portapapeles, 40,
80
y pegar texto, 25
Correo
adjuntos, 81
como destino de exportación,
81
Cortar y pegar texto, 25
Crear datos de capacitación, 69
Cuadros de diálogo
Cargar archivo, 51
Enviar correo, 81
Opciones, 33
Verificador, 41, 64
Cursiva, texto, 26
D
Datos de capacitación no guardados,
31
Descargar
archivo de capacitación, 69
diccionario del usuario, 66
plantilla de zona, 61
Descripción del diseño del
documento, 40, 42, 55
Desinstalación de OmniPage SE, 94
Desplazamiento entre páginas, 28
Detalles, vista de, 24
Detención del procesamiento
automático, 43
Dibujar zonas, 48
Diccionarios del usuario, 64, 66
Direct OCR, 33, 47
Diseño
descripción, 42
documento, descripción, 55
personalizado, 34, 56
Dividir zonas, 57
Divisores, colocar en tablas, 26
96
ÍNDICE
Documentos
diseño variado, 55
exportar, 23
generalidades, 28
por ambas caras, 54
sin terminar, 31
Documentos de OmniPage, 14, 31,
79
guardar, 32
objetivo, 32
Documentos en OmniPage, 23
E
Editar
archivo de capacitación, 69
atributos de caracteres, 71
atributos de párrafo, 71
cuadrículas de tablas, 59
diccionario del usuario, 66
divisores de tablas, 26
gráficos, 72
salida en PDF, 90
separadores de tablas, 60
tablas, 72
texto reconocido, 26, 71
Editor de texto, 24, 34, 63, 70
Efecto de los parámetros, 34
Ejemplos de archivos de imagen, 85
Eliminar
páginas, 28, 30
plantilla de zona, 61
separadores de tabla, 60
Entrada
archivo PDF, 51
desde escáner, 52
desde un archivo de imagen, 51
Enviar un documento adjunto a un
mensaje de correo electrónico,
81
Escala de grises, explorar, 53
Escáner, 52, 92
configuración, 14
controladores, 15
doble, 54
Escritorio, 24
OmniPage SE, 24
Escuchar lectura de texto en voz alta,
72
Espacio de disco, 12, 87
Estado de la página, 28
Estilos de párrafo, 26, 72, 78
Exactitud, 52
Explorar
blanco y negro, 52
color, 53
escala de grises, 53
imágenes, 53
Exportaciones
múltiples, 75, 79
preparación, 76
tipos de archivos, 89
Exportar, 23, 44, 75, 76
a un archivo, 78
al Portapapeles, 80
gráficos, 78
Exportar resultados, botón, 42, 46
F
Fijar tipos de zonas, 59
Filas en tablas, 60
Función texto a lenguaje, 14, 72
Funciones de OmniPage SE, 19
G
Generalidades de documentos, 28
Generar separadores de tablas, 60
Gráficos
archivos JPEG, 90
edición, 72
en la exportación, 78
exportación, 89
Guardar
archivo de capacitación, 69
como documento de
OmniPage, 32, 79
documento mientras trabaja,
32, 79
documentos, 75
e iniciar, 78
en un archivo, 41, 77
formato OPD, 32
imágenes originales, 77, 88
PDF, 90
plantilla de zona, 61
resultados del reconocimiento,
78
I
Idioma
instalación, 13
interfaz del usuario, 13, 34
reconocimiento, 33, 40, 92
texto a lenguaje, 13
Ignorar zona, 59
Imágenes
barra de herramientas, 24
color, 77
conversión, 88
entrada desde archivo de, 51
escala de grises, 77
guardar, 77
obtener, 23
originales, guardar, 77
resolución, 29, 77, 88, 91
rotación, 26
Imprimir, 25, 30
Información técnica, 83
Iniciar
aplicación de destino, 78
diccionario del usuario, 66
Inicio del programa, 14
Insertar separadores de tabla, 60
Instalación
escáner, 14
OmniPage SE, 13
Instrucciones de separación de
zonas, 45
IntelliTrain, 31, 34, 50, 67, 92
Interrupción del procesamiento
automático, 43
J
Juntar zonas, 57
L
Lectura de texto en voz alta, 72
M
Manipular tablas en el Editor de
texto, 72
Mantener estilos de párrafo, 78
Marcadores de color, 65
Marcos, 92
documento de exportación, 76
Matriz de puntos, 92
Mejorar la exactitud, 33, 52, 67
Menú rápido, 59
Método de OCR, 33, 40
Miniatura, vista de, 24
Modificar una plantilla de zona, 61
Modo
a prueba de errores, 85
VGA, 86
Mover separadores de tabla, 60
MS Outlook, 81
N
Navegación de páginas, 24
Negrita, texto, 26
Niveles de formato, 40, 50, 63, 70,
89
exportación, 76
Nuevas características en la versión
11 de OmniPage Pro, 18
O
Objetivo de los archivos OPD, 32
Obtener
ayuda en línea, ix
imágenes, 23, 44
parámetros del texto, 48
Obtener texto, elemento de menú,
48
OCR, 22, 33, 64
Ocultar o mostrar marcadores, 70
OmniPage
versión anterior, 13
OmniPage Pro
actualización a la versión, 19
nuevas características, 18
OmniPage SE, x, 19
desinstalación, 94
funciones, 19
inicio, 14
instalación, 13
prueba, 85
registro, 17
reinstalación, 94
Opciones
procesamiento, 34
separación de archivos, 78, 81
verificación, 34, 40, 64
Optimizar la calidad de la imagen,
53
Orden de lectura de archivos de
imagen, 51
P
Páginas
hojas de cálculo, 56
obtenida, 28
reconocida, 28
separada por zonas, 28
una sola columna, 55, 57
una sola columna con tablas, 55
varias columnas, 55
verificada, 28
Palabras
dudosas al verificar, 64
marcadas en el Editor de texto,
70
que no están en el diccionario al
verificar, 64
PaperPort, 49
Para, 19
Parámetros, 33, 41
Direct OCR, 48
Párrafos, reordenar, 74
Pasos de procesamiento
básicos, 23
generalidades, 23
Personalizar columnas en la vista de
detalles, 30
Plantillas, 61
zonas, 56, 61, 91
Portapapeles, 80
Preparar resultados del
reconocimiento para la
exportación, 76
Probar OmniPage SE, 85
OMNIPAGE SE MANUAL
DEL USUARIO
97
Problemas
espacio de disco insuficiente, 87
memoria insuficiente, 86
OCR, 91
reconocimiento de fax, 92
rendimiento durante el OCR,
93
sistema o rendimiento durante
el OCR, 93
Procesamiento
a partir de otras aplicaciones, 47
automático, 27
automático de documentos, 42
automático incompleto, 43
diferido, 31
documento en futuras sesiones,
31
manual, 27, 44
manual de documentos, 44
paso a paso, 44
Programar OCR, 50
Propiedades de zona, 26, 58
Q
Quitar de zonas, 57
R
Realizar OCR, 23
Reconocer todas las páginas, 43
Reconocimiento
efectuar, 44
fax, 92
lento, 93
óptico de caracteres, 22
Reemplazar una plantilla de zona,
61
Registro
aplicaciones para Direct OCR,
47
en línea, 17
OmniPage SE, 17
Reinicio del procesamiento
automático, 43
Reinstalación de OmniPage SE, 94
98
ÍNDICE
Reordenar
páginas, 28
párrafos y áreas, 74
zonas, 57
Requisitos
memoria, 12, 86
mínimos del sistema, 12
Resolución
imágenes, 29, 88, 91
imágenes guardadas, 77
problemas, 83, 84
Rotación de imágenes, 26
S
Salida
PDF, 90
texto ASCII, 90
texto Unicode, 90
Selección de varias páginas, 28
Separación de zonas
automática, 34, 42, 55
manual, 26, 56, 91, 93
Soluciones en caso de rendimiento
deficiente, 84
Subrayado, texto, 26
Sugerencia de los diccionarios para
la verificación, 64
Suplementar zonas de plantillas, 61
Sustitutos de imagen en PDF, 90
T
Tabla, zonas de, 26
Tamaño de la imagen, 29
Terminar un documento, 43
Texto, guardar, 78
Tipos
archivo, 78
archivos compatibles, 88, 89
archivos de imagen, 88
archivos para la exportación, 76,
89
zonas, 58, 91
Trabajo
Programar OCR, 50
zonas, 57
TWAIN, 15
U
Unidad de medición, 34
Uso de Direct OCR, 48
V
Velocidad maximizada, 33
Ver salida en PDF, 90
Verificación
documentos en sesiones
posteriores, 31
remota, 31
resultados de OCR, 64, 65
texto, 65
Versiones anteriores de OmniPage,
13
Vista
detalles, 29
detalles de columnas, 30
Editor, 63, 70
Mantener flujo de columnas,
63, 71, 76
Mantener fuentes y párrafos,
63, 70, 76
miniatura, 28
Sin formato, 63, 70, 76
True Page, 63, 70, 76
Z
Zonas
alfanumérica, 58
columna única, 58
detección automática, 55, 58
gráfica, 59
irregulares, 26, 57
numérica, 58
propiedades, 26
rectangulares, 57
separación manual, 26, 45, 56
tablas, 26, 58, 59
varias columnas, 58