Xerox PE16/i Guía del usuario

Tipo
Guía del usuario
AVISOS LEGALES
Copyright © 2002 ScanSoft, Inc. Reservados todos los derechos. Se prohíbe transmitir,
transcribir, reproducir, almacenar en cualquier sistema de recuperación o traducir a cualquier
idioma o lenguaje informático esta publicación o parte de ella, de ninguna forma ni por
ningún medio, ya sea mecánico, electrónico, magnético, óptico, químico, manual u otro, sin
la autorización previa por escrito del departamento legal de ScanSoft, Inc., 9 Centennial
Drive, Peabody, Massachusetts 01960, U.S.A.
El software descrito en esta publicación se otorga bajo licencia y sólo se puede usar o copiar
según los términos establecidos en dicha licencia.
A
VISO IMPORTANTE
ScanSoft, Inc. proporciona esta publicación "tal cual" sin garantías de ninguna índole, ya sean
expresas o implícitas, incluyendo, pero sin limitación alguna, las garantías implícitas de
comerciabilidad o idoneidad para fines particulares. Algunos estados o jurisdicciones no
permiten la renuncia a garantías expresas o implícitas en ciertas transacciones, por lo tanto,
esta afirmación puede no aplicarse a su caso particular. ScanSoft se reserva el derecho de
actualizar esta publicación y de hacer cambios de vez en cuando en el contenido actual sin
verse obligada a notificar a ninguna persona de dichas actualizaciones o cambios.
M
ARCAS COMERCIALES Y CRÉDITOS
ScanSoft, OmniPage, OmniPage Pro, OmniPage SE, PaperPort, Pagis, True Page, Direct OCR,
AutoOCR y OCR Proofreader son marcas registradas o comerciales de ScanSoft, Inc., en los
Estados Unidos u otros países.
Todas las demás marcas o denominaciones comerciales se reconocen en el presente
documento y pueden estar registradas por sus respectivos titulares.
ScanSoft Inc.
9 Centennial Drive
Peabody, MA 01960
U.S.A.
Ref.N°. 58-28001-04A
OMNIPAGE SE MANUAL DEL USUARIO iii
C ONTENIDO
BIENVENIDO VII
Uso de este manual viii
Obtener ayuda en línea ix
Ayuda en línea HTML ix
Ayuda contextual ix
Notas técnicas x
Glosario x
OmniPage SE x
1INSTALACIÓN Y CONFIGURACIÓN 11
Requisitos del sistema 12
Instalación de OmniPage SE 13
Configuración del escáner con OmniPage SE 14
Cómo iniciar el programa 16
Registro del software 17
Nuevas características de OmniPage Pro 11 18
OmniPage SE y OmniPage Pro 11 19
2INTRODUCCIÓN 21
Qué es el reconocimiento óptico de caracteres? 22
Funciones de OCR de OmniPage SE 22
Documentos en OmniPage SE 23
Pasos básicos de procesamiento 23
El escritorio de OmniPage SE 24
Barra de herramientas Estándar 25
iv CONTENIDO
Barra de menús25
Barra de herramientas Imagen 26
Barra de herramientas de formato 26
Caja de herramientas de OmniPage 27
Administración de documentos 28
Vista de miniatura 28
Vista de detalles 29
Personalizar columnas en la vista de detalles 30
Eliminar páginas de un documento 30
Imprimir un documento 30
Cerrar un documento 31
Documentos OmniPage 31
Por qué guardar el documento como tipo OPD 32
Cómo guardar un archivo en formato OPD 32
Parámetros 33
3 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS 35
Guía de inicio rápido 36
Carga y reconocimiento de archivos de
imágenes de ejemplo 36
Exploración y reconocimiento de una
sola página 36
Procesamiento de documentos utilizando el
Asistente de OCR 39
Procesamiento automático de documentos 42
Botones de comandos 43
Procesamiento manual de documentos 44
Procesamiento automático de un documento
y terminación manual 46
Procesamiento a partir de otras aplicaciones 47
Cómo configurar Direct OCR 47
Cómo usar Direct OCR 48
OMNIPAGE SE MANUAL DEL USUARIO v
Cómo usar OmniPage SE con el software
PaperPort 49
Procesamiento de documentos con Programar OCR 50
Definición del origen de imágenes de las páginas 51
Entrada desde archivos de imagen 51
Entrada desde escáner 52
Exploración con un alimentador automático
de documentos 54
Explorar documentos extensos sin un
alimentador automático de documentos 54
Descripción del diseño del documento 55
Separación manual de zonas 56
Trabajo con zonas 57
Propiedades de zona 58
Cuadrículas de tablas en la imagen 59
Uso de plantillas de zonas 61
4 VERIFICACIÓN Y EDICIÓN 63
Verificación de los resultados de OCR 64
Verificación del texto reconocido en comparación
con el original 65
Diccionarios del usuario 66
IntelliTrain 67
Pantalla y vistas del editor 70
Edición de texto e imágenes 71
Lectura de texto en voz alta 72
Contorno de página 74
vi CONTENIDO
5 GUARDAR Y EXPORTAR 75
Preparar resultados del reconocimiento para
la exportación 76
Guardar en un archivo 77
Guardar imágenes originales 77
Guardar los resultados del reconocimiento 78
Guardar un documento mientras trabaja 79
Copia de un documento al Portapapeles 80
Enviar un documento adjunto a un mensaje
de correo electrónico 81
6 INFORMACIÓN TÉCNICA 83
Resolución de problemas 84
Soluciones iniciales 84
Probar OmniPage SE 85
Problemas de memoria insuficiente 86
Problemas de espacio de disco insuficiente 87
Tipos de archivos compatibles 88
Tipos de archivos para abrir y guardar
imágenes 88
Tipos de archivos para guardar los resultados
del reconocimiento 89
Guardar en PDF 90
Problemas de OCR 91
El texto no se reconoce correctamente 91
Problemas con el reconocimiento de fax 92
Problemas de sistema o rendimiento durante el
OCR 93
Desinstalación del software 94
INDEX 95
OMNIPAGE SE MANUAL DEL USUARIO vii
Bienvenido
Bienvenido a OmniPage SE
y gracias por usar nuestro software. La
siguiente documentación se proporciona a modo de ayuda para comenzar y
como resumen del programa.
Este manual del usuario
Este manual es una introducción al uso de OmniPage SE. Incluye las
instrucciones de instalación y configuración, una descripción de los
comandos y áreas de trabajo del programa, instrucciones específicas de tareas,
métodos para personalizar y controlar el procesamiento e información
técnica. El formato PDF de la Guía permite utilizar hipervínculos en un
visor de archivos PDF, para referencias cruzadas así como otras herramientas
de navegación.
Ayuda en línea
La ayuda en línea de OmniPage SE contiene información acerca de las carac-
terísticas, parámetros y procedimientos. La ayuda en línea viene en formato
HTML, y ha sido diseñada para acceder a la información de manera rápida y
sencilla. La completa ayuda contextual brinda la asistencia suficiente para
permitirle seguir trabajando sin perder tiempo. Consulte la sección Obtener
ayuda en línea.
Archivo Léame
El archivo Léame contiene la información más reciente acerca del software.
Léalo antes de usar OmniPage SE. Para abrir este archivo HTML,
selecciónelo en el Instalador de OmniPage SE o bien más adelante en el
menú Ayuda.
Exploración y otra información
En el sitio web www.scansoft.com de ScanSoft encontrará la información
más reciente acerca del programa. En la guía de escáneres encontrará
información actualizada acerca de los escáneres compatibles y temas afines.
Tam bi én es posible acceder al sitio web de ScanSoft desde el Instalador de
OmniPage SE o bien más adelante en el menú Ayuda.
viii BIENVENIDO
USO DE ESTE MANUAL
Este manual está escrito dando por sentado que usted sabe cómo trabajar en
el entorno de Microsoft Windows. Consulte la documentación de Windows
si tiene dudas acerca de cómo usar los cuadros de diálogo, comandos de
menú, barras de desplazamiento, funciones de arrastrar y colocar, menús
rápidos, etc.
Tam bi én suponemos que está familiarizado con su escáner y el software del
mismo, y que dicho equipo está instalado y funcionando correctamente antes
de configurarlo con OmniPage SE. Consulte la documentación respectiva
del escáner según sea necesario.
En este manual se utilizan las siguientes convenciones:
Negrita Introduce nuevos términos y presenta subapartados.
Cursiva Sirve para nombrar las secciones de este manual (a menos
que se establezca lo contrario, la sección está ubicada en el
mismo capítulo que la referencia).
Sirve para nombrar los botones principales utilizados en el
procesamiento automático: Iniciar, Detener, Terminar,
Adicional.
Non-serif
Sirve para presentar nombres de archivos: sample.tif
Nota
Presenta un elemento de información adicional.
Consejo
Presenta ideas para usar características del programa a fin de
efectuar tareas específicas.
OMNIPAGE SE MANUAL DEL USUARIO ix
OBTENER AYUDA EN LÍNEA
Además de usar este manual, se puede utilizar la ayuda en línea de
OmniPage
SE
para informarse sobre nuevas características, parámetros y procedimientos.
La ayuda en línea está disponible tras instalar
OmniPage SE
.
Ayuda en línea HTML
Abra la ayuda en línea de OmniPage SE en el nivel superior escogiendo
Temas de ayuda de OmniPage SE en la parte superior del menú Ayuda. Esto
permite ver los temas dispuestos en una Tabla de contenido, buscar en una
lista alfabética de palabras clave o hacer búsquedas de texto completo en los
temas. Otros elementos del menú Ayuda permiten acceder a temas o páginas
web relevantes.
Pulse F1 mientras trabaja con el programa para ver un tema de la ayuda en
línea que guarde relación con el área de la pantalla, cuadro de diálogo o
mensaje de advertencia actual.
Ayuda contextual
Es posible ver una ventana emergente con información concisa y puntual
sobre un elemento de menú, botón de la barra de herramientas, área de la
pantalla o cuadro de diálogo particulares de OmniPage SE, de las siguientes
maneras:
Haga clic en el botón Ayuda en la barra de herramientas Estándar para
invocar el icono de ayuda. Haga clic en cualquier elemento del escritorio
fuera del cuadro de diálogo o mensaje de advertencia.
Pulse Mayús + F1 para invocar el mismo icono de ayuda.
Haga clic en el signo de interrogación situado en la esquina superior derecha
de un cuadro de diálogo y luego haga clic en un elemento de dicho cuadro de
diálogo para ver una ventana emergente.
Algunos cuadros de diálogo o mensajes de advertencia tienen su propio
botón o texto de ayuda. Haga clic en el botón o texto para obtener
información acerca del cuadro de diálogo o de mensaje.
x BIENVENIDO
Haga clic en cualquier lugar para que desaparezca la ventana emergente de
ayuda contextual.
Notas técnicas
En el sitio web www.scansoft.com de ScanSoft encontrará notas técnicas
sobre temas comúnmente mencionados al usar OmniPage SE.
Las páginas web también pueden ofrecer asistencia acerca del proceso de
instalación y resolución de problemas.
Glosario
Esta manual no contiene un glosario. La ayuda en línea tiene un completo
glosario, con su propio índice alfabético y una tabla de contenido.
Consúltelo si desea averiguar el significado de algún término utilizado en este
manual o en el programa.
OMNIPAGE SE
El producto de que dispone es la versión Special Edition del mundialmente
conocido programa OmniPage Pro
. Esta versión, desarrollada para ser
distribuida con fabricantes de escáneres seleccionados, cuenta con un
conjunto reducido de las funciones incluidas en el producto
OmniPage Pro 11. Esta Guía así como la Ayuda en línea describen las
funciones del producto completo, y un icono SE señala en el documento las
diferencias entre las dos versiones.
Si le resultan ventajosas las funciones adicionales de la versión profesional,
utilice las facilidades en línea para actualizar su versión Special Edition a
OmniPage Pro 11.
OMNIPAGE SE MANUAL DEL USUARIO 11
1
Instalación y
configuración
Este capítulo contiene información acerca de la instalación e inicio de
OmniPage SE. Se presentan los siguientes temas:
u Requisitos del sistema
u Instalación de OmniPage SE
u Configuración del escáner con OmniPage SE
u Cómo iniciar el programa
u Registro del software
u Nuevas características de OmniPage Pro 11
u OmniPage SE y OmniPage Pro 11
12 INSTALACIÓN Y CONFIGURACIÓN
REQUISITOS DEL SISTEMA
Se necesitan los siguientes requisitos mínimos de sistema para instalar y
ejecutar OmniPage SE:
u Un ordenador con procesador Pentium o superior
u Microsoft Windows 95, Windows 98, Windows Me,
Windows 2000 o Windows NT 4.0
u 32MB de memoria (RAM), se recomiendan 64MB
u 75MB de espacio libre en el disco duro para los archivos de la
aplicación, más 10MB de espacio de trabajo durante la instalación
u 9MB para Microsoft Installer (MSI) si no está presente y 44MB
para Internet Explorer si tampoco lo está. (Éstos se encuentran
como parte del sistema operativo en Windows 98, Windows Me y
Windows 2000.)
u Monitor SVGA con 256 colores y resolución de 800 x 600 píxeles
u Dispositivo señalador compatible con Windows
u Unidad de CD-ROM para la instalación
u Un escáner compatible si tiene pensado explorar documentos. En la
guía de escáneres en el sitio web de ScanSoft (www.scansoft.com)
encontrará una lista de todos los escáneres compatibles.
Nota El rendimiento y velocidad aumentarán si el procesador, memoria y
espacio disponibles en su equipo son superiores a los requisitos mínimos.
INSTALACIÓN DE OMNIPAGE SE 13
INSTALACIÓN DE OMNIPAGE SE
El programa de instalación de OmniPage SE le guiará a través de la
instalación mediante instrucciones en cada pantalla.
Antes de instalar OmniPage SE:
u Cerciórese de que el escáner esté conectado, encendido y sea
compatible con su sistema.
u Cierre todas las demás aplicaciones, especialmente programas
antivirus.
u Regístrese en su equipo con privilegios de administrador si ha de
instalar el programa en Windows 2000 o Windows NT.
u Si su sistema ya tiene instalada una versión anterior del programa
OmniPage, el programa de instalación le pedirá confirmación para
desinstalarla primero.
t Para instalar OmniPage SE:
1.
Introduzca el CD-ROM de OmniPage SE en la unidad de CD-ROM.
El programa de instalación debe iniciarse automáticamente. De no ser
así, busque la unidad de CD-ROM en el Explorador de Windows y haga
doble clic en el programa
Autorun.exe que aparece en el nivel superior del
CD-ROM.
2. Elija el idioma a usar durante la instalación. Este idioma se utilizará para
el sistema texto a lenguaje y como el idioma de la interfaz del programa.
El idioma de la interfaz del programa se utiliza para presentar los
elementos de menú, cuadros de diálogo, mensajes de advertencia, etc. Es
posible cambiar el idioma de la interfaz posteriormente en OmniPage
SE, pero su elección al momento de la instalación determina qué sistema
de texto a lenguaje se instalará en el programa.
Las referencias a la función de lectura en voz alta no se aplican a
OmniPage SE.
14 INSTALACIÓN Y CONFIGURACIÓN
3. Siga las instrucciones en cada pantalla para instalar el software. Todos los
archivos necesarios para la exploración se copian automáticamente
durante la instalación.
CONFIGURACIÓN DEL ESCÁNER CON OMNIPAGE SE
Todos los archivos necesarios para la configuración y respaldo del escáner se
copian automáticamente durante la instalación del programa. Antes de usar
OmniPage SE para la exploración, el escáner debe estar correctamente
instalado y se debe haber verificado su correcto funcionamiento.
La instalación y configuración del escáner se efectúan mediante el Asistente
del escáner. Lo puede iniciar por su cuenta, tal como se describe a
continuación. De otro modo, el Asistente del escáner aparece al tratar de
efectuar la primera exploración con OmniPage SE.
Siga estos pasos a fin de utilizar el Asistente del escáner para configurar su
equipo con OmniPage SE:
u Elija InicioÉProgramasÉScanSoft OmniPage SEÉ Asistente del
escáner,
o bien, haga clic en el botón de configuración en el panel Escáner del
cuadro de diálogo Opciones.
O, en último caso, elija un comando de exploración en la lista
desplegable Obtener página en la Caja de herramientas de
OmniPage.
u Elija Seleccionar el origen de exploración y luego haga clic en
Siguiente.
Nota En algunas ocasiones la solución puede consistir en desinstalar y
luego volver a instalar OmniPage SE. Consulte el apartado Desinstalación del
software al final del capítulo 6.
Nota En OmniPage Pro 11, la función de lectura en voz alta está
disponible para alemán, español, francés, inglés (británico y estadounidense),
italiano o portugués. No está disponible en OmniPage SE. Consulte también
la sección Lectura de texto en voz alta en el capítulo 4.
CONFIGURACIÓN DEL ESCÁNER CON OMNIPAGE SE 15
u Haga clic una vez en el controlador TWAIN de su escáner para
seleccionarlo y luego haga clic en Siguiente.
u Seleccione Sí para probar la configuración de su escáner y luego
haga clic en Siguiente.
u El asistente probará la conexión desde el ordenador al escáner.
Haga clic en Siguiente.
u Inserte una página de prueba en el escáner.
u El asistente está preparado para efectuar una exploración básica
usando el software del fabricante del escáner. Haga clic en Siguiente.
u Aparecerá la interfaz del usuario propia del escáner. Haga clic en el
botón u opción para explorar a fin de comenzar una exploración de
muestra.
u Si fuese necesario, haga clic en Imagen invertida o bien en
Imagen faltante y haga las selecciones correspondientes.
u Una vez que la imagen aparezca correctamente en la ventana, haga
clic en Siguiente.
u Seleccione el elemento que describa más adecuadamente su escáner
y luego haga clic en Siguiente.
u Haga clic en Siguiente para seguir con el tamaño de página.
u En la ventana aparecen los tamaños de página que el Asistente del
escáner considera compatibles con su escáner. Para efectuar cambios
en los tamaños de página, haga clic en Avanzadas, efectúe los
cambios y luego haga clic en Siguiente.
u Inserte una página con texto pero sin imágenes en su escáner.
Haga clic en Siguiente para comenzar a explorar en el modo blanco
y negro.
u Si fuese necesario, haga clic en Imagen invertida o bien en
Imagen faltante y haga las selecciones correspondientes.
u Una vez que la imagen aparezca correctamente en la ventana, haga
clic en Siguiente.
u Si tiene un escáner a color, inserte en él una fotografía en colores o
una página con una imagen en colores. Haga clic en Siguiente para
comenzar a explorar en el modo en colores. Si fuese necesario, haga
clic en Imagen invertida o bien en Imagen faltante y haga las
selecciones correspondientes. Una vez que la imagen aparezca
correctamente en la ventana, haga clic en Siguiente. Si el escáner no
puede explorar en colores, omita este paso.
16 INSTALACIÓN Y CONFIGURACIÓN
u Inserte en el escáner una fotografía o página que contenga una
imagen. Haga clic en Siguiente para comenzar una exploración en
escala de grises. Si fuese necesario, haga clic en Imagen invertida o
bien en Imagen faltante y haga las selecciones correspondientes.
Una vez que la imagen aparezca correctamente en la ventana, haga
clic en Siguiente.
u Ha configurado satisfactoriamente su escáner para que funcione con
OmniPage SE
. Haga clic en Terminar.
Para cambiar los parámetros del escáner posteriormente, configurar otro
escáner, o bien probar y reparar un escáner instalado, lleve a cabo uno de los
dos siguientes métodos a fin de volver a abrir el Asistente del escáner:
u Pulse InicioÉProgramasÉScanSoft OmniPage SEÉAsistente del
escáner o bien
u Pulse InicioÉProgramasÉScanSoft OmniPage SEÉOmniPage
SE
Émenú HerramientasÉOpcionesÉEscánerÉbotón
Configuración.
CÓMO INICIAR EL PROGRAMA
Para iniciar OmniPage SE, lleve a cabo uno de los siguientes procedimientos:
u Haga clic en Inicio en la barra de tareas de Windows y seleccione
Programas
ÉScanSoft OmniPage SEÉOmniPage SE.
u Haga doble clic en el icono OmniPage SE en la carpeta de
instalación del programa o bien en el escritorio de Windows si lo
colocó ahí.
u Haga doble clic en el icono o nombre de archivo de un documento
de OmniPage (OPD); el documento se carga en el programa.
Consulte la sección Documentos OmniPage en el capítulo 2.
Al abrirlo, aparece la pantalla de título de OmniPage SE y luego su escritorio.
En el capítulo 2 encontrará una introducción al escritorio de OmniPage SE.
Nota Para probar y reparar un escáner que no funcione correctamente, siga
el procedimiento anterior, seleccionando Probar y configurar el origen de
exploración actual al iniciar el proceso.
REGISTRO DEL SOFTWARE 17
Hay muchos modos de ejecutar el programa con una interfaz limitada:
u Utilice el programa Programar OCR. Haga clic en Inicio en la barra
de tareas de Windows y elija Programas
ÉScanSoft OmniPage SEÉ
Programar OCR. Consulte la sección Procesamiento de documentos
con Programar OCR en el capítulo 3.
u Haga clic en Obtener texto en el menú Archivo de una aplicación
registrada con la función Direct OCR. Consulte la sección Cómo
configurar Direct OCR en el capítulo 3.
u Haga clic con el botón derecho del ratón en el nombre o icono de
un archivo de imagen para obtener un menú rápido. Seleccione un
elemento de submenú de Convertir a... a fin de definir un destino.
u
En productos de administración para documentos PaperPort
®
o Pagis
®
de ScanSoft, utilice OmniPage SE a fin de obtener los servicios OCR.
Consulte el capítulo 3 (
Cómo usar OmniPage SE con el software
PaperPort
).
REGISTRO DEL SOFTWARE
El Asistente para el registro de ScanSoft se ejecuta al final de la instalación.
Se proporciona un sencillo formulario electrónico que se puede completar en
menos de cinco minutos.
Una vez lleno el formulario, y tras enviarlo, el programa buscará una
conexión a Internet para efectuar inmediatamente el registro en línea.
Si no registra el software durante la instalación, se le solicitará
periódicamente que lo haga más adelante. También puede registrarse en línea
en nuestro sitio www.scansoft.com en Internet. Haga clic en Support y en la
pantalla principal de apoyo técnico elija la opción para registrarse, situada en
la columna izquierda.
Para conocer la declaración sobre el uso de los datos de registro, revise la
política de confidencialidad de ScanSoft.
18 INSTALACIÓN Y CONFIGURACIÓN
NUEVAS CARACTERÍSTICAS DE OMNIPAGE PRO 11
La familia de productos OmniPage
®
ha sido ampliada con OmniPage Pro 11
y OmniPage SE. Esta sección enumera las mejoras introducidas en el
producto profesional OmniPage Pro 11. Algunas se encuentran también en
OmniPage SE, tal y como describe la siguiente sección.
Nuevas características de OmniPage Pro 11 comparadas con
OmniPage Pro 10 son:
u Mayor exactitud - los motores de reconocimiento con un diseño
mejorado hacen que OmniPage Pro 11 sea el OmniPage de mayor
exactitud.
u Diseño de página mejorado - OmniPage Pro 11 permite conservar el
formato real del original, incluso en páginas con tablas no
cuadriculadas, encabezados y pies de página y mayúsculas
embutidas.
u Verificación ortográfica más inteligente - La nueva característica
IntelliTrain utiliza automáticamente correcciones previas para
generar mejores resultados de OCR.
u Capacidad de PDF - Ahora se pueden importar archivos PDF
(incluso de sólo lectura) y convertirlos en archivos de su programa
favorito (Word, Excel, etc.). También se pueden crear archivos PDF
a partir de cualquier documento en papel o archivo de imagen.
u HTML de mejor calidad - La nueva salida de HTML tipo
WYSIWYG (que significa lo que se ve es lo que se obtiene)
permite manipular gráficos, texto y fondos para que el archivo web
de salida quede igual que el documento original.
u Compatibilidad de idiomas - OmniPage Pro 11 es compatible ahora
con más de 100 idiomas e incluye los alfabetos griego y cirílico.
u Vista detallada - Permite personalizar más información acerca de
cada página, facilitando la manipulación de páginas en un
documento.
u Editor de texto - Un nuevo y completo editor tipo WYSIWYG
que brinda un mejor reconocimiento, con una gran variedad de
herramientas de edición, compatibilidad de colores y una gama de
cuatro niveles de formato para visualización y exportación.
OMNIPAGE SE Y OMNIPAGE PRO 11 19
u Mejores resultados en texto en mal estado - Un nuevo módulo de
refinamiento reduce considerablemente los errores en fondos con
manchas, sombreados y en color.
OMNIPAGE SE Y OMNIPAGE PRO 11
El listado siguiente enumera características que no han sido incluidas en
OmniPage SE. Puede disponer de ellas cuando actualiza a la versión
OmniPage Pro 11:
u Mejora significativa de la precisión en el reconocimiento.
u Acceso a la característica de capacitación IntelliTrain para
reconocimiento de caracteres.
u Posibilidad de abrir y leer el contenido de archivos PDF.
u Posibilidad de guardar documentos reconocidos a formato PDF.
u Posibilidad de abrir archivos de imagen en formato TIFF FX.
u Reconocimiento de archivos de imagen en formato LZW TIFF y
GIF en la entrada y en la salida.
u Compatibilidad con el formato HTML 4.0 para salida WYSIWYG.
u El número de idiomas reconocidos asciende de unos 50 a un
centenar.
u Acceso a software de lectura en voz alta, que permite leer en voz alta
los textos reconocidos.
Para obtener más información o actualizar su versión, visite la dirección
www.scansoft.com.
OMNIPAGE SE MANUAL DEL USUARIO 21
2
Introducción
Probablemente usted utiliza su ordenador para procesar correspondencia
comercial, elaborar informes, manipular datos y llevar a cabo un número
cada vez mayor de tareas. El desafío es que, a pesar de la revolución digital,
ciertas fuentes de información aún circulan en papel o formato impreso, por
lo que no se pueden procesar inmediatamente en un ordenador.
Por ejemplo, si desea incorporar información acerca del artículo de una
revista en un informe que esté preparando, de algún modo tiene que
incorporar el texto del artículo en su equipo. Ciertamente, la engorrosa
redigitación del artículo no es la solución más atractiva.
Este capítulo le presenta la solución ideal: reconocimiento óptico de
caracteres (OCR). Describe la forma en que OmniPage SE utiliza la
tecnología OCR para transformar texto de páginas exploradas o archivos de
imágenes en texto que podrá editar con sus aplicaciones informáticas
favoritas.
Los temas tratados son los siguientes:
u Qué es el reconocimiento óptico de caracteres?
u Documentos en OmniPage SE
u Pasos básicos de procesamiento
u El escritorio de OmniPage SE
u Administración de documentos
u Documentos OmniPage
22 INTRODUCCIÓN
QUÉ ES EL RECONOCIMIENTO ÓPTICO DE CARACTERES?
El reconocimiento óptico de caracteres es el proceso de extracción de texto de
una imagen. Esta imagen puede obtenerse a partir de la exploración de un
documento en papel o de la apertura del archivo electrónico de una imagen.
Las imágenes no tienen caracteres editables de texto, sino muchos puntos
diminutos (píxeles) que en conjunto producen formas de caracteres. Éstos
presentan una imagen del texto en una página.
Durante el OCR, OmniPage SE analiza las formas de los caracteres presentes
en una imagen y define las soluciones para producir texto editable. Tras el
OCR, se puede guardar el texto resultante en una gran variedad de
aplicaciones de procesamiento de texto, autoedición u hojas de cálculo.
Funciones de OCR de OmniPage SE
Además del reconocimiento de texto, OmniPage SE puede mantener los
siguientes elementos en un documento mediante el procedimiento de OCR.
Gráficos
Ejemplos de gráficos son las fotografías, logotipos y diagramas.
Formato de texto
Tipos, tamaños y estilos de fuente (tales como negrita, cursiva y subrayado
)
son ejemplos de formato de caracteres. Sangrías, tabuladores, márgenes y
espaciado entre líneas son ejemplos de formato de párrafo.
Formato de página
Estructura de columnas, formatos de tablas y colocación de gráficos y
encabezados son ejemplos de formato de página.
Los elementos de formato de gráficos, texto y página que mantiene
OmniPage SE se determinan según los parámetros que seleccione el usuario.
En la sección de Pautas de parámetros de la Ayuda en línea encontrará más
información acerca de la selección de parámetros.
Nota OmniPage SE sólo reconoce caracteres generados por máquina tales
como impresoras offset o láser, o texto digitado en una máquina de escribir.
Sin embargo, puede mantener texto manuscrito, tal como una firma, como
un gráfico.
DOCUMENTOS EN OMNIPAGE SE 23
DOCUMENTOS EN OMNIPAGE SE
OmniPage SE puede trabajar con un solo documento a la vez. Cuando
obtenga la primera imagen (del escáner o a partir de un archivo) se generará
un nuevo documento. Las imágenes subsiguientes se irán agregando al
mismo documento, hasta que lo guarde y lo cierre.
Un documento en OmniPage SE consta de una imagen por cada página del
documento. Tras efectuar el OCR, el documento también contendrá el texto
reconocido, visualizado en el Editor de texto, posiblemente junto con los
gráficos y tablas. En la sección El escritorio de OmniPage SE encontrará más
información acerca de las áreas de las pantallas.
PASOS BÁSICOS DE PROCESAMIENTO
Hay dos formas principales de manipular los documentos: con procesa-
miento automático o procesamiento manual. Consulte Procesamiento auto-
mático de documentos y Procesamiento manual de documentos en el capítulo 3.
Los pasos básicos para ambos métodos de procesamiento son muy similares:
1. Abra un conjunto de imágenes con OmniPage SE.
Podrá explorar un documento en papel con o sin un alimentador auto-
mático de documentos, o bien cargar uno o más archivos de imágenes.
Las imágenes resultantes aparecerán en miniatura en la vista de minia-
tura del Administrador de documentos y las páginas resumidas en su
vista de detalles. La imagen de la página actual se ve en el área de la ima-
gen original.
2. Realice el OCR para generar texto editable.
Durante el OCR, OmniPage SE crea zonas alrededor de los elementos
en la página que se procesará, y luego interpreta los caracteres de texto o
gráficos en cada zona. También es posible efectuar una separación de
zonas manual o por plantilla. Después del OCR, se puede revisar y
corregir los errores en el documento utilizando el Verificador de OCR y
editar el documento mediante el Editor de texto.
3. Exportar el documento a la ubicación deseada.
Al guardar el documento se le puede designar un tipo y nombre de
archivo específicos, colocarlo en el Portapapeles, o bien adjuntarlo a un
mensaje de correo electrónico. Se puede guardar como documento de
OmniPage (OPD), tal como se describirá más adelante. Se puede
guardar el mismo documento varias veces en diferentes destinos, como
diferentes tipos de archivo y con diferentes parámetros y niveles de
formato. Consulte el capítulo 5.
24 INTRODUCCIÓN
EL ESCRITORIO DE OMNIPAGE SE
El escritorio de OmniPage SE tiene una barra de título y una barra de menús
en su parte superior, y una barra de estado en la parte inferior. Tiene tres
áreas de trabajo principales, separadas por divisores: el Administrador de
documentos, el área Imagen original y el Editor de texto. El Administrador
de documentos tiene dos paneles separados: vista de miniatura y vista de
detalles. El área Imagen original tiene una barra de herramientas Imagen y el
Editor de texto tiene una barra de herramientas de formato.
Barra de herramientas
Estándar
Caja de herramientas
de OmniPage
La vista de miniatura
muestra una imagen de
cada página en el
documento.
La página actual tiene
un borde pálido.
Esta página ya ha
sido reconocida.
Botones de navegación
de páginas
Botones para mostrar,
ocultar o reorganizar
las áreas de trabajo.
Barra de
herramient
as Imagen
Área Imagen original
Aquí aparece la imagen de la página actual,
junto con las zonas que se coloquen automática
o manualmente en dicha imagen.
Arrastre este divisor a la
izquierda o a la derecha para
cambiar el tamaño de las
áreas de trabajo.
Los botones de la vista
del Editor de texto
ofrecen cuatro niveles de
formato.
Editor de texto Sirve para
mostrar los resultados del
reconocimiento para la página
actual en la vista True Page.
Barra de herramientas de formato
Nota Para controlar cuál de las tres vistas (Administrador de documentos,
Imagen original y Editor de texto) aparecerá, active o desactive cada vista en
el menú Ver o bien los botones de la barra de estado.
EL ESCRITORIO DE OMNIPAGE SE 25
La Caja de herramientas de OmniPage permite controlar el procesamiento.
Puede tener tres estados, dependiendo de cuál de las tres fichas de la
izquierda estén seleccionadas. En la figura, se aprecia el aspecto de OCR
manual. El programa aparece con un documento de tres páginas. La página
uno es la página actual, que se ha reconocido y verificado. La página dos se
ha reconocido pero aún no se ha verificado. La página tres se ha obtenido y
separado manualmente por zonas, pero aún no se ha reconocido. Los iconos
situados en la parte inferior derecha de las imágenes de miniatura muestran
el estado de la página.
Los botones de la barra de estado permiten mostrar, ocultar o reorganizar las
áreas de la pantalla principal y desplazarse a otras páginas del documento.
Al hacer clic con el botón derecho del ratón en cualquier área de la pantalla
se obtiene un menú rápido con los comandos más útiles para dicha área.
Barra de herramientas Estándar
La barra de herramientas Estándar contiene botones y una lista desplegable
para efectuar las tareas más comunes. Se puede desplazar y acoplar a
cualquier borde del escritorio de OmniPage SE. También es posible acceder
a estas funciones mediante menús.
Barra de menús
Para obtener información concisa acerca de algún elemento de menú, haga
clic en el botón de ayuda contextual y luego en el elemento de menú que
desee. El texto emergente le explicará la función del elemento de menú en
cuestión. Haga clic en cualquier lugar para cerrar el cuadro emergente.
Nuevo
abre un
documento
nuevo.
Guardar
el documento actual
con el nombre y tipo
que tenía la última vez
que fue guardado.
Verificar
el texto
reconocido.
Copiar
la selección actual
del Editor de texto.
Deshacer
la última
acción de
edición.
Zoom en el área activa:
Imagen original o Editor de
texto.
Abrir un
Documento
OmniPage
Imprimir
imágenes o resultados
de reconocimiento de
todas las páginas o
sólo de las
seleccionadas.
Cortar
la selección
actual en el Editor
de texto.
Pegar
la selección en el
Editor de texto.
Abrir
el cuadro de diálogo
Opciones.
Ayuda
contextual
26 INTRODUCCIÓN
Barra de herramientas Imagen
La barra de herramientas Imagen contiene botones que permiten acercarse o
alejarse de la imagen actual, o bien girarla. También permiten trabajar con
zonas y divisores de tablas en la página. Consulte Separación manual de zonas
y Cuadrículas de tablas en la imagen el en capítulo 3. Aquí hemos resumido
las funciones de los botones. La barra de herramientas Imagen se puede
desplazar (es decir, desacoplar y mover a cualquier otro lugar del escritorio).
Se puede acoplar a cualquier borde del área Imagen original.
Barra de herramientas de formato
La barra de herramientas de formato contiene botones que permiten modifi-
car el texto reconocido en el Editor de texto. Esto se describe en detalle en el
capítulo 4 (Edición de texto e imágenes). Aquí presentamos un resumen de la
función de los botones. La barra de herramientas de formato siempre perma-
nece en la parte superior del Editor de texto.
Dibujar
zonas rectangulares.
Agregar
a una zona o
combinar
zonas.
Reordenar
zonas.
Mover
separadores de
fila o columna en
una tabla.
Eliminar/
Reemplazar todos
los separadores de
fila y columna.
Acercar
la imagen de
una página.
Dibujar
zonas irregulares.
Quitar de una
zona o zonas
individuales.
Propiedades
de zona
Insertar
separadores de
columna en una
tabla.
Eliminar
separadores de fila
o columna uno por
uno.
Girar
imágenes.
Alejar
la imagen de
una página.
Insertar
separadores
de fila en una
tabla.
Consejo Tamb ién se puede cambiar el tamaño o girar la imagen original
con un menú rápido. Haga clic con el botón derecho del ratón en el área de
Imagen original fuera de una zona y seleccione un valor de zoom o giro.
Estilos de
párrafo
Nombre de la
fuente
Tamaño de
la fuente
Negrita Subrayado
ViñetasCursiva
Alineación
de párrafo
Mostrar/Ocultar
caracteres no imprimibles.
EL ESCRITORIO DE OMNIPAGE SE 27
Caja de herramientas de OmniPage
Esta caja de herramientas permite controlar el procesamiento. De forma
predeterminada, está situada en la parte superior del escritorio de OmniPage
SE, justo sobre las áreas de trabajo. Se puede desplazar y acoplar a la parte
inferior del escritorio.
Tiene tres fichas a la izquierda: AutoOCR, OCR manual y Asistente de
OCR. Haga clic en una de ellas para ver sus controles en la Caja de
herramientas. En la imagen al principio de esta sección se aprecia el escritorio
de OmniPage con la barra de herramientas OCR manual. La barra de
herramientas AutoOCR tiene el siguiente aspecto.
El procesamiento Automático se inicia, se puede detener y reiniciar con los
botones situados a la derecha de la barra de herramientas. El uso de estos
botones y todos los parámetros se describen en la sección Procesamiento
automático de documentos, en el capítulo 3.
Se puede alternar entre el procesamiento automático y manual en cualquier
momento en que el programa no esté ocupado en algún tipo de
procesamiento. Eso significa que se puede alternar entre ambos modos
mientras esté trabajando en algún documento. Es posible procesar
automáticamente algunas páginas, y luego agregar más páginas con el
procesamiento manual. Tras procesar un grupo de páginas en forma
automática, se pueden revisar los resultados y volver a procesar ciertas
páginas manualmente. Este procedimiento también se describe en el
capítulo 3, Procesamiento automático de un documento y terminación manual.
OmniPage SE debe estar vacío al iniciar el Asistente de OCR. Cuando lo
haya utilizado para procesar y guardar un documento, permanece en el
programa y se puede utilizar posteriormente (agregar más páginas, reconocer
páginas, etc.) con el procesamiento manual o automático. Consulte
Procesamiento de documentos utilizando el Asistente de OCR en el capitulo 3.
28 INTRODUCCIÓN
ADMINISTRACIÓN DE DOCUMENTOS
El Administrador de documentos está situado a la izquierda del escritorio de
OmniPage SE. Tiene dos paneles separados: vista de miniatura y vista de
detalles. Haga clic en una ficha para apreciar cómo se ve. Ambas vistas resu-
men las páginas del documento y están sincronizadas: la página actual y las
seleccionadas permanecen invariables cuando se cambia de vista. Nuestras
imágenes muestran las dos vistas con el mismo documento de cuatro pági-
nas. Las páginas 1 y 2 están seleccionadas y la página 4 es la página actual, es
decir, la que aparece en el área Imagen original. El Administrador de docu-
mentos muestra el estado de la página con los siguientes iconos:
Vista de miniatura
Esta vista presenta un conjunto vertical de imágenes en miniatura numeradas,
una para cada página del documento. Desplácese para ver las páginas según sea
necesario. La página actual tiene un fondo más pálido y su número de página
aparece en negrita. Se pueden seleccionar varias páginas en el documento; éstas
tendrán un aspecto embutido. El icono de estado aparece en la parte inferior
derecha de cada página, tal como se describió anteriormente.
Pasar a una página: haga clic en el icono de la página deseada.
Reordenar una página: haga clic en la miniatura de la página que desee
mover, luego arrástrela y colóquela sobre el número de la página deseada.
Las páginas se vuelven a numerar automáticamente.
Eliminar una página: seleccione la miniatura de la página que desee
suprimir y pulse la tecla Suprimir.
Seleccionar varias páginas: mantenga pulsada la tecla Mayús y haga clic en
dos miniaturas para seleccionar todas las páginas entre ellas (inclusive). Man-
tenga pulsada la tecla Ctrl cuando haga clic en las miniaturas para agregar
páginas individualmente a la selección. Es posible mover o eliminar las pági-
nas seleccionadas como grupo, o bien enviarlas para su reconocimiento.
Página Estado
Icono de
miniatura
Icono de
detalle
La imagen de página se ha...
1 Obtenido
Obtenido sin zonas manuales ni de plantilla y aún
no se ha reconocido.
2
Separado
por zonas
Obtenido y se han colocado zonas manuales o de
plantilla; pero aún no se ha reconocido.
3 Reconocido
Reconocido, pero no verificado, o bien la verifica-
ción se interrumpió en la página.
4 Verificado
Reconocido, y la verificación ha llegado al final de la
página.
ADMINISTRACIÓN DE DOCUMENTOS 29
Vista de detalles
Esta es una nueva función de OmniPage SE. Proporciona una vista general
del documento con una tabla. Cada fila representa una página. Las columnas
presentan información estadística o de estado para cada página, y (cuando
corresponde) los totales del documento. En la imagen que aparece a
continuación se aprecian las columnas predeterminadas a la izquierda y
cuatro columnas especificadas por un usuario.
La página actual aparece resaltada. Se puede usar la vista de detalles para las
operaciones de la página, tal como se indica a continuación:
Pasar a una página: haga clic en una fila de la página deseada.
Reordenar una página: haga clic en la fila de la página que desee mover y
arrástrela a la ubicación deseada. Un indicador de flecha en la izquierda
muestra dónde se insertará la página. Las páginas se vuelven a numerar
automáticamente.
Eliminar una página: seleccione la fila de la página que desee suprimir y
pulse la tecla Suprimir.
Seleccionar varias páginas: mantenga pulsada la tecla Mayús y haga clic en
dos filas de página para seleccionar todas las páginas entre ellas (inclusive).
Mantenga pulsada la tecla Ctrl cuando haga clic en las filas para agregar
páginas individualmente a la selección. Es posible mover o eliminar las
páginas seleccionadas como grupo, o bien enviarlas para su reconocimiento.
Cuando se seleccionen varias páginas, la página indicada como actual no
cambiará. Todas las páginas seleccionadas quedan resaltadas.
Coloque el cursor en
el icono de estado
de la página para
ver una miniatura de
la misma.
Esto muestra el
número de zonas
de cada tipo en la
página.
Consejo Es posible obtener información del tamaño de la imagen
colocando el cursor sobre una miniatura o fuera de una zona en una imagen
original. El texto emergente mostrará el tamaño de la imagen en píxeles y en
la unidad de medición del programa. También aparece la resolución de la
imagen.
30 INTRODUCCIÓN
Personalizar columnas en la vista de detalles
Es posible especificar cuáles columnas de información desea apreciar en la
vista de detalles. Haga clic en Personalizar detalles... en el menú Ver para
invocar el siguiente cuadro de diálogo:
Defina cuáles columnas deben aparecer, sus anchos y el orden. En el
apartado sobre Personalización de columnas en la vista de detalles de la
ayuda en línea se clarifica lo que se presenta en cada columna. Es posible
cambiar fácilmente el ancho de las columnas en la vista de detalles; para ello
arrastre los separadores de columna en la barra de título.
Eliminar páginas de un documento
La eliminación de páginas se debe confirmar y se puede deshacer. Suprima la
página actual sólo mediante el elemento Eliminar la página actual en el menú
Editar. Para suprimir todas las páginas seleccionadas en el Administrador de
documentos (en cualquier vista) se debe pulsar la tecla Suprimir o bien usar
el comando de menú rápido Borrar.
Imprimir un documento
Es posible imprimir el documento con el elemento Imprimir en el menú
Archivo. Elija si desea imprimir imágenes o texto (es decir, los resultados del
reconocimiento tal como aparecen en el Editor de texto). Se pueden impri-
Haga clic en la
casilla de
verificación de un
elemento para
seleccionarlo.
Este elemento se
resalta.
Los tamaños de las
imágenes se
expresan en
píxeles.
Defina el ancho de
un elemento
resaltado.
Resalte un
elemento y utilice
estas flechas
para cambiar el
orden de las
columnas.
DOCUMENTOS OMNIPAGE 31
mir todas las páginas o un rango de páginas. El botón Imprimir en la barra
de herramientas Estándar permite imprimir imágenes o texto, dependiendo
de si está activa el área de la Imagen original o del Editor de texto.
Cerrar un documento
Seleccione Cerrar en el menú Archivo para cerrar un documento. Se le
solicitará que guarde el documento si no lo ha hecho o bien si lo ha
modificado desde la última vez que lo guardó. Consulte la siguiente sección
sobre cómo guardarlo como documento de OmniPage (*.opd). También se
le solicitará guardar los datos de capacitación que no se hayan guardado si es
que seleccionó Interrogar antes de guardar datos de IntelliTrain al cerrar un
documento en el panel Verificación del cuadro de diálogo Opciones.
La frase anterior no se aplica a OmniPage SE.
DOCUMENTOS OMNIPAGE
El documento de OmniPage es el tipo de archivo original del programa, y
que tiene extensión .opd. Es uno de los tipos de archivo ofrecidos al guardar
un documento como archivo. Guarde el documento como archivo tipo
OPD si desea trabajar con él nuevamente en OmniPage SE durante una
sesión futura. Luego puede procesar páginas sin terminar, agregar más
páginas y verificar o editar resultados reconocidos.
Un documento de OmniPage contiene imágenes de las páginas originales
con las zonas que éstas contengan. Tras el reconocimiento, el documento
OPD también contendrá los resultados del reconocimiento. Los caracteres
reconocidos se almacenan junto con sus datos de coordenadas e índices de
certeza. Ello conserva los vínculos entre imagen y texto, de modo que la
verificación esté disponible al volver a abrir el documento OPD en sesiones
futuras.
Al guardar un documento de OmniPage, también se almacenan los paráme-
tros actuales (y la información de capacitación no guardada). Al abrir un
documento de OmniPage, se aplican sus parámetros, reemplazando tempo-
ralmente los existentes en el programa.
32 INTRODUCCIÓN
Por qué guardar el documento como tipo OPD
No es necesario guardar los documentos como archivos tipo OPD. Esto se
hace normalmente por las siguientes razones:
No se puede terminar de trabajar con el documento en la sesión actual.
Es necesario pasar el documento a otros usuarios que tienen la versión
Omnipage SE o Pro 11. Por ejemplo, se puede pasar un archivo OPD a
un especialista para su verificación. En la red de una oficina, se puede
contar con un escáner que genere imágenes para reconocimiento y
realizar la verificación en diversas estaciones de trabajo.
Se desea archivar los documentos reconocidos cuyas imágenes originales
continúen siendo accesibles. Los textos reconocidos permiten buscar por
palabras clave y otras técnicas de recuperación de documentos.
Cómo guardar un archivo en formato OPD
Si desea crear un documento OPD, puede guardarlo en este formato desde
un comienzo, para fines de protección. Utilice el botón Guardar para irlo
guardando periódicamente a medida que vaya trabajando. Guárdelo
nuevamente al final de la sesión.
El botón Guardar permite grabar el documento con el mismo nombre y tipo
de archivo que tenía la última vez que se almacenó. Se puede guardar el
documento varias veces en diferentes formatos. Si lo almacenó la primera vez
en otro formato (por ejemplo .DOC), utilice el elemento Guardar como...
en el menú Archivo para guardarlo como OPD. Si un documento se guarda
como OPD, y luego lo guarda con otro formato, no se volverá a almacenar
automáticamente como OPD. Al cerrar el documento o salir del programa,
se le solicitará guardar el documento como OPD.
Nota Los resultados del reconocimiento se deben guardar a partir de
archivos OPD antes de instalar una actualización de OmniPage. Puede que
estos archivos no sean compatibles con las versiones más recientes de los
formatos de archivo OPD, o posiblemente sólo se conserven las imágenes al
actualizar los archivos.
PARÁMETROS 33
PARÁMETROS
El cuadro de diálogo Opciones es la ubicación central para los parámetros de
OmniPage SE. Tiene siete paneles. La ayuda contextual proporciona
información sobre cada parámetro. En general, los paneles de parámetros son
los siguientes:
OCR
Utilice este último para especificar el idioma o idiomas de reconocimiento, el
diccionario del usuario, un carácter de rechazo, un método de OCR
(optimícelo para mayor velocidad o precisión) y la coincidencia de fuentes.
Escáner
Utilice esta opción para definir el tamaño de página y la orientación de
exploración. También se pueden fijar ajustes de brillo y contraste, y definir
opciones para explorar documentos de varias páginas, sin importar si se
cuenta o no con un alimentador automático de documentos (ADF).
Es posible cambiar los parámetros de configuración del escáner, instalar un
nuevo escáner, o bien cambiar el escáner predeterminado.
Direct OCR
Esta característica proporciona servicios de OCR directamente desde su
procesador de texto favorito u otra aplicación similar. Utilice este panel para
registrar y eliminar el registro de las aplicaciones para Direct OCR, así como
para habilitar o inhabilitar este servicio. También se puede especificar la
separación de zonas automática o manual y si se desea o no la verificación.
34 INTRODUCCIÓN
Proceso
Utilice esta opción para definir dónde se colocarán nuevas imágenes en el
documento y para fijar otras preferencias que regirán el procesamiento. Aquí
también se puede cambiar el idioma de la interfaz.
Verificación
Utilice esta opción para definir si la verificación debe comenzar
automáticamente tras el reconocimiento. Defina también si se debe ejecutar
IntelliTrain, y utilícela para cargar o trabajar con un archivo de capacitación.
Encontrará más detalles en la sección Verificación de los resultados de OCR del
capítulo 4.
Las referencias a la función IntelliTrain no se aplican a OmniPage SE.
Diseño personalizado
Utilice esta opción para describir en forma precisa el diseño de las páginas del
documento de entrada. Esto permite el máximo control sobre el proceso de
separación automática de zonas, indicándole que busque o ignore las
columnas, gráficos y tablas.
Editor de texto
Utilice esta opción para mostrar u ocultar ciertas características en el Editor
de texto, para definir la unidad de medición que se va a utilizar y para activar
o desactivar la acomodación de texto.
Nota Algunos parámetros surten efecto sólo en el reconocimiento futuro.
Se pueden citar como ejemplos los idiomas de reconocimiento, un archivo
de capacitación y el brillo del escáner. Estos parámetros se deben ajustar
correctamente antes de comenzar el procesamiento. Para aplicar los cambios
en estos parámetros a páginas ya reconocidas, se deberá volver a reconocerlas.
Los demás parámetros surten efecto inmediatamente en todas las páginas
existentes. Ello ocurre por ejemplo con parámetros del Editor de texto tales
como la acomodación de texto y las unidades de medición.
OMNIPAGE SE MANUAL DEL USUARIO 35
3
Tutorial: Procesamiento
de documentos
En este capítulo se describen diferentes formas en que se puede procesar un
documento, y además se proporciona información acerca de los aspectos
fundamentales de estos tipos de procesamiento.
u Guía de inicio rápido
u Procesamiento de documentos utilizando el Asistente de OCR
u Procesamiento automático de documentos
u Procesamiento manual de documentos
u Procesamiento automático de un documento y terminación manual
u Procesamiento a partir de otras aplicaciones
(Direct OCR, PaperPort)
u Procesamiento de documentos con Programar OCR
Los temas detallados son:
u Definición del origen de imágenes de las páginas
u Descripción del diseño del documento
u Separación manual de zonas
u Cuadrículas de tablas en la imagen
u Uso de plantillas de zonas
36 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
GUÍA DE INICIO RÁPIDO
Esta sección muestra paso a paso el proceso básico de OCR.
Carga y reconocimiento de archivos de imágenes de ejemplo
Encontrará ejemplos de archivos de imágenes en la carpeta del programa,
tanto archivos de una página como de varias páginas. Primero intente leer
estos archivos utilizando el procedimiento que se indica a continuación, pero
ignorando las referencias al escáner. En la sección Entrada desde archivos de
imagen encontrará más información sobre la obtención de imágenes. Los
resultados le proporcionarán un parámetro sobre la calidad del
reconocimiento que puede esperar a partir de sus propios archivos de calidad
similar.
A continuación, intente explorar una página con su escáner.
Exploración y reconocimiento de una sola página
Encienda el escáner y cerciórese de que funciona correctamente. Seleccione
una página con texto nítido de buena calidad para esta prueba.
Se da por sentado que se fijaron los parámetros predeterminados de
OmniPage SE y que el documento está en el idioma que se especificó para la
interfaz durante la instalación. Abra el cuadro de diálogo Opciones en el
menú Herramientas y elija la opción Predeterminados si no está utilizando el
programa por primera vez.
Procesará el documento en forma automática y se guardarán los resultados de
reconocimiento en un archivo. Podrá verificar el documento pero no editar el
contenido en el Editor de texto de OmniPage SE.
GUÍA DE INICIO RÁPIDO 37
Acción Resultado
1. Configure el escáner utilizando el Asistente del
escáner, si aún no lo ha hecho.
Configura OmniPage SE para que funcione con su
escáner.
2.
Seleccione Inicio
ÉProgramasÉScanSoft
OmniPage SE
É OmniPage SE
Abre OmniPage SE en su equipo.
3. Coloque el documento correctamente en el
escáner.
4. Revise los tres botones de ficha a la izquierda de
la Caja de herramientas de OmniPro. El botón
AutoOCR debe estar seleccionado. De no ser
así, haca clic en él.
Especifica que desea que OmniPage SE procese el
documento automáticamente según los parámetros fija-
dos.
5. En el menú desplegable Obtener página, selec-
cione una opción de exploración para el docu-
mento: blanco y negro, escala de grises o color.
Permite determinar la forma en que se verán las imáge-
nes, texto de color y fondos en el documento exportado.
La exploración en colores necesita un escáner en color.
6. En el menú desplegable Describir el original,
verifique que esté seleccionada la opción Auto-
mático. Esta es la mejor opción para procesar
una gran variedad de documentos.
Configura OmniPage SE para que coloque zonas en la
página y decide sus propiedades en forma automática.
7. En el menú desplegable Exportar resultados,
verifique que esté seleccionada la opción Guar-
dar como archivo.
Esto significa que podrá nombrar el archivo de exporta-
ción tras haber verificado el documento.
8. Haga clic en Iniciar. OmniPage SE comenzará a explorar el documento.
9. Aparecerá el Verificador de OCR y le solicitará
modificar los términos que el programa sospe-
che que no se han reconocido correctamente.
El Verificador de OCR funciona como el corrector orto-
gráfico de un procesador de texto, pero además con-
tiene ciertas características específicas de OCR.
10. Haga clic en el Editor de texto. Seleccione las
vistas del Editor de texto una tras otra, para ver
el aspecto que tendrá la página en cada una de
ellas. Elija la vista que desee para la exporta-
ción.
Cada vista del Editor de texto define un nivel de formato.
La vista fijada al momento de guardar el documento se
aplica al texto en el archivo guardado.
11. Haga clic en Continuar para reiniciar la verifica-
ción. Cuando aparezca el mensaje La verifica-
ción del reconocimiento está completa, haga clic
en Aceptar.
Con esto termina el proceso del Verificador de OCR.
Aparecerá el cuadro de diálogo Guardar como.
12. Elija la ubicación y el tipo de archivo para guar-
dar el documento reconocido. Haga clic en
Aceptar.
De forma predeterminada, está activada la opción Guar-
dar e iniciar, de modo que el documento se abrirá auto-
máticamente en el procesador de texto asociado con el
tipo de archivo que seleccione.
13. Revise el documento en el procesador de texto. Ha utilizado satisfactoriamente OmniPage SE para
reconocer el documento y abrirlo en la aplicación de
destino
38 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
A continuación aparece un resumen de los métodos de procesamiento que se
pueden utilizar. En las siguientes páginas, encontrará una guía detallada para
cada uno de ellos.
Uso del Asistente de OCR
El Asistente de OCR le guiará a través de la selección de parámetros y
comandos mediante una serie de preguntas. Luego iniciará el procesamiento
automático. Esta es una buena manera de comenzar si aún no tiene mucha
experiencia en el uso de
OmniPage SE.
Automáticamente
La manera más rápida y sencilla de procesar documentos es dejar que
OmniPage SE lo haga automáticamente. Seleccione los parámetros en el
cuadro de diálogo Opciones y los comandos en la barra de herramientas
AutoOCR y luego haga clic en Iniciar. El programa procesará cada página
por todo el procedimiento de principio a fin, efectuando pasos en paralelo
cada vez que sea posible. Generalmente separará de manera automática las
zonas de las páginas.
Manualmente
El procesamiento manual le brinda un control más preciso sobre la forma de
manipulación de las páginas. Podrá procesar el documento página por página
con diferentes parámetros para cada una de ellas. El programa también se
detiene entre paso y paso: obtención de imágenes, reconocimiento,
exportación. Esto permite, por ejemplo, dibujar zonas manualmente o
cambiar el idioma o idiomas de reconocimiento. Para iniciar cada paso, se
debe hacer clic en los botones de la barra de herramientas OCR manual.
Automáticamente con terminación manual
Podrá procesar un documento automáticamente y ver los resultados en el
Editor de texto. Si la mayoría de las páginas están en orden, pero algunas no
quedaron como se esperaba, podrá pasar al procesamiento manual para
ajustar los parámetros y efectuar el reconocimiento sólo de las páginas
problemáticas.
Consejo Si obtuvo resultados satisfactorios a partir de los archivos de
imágenes de ejemplo, pero no con una página explorada, revise la instalación
y parámetros del escáner: en especial el brillo y la resolución de la imagen. En
la sección Entrada desde escáner encontrará un modelo de brillo óptimo.
Consulte también los temas de la ayuda en línea sobre Configuración del
escáner y Resolución de problemas del escáner.
PROCESAMIENTO DE DOCUMENTOS UTILIZANDO EL ASISTENTE DE OCR 39
En otras aplicaciones
Podrá usar la característica Direct OCR para recurrir a los servicio de
reconocimiento de OmniPage SE mientras trabaja en su procesador de texto
usual u otra aplicación similar. OmniPage SE se vincula automáticamente
con los programas de administración de documentos PaperPort y Pagis de
ScanSoft.
Posteriormente
Podrá programar trabajos de OCR para que se efectúen posteriormente de
manera automática, incluso sin que sea necesaria su presencia ante el equipo.
El Asistente para Programar OCR permite especificar los parámetros y una
hora de inicio.
PROCESAMIENTO DE DOCUMENTOS UTILIZANDO EL
ASISTENTE DE OCR
El Asistente de OCR le lleva por los seis paneles de parámetros para ayudarle
a fijar los parámetros del documento, y luego inicia el procesamiento
automático. Existe ayuda contextual en todos los paneles del asistente. El
Asistente de OCR puede funcionar solamente cuando no haya un
documento abierto con OmniPage SE.
Haga clic en la ficha Asistente de OCR en la Caja de herramientas de
OmniPage y luego en el botón del asistente para ver su primera pantalla:
40 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
1. El primer panel permite definir el origen del documento: escáner o
archivo de imagen. Encontrará más información en la sección Definición
del origen de imágenes de las páginas. Responda a las preguntas de la
primera pantalla y haga clic en Siguiente.
2. El segundo panel le solicita que describa el diseño del documento de
entrada, para ayudarle en la separación automática de zonas. Encontrará
más información en la sección Descripción del diseño del documento.
3. El tercer panel (que aparece a continuación) permite definir los idiomas
de reconocimiento y decidir el método de OCR. Los idiomas que
cuenten con diccionario tienen el icono .
4. El cuarto panel permite definir el nivel de formato que se aplicará al
documento para su presentación y exportación. En el capítulo 4,
Pantalla y vistas del editor, encontrará más información al respecto.
5. El quinto panel le pregunta si desea verificar el texto antes de exportarlo.
Si elige Sí también podrá editar el texto antes de guardar el documento.
Tam bi én podrá decidir si desea crear y utilizar datos de IntelliTrain
durante la verificación. En el capítulo 4,Verificación de los resultados de
OCR, encontrará más información al respecto.
La referencia a la función IntelliTrain no se aplica a OmniPage SE.
6. El último panel le solicita que defina la alternativa de exportación:
guardar en un archivo o copiar al Portapapeles. Tras fijar la opción, haga
PROCESAMIENTO DE DOCUMENTOS UTILIZANDO EL ASISTENTE DE OCR 41
clic en Termi nar para cerrar el asistente y comenzar el procesamiento
automático.
7. Si solicitó verificar y el texto contiene caracteres dudosos, aparecerá el
cuadro de diálogo OCR Proofreader. Cuando haya concluido la
verificación, los resultados del reconocimiento irán directamente al
Portapapeles, o bien se abrirá el cuadro de diálogo Guardar como para
que se puedan especificar los parámetros de exportación de archivos.
8. El documento permanece en OmniPage SE. Podrá editar los resultados
del reconocimiento y volver a guardarlos en otros formatos. Podrá
cambiar las zonas manualmente o bien modificar otros parámetros y
luego utilizar el procesamiento manual para reconocer páginas
independientes del documento. También podrá agregar páginas
mediante el procesamiento automático o manual.
Nota Los paneles del asistente presentan los parámetros tal como estaban la
última vez que se modificaron en el programa. Además, OmniPage SE
recordará los parámetros que se configuren en los paneles del Asistente de
OCR y los aplicará a los procesamientos futuros, ya sean automáticos o
manuales, hasta que los vuelva a cambiar. De modo que si tiene más
documentos para los cuales sean adecuados los parámetros del Asistente de
OCR, basta con cambiar a la barra de herramientas AutoOCR y hacer clic en
Iniciar.
Nota Los parámetros pertinentes que no ofrece el Asistente de OCR
adoptan los valores que se fijaron la última vez en el programa. Esto
concierne principalmente a los parámetros del escáner, un diccionario del
usuario o un archivo de capacitación. No es posible usar plantillas de zonas
con el Asistente de OCR. Si al iniciarse el Asistente de OCR se estableció un
archivo de plantilla, éste se descargará y se fijará la opción Automático como
descripción de entrada. No es posible exportar un documento reconocido
adjunto a un mensaje de correo electrónico. En ese caso, utilice el
procesamiento automático o manual.
42 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
PROCESAMIENTO AUTOMÁTICO DE DOCUMENTOS
El procesamiento automático constituye una manera eficiente de manipular
documentos, especialmente aquéllos de gran tamaño. Primero seleccione
todos los parámetros necesarios, luego podrá usar la barra de herramientas
AutoOCR de la Caja de herramientas de OmniPage para procesar un
nuevo documento de principio a fin, o bien reiniciar y terminar el
procesamiento de un documento abierto.
1. Haga clic en la ficha AutoOCR de la Caja de herramientas de OmniPage
para ver la barra de herramientas AutoOCR.
2. Seleccione en la lista desplegable el comando deseado de Obtener
página. Podrá definir el origen del documento, el cual puede provenir de
archivos de imágenes o un escáner. Encontrará más detalles en la sección
Definición del origen de imágenes de las páginas.
3. Seleccione un comando de la lista desplegable Describir el original, tal
como se indicó anteriormente. Esto guía el programa para la separación
automática de zonas de las páginas. Podrá describir las páginas entrantes
o especificar un archivo de plantilla de zonas. Encontrará más informa-
ción acerca de las opciones en la sección Descripción del diseño del docu-
mento.
4. Seleccione un comando de la lista desplegable Exportar resultados. Podrá
guardar el documento reconocido en un archivo, copiarlo al
Portapapeles o bien enviarlo adjunto a un mensaje de correo electrónico.
En el capítulo 5 encontrará información acerca de estas alternativas.
5. Elija Opciones en el menú Herramientas y compruebe que los
parámetros son adecuados para su documento. Es posible, por ejemplo,
especificar los idiomas de reconocimiento y si desea verificar o no el
documento. Consulte la sección Parámetros al final del capítulo 2.
PROCESAMIENTO AUTOMÁTICO DE DOCUMENTOS 43
6. Haga clic en Iniciar o bien seleccione Inicio en el menú Proceso. Cada
página del documento se procesará y terminará una tras otra. El pro-
grama puede efectuar tareas individualmente, por ejemplo puede iniciar
la carga y reconocimiento de una nueva página a medida que vaya verifi-
cando la página anterior.
Botones de comandos
Iniciar: permite comenzar el procesamiento automático de un nuevo
documento.
Detener: permite interrumpir el procesamiento automático. Le convendrá
hacer esto si encuentra que se deben cambiar algunos parámetros. Luego el
botón Iniciar cambia a Te rm ina r.
El botón de inicio adopta diferentes valores cuando el procesamiento se
detiene o termina.
Ter mi na r: este botón aparece si el procesamiento está incompleto. Permite:
u Te rmi na r de procesar páginas inconclusas.
u Exportar el documento, ignorando las páginas no reconocidas.
Adicional: este botón aparece si todas las páginas existentes se procesaron y
se exportaron una vez. Permite:
u Exportar el documento nuevamente, tal vez con cambios, a
otro tipo, nombre o ubicación de archivo, o bien con otro nivel
de formato.
u Agregar más páginas del mismo origen o de otro, con
parámetros cambiados o intactos.
u Volver a procesar todas las páginas: desecha todos los
resultados de reconocimiento y reconoce todas las páginas del
documento con parámetros distintos. Podrá especificar la
separación automática de zonas o un archivo de plantilla.
Consejo Podrá volver a procesar todas las páginas si un parámetro no
adecuado provocó resultados deficientes en todas las páginas. Un ejemplo
es la elección del idioma incorrecto, lo que puede hacer que aparezcan casi
todos los caracteres marcados como dudosos durante la verificación.
La opción de volver a procesar permite efectuar nuevamente el reconoci-
miento sin tener que explorar, cargar ni efectuar nuevamente la separación
de zonas de todas las imágenes.
44 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
PROCESAMIENTO MANUAL DE DOCUMENTOS
El procesamiento manual le brinda un control más preciso sobre la forma de
manipular las páginas. Podrá procesar el documento página por página con
diferentes parámetros para cada una de ellas. El programa también se detiene
entre paso y paso: obtención de imágenes, reconocimiento, exportación. Esto
permite, por ejemplo, dibujar zonas manualmente en cada página. Para
iniciar cada paso del proceso, deberá clic en los botones de la barra de
herramientas OCR manual.
1. Haga clic en la ficha OCR manual en la Caja de herramientas de
OmniPage para ver la barra de herramientas OCR manual.
2. Haga clic en la barra de herramientas Estándar o en Opciones en el
menú Herramientas para marcar o seleccionar los parámetros del cuadro
de diálogo Opciones. Consulte la sección Parámetros al final del
capítulo 2.
3. Seleccione el valor deseado para el botón Obtener página. Podrá definir
el origen del documento, el cual puede provenir de archivos de imágenes
o de un escáner. Acceda al cuadro de diálogo con los parámetros del
escáner y modifíquelos según desee. Encontrará más detalles en la
sección Definición del origen de imágenes de las páginas.
4. Haga clic en el botón Obtener página. Esto invoca el cuadro de diálogo
Cargar archivo, permitiéndole nombrar archivos de imágenes, o bien
inicia la exploración. Como resultado de lo anterior, aparecen una o más
imágenes en el Administrador de documentos, y una en el área Imagen
original.
PROCESAMIENTO MANUAL DE DOCUMENTOS 45
5.
Ahora podrá dibujar manualmente y modificar zonas en una o más
imágenes y asignar propiedades. Los botones de la barra de estado
permiten pasar a otras páginas. Al solicitarse el reconocimiento, se
efectuará la separación automática de zonas a todas las imágenes que no las
tengan. En la sección
Separación manual de zonas
encontrará más detalles
al respecto.
6. Seleccione un valor para el botón Realizar OCR. Podrá describir el
diseño de las páginas entrantes. Este valor influye si la separación
automática de zonas se efectúa en un número determinado de páginas.
Tam bi én se puede seleccionar una plantilla para colocar sus zonas en la
página actual. Encontrará más detalles en las secciones Descripción del
diseño del documento y Uso de plantillas de zonas.
7. Haga clic en el botón Realizar OCR para reconocer la página actual.
Para reorganizar las páginas seleccionadas, haga una selección múltiple
en el Administrador de documentos (consulte el capítulo 2,
Administración de documentos) y luego haga clic en el botón Realizar
OCR.
8. Aparecerá el cuadro de diálogo Instrucciones de separación de zonas, a
menos que lo haya desactivado.
Cuando elija una de sus opciones, comenzará el reconocimiento.
9. Si solicitó verificación, el cuadro de diálogo Verificador de OCR
mostrará los caracteres dudosos uno tras otro en la página o páginas
reconocidas. Podrá verificar y editar el texto reconocido. Consulte el
capítulo 4, Verificación de los resultados de OCR.
10. Continúe cargando páginas, efectuando el OCR, editando y verificando
según desee.
46 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
11.
Seleccione un valor para el botón Exportar resultados. Podrá guardar el
documento reconocido en un archivo (también como un documento de
OmniPage
), copiarlo al Portapapeles, o bien enviarlo adjunto a un
mensaje de correo electrónico. Podrá guardar el documento más de una
vez. Encontrará más información en el capítulo 5.
PROCESAMIENTO AUTOMÁTICO DE UN DOCUMENTO Y
TERMINACIÓN MANUAL
Cuando tenga un documento de gran tamaño que contenga sólo algunas
páginas a las que se deba prestar especial atención, no es necesario procesar
manualmente todo el documento. Podrá procesarlo automáticamente y ver
los resultados en el Editor de texto. Luego podrá determinar qué páginas
están en orden, y cuáles necesitan parámetros diferentes o separación manual
de zonas. Finalmente podrá pasar al procesamiento manual para ajustar los
parámetros y zonas, y luego volver a efectuar el reconocimiento de sólo esas
páginas.
1. Prepare el documento y efectúe el procesamiento automático, tal como
ya se describió.
2. Si cierra o termina la verificación, se le solicitará que guarde el
documento. Esto es lo que se recomienda hacer, aun cuando no sea su
forma final.
3. Seleccione una página que necesite parámetros distintos o una nueva
separación de zonas, y haga clic en la ficha OCR manual a la izquierda
de la Caja de herramientas de OmniPage.
4. Elimine o modifique las zonas existentes en el área Imagen original.
Tam bi én podrá cargar una plantilla para dejar que sus zonas reemplacen
Nota Si anula la selección de Buscar zonas además de zonas de plantilla/
actuales en el panel Proceso del cuadro de diálogo Opciones, no aparecerá el
cuadro de diálogo Instrucciones de separación de zonas y el reconocimiento
siempre se efectuará sólo con las zonas actuales.
PROCESAMIENTO A PARTIR DE OTRAS APLICACIONES 47
las existentes. Dibuje nuevas zonas según desee. Consulte la sección
Separación manual de zonas.
5. Cambie otros parámetros según sea necesario para la página actual.
Consulte la sección Parámetros al final del capítulo 2.
6. Haga clic en el botón Realizar OCR para volver a reconocer la página
actual. Confirme que se deben sobreescribir los resultados del reconoci-
miento anterior. Aparecerá al cuadro de diálogo Instrucciones de separa-
ción de zonas, a menos que lo haya desactivado.
7. Para volver a efectuar el reconocimiento de más de una página, selec-
cione las páginas necesarias en el Administrador de documentos antes de
hacer clic en el botón Realizar OCR.
8. Cuando haya vuelto a reconocer todas las páginas con resultados acepta-
bles, guarde el documento nuevamente.
PROCESAMIENTO A PARTIR DE OTRAS APLICACIONES
Puede usar la característica Direct OCR para recurrir a los servicios de
reconocimiento de OmniPage SE mientras trabaja en su procesador de texto
usual u otra aplicación similar. Primero se debe establecer la conexión directa
con la aplicación. Luego, dos elementos del menú Archivo dan paso a las
funciones de OCR.
Cómo configurar Direct OCR
1. Inicie la aplicación que quiere conectar a OmniPage SE. Inicie
OmniPage SE, abra el cuadro de diálogo Opciones en el panel Direct
OCR y seleccione Activar Direct OCR.
2. Aparece el panel Sin registrar que muestra las aplicaciones registradas
anteriormente o en ejecución. Seleccione las que desee y haga clic en
Agregar. Podrá examinar en busca de una aplicación que no aparezca en
la lista. Seleccione las opciones de proceso según desee, para que
funcionen según sus preferencias.
48 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
Cómo usar Direct OCR
1. Abra la aplicación registrada y trabaje en un documento. Para obtener
resultados de reconocimiento a partir de páginas exploradas, colóquelas
correctamente en el escáner.
2. Utilice el elemento de menú Obtener parámetros del texto... del menú
Archivo para especificar los parámetros que se utilizarán durante el
reconocimiento. Los parámetros que no se presenten, adoptan sus
valores según los últimos que se utilizaron con OmniPage SE. Los
parámetros cambiados para Direct OCR se cambian también en
OmniPage SE.
3. Utilice el elemento de menú Obtener texto del menú Archivo para
obtener imágenes provenientes del escáner o archivo.
4. Si seleccionó Zonas automáticas en el panel Direct OCR del cuadro de
diálogo Opciones, o bien en Obtener parámetros del texto..., el
reconocimiento se efectuará de inmediato.
5. Si no seleccionó Zonas automáticas, se presentará la imagen de cada
página, permitiéndole dibujar zonas manualmente. Haga clic en el
botón Realizar OCR para comenzar el reconocimiento.
6. Si se especificó la verificación, ésta se llevará a cabo tras el
reconocimiento. Luego el texto reconocido se colocará en la posición del
cursor en la aplicación, con el nivel de formato especificado en Obtener
parámetros del texto... .
Nota Si se está ejecutando OmniPage SE al momento de invocar Direct
OCR desde una aplicación de destino, se iniciará una segunda instancia de
OmniPage SE.
PROCESAMIENTO A PARTIR DE OTRAS APLICACIONES 49
Cómo usar OmniPage SE con el software PaperPort
PaperPort
®
es un software de ScanSoft para la administración de
documentos. Permite vincular páginas con aplicaciones afines. Las
páginas pueden contener imágenes, texto o ambas cosas. Si PaperPort se
encuentra instalado en un equipo en el momento de instalar OmniPage
SE, sus servicios de OCR quedarán disponibles y ampliarán la capacidad
de PaperPort. Podrá elegir un programa de OCR haciendo clic con el
botón derecho del ratón en un enlace de PaperPort para aplicaciones de
texto, seleccionando Preferencias y luego OmniPage SE como paquete
de OCR. Los parámetros de OCR se pueden especificar, tal como en el
caso de Direct OCR.
:
Aquí se ha seleccionado OmniPage SE como el paquete de OCR para
MS Word 2000. Ahora puede arrastrar imágenes de páginas desde el
escritorio de PaperPort al vínculo de MS Word en PaperPort. Mientras se
reconoce el texto, sólo aparecerá un monitor indicando el progreso de
dicho procedimiento. Si se solicita, aparecerán la ventana de separación
manual de zonas de OmniPage SE o la función de verificación. Los
resultados de reconocimiento se colocan en un nuevo documento sin
nombre en la aplicación de destino.
50 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
PROCESAMIENTO DE DOCUMENTOS CON PROGRAMAR
OCR
Podrá programar trabajos de OCR para que se efectúen automáticamente en
cualquier momento dentro de las próximas 24 horas. En cada trabajo se procesa
un documento. Las páginas del documento pueden provenir de archivos de
imágenes o bien de un escáner con alimentador automático de documentos.
No es necesario estar frente a al ordenador en el momento de iniciar el trabajo,
ni tampoco que
OmniPage SE
esté en funcionamiento. No importa si su
equipo se apaga después de configurar el trabajo, siempre y cuando esté
funcionando a la hora de inicio. Si se han de explorar páginas, el escáner debe
estar funcionando en el momento de iniciar el trabajo, con las páginas cargadas
en el alimentador automático de documentos. A continuación se indica cómo
configurar un trabajo:
1. Haga clic en Programar OCR en el menú Proceso o en el menú Inicio de
Windows: seleccione Programas
ÉScanSoftÉOmniPage SEÉ
Programar OCR.
2. Aparecerá el cuadro de diálogo Programar OCR. Haga clic en Agregar
trabajo... a fin de invocar el Asistente para Agregar trabajo. El programa
le guiará por seis paneles, similares al Asistente de OCR.
3. En el primer panel podrá definir el origen de la imagen. Una
característica adicional le permite procesar todos los archivos de imagen
compatibles en una carpeta definida.
4. Los siguientes tres paneles son similares a los del Asistente de OCR, pero
también podrá especificar un diccionario del usuario. OmniPage Pro 11
permite especificar un archivo de capacitación y ejecutar la función
IntelliTrain. Estas posibilidades no existen en OmniPage SE.
5. El quinto panel permite especificar el nombre, tipo y ubicación de un
archivo de exportación y una opción de separación para dicho archivo.
6.
El último panel permite definir la hora de inicio del trabajo, mantener o
eliminar los archivos de entrada tras el procesamiento, y especificar el uso
de un archivo de registro para indicar la finalización del trabajo y los
problemas que se hayan presentado. Haga clic en Terminar para cerrar el
asistente.
DEFINICIÓN DEL ORIGEN DE IMÁGENES DE LAS PÁGINAS 51
Encontrará más información en la sección sobre Programación de OCR en la
ayuda en línea.
DEFINICIÓN DEL ORIGEN DE IMÁGENES DE LAS PÁGINAS
Hay dos posibles orígenes de imágenes: desde archivos de imágenes y desde
un escáner. Existen dos tipos principales de escáneres: plano o con
alimentación de hojas. Un escáner puede tener un alimentador automático
de documentos incorporado o agregado, el cual facilita la exploración de
documentos con varias páginas. Las imágenes de los documentos explorados
se pueden introducir directamente en OmniPage SE o bien guardar con el
propio software del escáner en un archivo de imagen, que se puede abrir
posteriormente con OmniPage SE.
Entrada desde archivos de imagen
Podrá crear archivos de imágenes con su propio escáner, o recibirlos por
correo electrónico o como archivos de fax. OmniPage SE puede abrir una
gran variedad de tipos de archivos de imagen; en el capítulo 6 encontrará una
lista de ellos, Tipos de archivos para abrir y guardar imágenes. Los archivos de
imagen se especifican en el cuadro de diálogo Cargar archivo, el cual aparece
al iniciar el procesamiento automático. En el procesamiento manual, haga
clic en el botón Cargar archivo o bien use el menú Proceso. En la parte
inferior del cuadro de diálogo aparecerán los parámetros avanzados, los
cuales se pueden dejar a la vista u ocultar. A continuación aparece su aspecto.
Nota El cuadro de diálogo Programar OCR enumera cada trabajo e indica
si su estado es Esperando, Ejecución, Error o Completo. Utilice la opción
Modificar trabajo... para cambiar los parámetros de un trabajo en espera.
Podrá modificar y volver a utilizar los trabajos terminados para procesar
nuevos trabajos que necesiten parámetros similares. También podrá eliminar
los trabajos finalizados cuando ya no los necesite.
52 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
Normalmente el botón Agregar coloca cada archivo en la parte inferior de la
lista de archivos. Para colocar un archivo en alguna otra posición, resalte el
archivo en la lista. El nuevo archivo se agregará justo a continuación del
archivo resaltado que esté más abajo.
Entrada desde escáner
Se debe contar con un escáner en buen estado, compatible e instalado
correctamente con OmniPage SE. Consulte Configuración del escáner con
OmniPage SE en el capítulo 1. Se ofrecen varios modos de exploración. Al
elegir uno, se deben considerar dos aspectos fundamentales:
u El tipo de salida que se desea para el documento de exportación
u El modo que proporcionará la mayor exactitud de OCR
Explorar en blanco y negro
Seleccione esta opción para explorar en blanco y negro. Esta opción no es la
más idónea si desea color en el documento de salida, ni tampoco si desea que
las imágenes tengan un aspecto similar al de fotografías en blanco y negro:
en ese caso se recomienda la exploración en escala de grises. Para una mayor
exactitud de OCR, utilice esta opción para texto oscuro nítido o sobre un
fondo blanco o pálido. Las imágenes en blanco y negro se pueden explorar y
manipular más rápidamente que las demás y ocupan menos espacio de disco.
Ésta es la carpeta actual.
Especifique el tipo o tipos
de archivo que desea ver.
Esto se puede usar para
archivos TIFF y DCX de
varias páginas.
Este es un archivo de
imagen en blanco para la
opción de guardar:
"Archivo nuevo después
de cada página en
blanco".
Haga clic mientras pulsa
la tecla Mayús o bien la
tecla Ctrl a fin de colocar
más de un archivo en el
cuadro de texto Nombre
de archivo.
Haga clic en Avanzadas
para abrir el panel inferior
y en Básicas para
cerrarlo.
Utilice esta opción para
agregar individualmente
archivos de carpetas
diferentes y controlar de
manera precisa el orden
de los archivos.
DEFINICIÓN DEL ORIGEN DE IMÁGENES DE LAS PÁGINAS 53
Explorar en escala de grises
Seleccione esta opción para usar la exploración en escala de grises. Elija esta
opción para conservar fotografías blanco y negro en el documento de
salida. Para una mayor exactitud de OCR, utilice esta opción en páginas con
contraste variable o bajo (donde no haya mucha diferencia entre tonos claros
y oscuros) y con el texto sobre fondos de color o sombreados.
Explorar en color
Seleccione esta opción para explorar en color. Sólo está disponible para
escáneres a color. Elija esta opción si desea obtener gráficos, texto o fondos en
color en el documento de salida. Para mayor exactitud de OCR, esta opción
no ofrece mayores beneficios que la escala de grises (para una resolución
determinada), pero exigirá mucho más tiempo, recursos de memoria y
espacio de disco.
Brillo y contraste
Los parámetros correctos de brillo y contraste juegan un importante papel en
la exactitud de OCR. Fije estos parámetros en el panel Escáner del cuadro de
diálogo Opciones. El diagrama ilustra un ajuste óptimo de brillo. Tras cargar
una imagen, revise su aspecto. Si los caracteres son gruesos y se superponen,
aclare el brillo. Si los caracteres son finos y difusos, oscurezca el brillo. Luego
vuelva a explorar la página.
Deficiente
Tolerable
Buena
Óptima
Buena
Tolerable
Deficiente
54 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
Exploración con un alimentador automático de documentos
La mejor manera de explorar documentos de varias páginas es con un
alimentador automático de documentos. Basta con cargar las páginas en el
orden correcto en el alimentador. Coloque las páginas en blanco si desea
guardar su documento en varios archivos de salida, utilizando la opción
Crear un archivo nuevo después de cada página en blanco. Consulte
Guardar en un archivo en el capítulo 5.
Si tiene un documento que supere la capacidad del alimentador automático
de documentos, seleccione Pedir automáticamente más páginas en el panel
Proceso del cuadro de diálogo Opciones. Luego un cuadro de diálogo le
permitirá agregar más lotes de páginas e indicar cuando se hayan explorado
todas las páginas.
Podrá explorar documentos por ambas caras con un alimentador automático
de documentos. Un escáner dúplex administrará esta función de manera
automática. Para los escáneres sencillos, seleccione la opción Explorar
páginas de dos caras en el panel Escáner del cuadro de diálogo Opciones.
Luego podrá explorar el documento en apenas algunas pasadas, agrupando
las páginas pares e impares. OmniPage SE fusionará las páginas de manera
automática.
Explorar documentos extensos sin un alimentador automático de
documentos
Tam bi én es posible explorar eficazmente documentos de varias páginas en un
escáner plano, incluso sin contar con un alimentador automático de
documentos. Seleccione la opción Explorar páginas automáticamente en el
panel Escáner del cuadro de diálogo Opciones y defina un valor de pausa en
segundos. Luego el escáner efectuará las pasadas de exploración de manera
automática, haciendo pausas entre cada exploración según el número de
segundos que usted haya definido, lo que le dará tiempo de colocar la página
siguiente. Un cuadro de diálogo le permitirá terminar la pausa antes o bien
solicitar una pausa más prolongada y especificar cuándo explorar la última
página.
DESCRIPCIÓN DEL DISEÑO DEL DOCUMENTO 55
DESCRIPCIÓN DEL DISEÑO DEL DOCUMENTO
Antes del reconocimiento se le solicitará que describa el diseño de las páginas
entrantes para ayudar al proceso de separación automática de zonas. Cuando
utilice el Asistente de OCR, siempre se ejecutará la separación automática de
zonas. Cuando efectúe el procesamiento automático, siempre se ejecutará la
separación automática de zonas a menos que se especifique la utilización de
una plantilla propia. Cuando efectúe el procesamiento manual, a menudo se
ejecutará la separación automática de zonas. Encontrará más detalles en la
ayuda en línea.
A continuación aparecen las opciones de descripción de entradas:
Automático
Elija esta opción para que el programa tome todas las decisiones de separa-
ción automática de zonas. El programa decide si el texto está o no en colum-
nas, si un elemento es un gráfico o texto que se reconocerá y si se deben
colocar tablas o no. Elija Automático si el documento contiene páginas con
diseños distintos o desconocidos. Elija esta opción para una página con varias
columnas y una tabla, y para páginas que tengan más de una tabla.
Columna única, sin tabla
Elija este parámetro si las páginas contienen sólo una columna de texto, pero
no una tabla. Las cartas comerciales o páginas de un libro normalmente
tienen estas características. Elija esta opción también para una página con
palabras o números dispuestos en columnas si no desea que éstos se coloquen
en una tabla, que se pierdan las columnas o dejarlos como columnas
independientes. Es posible detectar gráficos.
Varias columnas, sin tabla
Escoja esta opción si algunas de las páginas contienen texto en columnas y
desea hacer desaparecer las columnas o bien conservarlas en columnas inde-
pendientes, similares al diseño original. Las columnas se pueden conservar en
el documento de salida, ya sea con marcos (si está activada la vista True Page)
o sin ellos (si está activada la vista Mantener flujo de columnas). Si hay datos
tabulados, es probable que se traten como texto de corrido. Es posible detec-
tar gráficos.
Columna única, con tabla
Elija esta opción si la página contiene sólo una columna de texto y una tabla.
La separación automática de zonas no buscará columnas pero tratará de bus-
car una tabla y colocarla en una cuadrícula en el Editor de texto. Posterior-
mente se puede especificar si desea exportarla en una cuadrícula o como
columnas de texto separadas por tabulaciones. Es posible detectar gráficos.
56 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
Hoja de cálculo
Elija esta opción si desea que toda la hoja quede convertida en una tabla que
se exportará a un programa de hojas de cálculo, o tratarla como una sola
tabla. No se detectará flujo de texto ni zonas de gráficos.
Personalizado
Elija esta opción para tener el máximo control sobre la separación automática
de zonas. Podrá evitar o estimular la detección de columnas, gráficos y tablas.
Fije los parámetros en el panel Diseño personalizado del cuadro de diálogo
Opciones.
Plantilla
Elija un archivo de plantilla de zonas si desea aplicar sus zonas y propiedades
a todas las páginas obtenidas de aquí en adelante. En el procesamiento
manual las zonas de plantillas también se aplican a la página actual, reempla-
zando las zonas existentes. Se permiten otras zonas además de las zonas de
plantillas. Encontrará más detalles en la sección Uso de plantillas de zonas.
Si la separación automática de zonas produjo resultados de reconocimiento
inesperados, utilice el procesamiento manual para volver a efectuar la
separación de zonas en páginas individuales y llevar a cabo nuevamente su
reconocimiento.
SEPARACIÓN MANUAL DE ZONAS
Las zonas definen las áreas de la página que se ha de procesar. Las zonas son
rectangulares o irregulares (con lados formados por líneas verticales y
horizontales). Las zonas no se pueden superponer. Tienen un número de
zona en la esquina superior izquierda y un icono para indicar el tipo de zona
en la parte superior derecha. Haga clic en una zona para seleccionarla. Haga
clic mientras mantiene pulsada la tecla Mayús para hacer una selección
múltiple. La zonas actual y las seleccionadas aparecen sombreadas. Haga clic
fuera de una zona para eliminar la selección. Las zonas aparecen en una
imagen original en los siguientes casos:
u La página ha sido reconocida.
u Se especificó un archivo de plantilla de zonas en el procesamiento
manual mientras la página estaba vigente.
u Ha dibujado zonas manuales en la imagen.
SEPARACIÓN MANUAL DE ZONAS 57
Trabajo con zonas
La barra de herramientas Imagen proporciona herramientas para la edición
de zonas. Siempre hay una seleccionada. Cuando ya no desee utilizar una
herramienta, haga clic en otra. Normalmente la herramienta que se utiliza es
Dibujar zonas rectangulares.
Dibujar zonas rectangulares.
Haga clic en esta opción y arrastre el cursor para definir zonas rectangulares.
La nueva zona adopta sus propiedades a partir de la última zona dibujada o
seleccionada. También podrá mover o cambiar el tamaño de las zonas
existentes cuando esta herramienta esté activa.
Dibujar zonas irregulares
Haga clic en esta opción para utilizar la herramienta que permite dibujar
zonas irregulares. Haga clic y arrastre el ratón para dibujar una sola línea.
Repita el procedimiento hasta que sólo falte por dibujar una línea. Haga
doble clic para cerrar la forma. Las zonas irregulares encajan en rectángulos si
las fija como zonas tipo tabla. También podrá mover o cambiar el tamaño de
las zonas existentes cuando esta herramienta esté activa.
Agregar a zona
Haga clic en esta opción para agregar zonas irregulares a una zona existente o
combinar varias zonas en una sola. No podrá mover ni cambiar el tamaño de
las zonas existentes cuando esta herramienta esté activa. Tampoco podrá usar
esta opción con una zona tipo tabla.
Quitar de zona
Haga clic en esta opción para quitar partes irregulares de una zona existente o
dividir una zona en otras más pequeñas. No podrá mover ni cambiar el
tamaño de las zonas existentes cuando esta herramienta esté activa. Tampoco
podrá usar esta opción con una zona tipo tabla.
Reordenar zonas
Haga clic en esta opción para utilizar la herramienta que sirve para reordenar
zonas. Luego haga clic en las zonas en el orden de lectura deseado. Para que
se respete el orden que determinó, elija Utilizar solamente zonas actuales y
evite tener en la página zonas de varias columnas o tipos de zona de detección
automática.
Propiedades de zona
Haga clic en esta opción para que aparezca el cuadro de diálogo Propiedades
de zona. Esto permite definir el tipo de zona y el contenido que tendrán las
zonas actualmente seleccionadas en la página. También podrá efectuar este
procedimiento en el menú rápido de una zona. Consulte la próxima sección.
58 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
Propiedades de zona
Cada zona es de un tipo determinado. Las zonas que contienen texto
también pueden tener un parámetro que describe su contenido:
alfanumérico o numérico. El tipo y el contenido de la zona constituyen sus
propiedades. Haga clic con el botón derecho del ratón en una zona para usar
el menú rápido que permite cambiar sus propiedades. Seleccione varias zonas
para cambiar sus propiedades de una sola vez. También se puede usar para
este fin el botón de propiedades de zonas, situado en la barra de herramientas
Imagen. Se dispone de los siguientes tipos de zonas:
Zona de flujo de texto de columna única
Utilice esta opción para que el contenido de la zona sea tratado como texto
de corrido, sin columnas.
Zona de flujo de texto de varias columnas
Utilice esta opción para que el contenido de la zona sea tratado como texto de
corrido. El programa tratará de detectar columnas dentro de la zona. Al texto se
le quitarán o mantendrán las columnas, dependiendo de la vista Editor de
texto. Durante el reconocimiento, una zona de múltiples columnas se puede
reemplazar por zonas individuales para cada columna. Para ello, debe estar
activada la función de separación automática de zonas, la cual también puede
producir un cambio en el orden de las zonas.
Zona de tabla
Utilice esta opción para que el contenido de la zona sea tratado como una
tabla. Es posible detectar automáticamente las cuadrículas de la tabla, o bien
colocarlas en forma manual tal como se describe en la siguiente sección. Las
zonas de tablas deben ser rectangulares. El Editor de texto muestra la tabla en
una cuadrícula editable. Podrá elegir si desea exportar tablas en cuadrículas o
en columnas separadas por tabulaciones.
Zona de detección automática
Utilice esta opción para dejar que el programa decida el tipo de zona. Para
ello, debe estar activada la función de separación automática de zonas, la cual
también puede producir un cambio en el orden de las zonas de la página.
Tras el reconocimiento podrá ver el tipo que se aplicó. Si utiliza una zona de
detección automática para cubrir el área de una página con diversos
contenidos, el programa puede reemplazar la zona de detección automática
por varias otras zonas más pequeñas.
CUADRÍCULAS DE TABLAS EN LA IMAGEN 59
Zona gráfica
Utilice esta opción para encerrar una imagen, diagrama, dibujo, firma o
cualquier otro elemento que desee transferir al Editor de texto como una
imagen incrustada, y no como texto reconocido. Una zona de gráficos tiene
un borde verde. Las imágenes incrustadas se pueden exportar con el
documento a aplicaciones de destino que permitan el uso de gráficos.
Ignorar zona
Utilice esta opción para definir el área de una página que no desee procesar
en el Editor de texto. La separación automática de zonas no colocará zonas
aquí. Para excluir un área determinada en muchas páginas (por ejemplo un
encabezado o los números de página), coloque las zonas ignoradas en una
plantilla y seleccione Buscar zonas además de zonas de plantilla/actuales en
el panel Proceso del cuadro de diálogo Opciones.
Contenido de zona
Esta opción está disponible para los tipos de zonas que contienen texto. El
contenido alfanumérico valida todos los caracteres necesarios para el idioma
elegido. Los resultados del reconocimiento de una zona numérica
contendrán sólo cifras y la puntuación que les sea pertinente. No se
colocarán letras.
CUADRÍCULAS DE TABLAS EN LA IMAGEN
Tras el procesamiento automático es posible que vea las zonas de tablas
colocadas en una página. Éstas se indican con un icono de una zona de tabla
en la esquina superior derecha de la zona. Para conferir o quitar la
designación de zona de tabla a una zona dada, utilice su menú rápido.
Tam bi én podrá dibujar una zona tipo tabla. Si ya hubiera una zona de tabla
en la página, selecciónela, y luego dibuje la nueva zona rectangular. Ésta
heredará” el tipo de tabla. De otro modo, dibuje una zona rectangular y
utilice su menú rápido para designarla como tipo tabla.
Nota Haga clic con el botón derecho del ratón fuera de una zona para
obtener un menú rápido diseñado para toda la imagen. Éste permite acercar,
alejar o girar la imagen. Al girar una imagen, se eliminan todas las zonas que
ésta contiene.
60 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
Los separadores de tabla se dibujan o mueven para determinar dónde
aparecerán las líneas de las cuadrículas al colocar la tabla en el Editor de
texto. Podrá utilizar las herramientas Agregar o Quitar para agrandar o
reducir una zona de tabla, pero la zona debe conservar su forma rectangular.
Puede hacerlo para eliminar columnas o filas innecesarias de una tabla.
Las cinco herramientas para la manipulación de tablas de la barra de
herramientas Imagen se activan si la página actual contiene una zona tipo
tabla. Utilícelas de la siguiente manera:
Mover separadores de fila o columna
Haga clic en la herramienta y mueva el cursor al separador que se ha de
mover. Aparecerá una flecha de dos puntas. Arrastre el borde según se desee.
No podrá arrastrarla más allá de la zona vecina. Evite colocar separadores de
modo que se superpongan entre sí o que corten texto. Pulse la tecla Ctrl
mientras arrastra un separador de columna, para moverlo sólo en la fila
actual.
Introducir separadores de columna
Haga clic en esta herramienta y luego en la posición de una zona de tabla
donde desee colocar un separador de columna. Pulse la tecla Ctrl mientras
hace clic para colocar el separador sólo en la fila actual.
Introducir separadores de fila
Haga clic en esta herramienta y luego en la posición de una zona de tabla
donde desee colocar un separador de fila. Evite colocar un separador encima
de otro, o de modo que corte texto.
Eliminar separadores de fila o columna
Haga clic en esta herramienta y luego en un solo separador que desee
eliminar. Hágalo si un separador está colocado incorrectamente, o si desea
cambiar el aspecto de la tabla en el documento final. Por ejemplo, puede
colocar dos columnas de datos en una sola columna, eliminando el separador
entre las dos columnas originales.
Eliminar/reemplazar todos los separadores
Haga clic en esta herramienta y luego dentro de una zona de tabla. Todos sus
separadores desaparecerán. Haga clic nuevamente para detectar (o volver a
detectar) automáticamente los separadores. La colocación de separadores
generalmente se produce durante el reconocimiento; al hacer clic dos veces
con esta herramienta podrá ver y editar los separadores antes del
reconocimiento.
USO DE PLANTILLAS DE ZONAS 61
USO DE PLANTILLAS DE ZONAS
Una plantilla es un conjunto de zonas, con unas propiedades y un orden de
lectura, almacenado en un archivo. Un archivo de plantilla de zonas se puede
cargar para usar las zonas de la plantilla durante el reconocimiento. Cargue
un archivo de plantilla en la lista desplegable Realizar OCR o en el menú
Herramientas.
Cuando cargue una plantilla utilizando la barra de herramientas OCR
manual, sus zonas aparecerán inmediatamente en la página actual,
reemplazando las que ésta contenga. Las páginas existentes no sufrirán
alteración alguna. Las zonas de plantilla se colocarán en todas las páginas
obtenidas posteriormente hasta descargar la plantilla. Podrá modificar las
zonas de plantilla y agregar nuevas zonas antes de efectuar el reconocimiento.
Al cargar una plantilla con la barra de herramientas AutoOCR, no se verán
afectadas la página actual ni las existentes. Las zonas de plantilla se colocarán
en todas las páginas obtenidas posteriormente hasta descargar la plantilla. En
el panel Proceso del cuadro de diálogo Opciones se encuentra la opción
Buscar zonas además de zonas de plantilla/actuales. Si está activada durante
el procesamiento automático, la separación automática de zonas se ejecutará
en las áreas de las páginas fuera de las zonas de plantilla.
Cómo guardar una plantilla de
zona
Prepare zonas en una página. Revise
sus posiciones, propiedades y orden
de lectura. Haga clic en Archivos de
plantilla de zonas... en el menú
Herramientas. En el cuadro de
diálogo, seleccione
[zonas en la
página]
y haga clic en Guardar.
Cómo modificar una plantilla de zona
Cargue la plantilla y obtenga una imagen adecuada mediante procesamiento
manual. Aparecerán las zonas de la plantilla. Modifique las zonas y/o
propiedades según desee. Abra el cuadro de diálogo Archivos de plantilla de
zonas. Se seleccionará la plantilla actual. Haga clic en Guardar y luego en
Cerrar.
62 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS
Cómo descargar una plantilla
Seleccione un parámetro sin plantilla para la descripción del diseño en la lista
desplegable Realizar OCR. Las zonas de plantilla no se eliminan de las
páginas actuales o existentes, pero tampoco se utilizarán para procesamientos
futuros. También puede abrir el cuadro de diálogo Archivos de plantilla de
zonas, seleccionar
[ninguno] y hacer clic en el botón Establecer como actual.
En este caso, el parámetro de la descripción del diseño vuelve a Automático.
Cómo reemplazar una plantilla por otra
Seleccione una plantilla diferente en la lista desplegable Realizar OCR, o
bien abra el cuadro de diálogo Archivos de plantilla de zonas, seleccione la
plantilla deseada y haga clic en el botón Establecer como actual. Cuando esté
activada la barra de herramientas AutoOCR, no se cambiarán zonas existen-
tes y se utilizará la nueva plantilla para los procesamientos futuros. Cuando
esté activada la barra de herramientas OCR manual, las zonas de la nueva
plantilla se aplicarán a la página actual, reemplazando las zonas existentes.
Cómo eliminar un archivo de plantilla
Abra el cuadro de diálogo Archivos de plantilla de zonas. Seleccione una
plantilla y haga clic en el botón Eliminar. Las zonas ya colocadas por esta
plantilla no se eliminarán.
Consejo Las plantillas aceptan los tipos de zonas ignoradas y de detección
automática. Por lo tanto, una plantilla podrá ser de gran utilidad para definir
qué partes de la página se leerán, y cuáles se ignorarán.
Nota Las zonas de detección automática provenientes de una plantilla se
pueden reemplazar por otras más pequeñas durante el reconocimiento; se
asignarán tipos de zona específicos a estas zonas. Las zonas de varias colum-
nas también se dividirán en zonas más pequeñas de una sola columna, una
para cada columna detectada.
Nota Las plantillas y la característica adicional de separación automática de
zonas están disponibles en Programar OCR y Direct OCR, pero no en el
Asistente de OCR.
OMNIPAGE SE MANUAL DEL USUARIO 63
4 Verificación y edición
Los resultados del reconocimiento se colocan en el Editor de texto. El nuevo
editor tipo WYSIWYG (que significa lo que se ve es lo que se obtiene)
ofrece las siguientes características, que se detallan en el presente capítulo:
u Verificación de los resultados de OCR
u Verificación del texto reconocido en comparación con el original
u Diccionarios del usuario
u IntelliTrain
u Pantalla y vistas del editor
u Edición de texto e imágenes
u Contorno de página
u Lectura de texto en voz alta
El Editor de texto ofrece cuatro vistas para apreciar sus páginas. Podrá
alternar libremente de una vista a otra. Éstas proporcionan diversos niveles
de formato. Las vistas son:
Vista Sin formato
Muestra el texto normal sin columnas, con un solo tipo y tamaño de fuente.
Vista Mantener fuentes y párrafos
Muestra el texto sin columnas con estilo de fuente y párrafo
Vista True Page
Trata de conservar lo más posible el formato del documento original. Se
mantienen los estilos de caracteres y párrafo. Todos los elementos de las
páginas, incluyendo las columnas, se colocan en marcos.
Vista Mantener flujo de columnas
Es idéntica a la vista True Page, salvo que el orden de lectura de las zonas se
muestra mediante flechas. La diferencia entre esta vista y True Page se refiere
principalmente a la exportación, tal como se explica en la sección Preparar
resultados del reconocimiento para la exportación en el capítulo 5.
64 VERIFICACIÓN Y EDICIÓN
VERIFICACIÓN DE LOS RESULTADOS DE OCR
Tras el reconocimiento de una página, los resultados aparecerán en el Editor
de texto. La verificación comienza automáticamente si se solicitó en el panel
Verificación del cuadro de diálogo Opciones en el Asistente de OCR. Podrá
comenzar manualmente la verificación en cualquier momento en que no esté
ocupando el programa. Funciona de la siguiente manera:
1. Haga clic en el botón Verificar OCR en la barra de herramientas
Estándar, o bien seleccione Verificar OCR... en el menú Herramientas.
2. La verificación se inicia al comienzo del documento, pero se salta el texto
ya revisado. Si se detecta un posible error, el cuadro de diálogo Verifica-
dor de OCR mostrará el error y una imagen del aspecto original en la
imagen.
3. Si la palabra reconocida es correcta, haga clic en Ignorar o Ignorar todo
para pasar a la siguiente palabra dudosa. Haga clic en Agregar para
añadirla al diccionario actual del usuario y pasar a la siguiente palabra
dudosa.
4. Si la palabra reconocida no es correcta, modifíquela en el cuadro de
edición Cambiar a o escriba la palabra deseada, o bien seleccione una
sugerencia del diccionario. Haga clic en Cambiar o en Cambiar todo
para que el cambio surta efecto y poder pasar a la palabra dudosa
siguiente. Haga clic en Agregar para añadir el término del cuadro de
edición Cambiar al diccionario actual del usuario y poder pasar a la
palabra dudosa siguiente.
Esta es la palabra
que OmniPage
SE pensó que
era.
La imagen de la
palabra dudosa
aparece
resaltada.
Arrastre una
esquina o la parte
inferior del
cuadro de
diálogo para
cambiar su
tamaño.
Esto indica por qué la
palabra es dudosa.
Esta ventana muestra la
parte pertinente de la
imagen original. Haga
clic dentro de ella para
agrandar o reducir la
pantalla.
VERIFICACIÓN DEL TEXTO RECONOCIDO EN COMPARACIÓN CON EL ORIGINAL 65
5. Los marcadores de color se eliminan de las palabras en el Editor de texto
a medida que son verificadas. Podrá pasar al Editor de texto durante la
verificación para hacer las correcciones allí. Utilice el botón Continuar
para reiniciar la verificación. Haga clic en Cerrar para detener la
verificación antes de llegar al final del documento.
V
ERIFICACIÓN
DEL
TEXTO
RECONOCIDO
EN
COMPARACIÓN
CON
EL
ORIGINAL
Tras efectuar el OCR, podrá comparar cualquier parte del texto reconocido
con su correspondiente en la imagen original a fin de verificar que el texto se
haya reconocido correctamente. Funciona de la siguiente manera:
1. Haga doble clic en cualquier palabra del Editor de texto o bien
seleccione una palabra y elija Verificar texto en el menú Herramientas.
Se abrirá la ventana Verificar texto y aparecerá una imagen de la palabra
original y el área que la rodea. Modifique la palabra en el Editor de texto
según sea necesario.
2. Haga clic dentro de la ventana para agrandar o reducir la imagen. La
imagen se agranda con los dos primeros clics y se reduce con los dos
siguientes.
3. Continúe seleccionando palabras que desee verificar, corrigiéndolas
según sea necesario. La pantalla cambia a medida que se van
seleccionando nuevas palabras.
Nota Si la verificación se ejecutó hasta el final de una página, ésta se marca
con los iconos de verificación y en el Administrador de
documentos.
Botón Cerrar
Esta es la palabra que se
seleccionó en el Editor de
texto.
Esta es la imagen
original de la
palabra que se
está verificando.
66 VERIFICACIÓN Y EDICIÓN
4. Haga clic en el botón Cerrar para cerrar la ventana del verificador.
DICCIONARIOS DEL USUARIO
El programa contiene diccionarios incorporados para numerosos idiomas.
Estos diccionarios ayudan al reconocimiento y pueden ofrecer sugerencias
durante la verificación. Pueden ser complementados por otros diccionarios
del usuario. Podrá guardar la cantidad de diccionarios del usuario que desee,
pero podrá cargar sólo uno a la vez. También están disponibles los
diccionarios del usuario de Microsoft Word; el diccionario denominado
Personalizado es el predeterminado para Microsoft Word.
Iniciar un diccionario del usuario
Haga clic en Agregar en el cuadro de diálogo Verificador de OCR sin tener
cargado ningún diccionario del usuario o abra el cuadro de diálogo Archivos
del diccionario del usuario en el menú Herramientas, y luego haga clic en
Nuevo. Se le solicitará que nombre el diccionario de inmediato.
Cargar o descargar un diccionario del usuario
Esto se realiza en el panel OCR del cuadro de diálogo Opciones, o desde el
cuadro de diálogo Archivos del diccionario del usuario. Seleccione un
archivo de diccionario para cargarlo o bien
[ninguno] para descargar un
diccionario del usuario.
Editar un diccionario del usuario
Para añadir palabras debe cargar un diccionario del usuario y luego hacer clic
en Agregar en el Verificador de OCR. Podrá agregar y eliminar palabras en el
cuadro de diálogo Archivos del diccionario del usuario.
Consejo Deberá verificar el texto antes de volver a editar a gran escala. Si
corta y pega grandes bloques de texto, se pueden alterar los vínculos entre el
texto e imagen.
Consejo La facilidad ofrecida por OmniPage Pro de lectura en voz alta del
texto reconocido es otro modo de comprobar el texto. Es posible escuchar
cada vez una letra, una palabra, una línea, una frase, o bien una página
completa del texto. Consulte la sección Lectura de texto en voz alta. Esta
función no está disponible en OmniPage SE.
INTELLITRAIN 67
INTELLITRAIN
IntelliTrain es una forma de capacitación nueva y automática recientemente
diseñada. Analiza las correcciones que usted haga durante la verificación.
Cuando haga un cambio, esta función recordará la forma del carácter en
cuestión y el cambio en la verificación. Buscará otras formas de caracteres
similares en el documento, especialmente en palabras dudosas; y evaluará si
corresponde o no aplicar la corrección del usuario.
OmniPage SE no es compatible con la función IntelliTrain ni con los
archivos de capacitación. Estas características sólo están disponibles en
OmniPage Pro 11. Al abrir un archivo OPD, OmniPage SE pasa por alto
cualquier información de capacitación incluida el archivo.
Puede activar o desactivar IntelliTrain en el panel de OCR en el cuadro de
diálogo Opciones. Es muy útil para documentos en mal estado o cuando se
usa un tipo de letra poco común en todo el documento. IntelliTrain será
menos útil para textos con distorsiones esporádicas. A continuación aparece
un ejemplo, basado en la letra g, que se puede imprimir de diferentes
maneras:
Los primeros dos ejemplos no requieren de IntelliTrain, ya que ambas formas
son normales para la letra g y el programa las puede manejar. En el tercer
ejemplo se podría aprovechar IntelliTrain ya que la forma de la g es poco
común, y es probable que todas las veces que aparezca la g en el texto se
parezcan a ésta. El cuarto ejemplo no es bueno para el uso de IntelliTrain, ya
que la primera g no está bien impresa, y es poco probable que aparezca esa
forma nuevamente en el documento.
Consejo Al editar un diccionario del usuario, podrá importar una lista de
palabras desde un archivo de texto para agregar palabras rápidamente al
diccionario.
68 VERIFICACIÓN Y EDICIÓN
El siguiente ejemplo muestra cómo funciona IntelliTrain, utilizando la
imagen original. En nuestro ejemplo se utilizan las letras c y e. Con algunos
tipos de letra y parámetros de exploración, la línea horizontal en la e puede
quedar muy delgada, induciendo a OCR a cometer errores que IntelliTrain
puede reparar.
IntelliTrain recordará los datos de capacitación que recopile, y usted podrá
guardarlos en un archivo de capacitación para uso futuro en documentos
similares. Si desea que se le consulte si desea guardar los datos de capacita-
ción al cerrar el documento, seleccione dicha opción en el panel Verificación
del cuadro de diálogo Opciones. Los datos de capacitación no guardados se
almacenan en un documento de OmniPage.
Las operaciones para guardar la capacitación en un archivo, así como cargar,
editar y descargar archivos de capacitación se efectúan en el cuadro de
diálogo Archivos de capacitación. Ábralo en el panel Verificación del cuadro
de diálogo Opciones o el menú Herramientas.
OmniPage Pro leerá esta
palabra inglesa como
rcsultados.
Usted la cambió durante la
verificación a resultados.
IntelliTrain recordará esta
forma y la regla:
Esta no es una c.
Es una e.
e
IntelliTrain cambiará:
cspañol a español
lcycs a leyes
sclccción a selección
etc.
INTELLITRAIN 69
Los datos de capacitación no guardados se pueden editar en el cuadro de
diálogo Editar capacitación; aparecerá un asterisco en la barra de título en vez
del nombre del archivo de capacitación. Permanecerá sin guardar cuando
cierre el cuadro de diálogo.
Un archivo de capacitación también se puede editar; su nombre aparecerá en
la barra de título. Si se le han agregado datos de capacitación sin guardar,
aparecerá un asterisco a continuación de su nombre. Tanto los datos de
capacitación no guardados como los modificados se guardarán al cerrar el
cuadro de diálogo.
El cuadro de diálogo muestra marcos que contienen la forma de un carácter y
una solución de OCR asignada a dicha forma. Haga clic en un marco para
seleccionarlo. Luego podrá suprimirlo con la tecla Suprimir, o bien cambiar
la asignación. Utilice las teclas de dirección para pasar al marco siguiente o al
anterior.
Se
l
eccione esta
opción, haga clic en
Guardar y escriba
un nombre para
guardar un nuevo
archivo de
capacitación.
Seleccione esta
opción para
descargar un
archivo de
capacitación.
Haga clic aquí para
editar el archivo de
capacitación
seleccionado
(ver a continuación).
Utilice esta opción
para guardar la nueva
capacitación en un
archivo de
capacitación cargado.
Aparecerá como:
Nombre del archivo
[modificado]
Está editando los
datos de
capacitación no
guardados.
Este marco aparece
en gris. Significa que
se ha eliminado. Para
recuperarlo,
selecciónelo
nuevamente y pulse
la tecla Suprimir. Los
caracteres marcados
como eliminados se
borrarán
efectivamente al
cerrar el cuadro de
diálogo.
Haga doble clic en
un marco o bien
pulse Intro para
cambiar su solución
OCR. Introduzca la
nueva solución en el
cuadro de texto que
aparece y pulse Intro.
Las asignaciones
cambiadas
aparecerán en rojo.
Este marco está seleccionado. En la parte
superior aparece la forma tomada de la
imagen. En la parte inferior aparece la
solución de OCR asignada.
70 VERIFICACIÓN Y EDICIÓN
PANTALLA Y VISTAS DEL EDITOR
El editor muestra los textos reconocidos y puede marcar las palabras que se
consideraron dudosas durante el reconocimiento. El marcado se hace con un
subrayado ondulado; subrayado rojo para las palabras que no se encontraron
en un diccionario (esto es válido sólo para los idiomas que tienen dicciona-
rios) y subrayado azul para las palabras que contengan caracteres dudosos o
rechazados. Estos marcadores pueden aparecer o estar ocultos según lo que se
haya seleccionado en el panel Editor de texto, dentro del cuadro de diálogo
Opciones. También podrá mostrar u ocultar caracteres no imprimibles e
indicadores de encabezado y pie de página. El panel Editor de texto también
permite definir una unidad de medición para el programa y un parámetro de
acomodación de texto en todas las vistas del Editor de texto salvo en la vista
Sin formato.
A continuación se mencionan las principales diferencias entre las vistas:
Vista Sin formato
Muestra el texto normal sin columnas y alineado en la izquierda con un solo
tipo y tamaño de fuente, con los mismos saltos de línea que el documento
original. La mayoría de los botones de formato y cuadros de diálogo están
desactivados. Tampoco se ven las reglas. Esta vista puede resultar práctica para
verificar y editar el texto.
Vista Mantener fuentes y párrafos
Muestra pantallas con texto sin columnas y con estilo de fuente y párrafo.
Aparece la regla horizontal. Esta vista puede resultar práctica para verificar,
editar y modificar el texto junto con su estilo.
Vista True Page
Trata de conservar lo más posible el formato del documento original. Se
mantienen los estilos de caracteres y párrafo. Todos los elementos de las
páginas, incluyendo las columnas, se colocan en marcos. Puede que sea más
difícil verificar y editar texto en esta vista, por lo que tal vez tenga que
desplazarse por el interior de un marco para ver todo su contenido. Una fila
de flechas indica que el contenido se prolonga más allá de los bordes del
marco.
EDICIÓN DE TEXTO E IMÁGENES 71
Vista Mantener flujo de columnas
Es idéntica a la vista True Page, salvo que el orden de lectura de las zonas se
muestra mediante flechas. Esta vista se diferencia de True Page durante la
exportación, consulte la sección Preparar resultados del reconocimiento para la
exportación en el capítulo 5.
Seleccione una vista con los cuatro botones de la parte inferior izquierda del
Editor de texto o del menú Ver. Los gráficos y tablas pueden aparecer en las
cuatro vistas.
EDICIÓN DE TEXTO E IMÁGENES
Este es un Editor de texto tipo WYSIWYG (lo que se ve es lo que se
obtiene), que proporciona muchas funciones de edición. Éstas funcionan de
manera muy similar a las de los principales procesadores de texto.
Editar atributos de caracteres
En todas las vistas salvo en Sin formato, es posible cambiar el tipo, tamaño y
atributos de fuente (negrita, cursiva, subrayado) del texto seleccionado.
Utilice la barra de herramientas de formato o bien el cuadro de diálogo
Fuente en el menú Formato. Este último también ofrece caracteres de
subíndice, superíndice, así como texto o fondo en color.
En la vista Sin formato se puede usar la barra de herramientas de formato
para especificar un tipo y tamaño de fuente y aplicarla a todo el documento.
Estos atributos no se transfieren a otras vistas, sino que se restauran sus
parámetros anteriores.
Abra el cuadro de diálogo Coincidencia de fuentes en el panel OCR del
cuadro de diálogo Opciones para especificar qué fuentes se usarán en los
textos que se introduzcan en el Editor de texto.
Editar atributos de párrafo
En todas las vistas salvo en la Sin formato, podrá cambiar el alineamiento de
los párrafos seleccionados y aplicar viñetas a los párrafos. Utilice la barra de
herramientas de formato o bien el cuadro de diálogo Párrafo en el menú For-
mato. Este último permite modificar sangrías, espaciado entre líneas y entre
párrafos. La regla horizontal del Editor de texto permite definir fácilmente
las posiciones de sangrías y tabuladores. Los ajustes avanzados de tabulación
se efectúan en el cuadro de diálogo Tabuladores en el menú Formato.
72 VERIFICACIÓN Y EDICIÓN
Estilos de párrafo
Los estilos de párrafo se detectan automáticamente durante el
reconocimiento. En un cuadro de selección situado a la izquierda de la barra
de herramientas de formato se acumula y presenta una lista de estilos.
Utilícela para asignar un estilo a los párrafos seleccionados. Utilice el cuadro
de diálogo Estilo del menú Formato para cambiar de nombre o modificar un
estilo y definir otro nuevo. Al guardar un documento en un archivo, podrá
elegir si exportar o no los estilos de párrafo con el documento. Esto es válido
sólo si la aplicación de destino es compatible con los estilos de párrafo.
Gráficos
Podrá editar el contenido de una zona de gráfico seleccionado si cuenta con
un editor de imágenes en su equipo. Haga clic en Editar imagen en el menú
Herramientas. Esto activará el editor de imágenes asociado con los archivos
BMP en su sistema Windows, y cargará el gráfico. Edite el gráfico y luego
cierre el editor para volver a incrustar la imagen en el Editor de texto de
OmniPage SE. No cambie el tamaño del gráfico ni su resolución o tipo, ya
que esto impedirá la reincrustación.
Tablas
Las tablas aparecen en el Editor de texto en forma de cuadrículas. Mueva el
cursor al área de una tabla. Cambiará su aspecto, permitiéndole mover las
líneas de las cuadrículas. También podrá usar las reglas del Editor de texto
para modificar una tabla. Modifique la colocación de texto en las celdas con
los botones de alineación de la barra de herramientas de formato y los
controles de tabulación de la regla. Al guardar el documento en un archivo,
podrá elegir si va a exportar las tablas en cuadrículas o como columnas
separadas por tabuladores.
LECTURA DE TEXTO EN VOZ ALTA
La función de texto a lenguaje se activa o desactiva en el elemento Modo de
lenguaje hablado del menú Herramientas o con la tecla F5. Un segundo ele-
mento de menú Parámetros de lenguaje hablado... permite seleccionar una
voz (por ejemplo, hombre o mujer para un determinado idioma), una veloci-
dad de lectura y el volumen. La facilidad de lectura en voz alta no está
incluida en OmniPage SE. Está disponible en OmniPage Pro 11.
Esta función de lenguaje está diseñada para discapacitados visuales, pero
también puede ser muy útil para cualquier persona durante la revisión y
verificación de texto. El habla se controla mediante movimientos del punto
de inserción en el Editor de texto, ya sea mediante el ratón o el teclado.
LECTURA DE TEXTO EN VOZ ALTA 73
* Si el cursor está en el medio de una palabra, se escuchará primero un fragmento de la
palabra, pero de ahí en adelante se escucharán las palabras completas.
Las tres teclas básicas para el lenguaje hablado están juntas en el teclado
numérico.
Para escuchar texto: Utilice estas teclas:
Un carácter a la vez, hacia adelante o hacia atrás
Flecha derecha o izquierda. Se nombran las
letras, números o signos de puntuación.
Palabra actual Ctrl + teclado numérico 1
Una palabra a la derecha Ctrl + flecha derecha *
Una palabra a la izquierda Ctrl + flecha izquierda *
Una sola línea Coloque el punto de inserción en la línea
Línea siguiente Flecha abajo
Línea anterior Flecha arriba
Oración actual Ctrl + teclado numérico 2
Desde el punto de inserción al final de la oración Ctrl + teclado numérico 6
Desde el inicio de la oración al punto de inserción Ctrl + teclado numérico 4
Página actual Ctrl + teclado numérico 3
Desde el inicio de la página al punto de inserción Ctrl + Inicio
Desde el punto de inserción al final de la página
actual
Ctrl + Fin
Página anterior, siguiente o cualquier otra Ctrl + RePág, AvPág o botones de navegación
Caracteres mecanografiados
Cada carácter mecanografiado se pronuncia, uno
por uno, incluyendo la puntuación.
+
1 2 3
Leer
palabra
actual
Leer
oración
actual
Leer
página
actual
74 VERIFICACIÓN Y EDICIÓN
Tam bi én contará con los siguientes controles de teclado:
Esta previsto proporcionar programas de lenguaje hablado para los siguientes
idiomas: inglés, francés, alemán, italiano, portugués y español. En el archivo
Léame encontrará la información más reciente. Sólo se instalará un sistema
de lenguaje hablado en OmniPage Pro, dependiendo del idioma elegido al
comienzo de la instalación. Si especifica un idioma que no disponga de un
sistema de lenguaje hablado, se instalará el inglés.
Si tiene otros sistemas de lenguaje compatibles con SAPI en su equipo, serán
detectados y quedarán disponibles para su uso. Sus voces quedarán
disponibles en el cuadro de diálogo Parámetros de lenguaje hablado. Una vez
que ha asociado una voz con un idioma, OmniPage Pro lo recordará y
cambiará las voces según el idioma de reconocimiento del documento.
CONTORNO DE PÁGINA
La ventana Contorno de página permite cambiar el orden de las áreas en una
página o de los párrafos dentro de las áreas. También permite definir cómo
fluirá el texto si se realiza la exportación con la vista Mantener flujo de
columnas. Abra la ventana de contorno de página en el menú Ver. Las áreas
corresponden a las zonas utilizadas durante el reconocimiento y también a
los marcos empleados en el Editor de texto. Haga clic en un elemento y
arrástrelo a la ubicación deseada. Los párrafos reordenados aparecen
inmediatamente en el Editor de texto y se exportan. Las áreas reordenadas
aparecen y se exportan en las vistas Sin formato y Mantener fuentes y
párrafos. En la vista True Page no surten efecto práctico. En la vista
Mantener flujo de columnas, las flechas muestran el orden del flujo de texto.
Muevas las áreas para cambiar su orden. Las posiciones de las áreas no
cambian, pero las flechas muestran el cambio en el texto de corrido.
Para hacer esto: Utilice lo siguiente:
Pausa/Reanudar Ctrl + teclado numérico 5
Aumentar la velocidad Ctrl + teclado numérico
Disminuir velocidad Ctrl + teclado numérico
Restablecer velocidad Ctrl + asterisco, teclado numérico (*)
OMNIPAGE SE MANUAL DEL USUARIO 75
5 Guardar y exportar
Una vez que haya obtenido por lo menos una imagen para un documento,
podrá exportarla a un archivo. Una vez que haya reconocido al menos una
página, podrá exportar los resultados del reconocimiento a una aplicación de
destino, para lo cual deberá:
1. Guardar en un archivo
2. Copia de un documento al Portapapeles
3. Enviar un documento adjunto a un mensaje de correo
electrónico.
El documento permanece en OmniPage SE tras la exportación. Esto permite
guardar, copiar o enviarlo varias veces, por ejemplo con diferentes niveles de
formato, utilizando diferentes tipos de archivos, nombres o ubicaciones.
Tam bi én podrá agregar o volver a reconocer las páginas, o bien modificar el
texto ya reconocido.
Con el procesamiento automático y utilizando el Asistente de OCR, usted
especifica el primer destino donde se guardará el archivo antes de comenzar
dicho proceso. Cuando se reconoce (o se verifica, si ello fue solicitado) la
última página disponible, comienza la exportación.
Podrá especificar la exportación en cualquier momento en que no esté
ocupando el programa. Si solicita exportar un documento con páginas no
reconocidas, se le consultará si primero desea reconocerlas. Si su respuesta es
No, sólo se exportarán los resultados de las páginas reconocidas. Si se han
modificado zonas en las páginas reconocidas, se le solicitará que reconozca
dichas páginas antes de exportar.
76 GUARDAR Y EXPORTAR
PREPARAR RESULTADOS DEL RECONOCIMIENTO PARA LA
EXPORTACIÓN
El texto se exporta a un archivo, al Portapapeles, o al correo electrónico con
el nivel de formato definido por la vista fijada en el Editor de texto en el
momento de la exportación, si ello es posible. Sin embargo, algunos tipos de
archivos de exportación y aplicaciones de destino no son compatibles con
todos los elementos de formato. Puede que se le advierta si hay una
incompatibilidad y se le ofrezca la mejor vista disponible. Puede aceptarla, o
bien cancelar la exportación, fijar otra vista y reiniciar la exportación.
La tabla de la sección Tipos de archivos para guardar los resultados del
reconocimiento en el capítulo 6 le indica qué tipos de archivos son
compatibles con qué niveles de formato.
A continuación se indica cómo se pueden usar las vistas para la exportación:
Vista Sin formato
Esta vista es necesaria para exportar a ASCII, Unicode u otros formatos con
extensión .TXT. Estos tipos de archivo no pueden aceptar gráficos o tablas.
Evidentemente, podrá exportar texto normal a cualquier tipo de archivo y
aplicación de destino.
Vista Mantener fuentes y párrafos
Esta vista es muy práctica para todos los formatos salvo los que tienen exten-
siones TXT o PDF. Todos estos formatos pueden contener gráficos y tablas.
Vista True Page
Esta vista es apta sólo para los tipos de archivos y aplicaciones de destino en
las que se pueden manipular marcos o cuadros de texto. Al exportar a PDF,
True Page se utiliza como origen, sin importar la vista del editor (El formato
PDF no se aplica a OmniPage SE).
El orden de lectura de las zonas, o las
áreas reordenadas en la ventana Contorno de página, no influyen cuando se
utiliza True Page para la exportación.
Vista Mantener flujo de columnas
Fije esta opción en el momento de la exportación para mantener el diseño
original de las páginas, incluyendo las columnas. Esto se efectúa cada vez que
es posible con parámetros de columnas, no con marcos. El texto fluirá de una
columna a otra, lo que no ocurre cuando se utilizan marcos. Las flechas
muestran el orden del flujo de texto. Podrá cambiar este orden con la
ventana Contorno de página, tal como se describe al final del capítulo 4.
GUARDAR EN UN ARCHIVO 77
GUARDAR EN UN ARCHIVO
Podrá guardar páginas reconocidas e imágenes originales en el disco en una
gran variedad de tipos de archivos. En el capítulo 6 encontrará una completa
lista de los tipos de archivos compatibles para guardar imágenes y resultados
de reconocimiento.
Guardar imágenes originales
1. Seleccione Guardar imagen... en el menú Archivo. En el cuadro de
diálogo que aparece, seleccione la ubicación de la carpeta y un tipo de
archivo para las imágenes. Escriba un nombre de archivo.
2. Seleccione guardar sólo la imagen actual o bien todas las imágenes del
documento. En el segundo caso puede guardar todas las imágenes en un
solo archivo de imagen de varias páginas, siempre y cuando elija TIFF o
DCX como tipo de archivo. De lo contrario cada imagen se colocará en
un archivo independiente. OmniPage SE agregará sufijos numéricos al
nombre de archivo que se proporcione, para generar nombres de archivo
exclusivos.
3. Haga clic en Aceptar para guardar las imágenes según se especifique. Las
zonas y el texto reconocidos no se guardan con el archivo. Si es posible,
el archivo se guarda tal como se ve: es decir, en blanco y negro, escala de
grises o en color. Las imágenes en blanco y negro se guardan con su
resolución original. Las imágenes en escala de grises y en color se
reducen aproximadamente a 150 ppp.
Consejo Para ver el tamaño y la resolución original de una imagen,
coloque el cursor sobre la imagen en el área de Imagen original o bien sobre
su miniatura en el Administrador de documentos.
Nota OmniPage Pro permite guardar un documento con las cuatro
variantes de formato PDF, incluido el formato sólo imagen. Este último
guarda como imagen los resultados del reconocimiento, no la imagen
original. No está disponible la opción guardar a PDF en OmniPage SE.
78 GUARDAR Y EXPORTAR
Guardar los resultados del reconocimiento
1. Seleccione Guardar como... en el menú Archivo, o bien haga clic en el
botón Exportar resultados en la barra de herramientas OCR manual con
la opción Guardar como archivo seleccionada en la lista desplegable.
2. Aparecerá el cuadro de diálogo Guardar como, tal como se indica en su
forma expandida.
3. Seleccione una ubicación de carpeta y un tipo de archivo para el
documento. El tipo de archivo OPD especial es el último en la lista de
tipos de archivo.
4. Escriba un nombre de archivo. Haga clic en el botón Avanzadas a fin de
ver todas las opciones para guardar. Seleccione la opción deseada.
5. Haga clic en Aceptar. El documento se guardará en el disco según se
especifique. Si se selecciona Guardar e iniciar, el archivo exportado
aparecerá en la aplicación de destino, que es la asociada con el tipo de
archivo seleccionado en su sistema Windows.
Seleccione esta
opción para abrir
automáticamente el
archivo guardado en
su aplicación de
destino.
Seleccione esta
opción para que los
estilos de párrafo del
Editor de texto se
exporten junto con el
texto reconocido.
Haga clic en Avanzadas
para abrir el panel
inferior y en Básicas
para cerrarlo.
Elija entre:
Crear un solo archivo para todas las páginas
Crear un archivo por página
Crear un archivo nuevo después de cada
página en blanco.
GUARDAR UN DOCUMENTO MIENTRAS TRABAJA 79
GUARDAR UN DOCUMENTO MIENTRAS TRABAJA
Haga clic en el botón Guardar en la barra de herramientas Estándar o bien
seleccione Guardar en el menú Archivo para guardar los cambios en el
documento actual mientras trabaja. Si lo hace con un documento sin título,
aparecerá el cuadro de diálogo Guardar como.
Con un documento con nombre, el comando Guardar lo almacena con el
nombre y formato de la última vez que se guardó, tal como se aprecia en la
barra de título. Si el documento se guardó la última vez como documento de
OmniPage, el comando para guardar lo actualizará: se guardarán las
imágenes nuevas o cambiadas, las separación de zonas modificada, los
resultados del reconocimiento y los datos de capacitación. Si el documento se
guardó por última vez como tipo de archivo de texto, sólo se guardarán los
cambios de los resultados del reconocimiento.
Si desea trabajar nuevamente con su documento en OmniPage SE en una
sesión futura, guárdelo como documento de OmniPage. Este es un tipo
especial de archivo de salida. Guarda las imágenes originales del archivo
junto con los resultados del reconocimiento, los parámetros y los datos de
capacitación. Consulte la sección Documentos OmniPage en el capítulo 2. El
cuadro de diálogo Guardar como enumera los tipos de archivo disponibles
en la lista desplegable Guardar como archivo de tipo. El documento de
OmniPage es el último formato de esa lista.
Nota Los gráficos y formato se guardan en el documento sólo si el tipo de
archivo seleccionado es compatible. El nivel de formato para la exportación
corresponde a la vista del Editor que se fijó al momento de guardar. Se le
advertirá si el nivel de formato no es compatible con el tipo de archivo de
exportación.
Nota Si se crea más de un archivo de exportación, OmniPage SE agregará
un sufijo numérico al nombre de archivo a fin de crear nombres de archivo
exclusivos. Si selecciona Crear un archivo nuevo después de cada página en
blanco con la entrada desde archivos de imagen, consulte la sección Entrada
desde archivos de imagen en el capítulo 3 para averiguar cómo colocar
imágenes en blanco.
80 GUARDAR Y EXPORTAR
Si guarda el documento por primera vez como documento de OmniPage
(por ejemplo llamándolo
memo.opd), lo puede modificar guardándolo
posteriormente como archivo de texto (por ejemplo
memo.txt), y volver a
hacerle cambios, para luego hacer clic en Guardar, y los cambios recientes se
guardarán en el archivo
memo.txt, no en el archivo OPD. Al cerrar el
documento o salir del programa, se le solicitará que guarde el documento si
no lo ha guardado como un documento de OmniPage, o si hay cambios
desde la última vez que lo almacenó como OPD.
Sus documentos OmniPage pueden cambiarse de OmniPage SE a
OmniPage Pro 11 e inversamente. En OmniPage SE, todos los datos de
capacitación de los archivos OPD se pasan por alto, y no puede realizarse la
capacitación.
COPIA DE UN DOCUMENTO AL PORTAPAPELES
Podrá copiar al Portapapeles los resultados del reconocimiento de cualquier
página reconocida de un documento. El proceso de copia se indica mediante
un monitor que refleja su progreso. Podrá pegar el contenido del
Portapapeles en otra aplicación.
El formato del texto, como negrita y cursiva, se mantiene al pegar el
contenido en otra aplicación compatible con la información RTF. De lo
contrario, sólo se pegará el texto normal. Los gráficos se mantienen si la
aplicación es compatible con la inserción de imágenes.
t Para copiar un documento al Portapapeles
Con el procesamiento automático, seleccione el comando Copiar al
Portapapeles de la lista desplegable Exportar resultados en la barra de
herramientas AutoOCR o en el Asistente de OCR. El texto se envía al
Portapapeles apenas se reconozca o verifique la última página disponible.
Con el procesamiento manual, seleccione el comando Copiar al
Portapapeles en la lista desplegable Exportar resultados y luego haga clic
en su botón en la barra de herramientas OCR manual. El proceso de
copia comienza de inmediato.
ENVIAR UN DOCUMENTO ADJUNTO A UN MENSAJE DE CORREO ELECTRÓNICO 81
ENVIAR UN DOCUMENTO ADJUNTO A UN MENSAJE DE
CORREO ELECTRÓNICO
Podrá enviar los resultados del reconocimiento como uno o más archivos
adjuntos a un mensaje de correo electrónico si tiene instalada una aplicación
de correo compatible con MAPI, como por ejemplo, Microsoft Outlook.
t Para enviar un documento por correo electrónico
Con el procesamiento automático, seleccione el comando Enviar como
correo en la lista desplegable Exportar resultados en la barra de
herramientas AutoOCR. Aparecerá el cuadro de diálogo Enviar correo
apenas se reconozca o verifique la última página disponible del
documento.
Con el procesamiento manual, seleccione el comando Enviar como
correo en la lista desplegable Exportar resultados y luego haga clic en su
botón en la barra de herramientas OCR manual. Aparecerá de
inmediato el cuadro de diálogo Enviar correo.
En cualquier momento en que no esté ocupado el programa, seleccione
Enviar como correo en el menú Archivo para invocar el cuadro de diálogo
Enviar correo.
1. El cuadro de diálogo Enviar correo permite especificar un tipo de
archivo y las opciones para adjuntar documentos: un adjunto para todas
las páginas, un adjunto por cada página, un nuevo adjunto cada vez que
haya una página en blanco. Fije todas las opciones y haga clic en
Aceptar.
2. Regístrese en su aplicación de correo electrónico si se le solicita hacerlo.
82 GUARDAR Y EXPORTAR
3. La aplicación de correo aparecerá con el documento o documentos
adjuntos en un nuevo mensaje vacío. Los adjuntos toman el mismo
nombre utilizado la última vez que se guardó el documento en
OmniPage SE, o bien aparecen como Sin título desde OmniPage. Se
agrega la correspondiente extensión de archivo y los sufijos numéricos en
caso de haber más de un documento adjunto.
4. Escriba la dirección de destino de su mensaje de correo, agregue texto al
mensaje si lo desea y luego haga clic en el botón Enviar.
OMNIPAGE SE MANUAL DEL USUARIO 83
6 Información técnica
En este capítulo se proporciona información sobre resolución de problemas y
demás información técnica acerca del uso de OmniPage SE.
Consulte también el archivo en línea Léame y los demás temas de la ayuda, o
bien visite las páginas web de ScanSoft. La página web con información
sobre escáneres contiene información detallada y actualizada regularmente
acerca de la configuración y asistencia técnica de escáneres. El archivo Léame
contiene la información más reciente acerca de OmniPage SE. Podrá acceder
al archivo Léame y a las páginas web de ScanSoft mediante el menú Ayuda.
Este capítulo contiene la siguiente información:
u Resolución de problemas
Soluciones iniciales
Probar OmniPage SE
Problemas de memoria insuficiente
Problemas de espacio de disco insuficiente
u Tipos de archivos compatibles
Tipos de archivos para abrir y guardar imágenes
Tipos de archivos para guardar los resultados del
reconocimiento
Guardar en PDF
u Problemas de OCR
El texto no se reconoce correctamente
Problemas con el reconocimiento de fax
Problemas de sistema o rendimiento durante el OCR
u Desinstalación del software
84 INFORMACIÓN TÉCNICA
RESOLUCIÓN DE PROBLEMAS
Si bien OmniPage SE está diseñado para un fácil uso, en ocasiones ocurren
problemas. Muchos de los mensajes de error contienen descripciones
autoexplicativas de lo que se debe hacer: revisar las conexiones, cerrar otras
aplicaciones para liberar memoria, etc. En ocasiones bastará con esas
indicaciones.
En la documentación de Windows encontrará información para optimizar su
sistema y el rendimiento de las aplicaciones.
Soluciones iniciales
Intente estas soluciones si experimenta problemas al iniciar o usar
OmniPage SE:
u Cerciórese de que el sistema cumpla todos los requisitos
mencionados en la lista Requisitos del sistema del capítulo 1.
u Cerciórese de que el escáner esté enchufado y que todas las
conexiones de cables estén fijas.
u En la sección de asistencia técnica del sitio web www.scansoft.com
de ScanSoft encontrará notas técnicas sobre temas comúnmente
mencionados al usar OmniPage SE. Nuestras páginas web también
pueden ofrecer asistencia acerca del proceso de instalación y
resolución de problemas.
u Apague su equipo y el escáner, encienda nuevamente este último y
luego reinicie su equipo. Cerciórese de que las demás aplicaciones
estén funcionando correctamente.
u Utilice el software que viene con el escáner para verificar que éste
funciona correctamente antes de usarlo con OmniPage SE.
u Cerciórese de contar con los controladores correctos para el escáner,
la impresora y la tarjeta de vídeo. Encontrará más información sobre
escáneres en la página web de ScanSoft, a la cual se puede acceder
mediante el menú Ayuda.
u Ejecute ScanDisk para Windows 95, 98 o Me, o bien Check Disk
para Windows NT y Windows 2000 a fin de revisar si la unidad de
disco duro presenta errores. Encontrará más información en la
ayuda en línea de Windows.
RESOLUCIÓN DE PROBLEMAS 85
u Haga una defragmentación en el disco duro. Encontrará más
información en la ayuda en línea de Windows.
u Desinstale y reinstale OmniPage SE, tal como se describe en la
última sección, Desinstalación del software.
Probar OmniPage SE
Al reiniciar Windows 95, 98, 2000 o Me en el modo a prueba de errores o
Windows NT en el modo VGA se podrá probar OmniPage SE en un sistema
simplificado. Esto se recomienda si no puede resolver problemas de bloqueo
del sistema o si OmniPage SE ha dejado de funcionar por completo.
Encontrará más información en la ayuda en línea de Windows.
t Para probar OmniPage SE en el modo a prueba de errores (Windows
95, 98, 2000 o Me):
1.
Reinicie su equipo en el modo a prueba de errores pulsando F8
inmediatamente después de que aparezca el mensaje que indica que se
está reiniciando Windows.
2. Inicie OmniPage SE y trate de efectuar el OCR con una imagen. Utilice
un archivo de imagen conocido, por ejemplo uno de los archivos de
imagen de ejemplo suministrados.
Si OmniPage SE no se inicia ni funciona correctamente en el
modo a prueba de errores, puede que haya un problema en la
instalación. Desinstale y reinstale OmniPage SE (consulte la
parte final de este capítulo), y luego ejecútelo en el modo a
prueba de errores de Windows.
Si OmniPage SE se ejecuta correctamente en el modo a prueba
de errores, entonces puede que un controlador de dispositivos
del sistema esté interfiriendo con el funcionamiento de
OmniPage SE. Solucione el problema reiniciando Windows en
el modo de confirmación paso a paso. Encontrará más
información en la ayuda en línea de Windows.
Nota El escáner no funcionará con OmniPage SE en el modo a prueba de
errores o en el modo VGA, de modo que no intente diagnosticar problemas
con el escáner en esta configuración.
86 INFORMACIÓN TÉCNICA
t Para probar OmniPage SE en el modo VGA (Windows NT):
1.
Reinicie su ordenador.
2. Seleccione la estación de trabajo Windows NT versión 4.00 [modo
VGA] y pulse Intro.
3. Pulse Ctrl+Alt+Supr y seleccione el Administrador de tareas.
4. En el cuadro de diálogo Administrador de tareas, seleccione todas las
aplicaciones en segundo plano y haga clic en la opción para terminar el
proceso. Encontrará más información en la ayuda en línea de Windows.
5. Inicie OmniPage SE y trate de efectuar el OCR con una imagen. Utilice
un archivo de imagen conocido, por ejemplo uno de los archivos de
ejemplo suministrados.
Problemas de memoria insuficiente
OmniPage SE puede ejecutarse deficientemente en condiciones de memoria
insuficiente. Esto se puede indicar mediante diversos mensajes de error o si
OmniPage SE funciona lentamente y accede al disco duro con mucha
frecuencia. Intente las siguientes soluciones para los casos de memoria
insuficiente:
u Reinicie su equipo.
u Cierre las demás aplicaciones para liberar memoria.
u Cierre aplicaciones innecesarias de OmniPage SE.
u Defragmente el disco duro para liberar bloques contiguos de espacio
en el disco. Encontrará más instrucciones en la ayuda en línea de
Windows.
u Aumente la cantidad de espacio libre en el disco.
Nota Tam bi én puede ejecutar OmniPage SE desde una línea de comando
en su propio modo a prueba de errores. Seleccione Inicio
É Ejecutar,
explore en busca del archivo
OmniPage.exe y agregue la opción /safe a la
línea de comandos. Esto iniciará el programa, pero ignorará los parámetros
almacenados anteriormente y no intentará recuperar un documento
proveniente de la finalización anormal del programa.
RESOLUCIÓN DE PROBLEMAS 87
u Aumente la memoria física (RAM) de su equipo.
u De esa manera podrá optimizar el rendimiento de OCR. En la
sección Requisitos del sistema en el capítulo 1 encontrará más
información al respecto.
Problemas de espacio de disco insuficiente
Si al sistema le queda poco espacio libre en el disco duro, se pueden producir
problemas. Intente las siguientes soluciones en caso de que surjan problemas
por espacio de disco insuficiente:
u Vacíe la Papelera de reciclaje de Windows.
u Cierre todas las aplicaciones y elimine los archivos *.tmp en la
carpeta Temp. Ésta generalmente se encuentra dentro de la carpeta
Windows.
u Ejecute ScanDisk para Windows 95, 98 o Me, o bien Check Disk
para Windows NT o Windows 2000 a fin de revisar si hay errores
que estén utilizando espacio en el disco. Encontrará más
instrucciones en la ayuda en línea de Windows.
u Realice una copia de seguridad de los archivos que no necesite en
disquetes o en otros medios y elimínelos del disco duro.
u Elimine aplicaciones de Windows que no use.
u Haga una defragmentación en el disco duro. Encontrará más
instrucciones en la ayuda en línea de Windows.
u Borre la caché para el explorador web y limite su tamaño.
88 INFORMACIÓN TÉCNICA
TIPOS DE ARCHIVOS COMPATIBLES
El programa admite una amplia gama de formatos de archivo. Numerosos
formatos importantes han sido incluidos en OmniPage SE.
Tipos de archivos para abrir y guardar imágenes
Los archivos de imagen de entrada pueden tener resoluciones de hasta 600
ppp, pero se recomiendan 300 ppp (tanto horizontal como verticalmente)
para una exactitud óptima de OCR. El programa almacena imágenes en
blanco y negro con su resolución original, pero las imágenes en escala de
grises y en color generalmente no se guardan con más de 150 ppp. Coloque
el cursor sobre una imagen para que aparezca una ventana emergente
mostrando el tamaño y la resolución de la imagen original.
Tipo de archivo Extensión
Varias
páginas
Abrir / Guardar
Blanco y negro,
escala de gri-
ses, color
BMP, mapa de bits *.bmp No Abrir y guardar Todos
DCX *.dcx Sí Abrir y guardar Todos
GIF *.gif N/A N/A N/A
JPEG *.jpg No Abrir y guardar
Escala de grises,
color
PCX *.pcx No Abrir y guardar Todos
PDF *.pdf N/A N/A (ver nota) N/A
PNG *.png No Abrir y guardar Todos
TIFF comprimido G3 *.tif Sí Abrir Blanco y negro
TIFF comprimido G4 *.tif Sí Abrir y guardar Blanco y negro
TIFF comprimido LZW *.tif N/A N/A N/A
TIFF FX *.xif N/A N/A N/A
TIFF PackBits (bits empa-
quetados)
*.tif Sí Abrir y guardar Todos
TIFF sin comprimir *.tif Sí Abrir y guardar Todos
Nota Si intenta guardar una imagen en blanco y negro con formato JPEG,
el programa le sugerirá la conversión a escala de grises. Con TIFF G3 y G4 le
sugerirá la conversión a blanco y negro.
TIPOS DE ARCHIVOS COMPATIBLES 89
Tipos de archivos para guardar los resultados del reconocimiento
Nota
OmniPage Pro 11 permite guardar un documento con las cuatro
variantes de formato PDF, uno de los cuales permite exportar con formato
de sólo imagen. Este último exporta como imagen los resultados del
reconocimiento, no las imágenes originales, en el Guardar como cuadro de
diálogo. No está disponible la opción guardar a PDF en OmniPage SE.
OmniPage SE tampoco puede utilizar los formatos de archivo GIF, LZW
TIFF and TIFF FX.
Tipo de archivo
Exten-
sión
Niveles de formato
(vistas del Editor de texto)
Compatibi-
lidad con
gráficos
Adobe PDF con imagen en texto *.pdf N/A N/A
Adobe PDF con sustitutos de imagen *.pdf N/A N/A
Adobe PDF, normal *.pdf N/A N/A
Adobe PDF, sólo imagen *.pdf N/A N/A
Documento de OmniPage
6
*.opd Todos Sí
Excel (3.0 a 7.0, 97, 2000) *.xls NFV, RFP (hoja de cálculo) Sí
Formato de texto enriquecido (RTF)
6.0/95
3
*.rtf Todos Sí
FrameMaker 5.5.3 *.mif Todos Sí
Freelance Graphics *.txt Vista Sin formato (NFV) No
Harvard Graphics *.txt Vista Sin formato (NFV) No
HTML (3.2 ó 4.0)
2
*.htm Todos
Sí
2
Microsoft Publisher 98 *.rtf Todos Sí
PageMaker (6.5.2) *.doc Todos Sí
PowerPoint 97 *.rtf Todos Sí
Quattro Pro para Windows 4.0, 8 *.xls NFV, RFP (hoja de cálculo) No
Texto ASCII
1
*.txt/.csv Vista Sin formato (NFV) No
Texto Unicode
1 4
*.txt/.csv Vista Sin formato (NFV) No
Ventura Publisher *.doc Todos Sí
Word para Windows (6.0, 97, 2000) *.doc Todos Sí
WordPad *.rtf
NFV, RFP
5
Sí
WordPerfect (5.1, 5.2, 6.0, 6.1, 8, 9, 10) *.wpd Todos Sí
90 INFORMACIÓN TÉCNICA
1 El texto ASCII y Unicode puede incluir texto de corrido, con saltos de línea o
separado por comas. Este último tiene extensión .csv y se utiliza para
introducir tablas con texto normal en programas de hojas de cálculo.
2 Al guardar archivos en formato HTML, se almacenan todos los gráficos como
archivos de imagen independientes con el formato JPEG. La compatibilidad
con el formato HTML 4.0 sólo existe en OmniPage Pro 11. La compatibilidad
de OmniPage SE está limitada a HTML 3.2.
3 Los resultados del reconocimiento se envían al Portapapeles y en este
formato se pegarán en RTF si ello es posible o, de lo contrario, como texto
Unicode o ASCII.
4 El texto Unicode acepta la máxima variedad de caracteres acentuados.
5 Las vistas True Page o Mantener flujo de columnas no se rechazarán, pero
aparecerán en la vista Mantener fuentes y párrafos, es decir, sin columnas.
6 OmniPage SE es capaz de abrir documentos creados con OmniPage SE y
con OmniPage Pro 11. También puede abrir archivos OPD creados con
OmniPage Pro 10 así como los archivos MET (equivalentes) creados con
OmniPage Pro 9. OmniPage SE realiza la conversión a partir de una copia
de estos archivos, que conservan su formato anterior.
Guardar en PDF
Esta sección no se aplica a OmniPage SE. En OmniPage Pro 11, contará con
cuatro opciones al guardar resultados de reconocimiento en archivos de
Formato de documento portátil (conocido como PDF).
Normal:
Las páginas se exportan tal como aparecieron en el Editor de texto en la vista
True Page. Este archivo PDF se puede ver con el visor de PDF y modificar
en un editor de PDF.
Con sustitutos de imagen:
Tal como en el caso anterior, pero los caracteres rechazados y dudosos tienen
superposiciones de imagen, de modo que estos caracteres inciertos aparecen
como estaban en el documento original. El archivo PDF se puede ver y
editar.
Sólo imagen:
El archivo en PDF sólo se puede ver pero no modificar en un editor de PDF
y tampoco es posible buscar texto.
PROBLEMAS DE OCR 91
Imagen en texto:
El archivo PDF sólo se puede ver pero no modificar en un editor de PDF.
No obstante hay un archivo de texto vinculado detrás de cada imagen, lo
cual sí permite buscar texto. La palabra buscada se resalta en la imagen.
PROBLEMAS DE OCR
Esta sección contiene información y soluciones para los posibles problemas
de OCR. En primer lugar proporcionamos soluciones para mejorar la
exactitud del reconocimiento, y luego para obtener buenos resultados al
manipular documentos de fax y, finalmente, soluciones para los problemas
de sistema o rendimiento que pudieran surgir durante el OCR.
El texto no se reconoce correctamente
Intente estas soluciones si parte del documento original no se convierte en
texto correctamente durante el OCR:
u Observe la imagen de la página original y cerciórese de que todas las
áreas de texto queden delimitadas por zonas de texto. Si un área no
queda delimitada en una zona, generalmente será ignorada durante
el OCR. Consulte la sección acerca de cómo crear y modificar
zonas, Trabajo con zonas en el capítulo 3.
u Cerciórese de identificar correctamente las zonas de texto. Vuelva a
identificar tipos y contenidos de zonas, si fuese necesario, y vuelva a
llevar a cabo el OCR en el documento. Consulte la sección
Propiedades de zona en el capítulo 3.
u Cerciórese de no haber cargado una plantilla incorrecta por error. Si
los bordes de la zona cortan texto, el reconocimiento será deficiente.
u Ajuste los controles deslizantes del brillo y el contraste en el panel
Escáner del cuadro de diálogo Opciones. Puede que sea necesario
experimentar con diferentes combinaciones de parámetros para
obtener los resultados deseados.
u Compruebe la resolución de la imagen original. Coloque el cursor
sobre el área Imagen original para ver una pantalla emergente. Si la
resolución es considerablemente superior o inferior a 300 ppp, es
probable que el reconocimiento sea deficiente.
92 INFORMACIÓN TÉCNICA
u Cerciórese de seleccionar los idiomas correctos para los documentos
en el panel OCR del cuadro de diálogo Opciones. Sólo se deben
incluir los idiomas incluidos en el documento.
u Active IntelliTrain y efectúe algunas correcciones de verificación.
Es probable que esto ayude más en el caso de fuentes estilizadas o
documentos que estén deteriorados uniformemente. Si ya estaba
activado IntelliTrain, intente desactivarlo; en algunos tipos de
documentos deteriorados puede que esta aplicación no resulte de
gran ayuda. Esto último no se aplica a OmniPage SE.
u Si utiliza True Page como vista del Editor de texto o para la
exportación, el texto reconocido se colocará en marcos (cuadros de
formato). Parte del texto puede quedar oculto si un marco es muy
pequeño. Para ver el texto, coloque el cursor en el marco del texto y
utilice las teclas de dirección del teclado para desplazarse hacia
arriba, hacia abajo a la izquierda o a la derecha del marco.
u Verifique que el cristal, espejos y lentes del escáner no tengan polvo,
manchas ni estén rayados. Límpielos si fuese necesario.
Problemas con el reconocimiento de fax
Intente estas soluciones para mejorar la exactitud del OCR en imágenes de
fax:
u Solicite a los remitentes que en lo posible usen documentos limpios
y originales.
u Solicite a los remitentes que seleccionen el modo Fino u Óptimo
cuando le envíen un fax. Esto produce una resolución de
200 x 200 ppp.
Nota OmniPage SE sólo reconoce caracteres de texto impresos, tales como
mecanografiados o generados en una impresora láser. Puede manejar caracte-
res impresos mediante matriz de puntos, aun cuando el nivel de exactitud
puede disminuir en el caso de texto con calidad de borrador; pero no tiene la
capacidad para leer impresión manual o texto manuscrito. Sin embargo, sí
puede mantener firmas u otro texto manuscrito, en forma de gráfico.
PROBLEMAS DE OCR 93
u Solicite a los remitentes que transmitan los archivos directamente a
su equipo vía fax módem si cuenta con dicho aparato. Podrá
guardar imágenes de fax como archivos de imagen y luego cargarlos
en OmniPage SE. Consulte la sección Entrada desde archivos de
imagen en el capítulo 3.
Problemas de sistema o rendimiento durante el OCR
Intente estas soluciones si se produce un bloqueo durante el OCR o si el
procesamiento tarda demasiado:
u Resuelva problemas de memoria insuficiente. Consulte la sección
Probar OmniPage SE.
u Resuelva problemas de espacio de disco insuficiente. Consulte la
sección Probar OmniPage SE.
u Minimice todas las aplicaciones o bien haga clic en Alt+Tab para ver
si hay mensajes de error de Windows.
u Revise la calidad de la imagen que está reconociendo.
u Consulte la documentación del escáner para averiguar formas de
mejorar la calidad de las imágenes exploradas.
u Divida imágenes de páginas complejas (mucho texto y gráficos o
formato complicado) en trabajos más pequeños. Dibuje zonas
manualmente o bien modifique las zonas creadas automáticamente
y efectúe el OCR en un área de una página a la vez. Consulte la
sección del capítulo 3 acerca de cómo crear y modificar zonas.
u Reinicie Windows 95, 98, Me y 2000 en el modo a prueba de
errores, o bien en Windows NT en el modo VGA y pruebe
OmniPage SE efectuando un OCR en los archivos de imágenes de
ejemplo incluidos
. Consulte la sección Probar OmniPage SE.
Si está efectuando varias tareas simultáneamente, tales como reconocer e
imprimir, puede que el OCR tarde más.
94 INFORMACIÓN TÉCNICA
DESINSTALACIÓN DEL SOFTWARE
En algunas ocasiones la solución puede consistir en desinstalar y luego volver
a instalar OmniPage SE. También conviene desinstalar OmniPage SE antes
de instalar OmniPage Pro 11 o cualquier programa OmniPage de
evaluación. El programa de desinstalación de OmniPage SE no eliminará
ninguno de los siguientes archivos creados por el usuario:
Plantillas de zonas (
*.zon)
Archivos de capacitación (
*.otd) (No se aplica a OmniPage SE)
Diccionarios del usuario (
*.ud)
Documentos de OmniPage (
*.opd)
Para desinstalar el producto en Windows NT o Windows 2000, debe
registrarse en su equipo con privilegios de administrador.
t Para desinstalar o reinstalar OmniPage SE:
u Cierre OmniPage SE.
u Haga clic en Inicio en la barra de tareas de Windows y seleccione
Configuración
É Panel de control É Agregar o quitar programas.
u Seleccione OmniPage SE y haga clic en Cambiar.
u Haga clic en Siguiente en el cuadro de diálogo que aparecerá a
continuación.
u Seleccione la opción para eliminar o reparar y luego Siguiente.
u Siga las instrucciones hasta terminar el procedimiento.
OMNIPAGE SE MANUAL DEL USUARIO 95
I NDEX
A
Abrir archivos de imagen
, 88
Acercar o alejar pantallas
, 25
Acomodación de texto
, 34
Actualización a la versión OmniPage
Pro
, 19
ADF
, 33
Administración de documentos
, 28
Administrador
documentos, 24, 28
tareas
, 86
Agregar
a zonas, 57
páginas a un documento
, 43
palabras a un diccionario del
usuario
, 64
Alimentador automático de
documentos
, 33, 51, 54
Alineación de párrafos
, 26
Alternar
entre el procesamiento manual y
automático
, 27, 46
entre las vistas del Editor de
texto
, 71
Archivos
adjuntos a mensajes de correo
electrónico
, 81
capacitación
, 69
como destino de exportación
,
77
como origen de imagen
, 51
imagen
, 22
imagen de ejemplo
, 85
imagen de varias páginas
, 51,
77, 88
imágenes TIFF
, 88
nuevo para cada página en
blanco
, 51
OPD
, 31
retenidos durante la
desinstalación
, 94
Áreas
Imagen original, 24
reordenar
, 74
Asistente
Agregar trabajo, 50
escáner
, 14
OCR
, 38, 39, 41
Atributos
caracteres, 71
párrafo
, 72
AutoOCR
, 27
Ayuda
contextual, ix, 25, 33
en línea
, ix
en línea HTML, ix
B
Barra de herramientas
AutoOCR, 42
Estándar, 24, 25
formato
, 24, 26
Imagen
, 26
Barra de menús
, 25
Blanco y negro, explorar
, 52, 77
Botones
comandos para el
procesamiento automático
,
43
Obtener página
, 42, 44
Realizar OCR
, 42, 45
Brillo
, 53, 91
escáner
, 33
Buscar
palabras dudosas, 64
palabras que no están en el
diccionario
, 64
salida en PDF
, 90
C
Caja de herramientas de OmniPage
,
24, 27, 42
Calidad de las imágenes
, 53
Cambiar
flujo de texto entre columnas,
74
orden de las áreas
, 74
orden de las zonas, 26
orden de los párrafos
, 74
tamaño de zonas
, 26, 57
tipos de zonas, 59
Capacitación
, 67
Caracteres no imprimibles
, 26
Características nuevas en la versión
11 de OmniPage Pro
, 18
Cargar
archivo de capacitación, 69
diccionario del usuario
, 66
Cerrar un documento
, 31
Colocar
divisores en las tablas, 26
gráficos desde la exportación
, 78
Color, explorar
, 53
Columnas
cambiar flujo de texto, 74
en tablas
, 60
Comandos del teclado para escuchar
texto
, 73
Comparación de las palabras
reconocidas con las originales
,
65
Compatibilizar la vista del editor
con el tipo de archivo
, 76, 89
Configuración
Direct OCR, 47
escáner
, 14
Contenido
documentos de OmniPage, 79
96 ÍNDICE
zonas, 58
Contorno de página
, 74
Contraste
, 53, 91
escáner, 33
Control sobre el reconocimiento
, 44
Controladores para escáneres
, 15
Conversión de imágenes
, 88
Copiar
documento al Portapapeles, 40,
80
y pegar texto
, 25
Correo
adjuntos, 81
como destino de exportación
,
81
Cortar y pegar texto
, 25
Crear datos de capacitación
, 69
Cuadros de diálogo
Cargar archivo, 51
Enviar correo, 81
Opciones
, 33
Verificador
, 41, 64
Cursiva, texto
, 26
D
Datos de capacitación no guardados
,
31
Descargar
archivo de capacitación, 69
diccionario del usuario
, 66
plantilla de zona
, 61
Descripción del diseño del
documento
, 40, 42, 55
Desinstalación de OmniPage SE
, 94
Desplazamiento entre páginas
, 28
Detalles, vista de
, 24
Detención del procesamiento
automático
, 43
Dibujar zonas
, 48
Diccionarios del usuario
, 64, 66
Direct OCR
, 33, 47
Diseño
descripción, 42
documento, descripción
, 55
personalizado
, 34, 56
Dividir zonas
, 57
Divisores, colocar en tablas
, 26
Documentos
diseño variado, 55
exportar
, 23
generalidades, 28
por ambas caras
, 54
sin terminar
, 31
Documentos de OmniPage
, 14, 31,
79
guardar
, 32
objetivo, 32
Documentos en OmniPage
, 23
E
Editar
archivo de capacitación, 69
atributos de caracteres, 71
atributos de párrafo
, 71
cuadrículas de tablas
, 59
diccionario del usuario, 66
divisores de tablas
, 26
gráficos
, 72
salida en PDF, 90
separadores de tablas
, 60
tablas
, 72
texto reconocido, 26, 71
Editor de texto
, 24, 34, 63, 70
Efecto de los parámetros
, 34
Ejemplos de archivos de imagen
, 85
Eliminar
páginas, 28, 30
plantilla de zona
, 61
separadores de tabla
, 60
Entrada
archivo PDF, 51
desde escáner
, 52
desde un archivo de imagen
, 51
Enviar un documento adjunto a un
mensaje de correo electrónico
,
81
Escala de grises, explorar
, 53
Escáner
, 52, 92
configuración
, 14
controladores
, 15
doble
, 54
Escritorio
, 24
OmniPage SE
, 24
Escuchar lectura de texto en voz alta
,
72
Espacio de disco
, 12, 87
Estado de la página
, 28
Estilos de párrafo
, 26, 72, 78
Exactitud
, 52
Explorar
blanco y negro, 52
color
, 53
escala de grises, 53
imágenes
, 53
Exportaciones
múltiples, 75, 79
preparación
, 76
tipos de archivos
, 89
Exportar
, 23, 44, 75, 76
a un archivo, 78
al Portapapeles
, 80
gráficos
, 78
Exportar resultados, botón
, 42, 46
F
Fijar tipos de zonas
, 59
Filas en tablas
, 60
Función texto a lenguaje
, 14, 72
Funciones de OmniPage SE
, 19
G
Generalidades de documentos
, 28
Generar separadores de tablas
, 60
Gráficos
archivos JPEG, 90
edición
, 72
en la exportación
, 78
exportación
, 89
Guardar
archivo de capacitación, 69
como documento de
OmniPage
, 32, 79
documento mientras trabaja
,
32, 79
documentos
, 75
e iniciar
, 78
en un archivo
, 41, 77
formato OPD
, 32
imágenes originales
, 77, 88
OMNIPAGE SE MANUAL DEL USUARIO 97
PDF, 90
plantilla de zona
, 61
resultados del reconocimiento
,
78
I
Idioma
instalación, 13
interfaz del usuario, 13, 34
reconocimiento
, 33, 40, 92
texto a lenguaje
, 13
Ignorar zona
, 59
Imágenes
barra de herramientas, 24
color
, 77
conversión, 88
entrada desde archivo de
, 51
escala de grises
, 77
guardar, 77
obtener
, 23
originales, guardar
, 77
resolución, 29, 77, 88, 91
rotación
, 26
Imprimir
, 25, 30
Información técnica
, 83
Iniciar
aplicación de destino, 78
diccionario del usuario, 66
Inicio del programa
, 14
Insertar separadores de tabla
, 60
Instalación
escáner, 14
OmniPage SE
, 13
Instrucciones de separación de
zonas
, 45
IntelliTrain
, 31, 34, 50, 67, 92
Interrupción del procesamiento
automático
, 43
J
Juntar zonas
, 57
L
Lectura de texto en voz alta
, 72
M
Manipular tablas en el Editor de
texto
, 72
Mantener estilos de párrafo
, 78
Marcadores de color
, 65
Marcos
, 92
documento de exportación
, 76
Matriz de puntos
, 92
Mejorar la exactitud
, 33, 52, 67
Menú rápido
, 59
Método de OCR
, 33, 40
Miniatura, vista de
, 24
Modificar una plantilla de zona
, 61
Modo
a prueba de errores, 85
VGA
, 86
Mover separadores de tabla
, 60
MS Outlook
, 81
N
Navegación de páginas
, 24
Negrita, texto
, 26
Niveles de formato
, 40, 50, 63, 70,
89
exportación
, 76
Nuevas características en la versión
11 de OmniPage Pro
, 18
O
Objetivo de los archivos OPD
, 32
Obtener
ayuda en línea, ix
imágenes
, 23, 44
parámetros del texto
, 48
Obtener texto, elemento de menú
,
48
OCR
, 22, 33, 64
Ocultar o mostrar marcadores
, 70
OmniPage
versión anterior, 13
OmniPage Pro
actualización a la versión, 19
nuevas características
, 18
OmniPage SE
, x, 19
desinstalación
, 94
funciones
, 19
inicio
, 14
instalación
, 13
prueba
, 85
registro, 17
reinstalación
, 94
Opciones
procesamiento, 34
separación de archivos
, 78, 81
verificación
, 34, 40, 64
Optimizar la calidad de la imagen
,
53
Orden de lectura de archivos de
imagen
, 51
P
Páginas
hojas de cálculo, 56
obtenida
, 28
reconocida, 28
separada por zonas
, 28
una sola columna
, 55, 57
una sola columna con tablas, 55
varias columnas
, 55
verificada
, 28
Palabras
dudosas al verificar, 64
marcadas en el Editor de texto
,
70
que no están en el diccionario al
verificar
, 64
PaperPort
, 49
Para
, 19
Parámetros
, 33, 41
Direct OCR
, 48
Párrafos, reordenar
, 74
Pasos de procesamiento
básicos, 23
generalidades
, 23
Personalizar columnas en la vista de
detalles
, 30
Plantillas
, 61
zonas
, 56, 61, 91
Portapapeles
, 80
Preparar resultados del
reconocimiento para la
exportación
, 76
Probar OmniPage SE
, 85
98 ÍNDICE
Problemas
espacio de disco insuficiente, 87
memoria insuficiente
, 86
OCR, 91
reconocimiento de fax
, 92
rendimiento durante el OCR
,
93
sistema o rendimiento durante
el OCR
, 93
Procesamiento
a partir de otras aplicaciones, 47
automático
, 27
automático de documentos, 42
automático incompleto
, 43
diferido
, 31
documento en futuras sesiones
,
31
manual
, 27, 44
manual de documentos
, 44
paso a paso, 44
Programar OCR
, 50
Propiedades de zona
, 26, 58
Q
Quitar de zonas
, 57
R
Realizar OCR
, 23
Reconocer todas las páginas
, 43
Reconocimiento
efectuar, 44
fax
, 92
lento
, 93
óptico de caracteres
, 22
Reemplazar una plantilla de zona
,
61
Registro
aplicaciones para Direct OCR,
47
en línea
, 17
OmniPage SE
, 17
Reinicio del procesamiento
automático
, 43
Reinstalación de OmniPage SE
, 94
Reordenar
páginas, 28
párrafos y áreas
, 74
zonas, 57
Requisitos
memoria, 12, 86
mínimos del sistema, 12
Resolución
imágenes, 29, 88, 91
imágenes guardadas, 77
problemas
, 83, 84
Rotación de imágenes
, 26
S
Salida
PDF, 90
texto ASCII
, 90
texto Unicode
, 90
Selección de varias páginas
, 28
Separación de zonas
automática, 34, 42, 55
manual, 26, 56, 91, 93
Soluciones en caso de rendimiento
deficiente
, 84
Subrayado, texto
, 26
Sugerencia de los diccionarios para
la verificación
, 64
Suplementar zonas de plantillas
, 61
Sustitutos de imagen en PDF
, 90
T
Tabla, zonas de
, 26
Tamaño de la imagen
, 29
Terminar un documento
, 43
Texto, guardar
, 78
Tipos
archivo, 78
archivos compatibles
, 88, 89
archivos de imagen
, 88
archivos para la exportación
, 76,
89
zonas
, 58, 91
Trabajo
Programar OCR, 50
zonas
, 57
TWAIN
, 15
U
Unidad de medición
, 34
Uso de Direct OCR
, 48
V
Velocidad maximizada
, 33
Ver salida en PDF
, 90
Verificación
documentos en sesiones
posteriores
, 31
remota, 31
resultados de OCR
, 64, 65
texto
, 65
Versiones anteriores de OmniPage
,
13
Vista
detalles, 29
detalles de columnas, 30
Editor
, 63, 70
Mantener flujo de columnas
,
63, 71, 76
Mantener fuentes y párrafos
,
63, 70, 76
miniatura, 28
Sin formato
, 63, 70, 76
True Page
, 63, 70, 76
Z
Zonas
alfanumérica, 58
columna única
, 58
detección automática
, 55, 58
gráfica
, 59
irregulares
, 26, 57
numérica
, 58
propiedades
, 26
rectangulares
, 57
separación manual
, 26, 45, 56
tablas
, 26, 58, 59
varias columnas
, 58

Transcripción de documentos

AVISOS LEGALES Copyright © 2002 ScanSoft, Inc. Reservados todos los derechos. Se prohíbe transmitir, transcribir, reproducir, almacenar en cualquier sistema de recuperación o traducir a cualquier idioma o lenguaje informático esta publicación o parte de ella, de ninguna forma ni por ningún medio, ya sea mecánico, electrónico, magnético, óptico, químico, manual u otro, sin la autorización previa por escrito del departamento legal de ScanSoft, Inc., 9 Centennial Drive, Peabody, Massachusetts 01960, U.S.A. El software descrito en esta publicación se otorga bajo licencia y sólo se puede usar o copiar según los términos establecidos en dicha licencia. AV I S O IMPORTANTE ScanSoft, Inc. proporciona esta publicación "tal cual" sin garantías de ninguna índole, ya sean expresas o implícitas, incluyendo, pero sin limitación alguna, las garantías implícitas de comerciabilidad o idoneidad para fines particulares. Algunos estados o jurisdicciones no permiten la renuncia a garantías expresas o implícitas en ciertas transacciones, por lo tanto, esta afirmación puede no aplicarse a su caso particular. ScanSoft se reserva el derecho de actualizar esta publicación y de hacer cambios de vez en cuando en el contenido actual sin verse obligada a notificar a ninguna persona de dichas actualizaciones o cambios. MARCAS COMERCIALES Y CRÉDITOS ScanSoft, OmniPage, OmniPage Pro, OmniPage SE, PaperPort, Pagis, True Page, Direct OCR, AutoOCR y OCR Proofreader son marcas registradas o comerciales de ScanSoft, Inc., en los Estados Unidos u otros países. Todas las demás marcas o denominaciones comerciales se reconocen en el presente documento y pueden estar registradas por sus respectivos titulares. ScanSoft Inc. 9 Centennial Drive Peabody, MA 01960 U.S.A. Ref.N°. 58-28001-04A C O N T E N I D O BIENVENIDO VII Uso de este manual viii Obtener ayuda en línea Ayuda en línea HTML ix Ayuda contextual ix Notas técnicas x Glosario x OmniPage SE 1 2 ix x INSTALACIÓN Y CONFIGURACIÓN 11 Requisitos del sistema 12 Instalación de OmniPage SE 13 Configuración del escáner con OmniPage SE 14 Cómo iniciar el programa 16 Registro del software 17 Nuevas características de OmniPage Pro 11 18 OmniPage SE y OmniPage Pro 11 19 INTRODUCCIÓN 21 Qué es el reconocimiento óptico de caracteres? Funciones de OCR de OmniPage SE 22 22 Documentos en OmniPage SE 23 Pasos básicos de procesamiento 23 El escritorio de OmniPage SE 24 Barra de herramientas Estándar OMNIPAGE SE MANUAL 25 DEL USUARIO iii Barra de menús 25 Barra de herramientas Imagen 26 Barra de herramientas de formato 26 Caja de herramientas de OmniPage 27 Administración de documentos 28 Vista de miniatura 28 Vista de detalles 29 Personalizar columnas en la vista de detalles 30 Eliminar páginas de un documento 30 Imprimir un documento 30 Cerrar un documento 31 Documentos OmniPage 31 Por qué guardar el documento como tipo OPD 32 Cómo guardar un archivo en formato OPD Parámetros 3 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS Guía de inicio rápido iv CONTENIDO 32 33 35 36 Carga y reconocimiento de archivos de imágenes de ejemplo 36 Exploración y reconocimiento de una sola página 36 Procesamiento de documentos utilizando el Asistente de OCR 39 Procesamiento automático de documentos 42 Botones de comandos 43 Procesamiento manual de documentos 44 Procesamiento automático de un documento y terminación manual 46 Procesamiento a partir de otras aplicaciones 47 Cómo configurar Direct OCR 47 Cómo usar Direct OCR 48 Cómo usar OmniPage SE con el software PaperPort 4 49 Procesamiento de documentos con Programar OCR 50 Definición del origen de imágenes de las páginas 51 Entrada desde archivos de imagen 51 Entrada desde escáner 52 Exploración con un alimentador automático de documentos 54 Explorar documentos extensos sin un alimentador automático de documentos 54 Descripción del diseño del documento 55 Separación manual de zonas 56 Trabajo con zonas 57 Propiedades de zona 58 Cuadrículas de tablas en la imagen 59 Uso de plantillas de zonas 61 VERIFICACIÓN Y EDICIÓN 63 Verificación de los resultados de OCR 64 Verificación del texto reconocido en comparación con el original 65 Diccionarios del usuario 66 IntelliTrain 67 Pantalla y vistas del editor 70 Edición de texto e imágenes 71 Lectura de texto en voz alta 72 Contorno de página 74 OMNIPAGE SE MANUAL DEL USUARIO v 5 6 GUARDAR Y EXPORTAR 75 Preparar resultados del reconocimiento para la exportación 76 Guardar en un archivo 77 Guardar imágenes originales 77 Guardar los resultados del reconocimiento 78 Guardar un documento mientras trabaja 79 Copia de un documento al Portapapeles 80 Enviar un documento adjunto a un mensaje de correo electrónico 81 INFORMACIÓN TÉCNICA Resolución de problemas 83 84 Soluciones iniciales 84 Probar OmniPage SE 85 Problemas de memoria insuficiente 86 Problemas de espacio de disco insuficiente 87 Tipos de archivos compatibles 88 Tipos de archivos para abrir y guardar imágenes 88 Tipos de archivos para guardar los resultados del reconocimiento 89 Guardar en PDF 90 Problemas de OCR 91 El texto no se reconoce correctamente 91 Problemas con el reconocimiento de fax 92 Problemas de sistema o rendimiento durante el OCR 93 Desinstalación del software INDEX vi CONTENIDO 94 95 Bienvenido Bienvenido a OmniPage SE™ y gracias por usar nuestro software. La siguiente documentación se proporciona a modo de ayuda para comenzar y como resumen del programa. Este manual del usuario Este manual es una introducción al uso de OmniPage SE. Incluye las instrucciones de instalación y configuración, una descripción de los comandos y áreas de trabajo del programa, instrucciones específicas de tareas, métodos para personalizar y controlar el procesamiento e información técnica. El formato PDF de la Guía permite utilizar hipervínculos en un visor de archivos PDF, para referencias cruzadas así como otras herramientas de navegación. Ayuda en línea La ayuda en línea de OmniPage SE contiene información acerca de las características, parámetros y procedimientos. La ayuda en línea viene en formato HTML, y ha sido diseñada para acceder a la información de manera rápida y sencilla. La completa ayuda contextual brinda la asistencia suficiente para permitirle seguir trabajando sin perder tiempo. Consulte la sección Obtener ayuda en línea. Archivo Léame El archivo Léame contiene la información más reciente acerca del software. Léalo antes de usar OmniPage SE. Para abrir este archivo HTML, selecciónelo en el Instalador de OmniPage SE o bien más adelante en el menú Ayuda. Exploración y otra información En el sitio web www.scansoft.com de ScanSoft encontrará la información más reciente acerca del programa. En la guía de escáneres encontrará información actualizada acerca de los escáneres compatibles y temas afines. También es posible acceder al sitio web de ScanSoft desde el Instalador de OmniPage SE o bien más adelante en el menú Ayuda. OMNIPAGE SE MANUAL DEL USUARIO vii USO DE ESTE MANUAL Este manual está escrito dando por sentado que usted sabe cómo trabajar en el entorno de Microsoft Windows. Consulte la documentación de Windows si tiene dudas acerca de cómo usar los cuadros de diálogo, comandos de menú, barras de desplazamiento, funciones de arrastrar y colocar, menús rápidos, etc. También suponemos que está familiarizado con su escáner y el software del mismo, y que dicho equipo está instalado y funcionando correctamente antes de configurarlo con OmniPage SE. Consulte la documentación respectiva del escáner según sea necesario. En este manual se utilizan las siguientes convenciones: viii BIENVENIDO Negrita Introduce nuevos términos y presenta subapartados. Cursiva Sirve para nombrar las secciones de este manual (a menos que se establezca lo contrario, la sección está ubicada en el mismo capítulo que la referencia). Sirve para nombrar los botones principales utilizados en el procesamiento automático: Iniciar, Detener, Terminar, Adicional. Non-serif Sirve para presentar nombres de archivos: sample.tif Nota Presenta un elemento de información adicional. Consejo Presenta ideas para usar características del programa a fin de efectuar tareas específicas. OBTENER AYUDA EN LÍNEA Además de usar este manual, se puede utilizar la ayuda en línea de OmniPage SE para informarse sobre nuevas características, parámetros y procedimientos. La ayuda en línea está disponible tras instalar OmniPage SE. Ayuda en línea HTML Abra la ayuda en línea de OmniPage SE en el nivel superior escogiendo Temas de ayuda de OmniPage SE en la parte superior del menú Ayuda. Esto permite ver los temas dispuestos en una Tabla de contenido, buscar en una lista alfabética de palabras clave o hacer búsquedas de texto completo en los temas. Otros elementos del menú Ayuda permiten acceder a temas o páginas web relevantes. Pulse F1 mientras trabaja con el programa para ver un tema de la ayuda en línea que guarde relación con el área de la pantalla, cuadro de diálogo o mensaje de advertencia actual. Ayuda contextual Es posible ver una ventana emergente con información concisa y puntual sobre un elemento de menú, botón de la barra de herramientas, área de la pantalla o cuadro de diálogo particulares de OmniPage SE, de las siguientes maneras: Haga clic en el botón Ayuda en la barra de herramientas Estándar para invocar el icono de ayuda. Haga clic en cualquier elemento del escritorio fuera del cuadro de diálogo o mensaje de advertencia. Pulse Mayús + F1 para invocar el mismo icono de ayuda. Haga clic en el signo de interrogación situado en la esquina superior derecha de un cuadro de diálogo y luego haga clic en un elemento de dicho cuadro de diálogo para ver una ventana emergente. Algunos cuadros de diálogo o mensajes de advertencia tienen su propio botón o texto de ayuda. Haga clic en el botón o texto para obtener información acerca del cuadro de diálogo o de mensaje. OMNIPAGE SE MANUAL DEL USUARIO ix Haga clic en cualquier lugar para que desaparezca la ventana emergente de ayuda contextual. Notas técnicas En el sitio web www.scansoft.com de ScanSoft encontrará notas técnicas sobre temas comúnmente mencionados al usar OmniPage SE. Las páginas web también pueden ofrecer asistencia acerca del proceso de instalación y resolución de problemas. Glosario Esta manual no contiene un glosario. La ayuda en línea tiene un completo glosario, con su propio índice alfabético y una tabla de contenido. Consúltelo si desea averiguar el significado de algún término utilizado en este manual o en el programa. OMNIPAGE SE El producto de que dispone es la versión Special Edition del mundialmente conocido programa OmniPage Pro™. Esta versión, desarrollada para ser distribuida con fabricantes de escáneres seleccionados, cuenta con un conjunto reducido de las funciones incluidas en el producto OmniPage Pro 11. Esta Guía así como la Ayuda en línea describen las funciones del producto completo, y un icono SE señala en el documento las diferencias entre las dos versiones. Si le resultan ventajosas las funciones adicionales de la versión profesional, utilice las facilidades en línea para actualizar su versión Special Edition a OmniPage Pro 11. x BIENVENIDO 1 Instalación y configuración Este capítulo contiene información acerca de la instalación e inicio de OmniPage SE. Se presentan los siguientes temas: u Requisitos del sistema u Instalación de OmniPage SE u Configuración del escáner con OmniPage SE u Cómo iniciar el programa u Registro del software u Nuevas características de OmniPage Pro 11 u OmniPage SE y OmniPage Pro 11 OMNIPAGE SE MANUAL DEL USUARIO 11 REQUISITOS DEL SISTEMA Se necesitan los siguientes requisitos mínimos de sistema para instalar y ejecutar OmniPage SE: u Un ordenador con procesador Pentium o superior u Microsoft Windows 95, Windows 98, Windows Me, Windows 2000 o Windows NT 4.0 u 32MB de memoria (RAM), se recomiendan 64MB u 75MB de espacio libre en el disco duro para los archivos de la aplicación, más 10MB de espacio de trabajo durante la instalación u 9MB para Microsoft Installer (MSI) si no está presente y 44MB para Internet Explorer si tampoco lo está. (Éstos se encuentran como parte del sistema operativo en Windows 98, Windows Me y Windows 2000.) u Monitor SVGA con 256 colores y resolución de 800 x 600 píxeles u Dispositivo señalador compatible con Windows u Unidad de CD-ROM para la instalación u Un escáner compatible si tiene pensado explorar documentos. En la guía de escáneres en el sitio web de ScanSoft (www.scansoft.com) encontrará una lista de todos los escáneres compatibles. Nota El rendimiento y velocidad aumentarán si el procesador, memoria y espacio disponibles en su equipo son superiores a los requisitos mínimos. 12 INSTALACIÓN Y CONFIGURACIÓN INSTALACIÓN DE OMNIPAGE SE El programa de instalación de OmniPage SE le guiará a través de la instalación mediante instrucciones en cada pantalla. Antes de instalar OmniPage SE: u Cerciórese de que el escáner esté conectado, encendido y sea compatible con su sistema. u Cierre todas las demás aplicaciones, especialmente programas antivirus. u Regístrese en su equipo con privilegios de administrador si ha de instalar el programa en Windows 2000 o Windows NT. u Si su sistema ya tiene instalada una versión anterior del programa OmniPage, el programa de instalación le pedirá confirmación para desinstalarla primero. t Para instalar OmniPage SE: 1. Introduzca el CD-ROM de OmniPage SE en la unidad de CD-ROM. El programa de instalación debe iniciarse automáticamente. De no ser así, busque la unidad de CD-ROM en el Explorador de Windows y haga doble clic en el programa Autorun.exe que aparece en el nivel superior del CD-ROM. 2. Elija el idioma a usar durante la instalación. Este idioma se utilizará para el sistema texto a lenguaje y como el idioma de la interfaz del programa. El idioma de la interfaz del programa se utiliza para presentar los elementos de menú, cuadros de diálogo, mensajes de advertencia, etc. Es posible cambiar el idioma de la interfaz posteriormente en OmniPage SE, pero su elección al momento de la instalación determina qué sistema de texto a lenguaje se instalará en el programa. Las referencias a la función de lectura en voz alta no se aplican a OmniPage SE. INSTALACIÓN DE OMNIPAGE SE 13 3. Siga las instrucciones en cada pantalla para instalar el software. Todos los archivos necesarios para la exploración se copian automáticamente durante la instalación. Nota En algunas ocasiones la solución puede consistir en desinstalar y luego volver a instalar OmniPage SE. Consulte el apartado Desinstalación del software al final del capítulo 6. Nota En OmniPage Pro 11, la función de lectura en voz alta está disponible para alemán, español, francés, inglés (británico y estadounidense), italiano o portugués. No está disponible en OmniPage SE. Consulte también la sección Lectura de texto en voz alta en el capítulo 4. CONFIGURACIÓN DEL ESCÁNER CON OMNIPAGE SE Todos los archivos necesarios para la configuración y respaldo del escáner se copian automáticamente durante la instalación del programa. Antes de usar OmniPage SE para la exploración, el escáner debe estar correctamente instalado y se debe haber verificado su correcto funcionamiento. La instalación y configuración del escáner se efectúan mediante el Asistente del escáner. Lo puede iniciar por su cuenta, tal como se describe a continuación. De otro modo, el Asistente del escáner aparece al tratar de efectuar la primera exploración con OmniPage SE. Siga estos pasos a fin de utilizar el Asistente del escáner para configurar su equipo con OmniPage SE: u Elija InicioÉProgramasÉScanSoft OmniPage SEÉ Asistente del escáner, o bien, haga clic en el botón de configuración en el panel Escáner del cuadro de diálogo Opciones. O, en último caso, elija un comando de exploración en la lista desplegable Obtener página en la Caja de herramientas de OmniPage. u Elija Seleccionar el origen de exploración y luego haga clic en Siguiente. 14 INSTALACIÓN Y CONFIGURACIÓN u Haga clic una vez en el controlador TWAIN de su escáner para u u u u u u u u u u u u u u seleccionarlo y luego haga clic en Siguiente. Seleccione Sí para probar la configuración de su escáner y luego haga clic en Siguiente. El asistente probará la conexión desde el ordenador al escáner. Haga clic en Siguiente. Inserte una página de prueba en el escáner. El asistente está preparado para efectuar una exploración básica usando el software del fabricante del escáner. Haga clic en Siguiente. Aparecerá la interfaz del usuario propia del escáner. Haga clic en el botón u opción para explorar a fin de comenzar una exploración de muestra. Si fuese necesario, haga clic en Imagen invertida… o bien en Imagen faltante… y haga las selecciones correspondientes. Una vez que la imagen aparezca correctamente en la ventana, haga clic en Siguiente. Seleccione el elemento que describa más adecuadamente su escáner y luego haga clic en Siguiente. Haga clic en Siguiente para seguir con el tamaño de página. En la ventana aparecen los tamaños de página que el Asistente del escáner considera compatibles con su escáner. Para efectuar cambios en los tamaños de página, haga clic en Avanzadas, efectúe los cambios y luego haga clic en Siguiente. Inserte una página con texto pero sin imágenes en su escáner. Haga clic en Siguiente para comenzar a explorar en el modo blanco y negro. Si fuese necesario, haga clic en Imagen invertida… o bien en Imagen faltante… y haga las selecciones correspondientes. Una vez que la imagen aparezca correctamente en la ventana, haga clic en Siguiente. Si tiene un escáner a color, inserte en él una fotografía en colores o una página con una imagen en colores. Haga clic en Siguiente para comenzar a explorar en el modo en colores. Si fuese necesario, haga clic en Imagen invertida… o bien en Imagen faltante… y haga las selecciones correspondientes. Una vez que la imagen aparezca correctamente en la ventana, haga clic en Siguiente. Si el escáner no puede explorar en colores, omita este paso. CONFIGURACIÓN DEL ESCÁNER CON OMNIPAGE SE 15 u Inserte en el escáner una fotografía o página que contenga una imagen. Haga clic en Siguiente para comenzar una exploración en escala de grises. Si fuese necesario, haga clic en Imagen invertida… o bien en Imagen faltante… y haga las selecciones correspondientes. Una vez que la imagen aparezca correctamente en la ventana, haga clic en Siguiente. u Ha configurado satisfactoriamente su escáner para que funcione con OmniPage SE. Haga clic en Terminar. Para cambiar los parámetros del escáner posteriormente, configurar otro escáner, o bien probar y reparar un escáner instalado, lleve a cabo uno de los dos siguientes métodos a fin de volver a abrir el Asistente del escáner: u Pulse InicioÉProgramasÉScanSoft OmniPage SEÉAsistente del escáner o bien u Pulse InicioÉProgramasÉScanSoft OmniPage SEÉOmniPage SEÉmenú HerramientasÉOpcionesÉEscáner…Ébotón Configuración. Nota Para probar y reparar un escáner que no funcione correctamente, siga el procedimiento anterior, seleccionando ‘Probar y configurar el origen de exploración actual’ al iniciar el proceso. CÓMO INICIAR EL PROGRAMA Para iniciar OmniPage SE, lleve a cabo uno de los siguientes procedimientos: u Haga clic en Inicio en la barra de tareas de Windows y seleccione ProgramasÉScanSoft OmniPage SEÉOmniPage SE. u Haga doble clic en el icono OmniPage SE en la carpeta de instalación del programa o bien en el escritorio de Windows si lo colocó ahí. u Haga doble clic en el icono o nombre de archivo de un documento de OmniPage (OPD); el documento se carga en el programa. Consulte la sección Documentos OmniPage en el capítulo 2. Al abrirlo, aparece la pantalla de título de OmniPage SE y luego su escritorio. En el capítulo 2 encontrará una introducción al escritorio de OmniPage SE. 16 INSTALACIÓN Y CONFIGURACIÓN Hay muchos modos de ejecutar el programa con una interfaz limitada: u Utilice el programa Programar OCR. Haga clic en Inicio en la barra de tareas de Windows y elija ProgramasÉScanSoft OmniPage SEÉ Programar OCR. Consulte la sección Procesamiento de documentos con Programar OCR en el capítulo 3. u Haga clic en Obtener texto en el menú Archivo de una aplicación registrada con la función Direct OCR™. Consulte la sección Cómo configurar Direct OCR en el capítulo 3. u Haga clic con el botón derecho del ratón en el nombre o icono de un archivo de imagen para obtener un menú rápido. Seleccione un elemento de submenú de ‘Convertir a...’ a fin de definir un destino. u En productos de administración para documentos PaperPort ® o Pagis ® de ScanSoft, utilice OmniPage SE a fin de obtener los servicios OCR. Consulte el capítulo 3 (Cómo usar OmniPage SE con el software PaperPort). REGISTRO DEL SOFTWARE El Asistente para el registro de ScanSoft se ejecuta al final de la instalación. Se proporciona un sencillo formulario electrónico que se puede completar en menos de cinco minutos. Una vez lleno el formulario, y tras enviarlo, el programa buscará una conexión a Internet para efectuar inmediatamente el registro en línea. Si no registra el software durante la instalación, se le solicitará periódicamente que lo haga más adelante. También puede registrarse en línea en nuestro sitio www.scansoft.com en Internet. Haga clic en Support y en la pantalla principal de apoyo técnico elija la opción para registrarse, situada en la columna izquierda. Para conocer la declaración sobre el uso de los datos de registro, revise la política de confidencialidad de ScanSoft. REGISTRO DEL SOFTWARE 17 NUEVAS CARACTERÍSTICAS DE OMNIPAGE PRO 11 La familia de productos OmniPage® ha sido ampliada con OmniPage Pro 11 y OmniPage SE. Esta sección enumera las mejoras introducidas en el producto profesional OmniPage Pro 11. Algunas se encuentran también en OmniPage SE, tal y como describe la siguiente sección. Nuevas características de OmniPage Pro 11 comparadas con OmniPage Pro 10 son: u Mayor exactitud - los motores de reconocimiento con un diseño mejorado hacen que OmniPage Pro 11 sea el OmniPage de mayor exactitud. u Diseño de página mejorado - OmniPage Pro 11 permite conservar el formato real del original, incluso en páginas con tablas no cuadriculadas, encabezados y pies de página y mayúsculas embutidas. u Verificación ortográfica más inteligente - La nueva característica IntelliTrain utiliza automáticamente correcciones previas para generar mejores resultados de OCR. u Capacidad de PDF - Ahora se pueden importar archivos PDF (incluso de sólo lectura) y convertirlos en archivos de su programa favorito (Word, Excel, etc.). También se pueden crear archivos PDF a partir de cualquier documento en papel o archivo de imagen. u HTML de mejor calidad - La nueva salida de HTML tipo “WYSIWYG” (que significa “lo que se ve es lo que se obtiene”) permite manipular gráficos, texto y fondos para que el archivo web de salida quede igual que el documento original. u Compatibilidad de idiomas - OmniPage Pro 11 es compatible ahora con más de 100 idiomas e incluye los alfabetos griego y cirílico. u Vista detallada - Permite personalizar más información acerca de cada página, facilitando la manipulación de páginas en un documento. u Editor de texto - Un nuevo y completo editor tipo “WYSIWYG” que brinda un mejor reconocimiento, con una gran variedad de herramientas de edición, compatibilidad de colores y una gama de cuatro niveles de formato para visualización y exportación. 18 INSTALACIÓN Y CONFIGURACIÓN u Mejores resultados en texto en mal estado - Un nuevo módulo de refinamiento reduce considerablemente los errores en fondos con manchas, sombreados y en color. OMNIPAGE SE Y OMNIPAGE PRO 11 El listado siguiente enumera características que no han sido incluidas en OmniPage SE. Puede disponer de ellas cuando actualiza a la versión OmniPage Pro 11: u Mejora significativa de la precisión en el reconocimiento. u Acceso a la característica de capacitación IntelliTrain para reconocimiento de caracteres. u Posibilidad de abrir y leer el contenido de archivos PDF. u Posibilidad de guardar documentos reconocidos a formato PDF. u Posibilidad de abrir archivos de imagen en formato TIFF FX. u Reconocimiento de archivos de imagen en formato LZW TIFF y GIF en la entrada y en la salida. u Compatibilidad con el formato HTML 4.0 para salida WYSIWYG. u El número de idiomas reconocidos asciende de unos 50 a un centenar. u Acceso a software de lectura en voz alta, que permite leer en voz alta los textos reconocidos. Para obtener más información o actualizar su versión, visite la dirección www.scansoft.com. OMNIPAGE SE Y O M N I P A G E P R O 11 19 2 Introducción Probablemente usted utiliza su ordenador para procesar correspondencia comercial, elaborar informes, manipular datos y llevar a cabo un número cada vez mayor de tareas. El desafío es que, a pesar de la revolución digital, ciertas fuentes de información aún circulan en papel o formato impreso, por lo que no se pueden procesar inmediatamente en un ordenador. Por ejemplo, si desea incorporar información acerca del artículo de una revista en un informe que esté preparando, de algún modo tiene que incorporar el texto del artículo en su equipo. Ciertamente, la engorrosa redigitación del artículo no es la solución más atractiva. Este capítulo le presenta la solución ideal: reconocimiento óptico de caracteres (OCR). Describe la forma en que OmniPage SE utiliza la tecnología OCR para transformar texto de páginas exploradas o archivos de imágenes en texto que podrá editar con sus aplicaciones informáticas favoritas. Los temas tratados son los siguientes: u Qué es el reconocimiento óptico de caracteres? u Documentos en OmniPage SE u Pasos básicos de procesamiento u El escritorio de OmniPage SE u Administración de documentos u Documentos OmniPage OMNIPAGE SE MANUAL DEL USUARIO 21 QUÉ ES EL RECONOCIMIENTO ÓPTICO DE CARACTERES? El reconocimiento óptico de caracteres es el proceso de extracción de texto de una imagen. Esta imagen puede obtenerse a partir de la exploración de un documento en papel o de la apertura del archivo electrónico de una imagen. Las imágenes no tienen caracteres editables de texto, sino muchos puntos diminutos (píxeles) que en conjunto producen formas de caracteres. Éstos presentan una imagen del texto en una página. Durante el OCR, OmniPage SE analiza las formas de los caracteres presentes en una imagen y define las soluciones para producir texto editable. Tras el OCR, se puede guardar el texto resultante en una gran variedad de aplicaciones de procesamiento de texto, autoedición u hojas de cálculo. Funciones de OCR de OmniPage SE Además del reconocimiento de texto, OmniPage SE puede mantener los siguientes elementos en un documento mediante el procedimiento de OCR. Gráficos Ejemplos de gráficos son las fotografías, logotipos y diagramas. Formato de texto Tipos, tamaños y estilos de fuente (tales como negrita, cursiva y subrayado) son ejemplos de formato de caracteres. Sangrías, tabuladores, márgenes y espaciado entre líneas son ejemplos de formato de párrafo. Formato de página Estructura de columnas, formatos de tablas y colocación de gráficos y encabezados son ejemplos de formato de página. Los elementos de formato de gráficos, texto y página que mantiene OmniPage SE se determinan según los parámetros que seleccione el usuario. En la sección de Pautas de parámetros de la Ayuda en línea encontrará más información acerca de la selección de parámetros. Nota OmniPage SE sólo reconoce caracteres generados por máquina tales como impresoras offset o láser, o texto digitado en una máquina de escribir. Sin embargo, puede mantener texto manuscrito, tal como una firma, como un gráfico. 22 INTRODUCCIÓN DOCUMENTOS EN OMNIPAGE SE OmniPage SE puede trabajar con un solo documento a la vez. Cuando obtenga la primera imagen (del escáner o a partir de un archivo) se generará un nuevo documento. Las imágenes subsiguientes se irán agregando al mismo documento, hasta que lo guarde y lo cierre. Un documento en OmniPage SE consta de una imagen por cada página del documento. Tras efectuar el OCR, el documento también contendrá el texto reconocido, visualizado en el Editor de texto, posiblemente junto con los gráficos y tablas. En la sección El escritorio de OmniPage SE encontrará más información acerca de las áreas de las pantallas. PASOS BÁSICOS DE PROCESAMIENTO Hay dos formas principales de manipular los documentos: con procesamiento automático o procesamiento manual. Consulte Procesamiento automático de documentos y Procesamiento manual de documentos en el capítulo 3. Los pasos básicos para ambos métodos de procesamiento son muy similares: 1. Abra un conjunto de imágenes con OmniPage SE. Podrá explorar un documento en papel con o sin un alimentador automático de documentos, o bien cargar uno o más archivos de imágenes. Las imágenes resultantes aparecerán en miniatura en la vista de miniatura del Administrador de documentos y las páginas resumidas en su vista de detalles. La imagen de la página actual se ve en el área de la imagen original. 2. Realice el OCR para generar texto editable. Durante el OCR, OmniPage SE crea zonas alrededor de los elementos en la página que se procesará, y luego interpreta los caracteres de texto o gráficos en cada zona. También es posible efectuar una separación de zonas manual o por plantilla. Después del OCR, se puede revisar y corregir los errores en el documento utilizando el Verificador de OCR y editar el documento mediante el Editor de texto. 3. Exportar el documento a la ubicación deseada. Al guardar el documento se le puede designar un tipo y nombre de archivo específicos, colocarlo en el Portapapeles, o bien adjuntarlo a un mensaje de correo electrónico. Se puede guardar como documento de OmniPage (OPD), tal como se describirá más adelante. Se puede guardar el mismo documento varias veces en diferentes destinos, como diferentes tipos de archivo y con diferentes parámetros y niveles de formato. Consulte el capítulo 5. DOCUMENTOS EN OMNIPAGE SE 23 EL ESCRITORIO DE OMNIPAGE SE El escritorio de OmniPage SE tiene una barra de título y una barra de menús en su parte superior, y una barra de estado en la parte inferior. Tiene tres áreas de trabajo principales, separadas por divisores: el Administrador de documentos, el área Imagen original y el Editor de texto. El Administrador de documentos tiene dos paneles separados: vista de miniatura y vista de detalles. El área Imagen original tiene una barra de herramientas Imagen y el Editor de texto tiene una barra de herramientas de formato. Barra de herramientas de formato Barra de herramientas Estándar Caja de herramientas de OmniPage La página actual tiene un borde pálido. Esta página ya ha sido reconocida. La vista de miniatura muestra una imagen de cada página en el documento. Botones de navegación de páginas Botones para mostrar, ocultar o reorganizar las áreas de trabajo. Barra de herramient as Imagen Arrastre este divisor a la izquierda o a la derecha para cambiar el tamaño de las áreas de trabajo. Área Imagen original Aquí aparece la imagen de la página actual, junto con las zonas que se coloquen automática o manualmente en dicha imagen. Nota Los botones de la vista del Editor de texto ofrecen cuatro niveles de formato. Editor de texto Sirve para mostrar los resultados del reconocimiento para la página actual en la vista True Page™. Para controlar cuál de las tres vistas (Administrador de documentos, Imagen original y Editor de texto) aparecerá, active o desactive cada vista en el menú Ver o bien los botones de la barra de estado. 24 INTRODUCCIÓN La Caja de herramientas de OmniPage permite controlar el procesamiento. Puede tener tres estados, dependiendo de cuál de las tres fichas de la izquierda estén seleccionadas. En la figura, se aprecia el aspecto de OCR manual. El programa aparece con un documento de tres páginas. La página uno es la página actual, que se ha reconocido y verificado. La página dos se ha reconocido pero aún no se ha verificado. La página tres se ha obtenido y separado manualmente por zonas, pero aún no se ha reconocido. Los iconos situados en la parte inferior derecha de las imágenes de miniatura muestran el estado de la página. Los botones de la barra de estado permiten mostrar, ocultar o reorganizar las áreas de la pantalla principal y desplazarse a otras páginas del documento. Al hacer clic con el botón derecho del ratón en cualquier área de la pantalla se obtiene un menú rápido con los comandos más útiles para dicha área. Barra de herramientas Estándar La barra de herramientas Estándar contiene botones y una lista desplegable para efectuar las tareas más comunes. Se puede desplazar y acoplar a cualquier borde del escritorio de OmniPage SE. También es posible acceder a estas funciones mediante menús. Nuevo abre un documento nuevo. Guardar el documento actual con el nombre y tipo que tenía la última vez que fue guardado. Abrir un Documento OmniPage Imprimir imágenes o resultados de reconocimiento de todas las páginas o sólo de las seleccionadas. Verificar el texto reconocido. Cortar la selección actual en el Editor de texto. Copiar la selección actual del Editor de texto. Pegar la selección en el Editor de texto. Deshacer la última acción de edición. Zoom en el área activa: Imagen original o Editor de texto. Abrir el cuadro de diálogo Opciones. Ayuda contextual Barra de menús Para obtener información concisa acerca de algún elemento de menú, haga clic en el botón de ayuda contextual y luego en el elemento de menú que desee. El texto emergente le explicará la función del elemento de menú en cuestión. Haga clic en cualquier lugar para cerrar el cuadro emergente. EL ESCRITORIO DE OMNIPAGE SE 25 Barra de herramientas Imagen La barra de herramientas Imagen contiene botones que permiten acercarse o alejarse de la imagen actual, o bien girarla. También permiten trabajar con zonas y divisores de tablas en la página. Consulte Separación manual de zonas y Cuadrículas de tablas en la imagen el en capítulo 3. Aquí hemos resumido las funciones de los botones. La barra de herramientas Imagen se puede desplazar (es decir, desacoplar y mover a cualquier otro lugar del escritorio). Se puede acoplar a cualquier borde del área Imagen original. Dibujar zonas rectangulares. Dibujar zonas irregulares. Agregar a una zona o combinar zonas. Quitar de una zona o zonas individuales. Reordenar zonas. Mover separadores de fila o columna en una tabla. Propiedades de zona Insertar separadores de fila en una tabla. Insertar separadores de columna en una tabla. Acercar Eliminar/ Reemplazar todos la imagen de una página. los separadores de fila y columna. Girar Eliminar separadores de fila imágenes. o columna uno por uno. Alejar la imagen de una página. Consejo También se puede cambiar el tamaño o girar la imagen original con un menú rápido. Haga clic con el botón derecho del ratón en el área de Imagen original fuera de una zona y seleccione un valor de zoom o giro. Barra de herramientas de formato La barra de herramientas de formato contiene botones que permiten modificar el texto reconocido en el Editor de texto. Esto se describe en detalle en el capítulo 4 (Edición de texto e imágenes). Aquí presentamos un resumen de la función de los botones. La barra de herramientas de formato siempre permanece en la parte superior del Editor de texto. Estilos de párrafo Nombre de la fuente Tamaño de la fuente Negrita Subrayado Cursiva 26 INTRODUCCIÓN Alineación de párrafo Mostrar/Ocultar caracteres no imprimibles. Viñetas Caja de herramientas de OmniPage Esta caja de herramientas permite controlar el procesamiento. De forma predeterminada, está situada en la parte superior del escritorio de OmniPage SE, justo sobre las áreas de trabajo. Se puede desplazar y acoplar a la parte inferior del escritorio. Tiene tres fichas a la izquierda: AutoOCR™, OCR manual y Asistente de OCR. Haga clic en una de ellas para ver sus controles en la Caja de herramientas. En la imagen al principio de esta sección se aprecia el escritorio de OmniPage con la barra de herramientas OCR manual. La barra de herramientas AutoOCR tiene el siguiente aspecto. El procesamiento Automático se inicia, se puede detener y reiniciar con los botones situados a la derecha de la barra de herramientas. El uso de estos botones y todos los parámetros se describen en la sección Procesamiento automático de documentos, en el capítulo 3. Se puede alternar entre el procesamiento automático y manual en cualquier momento en que el programa no esté ocupado en algún tipo de procesamiento. Eso significa que se puede alternar entre ambos modos mientras esté trabajando en algún documento. Es posible procesar automáticamente algunas páginas, y luego agregar más páginas con el procesamiento manual. Tras procesar un grupo de páginas en forma automática, se pueden revisar los resultados y volver a procesar ciertas páginas manualmente. Este procedimiento también se describe en el capítulo 3, Procesamiento automático de un documento y terminación manual. OmniPage SE debe estar vacío al iniciar el Asistente de OCR. Cuando lo haya utilizado para procesar y guardar un documento, permanece en el programa y se puede utilizar posteriormente (agregar más páginas, reconocer páginas, etc.) con el procesamiento manual o automático. Consulte Procesamiento de documentos utilizando el Asistente de OCR en el capitulo 3. EL ESCRITORIO DE OMNIPAGE SE 27 ADMINISTRACIÓN DE DOCUMENTOS El Administrador de documentos está situado a la izquierda del escritorio de OmniPage SE. Tiene dos paneles separados: vista de miniatura y vista de detalles. Haga clic en una ficha para apreciar cómo se ve. Ambas vistas resumen las páginas del documento y están sincronizadas: la página actual y las seleccionadas permanecen invariables cuando se cambia de vista. Nuestras imágenes muestran las dos vistas con el mismo documento de cuatro páginas. Las páginas 1 y 2 están seleccionadas y la página 4 es la página actual, es decir, la que aparece en el área Imagen original. El Administrador de documentos muestra el estado de la página con los siguientes iconos: Icono de miniatura Icono de detalle Página Estado La imagen de página se ha... 1 Obtenido 2 Separado por zonas 3 Reconocido Reconocido, pero no verificado, o bien la verificación se interrumpió en la página. 4 Verificado Reconocido, y la verificación ha llegado al final de la página. Obtenido sin zonas manuales ni de plantilla y aún no se ha reconocido. — — Obtenido y se han colocado zonas manuales o de plantilla; pero aún no se ha reconocido. Vista de miniatura Esta vista presenta un conjunto vertical de imágenes en miniatura numeradas, una para cada página del documento. Desplácese para ver las páginas según sea necesario. La página actual tiene un fondo más pálido y su número de página aparece en negrita. Se pueden seleccionar varias páginas en el documento; éstas tendrán un aspecto ‘embutido’. El icono de estado aparece en la parte inferior derecha de cada página, tal como se describió anteriormente. Pasar a una página: haga clic en el icono de la página deseada. Reordenar una página: haga clic en la miniatura de la página que desee mover, luego arrástrela y colóquela sobre el número de la página deseada. Las páginas se vuelven a numerar automáticamente. Eliminar una página: seleccione la miniatura de la página que desee suprimir y pulse la tecla Suprimir. Seleccionar varias páginas: mantenga pulsada la tecla Mayús y haga clic en dos miniaturas para seleccionar todas las páginas entre ellas (inclusive). Mantenga pulsada la tecla Ctrl cuando haga clic en las miniaturas para agregar páginas individualmente a la selección. Es posible mover o eliminar las páginas seleccionadas como grupo, o bien enviarlas para su reconocimiento. 28 INTRODUCCIÓN Vista de detalles Esta es una nueva función de OmniPage SE. Proporciona una vista general del documento con una tabla. Cada fila representa una página. Las columnas presentan información estadística o de estado para cada página, y (cuando corresponde) los totales del documento. En la imagen que aparece a continuación se aprecian las columnas predeterminadas a la izquierda y cuatro columnas especificadas por un usuario. Coloque el cursor en el icono de estado de la página para ver una miniatura de la misma. Esto muestra el número de zonas de cada tipo en la página. La página actual aparece resaltada. Se puede usar la vista de detalles para las operaciones de la página, tal como se indica a continuación: Pasar a una página: haga clic en una fila de la página deseada. Reordenar una página: haga clic en la fila de la página que desee mover y arrástrela a la ubicación deseada. Un indicador de flecha en la izquierda muestra dónde se insertará la página. Las páginas se vuelven a numerar automáticamente. Eliminar una página: seleccione la fila de la página que desee suprimir y pulse la tecla Suprimir. Seleccionar varias páginas: mantenga pulsada la tecla Mayús y haga clic en dos filas de página para seleccionar todas las páginas entre ellas (inclusive). Mantenga pulsada la tecla Ctrl cuando haga clic en las filas para agregar páginas individualmente a la selección. Es posible mover o eliminar las páginas seleccionadas como grupo, o bien enviarlas para su reconocimiento. Cuando se seleccionen varias páginas, la página indicada como actual no cambiará. Todas las páginas seleccionadas quedan resaltadas. Consejo Es posible obtener información del tamaño de la imagen colocando el cursor sobre una miniatura o fuera de una zona en una imagen original. El texto emergente mostrará el tamaño de la imagen en píxeles y en la unidad de medición del programa. También aparece la resolución de la imagen. ADMINISTRACIÓN DE DOCUMENTOS 29 Personalizar columnas en la vista de detalles Es posible especificar cuáles columnas de información desea apreciar en la vista de detalles. Haga clic en Personalizar detalles... en el menú Ver para invocar el siguiente cuadro de diálogo: Este elemento se resalta. Haga clic en la casilla de verificación de un elemento para seleccionarlo. Resalte un elemento y utilice estas flechas para cambiar el orden de las columnas. Los tamaños de las imágenes se expresan en píxeles. Defina el ancho de un elemento resaltado. Defina cuáles columnas deben aparecer, sus anchos y el orden. En el apartado sobre Personalización de columnas en la vista de detalles de la ayuda en línea se clarifica lo que se presenta en cada columna. Es posible cambiar fácilmente el ancho de las columnas en la vista de detalles; para ello arrastre los separadores de columna en la barra de título. Eliminar páginas de un documento La eliminación de páginas se debe confirmar y se puede deshacer. Suprima la página actual sólo mediante el elemento Eliminar la página actual en el menú Editar. Para suprimir todas las páginas seleccionadas en el Administrador de documentos (en cualquier vista) se debe pulsar la tecla Suprimir o bien usar el comando de menú rápido Borrar. Imprimir un documento Es posible imprimir el documento con el elemento Imprimir en el menú Archivo. Elija si desea imprimir imágenes o texto (es decir, los resultados del reconocimiento tal como aparecen en el Editor de texto). Se pueden impri- 30 INTRODUCCIÓN mir todas las páginas o un rango de páginas. El botón Imprimir en la barra de herramientas Estándar permite imprimir imágenes o texto, dependiendo de si está activa el área de la Imagen original o del Editor de texto. Cerrar un documento Seleccione Cerrar en el menú Archivo para cerrar un documento. Se le solicitará que guarde el documento si no lo ha hecho o bien si lo ha modificado desde la última vez que lo guardó. Consulte la siguiente sección sobre cómo guardarlo como documento de OmniPage (*.opd). También se le solicitará guardar los datos de capacitación que no se hayan guardado si es que seleccionó ‘Interrogar antes de guardar datos de IntelliTrain al cerrar un documento’ en el panel Verificación del cuadro de diálogo Opciones. La frase anterior no se aplica a OmniPage SE. DOCUMENTOS OMNIPAGE El documento de OmniPage es el tipo de archivo original del programa, y que tiene extensión .opd. Es uno de los tipos de archivo ofrecidos al guardar un documento como archivo. Guarde el documento como archivo tipo OPD si desea trabajar con él nuevamente en OmniPage SE durante una sesión futura. Luego puede procesar páginas sin terminar, agregar más páginas y verificar o editar resultados reconocidos. Un documento de OmniPage contiene imágenes de las páginas originales con las zonas que éstas contengan. Tras el reconocimiento, el documento OPD también contendrá los resultados del reconocimiento. Los caracteres reconocidos se almacenan junto con sus datos de coordenadas e índices de certeza. Ello conserva los vínculos entre imagen y texto, de modo que la verificación esté disponible al volver a abrir el documento OPD en sesiones futuras. Al guardar un documento de OmniPage, también se almacenan los parámetros actuales (y la información de capacitación no guardada). Al abrir un documento de OmniPage, se aplican sus parámetros, reemplazando temporalmente los existentes en el programa. DOCUMENTOS OMNIPAGE 31 Por qué guardar el documento como tipo OPD No es necesario guardar los documentos como archivos tipo OPD. Esto se hace normalmente por las siguientes razones: Ž Ž No se puede terminar de trabajar con el documento en la sesión actual. Es necesario pasar el documento a otros usuarios que tienen la versión Omnipage SE o Pro 11. Por ejemplo, se puede pasar un archivo OPD a un especialista para su verificación. En la red de una oficina, se puede contar con un escáner que genere imágenes para reconocimiento y realizar la verificación en diversas estaciones de trabajo. Ž Se desea archivar los documentos reconocidos cuyas imágenes originales continúen siendo accesibles. Los textos reconocidos permiten buscar por palabras clave y otras técnicas de recuperación de documentos. Nota Los resultados del reconocimiento se deben guardar a partir de archivos OPD antes de instalar una actualización de OmniPage. Puede que estos archivos no sean compatibles con las versiones más recientes de los formatos de archivo OPD, o posiblemente sólo se conserven las imágenes al actualizar los archivos. Cómo guardar un archivo en formato OPD Si desea crear un documento OPD, puede guardarlo en este formato desde un comienzo, para fines de protección. Utilice el botón Guardar para irlo guardando periódicamente a medida que vaya trabajando. Guárdelo nuevamente al final de la sesión. El botón Guardar permite grabar el documento con el mismo nombre y tipo de archivo que tenía la última vez que se almacenó. Se puede guardar el documento varias veces en diferentes formatos. Si lo almacenó la primera vez en otro formato (por ejemplo .DOC), utilice el elemento Guardar como... en el menú Archivo para guardarlo como OPD. Si un documento se guarda como OPD, y luego lo guarda con otro formato, no se volverá a almacenar automáticamente como OPD. Al cerrar el documento o salir del programa, se le solicitará guardar el documento como OPD. 32 INTRODUCCIÓN PARÁMETROS El cuadro de diálogo Opciones es la ubicación central para los parámetros de OmniPage SE. Tiene siete paneles. La ayuda contextual proporciona información sobre cada parámetro. En general, los paneles de parámetros son los siguientes: OCR Utilice este último para especificar el idioma o idiomas de reconocimiento, el diccionario del usuario, un carácter de rechazo, un método de OCR (optimícelo para mayor velocidad o precisión) y la coincidencia de fuentes. Escáner Utilice esta opción para definir el tamaño de página y la orientación de exploración. También se pueden fijar ajustes de brillo y contraste, y definir opciones para explorar documentos de varias páginas, sin importar si se cuenta o no con un alimentador automático de documentos (ADF). Es posible cambiar los parámetros de configuración del escáner, instalar un nuevo escáner, o bien cambiar el escáner predeterminado. Direct OCR™ Esta característica proporciona servicios de OCR directamente desde su procesador de texto favorito u otra aplicación similar. Utilice este panel para registrar y eliminar el registro de las aplicaciones para Direct OCR, así como para habilitar o inhabilitar este servicio. También se puede especificar la separación de zonas automática o manual y si se desea o no la verificación. PARÁMETROS 33 Proceso Utilice esta opción para definir dónde se colocarán nuevas imágenes en el documento y para fijar otras preferencias que regirán el procesamiento. Aquí también se puede cambiar el idioma de la interfaz. Verificación Utilice esta opción para definir si la verificación debe comenzar automáticamente tras el reconocimiento. Defina también si se debe ejecutar IntelliTrain, y utilícela para cargar o trabajar con un archivo de capacitación. Encontrará más detalles en la sección Verificación de los resultados de OCR del capítulo 4. Las referencias a la función IntelliTrain no se aplican a OmniPage SE. Diseño personalizado Utilice esta opción para describir en forma precisa el diseño de las páginas del documento de entrada. Esto permite el máximo control sobre el proceso de separación automática de zonas, indicándole que busque o ignore las columnas, gráficos y tablas. Editor de texto Utilice esta opción para mostrar u ocultar ciertas características en el Editor de texto, para definir la unidad de medición que se va a utilizar y para activar o desactivar la acomodación de texto. Nota Algunos parámetros surten efecto sólo en el reconocimiento futuro. Se pueden citar como ejemplos los idiomas de reconocimiento, un archivo de capacitación y el brillo del escáner. Estos parámetros se deben ajustar correctamente antes de comenzar el procesamiento. Para aplicar los cambios en estos parámetros a páginas ya reconocidas, se deberá volver a reconocerlas. Los demás parámetros surten efecto inmediatamente en todas las páginas existentes. Ello ocurre por ejemplo con parámetros del Editor de texto tales como la acomodación de texto y las unidades de medición. 34 INTRODUCCIÓN 3 Tutorial: Procesamiento de documentos En este capítulo se describen diferentes formas en que se puede procesar un documento, y además se proporciona información acerca de los aspectos fundamentales de estos tipos de procesamiento. u u u u u u Guía de inicio rápido Procesamiento de documentos utilizando el Asistente de OCR Procesamiento automático de documentos Procesamiento manual de documentos Procesamiento automático de un documento y terminación manual Procesamiento a partir de otras aplicaciones (Direct OCR, PaperPort) u Procesamiento de documentos con Programar OCR Los temas detallados son: u u u u u Definición del origen de imágenes de las páginas Descripción del diseño del documento Separación manual de zonas Cuadrículas de tablas en la imagen Uso de plantillas de zonas OMNIPAGE SE MANUAL DEL USUARIO 35 GUÍA DE INICIO RÁPIDO Esta sección muestra paso a paso el proceso básico de OCR. Carga y reconocimiento de archivos de imágenes de ejemplo Encontrará ejemplos de archivos de imágenes en la carpeta del programa, tanto archivos de una página como de varias páginas. Primero intente leer estos archivos utilizando el procedimiento que se indica a continuación, pero ignorando las referencias al escáner. En la sección Entrada desde archivos de imagen encontrará más información sobre la obtención de imágenes. Los resultados le proporcionarán un parámetro sobre la calidad del reconocimiento que puede esperar a partir de sus propios archivos de calidad similar. A continuación, intente explorar una página con su escáner. Exploración y reconocimiento de una sola página Encienda el escáner y cerciórese de que funciona correctamente. Seleccione una página con texto nítido de buena calidad para esta prueba. Se da por sentado que se fijaron los parámetros predeterminados de OmniPage SE y que el documento está en el idioma que se especificó para la interfaz durante la instalación. Abra el cuadro de diálogo Opciones en el menú Herramientas y elija la opción Predeterminados si no está utilizando el programa por primera vez. Procesará el documento en forma automática y se guardarán los resultados de reconocimiento en un archivo. Podrá verificar el documento pero no editar el contenido en el Editor de texto de OmniPage SE. 36 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS Acción Resultado 1. Configure el escáner utilizando el Asistente del escáner, si aún no lo ha hecho. Configura OmniPage SE para que funcione con su escáner. 2. Seleccione InicioÉProgramasÉScanSoft OmniPage SE É OmniPage SE Abre OmniPage SE en su equipo. 3. Coloque el documento correctamente en el escáner. 4. Revise los tres botones de ficha a la izquierda de la Caja de herramientas de OmniPro. El botón AutoOCR debe estar seleccionado. De no ser así, haca clic en él. Especifica que desea que OmniPage SE procese el documento automáticamente según los parámetros fijados. 5. En el menú desplegable Obtener página, seleccione una opción de exploración para el documento: blanco y negro, escala de grises o color. Permite determinar la forma en que se verán las imágenes, texto de color y fondos en el documento exportado. La exploración en colores necesita un escáner en color. 6. En el menú desplegable Describir el original, verifique que esté seleccionada la opción Automático. Esta es la mejor opción para procesar una gran variedad de documentos. Configura OmniPage SE para que coloque zonas en la página y decide sus propiedades en forma automática. 7. En el menú desplegable Exportar resultados, verifique que esté seleccionada la opción Guardar como archivo. Esto significa que podrá nombrar el archivo de exportación tras haber verificado el documento. 8. Haga clic en Iniciar. OmniPage SE comenzará a explorar el documento. 9. Aparecerá el Verificador de OCR y le solicitará modificar los términos que el programa sospeche que no se han reconocido correctamente. El Verificador de OCR funciona como el corrector ortográfico de un procesador de texto, pero además contiene ciertas características específicas de OCR. 10. Haga clic en el Editor de texto. Seleccione las vistas del Editor de texto una tras otra, para ver el aspecto que tendrá la página en cada una de ellas. Elija la vista que desee para la exportación. Cada vista del Editor de texto define un nivel de formato. La vista fijada al momento de guardar el documento se aplica al texto en el archivo guardado. 11. Haga clic en Continuar para reiniciar la verificación. Cuando aparezca el mensaje La verificación del reconocimiento está completa, haga clic en Aceptar. Con esto termina el proceso del Verificador de OCR. Aparecerá el cuadro de diálogo Guardar como. 12. Elija la ubicación y el tipo de archivo para guardar el documento reconocido. Haga clic en Aceptar. De forma predeterminada, está activada la opción Guardar e iniciar, de modo que el documento se abrirá automáticamente en el procesador de texto asociado con el tipo de archivo que seleccione. 13. Revise el documento en el procesador de texto. Ha utilizado satisfactoriamente OmniPage SE para reconocer el documento y abrirlo en la aplicación de destino GUÍA DE INICIO RÁPIDO 37 Consejo Si obtuvo resultados satisfactorios a partir de los archivos de imágenes de ejemplo, pero no con una página explorada, revise la instalación y parámetros del escáner: en especial el brillo y la resolución de la imagen. En la sección Entrada desde escáner encontrará un modelo de brillo óptimo. Consulte también los temas de la ayuda en línea sobre Configuración del escáner y Resolución de problemas del escáner. A continuación aparece un resumen de los métodos de procesamiento que se pueden utilizar. En las siguientes páginas, encontrará una guía detallada para cada uno de ellos. Uso del Asistente de OCR El Asistente de OCR le guiará a través de la selección de parámetros y comandos mediante una serie de preguntas. Luego iniciará el procesamiento automático. Esta es una buena manera de comenzar si aún no tiene mucha experiencia en el uso de OmniPage SE. Automáticamente La manera más rápida y sencilla de procesar documentos es dejar que OmniPage SE lo haga automáticamente. Seleccione los parámetros en el cuadro de diálogo Opciones y los comandos en la barra de herramientas AutoOCR y luego haga clic en Iniciar. El programa procesará cada página por todo el procedimiento de principio a fin, efectuando pasos en paralelo cada vez que sea posible. Generalmente separará de manera automática las zonas de las páginas. Manualmente El procesamiento manual le brinda un control más preciso sobre la forma de manipulación de las páginas. Podrá procesar el documento página por página con diferentes parámetros para cada una de ellas. El programa también se detiene entre paso y paso: obtención de imágenes, reconocimiento, exportación. Esto permite, por ejemplo, dibujar zonas manualmente o cambiar el idioma o idiomas de reconocimiento. Para iniciar cada paso, se debe hacer clic en los botones de la barra de herramientas OCR manual. Automáticamente con terminación manual Podrá procesar un documento automáticamente y ver los resultados en el Editor de texto. Si la mayoría de las páginas están en orden, pero algunas no quedaron como se esperaba, podrá pasar al procesamiento manual para ajustar los parámetros y efectuar el reconocimiento sólo de las páginas problemáticas. 38 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS En otras aplicaciones Podrá usar la característica Direct OCR para recurrir a los servicio de reconocimiento de OmniPage SE mientras trabaja en su procesador de texto usual u otra aplicación similar. OmniPage SE se vincula automáticamente con los programas de administración de documentos PaperPort y Pagis de ScanSoft. Posteriormente Podrá programar trabajos de OCR para que se efectúen posteriormente de manera automática, incluso sin que sea necesaria su presencia ante el equipo. El Asistente para Programar OCR permite especificar los parámetros y una hora de inicio. PROCESAMIENTO DE DOCUMENTOS UTILIZANDO EL ASISTENTE DE OCR El Asistente de OCR le lleva por los seis paneles de parámetros para ayudarle a fijar los parámetros del documento, y luego inicia el procesamiento automático. Existe ayuda contextual en todos los paneles del asistente. El Asistente de OCR puede funcionar solamente cuando no haya un documento abierto con OmniPage SE. Haga clic en la ficha Asistente de OCR en la Caja de herramientas de OmniPage y luego en el botón del asistente para ver su primera pantalla: PROCESAMIENTO DE DOCUMENTOS UTILIZANDO EL ASISTENTE DE OC R 39 1. El primer panel permite definir el origen del documento: escáner o archivo de imagen. Encontrará más información en la sección Definición del origen de imágenes de las páginas. Responda a las preguntas de la primera pantalla y haga clic en Siguiente. 2. El segundo panel le solicita que describa el diseño del documento de entrada, para ayudarle en la separación automática de zonas. Encontrará más información en la sección Descripción del diseño del documento. 3. El tercer panel (que aparece a continuación) permite definir los idiomas de reconocimiento y decidir el método de OCR. Los idiomas que cuenten con diccionario tienen el icono . 4. El cuarto panel permite definir el nivel de formato que se aplicará al documento para su presentación y exportación. En el capítulo 4, Pantalla y vistas del editor, encontrará más información al respecto. 5. El quinto panel le pregunta si desea verificar el texto antes de exportarlo. Si elige Sí también podrá editar el texto antes de guardar el documento. También podrá decidir si desea crear y utilizar datos de IntelliTrain durante la verificación. En el capítulo 4,Verificación de los resultados de OCR, encontrará más información al respecto. La referencia a la función IntelliTrain no se aplica a OmniPage SE. 6. El último panel le solicita que defina la alternativa de exportación: guardar en un archivo o copiar al Portapapeles. Tras fijar la opción, haga 40 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS clic en Terminar para cerrar el asistente y comenzar el procesamiento automático. 7. Si solicitó verificar y el texto contiene caracteres dudosos, aparecerá el cuadro de diálogo OCR Proofreader™. Cuando haya concluido la verificación, los resultados del reconocimiento irán directamente al Portapapeles, o bien se abrirá el cuadro de diálogo Guardar como para que se puedan especificar los parámetros de exportación de archivos. 8. El documento permanece en OmniPage SE. Podrá editar los resultados del reconocimiento y volver a guardarlos en otros formatos. Podrá cambiar las zonas manualmente o bien modificar otros parámetros y luego utilizar el procesamiento manual para reconocer páginas independientes del documento. También podrá agregar páginas mediante el procesamiento automático o manual. Nota Los paneles del asistente presentan los parámetros tal como estaban la última vez que se modificaron en el programa. Además, OmniPage SE recordará los parámetros que se configuren en los paneles del Asistente de OCR y los aplicará a los procesamientos futuros, ya sean automáticos o manuales, hasta que los vuelva a cambiar. De modo que si tiene más documentos para los cuales sean adecuados los parámetros del Asistente de OCR, basta con cambiar a la barra de herramientas AutoOCR y hacer clic en Iniciar. Nota Los parámetros pertinentes que no ofrece el Asistente de OCR adoptan los valores que se fijaron la última vez en el programa. Esto concierne principalmente a los parámetros del escáner, un diccionario del usuario o un archivo de capacitación. No es posible usar plantillas de zonas con el Asistente de OCR. Si al iniciarse el Asistente de OCR se estableció un archivo de plantilla, éste se descargará y se fijará la opción Automático como descripción de entrada. No es posible exportar un documento reconocido adjunto a un mensaje de correo electrónico. En ese caso, utilice el procesamiento automático o manual. PROCESAMIENTO DE DOCUMENTOS UTILIZANDO EL ASISTENTE DE OC R 41 PROCESAMIENTO AUTOMÁTICO DE DOCUMENTOS El procesamiento automático constituye una manera eficiente de manipular documentos, especialmente aquéllos de gran tamaño. Primero seleccione todos los parámetros necesarios, luego podrá usar la barra de herramientas AutoOCR™ de la Caja de herramientas de OmniPage para procesar un nuevo documento de principio a fin, o bien reiniciar y terminar el procesamiento de un documento abierto. 1. Haga clic en la ficha AutoOCR de la Caja de herramientas de OmniPage para ver la barra de herramientas AutoOCR. 2. Seleccione en la lista desplegable el comando deseado de Obtener página. Podrá definir el origen del documento, el cual puede provenir de archivos de imágenes o un escáner. Encontrará más detalles en la sección Definición del origen de imágenes de las páginas. 3. Seleccione un comando de la lista desplegable Describir el original, tal como se indicó anteriormente. Esto guía el programa para la separación automática de zonas de las páginas. Podrá describir las páginas entrantes o especificar un archivo de plantilla de zonas. Encontrará más información acerca de las opciones en la sección Descripción del diseño del documento. 4. Seleccione un comando de la lista desplegable Exportar resultados. Podrá guardar el documento reconocido en un archivo, copiarlo al Portapapeles o bien enviarlo adjunto a un mensaje de correo electrónico. En el capítulo 5 encontrará información acerca de estas alternativas. 5. Elija Opciones en el menú Herramientas y compruebe que los parámetros son adecuados para su documento. Es posible, por ejemplo, especificar los idiomas de reconocimiento y si desea verificar o no el documento. Consulte la sección Parámetros al final del capítulo 2. 42 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS 6. Haga clic en Iniciar o bien seleccione Inicio en el menú Proceso. Cada página del documento se procesará y terminará una tras otra. El programa puede efectuar tareas individualmente, por ejemplo puede iniciar la carga y reconocimiento de una nueva página a medida que vaya verificando la página anterior. Botones de comandos Iniciar: permite comenzar el procesamiento automático de un nuevo documento. Detener: permite interrumpir el procesamiento automático. Le convendrá hacer esto si encuentra que se deben cambiar algunos parámetros. Luego el botón Iniciar cambia a Terminar. El botón de inicio adopta diferentes valores cuando el procesamiento se detiene o termina. Terminar: este botón aparece si el procesamiento está incompleto. Permite: u Terminar de procesar páginas inconclusas. u Exportar el documento, ignorando las páginas no reconocidas. Adicional: este botón aparece si todas las páginas existentes se procesaron y se exportaron una vez. Permite: u Exportar el documento nuevamente, tal vez con cambios, a otro tipo, nombre o ubicación de archivo, o bien con otro nivel de formato. u Agregar más páginas del mismo origen o de otro, con parámetros cambiados o intactos. u Volver a procesar todas las páginas: desecha todos los resultados de reconocimiento y reconoce todas las páginas del documento con parámetros distintos. Podrá especificar la separación automática de zonas o un archivo de plantilla. Consejo Podrá volver a procesar todas las páginas si un parámetro no adecuado provocó resultados deficientes en todas las páginas. Un ejemplo es la elección del idioma incorrecto, lo que puede hacer que aparezcan casi todos los caracteres marcados como dudosos durante la verificación. La opción de ‘volver a procesar’ permite efectuar nuevamente el reconocimiento sin tener que explorar, cargar ni efectuar nuevamente la separación de zonas de todas las imágenes. PROCESAMIENTO AUTOMÁTICO DE DOCUMENTOS 43 PROCESAMIENTO MANUAL DE DOCUMENTOS El procesamiento manual le brinda un control más preciso sobre la forma de manipular las páginas. Podrá procesar el documento página por página con diferentes parámetros para cada una de ellas. El programa también se detiene entre paso y paso: obtención de imágenes, reconocimiento, exportación. Esto permite, por ejemplo, dibujar zonas manualmente en cada página. Para iniciar cada paso del proceso, deberá clic en los botones de la barra de herramientas OCR manual. 1. Haga clic en la ficha OCR manual en la Caja de herramientas de OmniPage para ver la barra de herramientas OCR manual. 2. Haga clic en la barra de herramientas Estándar o en Opciones en el menú Herramientas para marcar o seleccionar los parámetros del cuadro de diálogo Opciones. Consulte la sección Parámetros al final del capítulo 2. 3. Seleccione el valor deseado para el botón Obtener página. Podrá definir el origen del documento, el cual puede provenir de archivos de imágenes o de un escáner. Acceda al cuadro de diálogo con los parámetros del escáner y modifíquelos según desee. Encontrará más detalles en la sección Definición del origen de imágenes de las páginas. 4. Haga clic en el botón Obtener página. Esto invoca el cuadro de diálogo Cargar archivo, permitiéndole nombrar archivos de imágenes, o bien inicia la exploración. Como resultado de lo anterior, aparecen una o más imágenes en el Administrador de documentos, y una en el área Imagen original. 44 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS 5. Ahora podrá dibujar manualmente y modificar zonas en una o más imágenes y asignar propiedades. Los botones de la barra de estado permiten pasar a otras páginas. Al solicitarse el reconocimiento, se efectuará la separación automática de zonas a todas las imágenes que no las tengan. En la sección Separación manual de zonas encontrará más detalles al respecto. 6. Seleccione un valor para el botón Realizar OCR. Podrá describir el diseño de las páginas entrantes. Este valor influye si la separación automática de zonas se efectúa en un número determinado de páginas. También se puede seleccionar una plantilla para colocar sus zonas en la página actual. Encontrará más detalles en las secciones Descripción del diseño del documento y Uso de plantillas de zonas. 7. Haga clic en el botón Realizar OCR para reconocer la página actual. Para reorganizar las páginas seleccionadas, haga una selección múltiple en el Administrador de documentos (consulte el capítulo 2, Administración de documentos) y luego haga clic en el botón Realizar OCR. 8. Aparecerá el cuadro de diálogo Instrucciones de separación de zonas, a menos que lo haya desactivado. Cuando elija una de sus opciones, comenzará el reconocimiento. 9. Si solicitó verificación, el cuadro de diálogo Verificador de OCR mostrará los caracteres dudosos uno tras otro en la página o páginas reconocidas. Podrá verificar y editar el texto reconocido. Consulte el capítulo 4, Verificación de los resultados de OCR. 10. Continúe cargando páginas, efectuando el OCR, editando y verificando según desee. PROCESAMIENTO MANUAL DE DOCUMENTOS 45 11. Seleccione un valor para el botón Exportar resultados. Podrá guardar el documento reconocido en un archivo (también como un documento de OmniPage), copiarlo al Portapapeles, o bien enviarlo adjunto a un mensaje de correo electrónico. Podrá guardar el documento más de una vez. Encontrará más información en el capítulo 5. Nota Si anula la selección de ‘Buscar zonas además de zonas de plantilla/ actuales’ en el panel Proceso del cuadro de diálogo Opciones, no aparecerá el cuadro de diálogo Instrucciones de separación de zonas y el reconocimiento siempre se efectuará sólo con las zonas actuales. PROCESAMIENTO AUTOMÁTICO DE UN DOCUMENTO Y TERMINACIÓN MANUAL Cuando tenga un documento de gran tamaño que contenga sólo algunas páginas a las que se deba prestar especial atención, no es necesario procesar manualmente todo el documento. Podrá procesarlo automáticamente y ver los resultados en el Editor de texto. Luego podrá determinar qué páginas están en orden, y cuáles necesitan parámetros diferentes o separación manual de zonas. Finalmente podrá pasar al procesamiento manual para ajustar los parámetros y zonas, y luego volver a efectuar el reconocimiento de sólo esas páginas. 1. Prepare el documento y efectúe el procesamiento automático, tal como ya se describió. 2. Si cierra o termina la verificación, se le solicitará que guarde el documento. Esto es lo que se recomienda hacer, aun cuando no sea su forma final. 3. Seleccione una página que necesite parámetros distintos o una nueva separación de zonas, y haga clic en la ficha OCR manual a la izquierda de la Caja de herramientas de OmniPage. 4. Elimine o modifique las zonas existentes en el área Imagen original. También podrá cargar una plantilla para dejar que sus zonas reemplacen 46 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS las existentes. Dibuje nuevas zonas según desee. Consulte la sección Separación manual de zonas. 5. Cambie otros parámetros según sea necesario para la página actual. Consulte la sección Parámetros al final del capítulo 2. 6. Haga clic en el botón Realizar OCR para volver a reconocer la página actual. Confirme que se deben sobreescribir los resultados del reconocimiento anterior. Aparecerá al cuadro de diálogo Instrucciones de separación de zonas, a menos que lo haya desactivado. 7. Para volver a efectuar el reconocimiento de más de una página, seleccione las páginas necesarias en el Administrador de documentos antes de hacer clic en el botón Realizar OCR. 8. Cuando haya vuelto a reconocer todas las páginas con resultados aceptables, guarde el documento nuevamente. PROCESAMIENTO A PARTIR DE OTRAS APLICACIONES Puede usar la característica Direct OCR para recurrir a los servicios de reconocimiento de OmniPage SE mientras trabaja en su procesador de texto usual u otra aplicación similar. Primero se debe establecer la conexión directa con la aplicación. Luego, dos elementos del menú Archivo dan paso a las funciones de OCR. Cómo configurar Direct OCR 1. Inicie la aplicación que quiere conectar a OmniPage SE. Inicie OmniPage SE, abra el cuadro de diálogo Opciones en el panel Direct OCR y seleccione ‘Activar Direct OCR’. 2. Aparece el panel Sin registrar que muestra las aplicaciones registradas anteriormente o en ejecución. Seleccione las que desee y haga clic en Agregar. Podrá examinar en busca de una aplicación que no aparezca en la lista. Seleccione las opciones de proceso según desee, para que funcionen según sus preferencias. PROCESAMIENTO A PARTIR DE OTRAS APLICACIONES 47 Cómo usar Direct OCR 1. Abra la aplicación registrada y trabaje en un documento. Para obtener resultados de reconocimiento a partir de páginas exploradas, colóquelas correctamente en el escáner. 2. Utilice el elemento de menú Obtener parámetros del texto... del menú Archivo para especificar los parámetros que se utilizarán durante el reconocimiento. Los parámetros que no se presenten, adoptan sus valores según los últimos que se utilizaron con OmniPage SE. Los parámetros cambiados para Direct OCR se cambian también en OmniPage SE. 3. Utilice el elemento de menú Obtener texto del menú Archivo para obtener imágenes provenientes del escáner o archivo. 4. Si seleccionó ‘Zonas automáticas’ en el panel Direct OCR del cuadro de diálogo Opciones, o bien en Obtener parámetros del texto..., el reconocimiento se efectuará de inmediato. 5. Si no seleccionó ‘Zonas automáticas’, se presentará la imagen de cada página, permitiéndole dibujar zonas manualmente. Haga clic en el botón Realizar OCR para comenzar el reconocimiento. 6. Si se especificó la verificación, ésta se llevará a cabo tras el reconocimiento. Luego el texto reconocido se colocará en la posición del cursor en la aplicación, con el nivel de formato especificado en Obtener parámetros del texto... . Nota Si se está ejecutando OmniPage SE al momento de invocar Direct OCR desde una aplicación de destino, se iniciará una segunda instancia de OmniPage SE. 48 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS Cómo usar OmniPage SE con el software PaperPort PaperPort® es un software de ScanSoft para la administración de documentos. Permite vincular páginas con aplicaciones afines. Las páginas pueden contener imágenes, texto o ambas cosas. Si PaperPort se encuentra instalado en un equipo en el momento de instalar OmniPage SE, sus servicios de OCR quedarán disponibles y ampliarán la capacidad de PaperPort. Podrá elegir un programa de OCR haciendo clic con el botón derecho del ratón en un enlace de PaperPort para aplicaciones de texto, seleccionando Preferencias y luego OmniPage SE como paquete de OCR. Los parámetros de OCR se pueden especificar, tal como en el caso de Direct OCR. : Aquí se ha seleccionado OmniPage SE como el paquete de OCR para MS Word 2000. Ahora puede arrastrar imágenes de páginas desde el escritorio de PaperPort al vínculo de MS Word en PaperPort. Mientras se reconoce el texto, sólo aparecerá un monitor indicando el progreso de dicho procedimiento. Si se solicita, aparecerán la ventana de separación manual de zonas de OmniPage SE o la función de verificación. Los resultados de reconocimiento se colocan en un nuevo documento sin nombre en la aplicación de destino. PROCESAMIENTO A PARTIR DE OTRAS APLICACIONES 49 PROCESAMIENTO DE DOCUMENTOS CON PROGRAMAR OCR Podrá programar trabajos de OCR para que se efectúen automáticamente en cualquier momento dentro de las próximas 24 horas. En cada trabajo se procesa un documento. Las páginas del documento pueden provenir de archivos de imágenes o bien de un escáner con alimentador automático de documentos. No es necesario estar frente a al ordenador en el momento de iniciar el trabajo, ni tampoco que OmniPage SE esté en funcionamiento. No importa si su equipo se apaga después de configurar el trabajo, siempre y cuando esté funcionando a la hora de inicio. Si se han de explorar páginas, el escáner debe estar funcionando en el momento de iniciar el trabajo, con las páginas cargadas en el alimentador automático de documentos. A continuación se indica cómo configurar un trabajo: 1. Haga clic en Programar OCR en el menú Proceso o en el menú Inicio de Windows: seleccione ProgramasÉScanSoftÉOmniPage SEÉ Programar OCR. 2. Aparecerá el cuadro de diálogo Programar OCR. Haga clic en Agregar trabajo... a fin de invocar el Asistente para Agregar trabajo. El programa le guiará por seis paneles, similares al Asistente de OCR. 3. En el primer panel podrá definir el origen de la imagen. Una característica adicional le permite procesar todos los archivos de imagen compatibles en una carpeta definida. 4. Los siguientes tres paneles son similares a los del Asistente de OCR, pero también podrá especificar un diccionario del usuario. OmniPage Pro 11 permite especificar un archivo de capacitación y ejecutar la función IntelliTrain. Estas posibilidades no existen en OmniPage SE. 5. El quinto panel permite especificar el nombre, tipo y ubicación de un archivo de exportación y una opción de separación para dicho archivo. 6. El último panel permite definir la hora de inicio del trabajo, mantener o eliminar los archivos de entrada tras el procesamiento, y especificar el uso de un archivo de registro para indicar la finalización del trabajo y los problemas que se hayan presentado. Haga clic en Terminar para cerrar el asistente. 50 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS Nota El cuadro de diálogo Programar OCR enumera cada trabajo e indica si su estado es Esperando, Ejecución, Error o Completo. Utilice la opción Modificar trabajo... para cambiar los parámetros de un trabajo en espera. Podrá modificar y volver a utilizar los trabajos terminados para procesar nuevos trabajos que necesiten parámetros similares. También podrá eliminar los trabajos finalizados cuando ya no los necesite. Encontrará más información en la sección sobre Programación de OCR en la ayuda en línea. DEFINICIÓN DEL ORIGEN DE IMÁGENES DE LAS PÁGINAS Hay dos posibles orígenes de imágenes: desde archivos de imágenes y desde un escáner. Existen dos tipos principales de escáneres: plano o con alimentación de hojas. Un escáner puede tener un alimentador automático de documentos incorporado o agregado, el cual facilita la exploración de documentos con varias páginas. Las imágenes de los documentos explorados se pueden introducir directamente en OmniPage SE o bien guardar con el propio software del escáner en un archivo de imagen, que se puede abrir posteriormente con OmniPage SE. Entrada desde archivos de imagen Podrá crear archivos de imágenes con su propio escáner, o recibirlos por correo electrónico o como archivos de fax. OmniPage SE puede abrir una gran variedad de tipos de archivos de imagen; en el capítulo 6 encontrará una lista de ellos, Tipos de archivos para abrir y guardar imágenes. Los archivos de imagen se especifican en el cuadro de diálogo Cargar archivo, el cual aparece al iniciar el procesamiento automático. En el procesamiento manual, haga clic en el botón Cargar archivo o bien use el menú Proceso. En la parte inferior del cuadro de diálogo aparecerán los parámetros avanzados, los cuales se pueden dejar a la vista u ocultar. A continuación aparece su aspecto. DEFINICIÓN DEL ORIGEN DE IMÁGENES DE LAS PÁGINAS 51 Haga clic mientras pulsa la tecla Mayús o bien la tecla Ctrl a fin de colocar más de un archivo en el cuadro de texto Nombre de archivo. Ésta es la carpeta actual. Especifique el tipo o tipos de archivo que desea ver. Haga clic en Avanzadas para abrir el panel inferior y en Básicas para cerrarlo. Esto se puede usar para archivos TIFF y DCX de varias páginas. Utilice esta opción para agregar individualmente archivos de carpetas diferentes y controlar de manera precisa el orden de los archivos. Este es un archivo de imagen en blanco para la opción de guardar: "Archivo nuevo después de cada página en blanco". Normalmente el botón Agregar coloca cada archivo en la parte inferior de la lista de archivos. Para colocar un archivo en alguna otra posición, resalte el archivo en la lista. El nuevo archivo se agregará justo a continuación del archivo resaltado que esté más abajo. Entrada desde escáner Se debe contar con un escáner en buen estado, compatible e instalado correctamente con OmniPage SE. Consulte Configuración del escáner con OmniPage SE en el capítulo 1. Se ofrecen varios modos de exploración. Al elegir uno, se deben considerar dos aspectos fundamentales: u El tipo de salida que se desea para el documento de exportación u El modo que proporcionará la mayor exactitud de OCR Explorar en blanco y negro Seleccione esta opción para explorar en blanco y negro. Esta opción no es la más idónea si desea color en el documento de salida, ni tampoco si desea que las imágenes tengan un aspecto similar al de fotografías “en blanco y negro”: en ese caso se recomienda la exploración en escala de grises. Para una mayor exactitud de OCR, utilice esta opción para texto oscuro nítido o sobre un fondo blanco o pálido. Las imágenes en blanco y negro se pueden explorar y manipular más rápidamente que las demás y ocupan menos espacio de disco. 52 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS Explorar en escala de grises Seleccione esta opción para usar la exploración en escala de grises. Elija esta opción para conservar fotografías “blanco y negro” en el documento de salida. Para una mayor exactitud de OCR, utilice esta opción en páginas con contraste variable o bajo (donde no haya mucha diferencia entre tonos claros y oscuros) y con el texto sobre fondos de color o sombreados. Explorar en color Seleccione esta opción para explorar en color. Sólo está disponible para escáneres a color. Elija esta opción si desea obtener gráficos, texto o fondos en color en el documento de salida. Para mayor exactitud de OCR, esta opción no ofrece mayores beneficios que la escala de grises (para una resolución determinada), pero exigirá mucho más tiempo, recursos de memoria y espacio de disco. Brillo y contraste Los parámetros correctos de brillo y contraste juegan un importante papel en la exactitud de OCR. Fije estos parámetros en el panel Escáner del cuadro de diálogo Opciones. El diagrama ilustra un ajuste óptimo de brillo. Tras cargar una imagen, revise su aspecto. Si los caracteres son gruesos y se superponen, aclare el brillo. Si los caracteres son finos y difusos, oscurezca el brillo. Luego vuelva a explorar la página. Deficiente Tolerable Buena Óptima Buena Tolerable Deficiente DEFINICIÓN DEL ORIGEN DE IMÁGENES DE LAS PÁGINAS 53 Exploración con un alimentador automático de documentos La mejor manera de explorar documentos de varias páginas es con un alimentador automático de documentos. Basta con cargar las páginas en el orden correcto en el alimentador. Coloque las páginas en blanco si desea guardar su documento en varios archivos de salida, utilizando la opción ‘Crear un archivo nuevo después de cada página en blanco’. Consulte Guardar en un archivo en el capítulo 5. Si tiene un documento que supere la capacidad del alimentador automático de documentos, seleccione ‘Pedir automáticamente más páginas’ en el panel Proceso del cuadro de diálogo Opciones. Luego un cuadro de diálogo le permitirá agregar más lotes de páginas e indicar cuando se hayan explorado todas las páginas. Podrá explorar documentos por ambas caras con un alimentador automático de documentos. Un escáner dúplex administrará esta función de manera automática. Para los escáneres sencillos, seleccione la opción ‘Explorar páginas de dos caras’ en el panel Escáner del cuadro de diálogo Opciones. Luego podrá explorar el documento en apenas algunas pasadas, agrupando las páginas pares e impares. OmniPage SE fusionará las páginas de manera automática. Explorar documentos extensos sin un alimentador automático de documentos También es posible explorar eficazmente documentos de varias páginas en un escáner plano, incluso sin contar con un alimentador automático de documentos. Seleccione la opción ‘Explorar páginas automáticamente’ en el panel Escáner del cuadro de diálogo Opciones y defina un valor de pausa en segundos. Luego el escáner efectuará las pasadas de exploración de manera automática, haciendo pausas entre cada exploración según el número de segundos que usted haya definido, lo que le dará tiempo de colocar la página siguiente. Un cuadro de diálogo le permitirá terminar la pausa antes o bien solicitar una pausa más prolongada y especificar cuándo explorar la última página. 54 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS DESCRIPCIÓN DEL DISEÑO DEL DOCUMENTO Antes del reconocimiento se le solicitará que describa el diseño de las páginas entrantes para ayudar al proceso de separación automática de zonas. Cuando utilice el Asistente de OCR, siempre se ejecutará la separación automática de zonas. Cuando efectúe el procesamiento automático, siempre se ejecutará la separación automática de zonas a menos que se especifique la utilización de una plantilla propia. Cuando efectúe el procesamiento manual, a menudo se ejecutará la separación automática de zonas. Encontrará más detalles en la ayuda en línea. A continuación aparecen las opciones de descripción de entradas: Automático Elija esta opción para que el programa tome todas las decisiones de separación automática de zonas. El programa decide si el texto está o no en columnas, si un elemento es un gráfico o texto que se reconocerá y si se deben colocar tablas o no. Elija Automático si el documento contiene páginas con diseños distintos o desconocidos. Elija esta opción para una página con varias columnas y una tabla, y para páginas que tengan más de una tabla. Columna única, sin tabla Elija este parámetro si las páginas contienen sólo una columna de texto, pero no una tabla. Las cartas comerciales o páginas de un libro normalmente tienen estas características. Elija esta opción también para una página con palabras o números dispuestos en columnas si no desea que éstos se coloquen en una tabla, que se pierdan las columnas o dejarlos como columnas independientes. Es posible detectar gráficos. Varias columnas, sin tabla Escoja esta opción si algunas de las páginas contienen texto en columnas y desea hacer desaparecer las columnas o bien conservarlas en columnas independientes, similares al diseño original. Las columnas se pueden conservar en el documento de salida, ya sea con marcos (si está activada la vista True Page) o sin ellos (si está activada la vista Mantener flujo de columnas). Si hay datos tabulados, es probable que se traten como texto de corrido. Es posible detectar gráficos. Columna única, con tabla Elija esta opción si la página contiene sólo una columna de texto y una tabla. La separación automática de zonas no buscará columnas pero tratará de buscar una tabla y colocarla en una cuadrícula en el Editor de texto. Posteriormente se puede especificar si desea exportarla en una cuadrícula o como columnas de texto separadas por tabulaciones. Es posible detectar gráficos. DESCRIPCIÓN DEL DISEÑO DEL DOCUMENTO 55 Hoja de cálculo Elija esta opción si desea que toda la hoja quede convertida en una tabla que se exportará a un programa de hojas de cálculo, o tratarla como una sola tabla. No se detectará flujo de texto ni zonas de gráficos. Personalizado Elija esta opción para tener el máximo control sobre la separación automática de zonas. Podrá evitar o estimular la detección de columnas, gráficos y tablas. Fije los parámetros en el panel Diseño personalizado del cuadro de diálogo Opciones. Plantilla Elija un archivo de plantilla de zonas si desea aplicar sus zonas y propiedades a todas las páginas obtenidas de aquí en adelante. En el procesamiento manual las zonas de plantillas también se aplican a la página actual, reemplazando las zonas existentes. Se permiten otras zonas además de las zonas de plantillas. Encontrará más detalles en la sección Uso de plantillas de zonas. Si la separación automática de zonas produjo resultados de reconocimiento inesperados, utilice el procesamiento manual para volver a efectuar la separación de zonas en páginas individuales y llevar a cabo nuevamente su reconocimiento. SEPARACIÓN MANUAL DE ZONAS Las zonas definen las áreas de la página que se ha de procesar. Las zonas son rectangulares o irregulares (con lados formados por líneas verticales y horizontales). Las zonas no se pueden superponer. Tienen un número de zona en la esquina superior izquierda y un icono para indicar el tipo de zona en la parte superior derecha. Haga clic en una zona para seleccionarla. Haga clic mientras mantiene pulsada la tecla Mayús para hacer una selección múltiple. La zonas actual y las seleccionadas aparecen sombreadas. Haga clic fuera de una zona para eliminar la selección. Las zonas aparecen en una imagen original en los siguientes casos: u La página ha sido reconocida. u Se especificó un archivo de plantilla de zonas en el procesamiento manual mientras la página estaba vigente. u Ha dibujado zonas manuales en la imagen. 56 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS Trabajo con zonas La barra de herramientas Imagen proporciona herramientas para la edición de zonas. Siempre hay una seleccionada. Cuando ya no desee utilizar una herramienta, haga clic en otra. Normalmente la herramienta que se utiliza es Dibujar zonas rectangulares. Dibujar zonas rectangulares. Haga clic en esta opción y arrastre el cursor para definir zonas rectangulares. La nueva zona adopta sus propiedades a partir de la última zona dibujada o seleccionada. También podrá mover o cambiar el tamaño de las zonas existentes cuando esta herramienta esté activa. Dibujar zonas irregulares Haga clic en esta opción para utilizar la herramienta que permite dibujar zonas irregulares. Haga clic y arrastre el ratón para dibujar una sola línea. Repita el procedimiento hasta que sólo falte por dibujar una línea. Haga doble clic para cerrar la forma. Las zonas irregulares encajan en rectángulos si las fija como zonas tipo tabla. También podrá mover o cambiar el tamaño de las zonas existentes cuando esta herramienta esté activa. Agregar a zona Haga clic en esta opción para agregar zonas irregulares a una zona existente o combinar varias zonas en una sola. No podrá mover ni cambiar el tamaño de las zonas existentes cuando esta herramienta esté activa. Tampoco podrá usar esta opción con una zona tipo tabla. Quitar de zona Haga clic en esta opción para quitar partes irregulares de una zona existente o dividir una zona en otras más pequeñas. No podrá mover ni cambiar el tamaño de las zonas existentes cuando esta herramienta esté activa. Tampoco podrá usar esta opción con una zona tipo tabla. Reordenar zonas Haga clic en esta opción para utilizar la herramienta que sirve para reordenar zonas. Luego haga clic en las zonas en el orden de lectura deseado. Para que se respete el orden que determinó, elija ‘Utilizar solamente zonas actuales’ y evite tener en la página zonas de varias columnas o tipos de zona de detección automática. Propiedades de zona Haga clic en esta opción para que aparezca el cuadro de diálogo Propiedades de zona. Esto permite definir el tipo de zona y el contenido que tendrán las zonas actualmente seleccionadas en la página. También podrá efectuar este procedimiento en el menú rápido de una zona. Consulte la próxima sección. SEPARACIÓN MANUAL DE ZONAS 57 Propiedades de zona Cada zona es de un tipo determinado. Las zonas que contienen texto también pueden tener un parámetro que describe su contenido: alfanumérico o numérico. El tipo y el contenido de la zona constituyen sus propiedades. Haga clic con el botón derecho del ratón en una zona para usar el menú rápido que permite cambiar sus propiedades. Seleccione varias zonas para cambiar sus propiedades de una sola vez. También se puede usar para este fin el botón de propiedades de zonas, situado en la barra de herramientas Imagen. Se dispone de los siguientes tipos de zonas: Zona de flujo de texto de columna única Utilice esta opción para que el contenido de la zona sea tratado como texto de corrido, sin columnas. Zona de flujo de texto de varias columnas Utilice esta opción para que el contenido de la zona sea tratado como texto de corrido. El programa tratará de detectar columnas dentro de la zona. Al texto se le quitarán o mantendrán las columnas, dependiendo de la vista Editor de texto. Durante el reconocimiento, una zona de múltiples columnas se puede reemplazar por zonas individuales para cada columna. Para ello, debe estar activada la función de separación automática de zonas, la cual también puede producir un cambio en el orden de las zonas. Zona de tabla Utilice esta opción para que el contenido de la zona sea tratado como una tabla. Es posible detectar automáticamente las cuadrículas de la tabla, o bien colocarlas en forma manual tal como se describe en la siguiente sección. Las zonas de tablas deben ser rectangulares. El Editor de texto muestra la tabla en una cuadrícula editable. Podrá elegir si desea exportar tablas en cuadrículas o en columnas separadas por tabulaciones. Zona de detección automática Utilice esta opción para dejar que el programa decida el tipo de zona. Para ello, debe estar activada la función de separación automática de zonas, la cual también puede producir un cambio en el orden de las zonas de la página. Tras el reconocimiento podrá ver el tipo que se aplicó. Si utiliza una zona de detección automática para cubrir el área de una página con diversos contenidos, el programa puede reemplazar la zona de detección automática por varias otras zonas más pequeñas. 58 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS Zona gráfica Utilice esta opción para encerrar una imagen, diagrama, dibujo, firma o cualquier otro elemento que desee transferir al Editor de texto como una imagen incrustada, y no como texto reconocido. Una zona de gráficos tiene un borde verde. Las imágenes incrustadas se pueden exportar con el documento a aplicaciones de destino que permitan el uso de gráficos. Ignorar zona Utilice esta opción para definir el área de una página que no desee procesar en el Editor de texto. La separación automática de zonas no colocará zonas aquí. Para excluir un área determinada en muchas páginas (por ejemplo un encabezado o los números de página), coloque las zonas ignoradas en una plantilla y seleccione ‘Buscar zonas además de zonas de plantilla/actuales’ en el panel Proceso del cuadro de diálogo Opciones. Contenido de zona Esta opción está disponible para los tipos de zonas que contienen texto. El contenido alfanumérico valida todos los caracteres necesarios para el idioma elegido. Los resultados del reconocimiento de una zona numérica contendrán sólo cifras y la puntuación que les sea pertinente. No se colocarán letras. Nota Haga clic con el botón derecho del ratón fuera de una zona para obtener un menú rápido diseñado para toda la imagen. Éste permite acercar, alejar o girar la imagen. Al girar una imagen, se eliminan todas las zonas que ésta contiene. CUADRÍCULAS DE TABLAS EN LA IMAGEN Tras el procesamiento automático es posible que vea las zonas de tablas colocadas en una página. Éstas se indican con un icono de una zona de tabla en la esquina superior derecha de la zona. Para conferir o quitar la designación de zona de tabla a una zona dada, utilice su menú rápido. También podrá dibujar una zona tipo tabla. Si ya hubiera una zona de tabla en la página, selecciónela, y luego dibuje la nueva zona rectangular. Ésta “heredará” el tipo de tabla. De otro modo, dibuje una zona rectangular y utilice su menú rápido para designarla como tipo tabla. CUADRÍCULAS DE TABLAS EN LA IMAGEN 59 Los separadores de tabla se dibujan o mueven para determinar dónde aparecerán las líneas de las cuadrículas al colocar la tabla en el Editor de texto. Podrá utilizar las herramientas Agregar o Quitar para agrandar o reducir una zona de tabla, pero la zona debe conservar su forma rectangular. Puede hacerlo para eliminar columnas o filas innecesarias de una tabla. Las cinco herramientas para la manipulación de tablas de la barra de herramientas Imagen se activan si la página actual contiene una zona tipo tabla. Utilícelas de la siguiente manera: Mover separadores de fila o columna Haga clic en la herramienta y mueva el cursor al separador que se ha de mover. Aparecerá una flecha de dos puntas. Arrastre el borde según se desee. No podrá arrastrarla más allá de la zona vecina. Evite colocar separadores de modo que se superpongan entre sí o que corten texto. Pulse la tecla Ctrl mientras arrastra un separador de columna, para moverlo sólo en la fila actual. Introducir separadores de columna Haga clic en esta herramienta y luego en la posición de una zona de tabla donde desee colocar un separador de columna. Pulse la tecla Ctrl mientras hace clic para colocar el separador sólo en la fila actual. Introducir separadores de fila Haga clic en esta herramienta y luego en la posición de una zona de tabla donde desee colocar un separador de fila. Evite colocar un separador encima de otro, o de modo que corte texto. Eliminar separadores de fila o columna Haga clic en esta herramienta y luego en un solo separador que desee eliminar. Hágalo si un separador está colocado incorrectamente, o si desea cambiar el aspecto de la tabla en el documento final. Por ejemplo, puede colocar dos columnas de datos en una sola columna, eliminando el separador entre las dos columnas originales. Eliminar/reemplazar todos los separadores Haga clic en esta herramienta y luego dentro de una zona de tabla. Todos sus separadores desaparecerán. Haga clic nuevamente para detectar (o volver a detectar) automáticamente los separadores. La colocación de separadores generalmente se produce durante el reconocimiento; al hacer clic dos veces con esta herramienta podrá ver y editar los separadores antes del reconocimiento. 60 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS USO DE PLANTILLAS DE ZONAS Una plantilla es un conjunto de zonas, con unas propiedades y un orden de lectura, almacenado en un archivo. Un archivo de plantilla de zonas se puede cargar para usar las zonas de la plantilla durante el reconocimiento. Cargue un archivo de plantilla en la lista desplegable Realizar OCR o en el menú Herramientas. Cuando cargue una plantilla utilizando la barra de herramientas OCR manual, sus zonas aparecerán inmediatamente en la página actual, reemplazando las que ésta contenga. Las páginas existentes no sufrirán alteración alguna. Las zonas de plantilla se colocarán en todas las páginas obtenidas posteriormente hasta descargar la plantilla. Podrá modificar las zonas de plantilla y agregar nuevas zonas antes de efectuar el reconocimiento. Al cargar una plantilla con la barra de herramientas AutoOCR, no se verán afectadas la página actual ni las existentes. Las zonas de plantilla se colocarán en todas las páginas obtenidas posteriormente hasta descargar la plantilla. En el panel Proceso del cuadro de diálogo Opciones se encuentra la opción ‘Buscar zonas además de zonas de plantilla/actuales’. Si está activada durante el procesamiento automático, la separación automática de zonas se ejecutará en las áreas de las páginas fuera de las zonas de plantilla. Cómo guardar una plantilla de zona Prepare zonas en una página. Revise sus posiciones, propiedades y orden de lectura. Haga clic en Archivos de plantilla de zonas... en el menú Herramientas. En el cuadro de diálogo, seleccione [zonas en la página] y haga clic en Guardar. Cómo modificar una plantilla de zona Cargue la plantilla y obtenga una imagen adecuada mediante procesamiento manual. Aparecerán las zonas de la plantilla. Modifique las zonas y/o propiedades según desee. Abra el cuadro de diálogo Archivos de plantilla de zonas. Se seleccionará la plantilla actual. Haga clic en Guardar y luego en Cerrar. USO DE PLANTILLAS DE ZONAS 61 Cómo descargar una plantilla Seleccione un parámetro sin plantilla para la descripción del diseño en la lista desplegable Realizar OCR. Las zonas de plantilla no se eliminan de las páginas actuales o existentes, pero tampoco se utilizarán para procesamientos futuros. También puede abrir el cuadro de diálogo Archivos de plantilla de zonas, seleccionar [ninguno] y hacer clic en el botón Establecer como actual. En este caso, el parámetro de la descripción del diseño vuelve a Automático. Cómo reemplazar una plantilla por otra Seleccione una plantilla diferente en la lista desplegable Realizar OCR, o bien abra el cuadro de diálogo Archivos de plantilla de zonas, seleccione la plantilla deseada y haga clic en el botón Establecer como actual. Cuando esté activada la barra de herramientas AutoOCR, no se cambiarán zonas existentes y se utilizará la nueva plantilla para los procesamientos futuros. Cuando esté activada la barra de herramientas OCR manual, las zonas de la nueva plantilla se aplicarán a la página actual, reemplazando las zonas existentes. Cómo eliminar un archivo de plantilla Abra el cuadro de diálogo Archivos de plantilla de zonas. Seleccione una plantilla y haga clic en el botón Eliminar. Las zonas ya colocadas por esta plantilla no se eliminarán. Consejo Las plantillas aceptan los tipos de zonas ignoradas y de detección automática. Por lo tanto, una plantilla podrá ser de gran utilidad para definir qué partes de la página se leerán, y cuáles se ignorarán. Nota Las zonas de detección automática provenientes de una plantilla se pueden reemplazar por otras más pequeñas durante el reconocimiento; se asignarán tipos de zona específicos a estas zonas. Las zonas de varias columnas también se dividirán en zonas más pequeñas de una sola columna, una para cada columna detectada. Nota Las plantillas y la característica adicional de separación automática de zonas están disponibles en Programar OCR y Direct OCR, pero no en el Asistente de OCR. 62 TUTORIAL: PROCESAMIENTO DE DOCUMENTOS 4 Verificación y edición Los resultados del reconocimiento se colocan en el Editor de texto. El nuevo editor tipo “WYSIWYG” (que significa “lo que se ve es lo que se obtiene”) ofrece las siguientes características, que se detallan en el presente capítulo: u Verificación de los resultados de OCR u Verificación del texto reconocido en comparación con el original u Diccionarios del usuario u IntelliTrain u Pantalla y vistas del editor u Edición de texto e imágenes u Contorno de página u Lectura de texto en voz alta El Editor de texto ofrece cuatro vistas para apreciar sus páginas. Podrá alternar libremente de una vista a otra. Éstas proporcionan diversos niveles de formato. Las vistas son: Vista Sin formato Muestra el texto normal sin columnas, con un solo tipo y tamaño de fuente. Vista Mantener fuentes y párrafos Muestra el texto sin columnas con estilo de fuente y párrafo Vista True Page Trata de conservar lo más posible el formato del documento original. Se mantienen los estilos de caracteres y párrafo. Todos los elementos de las páginas, incluyendo las columnas, se colocan en marcos. Vista Mantener flujo de columnas Es idéntica a la vista True Page, salvo que el orden de lectura de las zonas se muestra mediante flechas. La diferencia entre esta vista y True Page se refiere principalmente a la exportación, tal como se explica en la sección Preparar resultados del reconocimiento para la exportación en el capítulo 5. OMNIPAGE SE MANUAL DEL USUARIO 63 VERIFICACIÓN DE LOS RESULTADOS DE OCR Tras el reconocimiento de una página, los resultados aparecerán en el Editor de texto. La verificación comienza automáticamente si se solicitó en el panel Verificación del cuadro de diálogo Opciones en el Asistente de OCR. Podrá comenzar manualmente la verificación en cualquier momento en que no esté ocupando el programa. Funciona de la siguiente manera: 1. Haga clic en el botón Verificar OCR en la barra de herramientas Estándar, o bien seleccione Verificar OCR... en el menú Herramientas. 2. La verificación se inicia al comienzo del documento, pero se salta el texto ya revisado. Si se detecta un posible error, el cuadro de diálogo Verificador de OCR mostrará el error y una imagen del aspecto original en la imagen. Esta es la palabra que OmniPage SE pensó que era. Esto indica por qué la palabra es dudosa. La imagen de la palabra dudosa aparece resaltada. Esta ventana muestra la parte pertinente de la imagen original. Haga clic dentro de ella para agrandar o reducir la pantalla. Arrastre una esquina o la parte inferior del cuadro de diálogo para cambiar su tamaño. 3. Si la palabra reconocida es correcta, haga clic en Ignorar o Ignorar todo para pasar a la siguiente palabra dudosa. Haga clic en Agregar para añadirla al diccionario actual del usuario y pasar a la siguiente palabra dudosa. 4. Si la palabra reconocida no es correcta, modifíquela en el cuadro de edición Cambiar a o escriba la palabra deseada, o bien seleccione una sugerencia del diccionario. Haga clic en Cambiar o en Cambiar todo para que el cambio surta efecto y poder pasar a la palabra dudosa siguiente. Haga clic en Agregar para añadir el término del cuadro de edición Cambiar al diccionario actual del usuario y poder pasar a la palabra dudosa siguiente. 64 VERIFICACIÓN Y EDICIÓN 5. Los marcadores de color se eliminan de las palabras en el Editor de texto a medida que son verificadas. Podrá pasar al Editor de texto durante la verificación para hacer las correcciones allí. Utilice el botón Continuar para reiniciar la verificación. Haga clic en Cerrar para detener la verificación antes de llegar al final del documento. Nota Si la verificación se ejecutó hasta el final de una página, ésta se marca con los iconos de verificación documentos. y en el Administrador de VERIFICACIÓN DEL TEXTO RECONOCIDO EN COMPARACIÓN CON EL ORIGINAL Tras efectuar el OCR, podrá comparar cualquier parte del texto reconocido con su correspondiente en la imagen original a fin de verificar que el texto se haya reconocido correctamente. Funciona de la siguiente manera: 1. Haga doble clic en cualquier palabra del Editor de texto o bien seleccione una palabra y elija Verificar texto en el menú Herramientas. Se abrirá la ventana Verificar texto y aparecerá una imagen de la palabra original y el área que la rodea. Modifique la palabra en el Editor de texto según sea necesario. 2. Haga clic dentro de la ventana para agrandar o reducir la imagen. La imagen se agranda con los dos primeros clics y se reduce con los dos siguientes. Botón Cerrar Esta es la imagen original de la palabra que se está verificando. Esta es la palabra que se seleccionó en el Editor de texto. 3. Continúe seleccionando palabras que desee verificar, corrigiéndolas según sea necesario. La pantalla cambia a medida que se van seleccionando nuevas palabras. VERIFICACIÓN DEL TEXTO RECONOCIDO EN COMPARACIÓN CON EL ORIGINAL 65 4. Haga clic en el botón Cerrar para cerrar la ventana del verificador. Consejo Deberá verificar el texto antes de volver a editar a gran escala. Si corta y pega grandes bloques de texto, se pueden alterar los vínculos entre el texto e imagen. Consejo La facilidad ofrecida por OmniPage Pro de lectura en voz alta del texto reconocido es otro modo de comprobar el texto. Es posible escuchar cada vez una letra, una palabra, una línea, una frase, o bien una página completa del texto. Consulte la sección Lectura de texto en voz alta. Esta función no está disponible en OmniPage SE. DICCIONARIOS DEL USUARIO El programa contiene diccionarios incorporados para numerosos idiomas. Estos diccionarios ayudan al reconocimiento y pueden ofrecer sugerencias durante la verificación. Pueden ser complementados por otros diccionarios del usuario. Podrá guardar la cantidad de diccionarios del usuario que desee, pero podrá cargar sólo uno a la vez. También están disponibles los diccionarios del usuario de Microsoft Word; el diccionario denominado Personalizado es el predeterminado para Microsoft Word. Iniciar un diccionario del usuario Haga clic en Agregar en el cuadro de diálogo Verificador de OCR sin tener cargado ningún diccionario del usuario o abra el cuadro de diálogo Archivos del diccionario del usuario en el menú Herramientas, y luego haga clic en Nuevo. Se le solicitará que nombre el diccionario de inmediato. Cargar o descargar un diccionario del usuario Esto se realiza en el panel OCR del cuadro de diálogo Opciones, o desde el cuadro de diálogo Archivos del diccionario del usuario. Seleccione un archivo de diccionario para cargarlo o bien [ninguno] para descargar un diccionario del usuario. Editar un diccionario del usuario Para añadir palabras debe cargar un diccionario del usuario y luego hacer clic en Agregar en el Verificador de OCR. Podrá agregar y eliminar palabras en el cuadro de diálogo Archivos del diccionario del usuario. 66 VERIFICACIÓN Y EDICIÓN Consejo Al editar un diccionario del usuario, podrá importar una lista de palabras desde un archivo de texto para agregar palabras rápidamente al diccionario. INTELLITRAIN IntelliTrain es una forma de capacitación nueva y automática recientemente diseñada. Analiza las correcciones que usted haga durante la verificación. Cuando haga un cambio, esta función recordará la forma del carácter en cuestión y el cambio en la verificación. Buscará otras formas de caracteres similares en el documento, especialmente en palabras dudosas; y evaluará si corresponde o no aplicar la corrección del usuario. OmniPage SE no es compatible con la función IntelliTrain ni con los archivos de capacitación. Estas características sólo están disponibles en OmniPage Pro 11. Al abrir un archivo OPD, OmniPage SE pasa por alto cualquier información de capacitación incluida el archivo. Puede activar o desactivar IntelliTrain en el panel de OCR en el cuadro de diálogo Opciones. Es muy útil para documentos en mal estado o cuando se usa un tipo de letra poco común en todo el documento. IntelliTrain será menos útil para textos con distorsiones esporádicas. A continuación aparece un ejemplo, basado en la letra “g”, que se puede imprimir de diferentes maneras: Los primeros dos ejemplos no requieren de IntelliTrain, ya que ambas formas son normales para la letra “g” y el programa las puede manejar. En el tercer ejemplo se podría aprovechar IntelliTrain ya que la forma de la “g” es poco común, y es probable que todas las veces que aparezca la “g” en el texto se parezcan a ésta. El cuarto ejemplo no es bueno para el uso de IntelliTrain, ya que la primera “g” no está bien impresa, y es poco probable que aparezca esa forma nuevamente en el documento. INTELLITRAIN 67 El siguiente ejemplo muestra cómo funciona IntelliTrain, utilizando la imagen original. En nuestro ejemplo se utilizan las letras c y e. Con algunos tipos de letra y parámetros de exploración, la línea horizontal en la e puede quedar muy delgada, induciendo a OCR a cometer errores que IntelliTrain puede reparar. OmniPage Pro leerá esta palabra inglesa como rcsultados. Usted la cambió durante la verificación a resultados. IntelliTrain recordará esta forma y la regla: e Esta no es una “c”. Es una “e”. IntelliTrain cambiará: cspañol a español lcycs a leyes sclccción a selección etc. IntelliTrain recordará los datos de capacitación que recopile, y usted podrá guardarlos en un archivo de capacitación para uso futuro en documentos similares. Si desea que se le consulte si desea guardar los datos de capacitación al cerrar el documento, seleccione dicha opción en el panel Verificación del cuadro de diálogo Opciones. Los datos de capacitación no guardados se almacenan en un documento de OmniPage. Las operaciones para guardar la capacitación en un archivo, así como cargar, editar y descargar archivos de capacitación se efectúan en el cuadro de diálogo Archivos de capacitación. Ábralo en el panel Verificación del cuadro de diálogo Opciones o el menú Herramientas. 68 VERIFICACIÓN Y EDICIÓN Seleccione esta opción, haga clic en Guardar y escriba un nombre para guardar un nuevo archivo de capacitación. Haga clic aquí para editar el archivo de capacitación seleccionado (ver a continuación). Utilice esta opción para guardar la nueva capacitación en un archivo de capacitación cargado. Aparecerá como: Nombre del archivo [modificado] Seleccione esta opción para descargar un archivo de capacitación. Los datos de capacitación no guardados se pueden editar en el cuadro de diálogo Editar capacitación; aparecerá un asterisco en la barra de título en vez del nombre del archivo de capacitación. Permanecerá sin guardar cuando cierre el cuadro de diálogo. Un archivo de capacitación también se puede editar; su nombre aparecerá en la barra de título. Si se le han agregado datos de capacitación sin guardar, aparecerá un asterisco a continuación de su nombre. Tanto los datos de capacitación no guardados como los modificados se guardarán al cerrar el cuadro de diálogo. El cuadro de diálogo muestra marcos que contienen la forma de un carácter y una solución de OCR asignada a dicha forma. Haga clic en un marco para seleccionarlo. Luego podrá suprimirlo con la tecla Suprimir, o bien cambiar la asignación. Utilice las teclas de dirección para pasar al marco siguiente o al anterior. Está editando los datos de capacitación no guardados. Este marco aparece en gris. Significa que se ha eliminado. Para recuperarlo, selecciónelo nuevamente y pulse la tecla Suprimir. Los caracteres marcados como eliminados se borrarán efectivamente al cerrar el cuadro de diálogo. Este marco está seleccionado. En la parte superior aparece la forma tomada de la imagen. En la parte inferior aparece la solución de OCR asignada. Haga doble clic en un marco o bien pulse Intro para cambiar su solución OCR. Introduzca la nueva solución en el cuadro de texto que aparece y pulse Intro. Las asignaciones cambiadas aparecerán en rojo. INTELLITRAIN 69 PANTALLA Y VISTAS DEL EDITOR El editor muestra los textos reconocidos y puede marcar las palabras que se consideraron dudosas durante el reconocimiento. El marcado se hace con un subrayado ondulado; subrayado rojo para las palabras que no se encontraron en un diccionario (esto es válido sólo para los idiomas que tienen diccionarios) y subrayado azul para las palabras que contengan caracteres dudosos o rechazados. Estos marcadores pueden aparecer o estar ocultos según lo que se haya seleccionado en el panel Editor de texto, dentro del cuadro de diálogo Opciones. También podrá mostrar u ocultar caracteres no imprimibles e indicadores de encabezado y pie de página. El panel Editor de texto también permite definir una unidad de medición para el programa y un parámetro de acomodación de texto en todas las vistas del Editor de texto salvo en la vista Sin formato. A continuación se mencionan las principales diferencias entre las vistas: Vista Sin formato Muestra el texto normal sin columnas y alineado en la izquierda con un solo tipo y tamaño de fuente, con los mismos saltos de línea que el documento original. La mayoría de los botones de formato y cuadros de diálogo están desactivados. Tampoco se ven las reglas. Esta vista puede resultar práctica para verificar y editar el texto. Vista Mantener fuentes y párrafos Muestra pantallas con texto sin columnas y con estilo de fuente y párrafo. Aparece la regla horizontal. Esta vista puede resultar práctica para verificar, editar y modificar el texto junto con su estilo. Vista True Page Trata de conservar lo más posible el formato del documento original. Se mantienen los estilos de caracteres y párrafo. Todos los elementos de las páginas, incluyendo las columnas, se colocan en marcos. Puede que sea más difícil verificar y editar texto en esta vista, por lo que tal vez tenga que desplazarse por el interior de un marco para ver todo su contenido. Una fila de flechas indica que el contenido se prolonga más allá de los bordes del marco. 70 VERIFICACIÓN Y EDICIÓN Vista Mantener flujo de columnas Es idéntica a la vista True Page, salvo que el orden de lectura de las zonas se muestra mediante flechas. Esta vista se diferencia de True Page durante la exportación, consulte la sección Preparar resultados del reconocimiento para la exportación en el capítulo 5. Seleccione una vista con los cuatro botones de la parte inferior izquierda del Editor de texto o del menú Ver. Los gráficos y tablas pueden aparecer en las cuatro vistas. EDICIÓN DE TEXTO E IMÁGENES Este es un Editor de texto tipo “WYSIWYG” (lo que se ve es lo que se obtiene), que proporciona muchas funciones de edición. Éstas funcionan de manera muy similar a las de los principales procesadores de texto. Editar atributos de caracteres En todas las vistas salvo en Sin formato, es posible cambiar el tipo, tamaño y atributos de fuente (negrita, cursiva, subrayado) del texto seleccionado. Utilice la barra de herramientas de formato o bien el cuadro de diálogo Fuente en el menú Formato. Este último también ofrece caracteres de subíndice, superíndice, así como texto o fondo en color. En la vista Sin formato se puede usar la barra de herramientas de formato para especificar un tipo y tamaño de fuente y aplicarla a todo el documento. Estos atributos no se transfieren a otras vistas, sino que se restauran sus parámetros anteriores. Abra el cuadro de diálogo Coincidencia de fuentes en el panel OCR del cuadro de diálogo Opciones para especificar qué fuentes se usarán en los textos que se introduzcan en el Editor de texto. Editar atributos de párrafo En todas las vistas salvo en la Sin formato, podrá cambiar el alineamiento de los párrafos seleccionados y aplicar viñetas a los párrafos. Utilice la barra de herramientas de formato o bien el cuadro de diálogo Párrafo en el menú Formato. Este último permite modificar sangrías, espaciado entre líneas y entre párrafos. La regla horizontal del Editor de texto permite definir fácilmente las posiciones de sangrías y tabuladores. Los ajustes avanzados de tabulación se efectúan en el cuadro de diálogo Tabuladores en el menú Formato. EDICIÓN DE TEXTO E IMÁGENES 71 Estilos de párrafo Los estilos de párrafo se detectan automáticamente durante el reconocimiento. En un cuadro de selección situado a la izquierda de la barra de herramientas de formato se acumula y presenta una lista de estilos. Utilícela para asignar un estilo a los párrafos seleccionados. Utilice el cuadro de diálogo Estilo del menú Formato para cambiar de nombre o modificar un estilo y definir otro nuevo. Al guardar un documento en un archivo, podrá elegir si exportar o no los estilos de párrafo con el documento. Esto es válido sólo si la aplicación de destino es compatible con los estilos de párrafo. Gráficos Podrá editar el contenido de una zona de gráfico seleccionado si cuenta con un editor de imágenes en su equipo. Haga clic en Editar imagen en el menú Herramientas. Esto activará el editor de imágenes asociado con los archivos BMP en su sistema Windows, y cargará el gráfico. Edite el gráfico y luego cierre el editor para volver a incrustar la imagen en el Editor de texto de OmniPage SE. No cambie el tamaño del gráfico ni su resolución o tipo, ya que esto impedirá la reincrustación. Tablas Las tablas aparecen en el Editor de texto en forma de cuadrículas. Mueva el cursor al área de una tabla. Cambiará su aspecto, permitiéndole mover las líneas de las cuadrículas. También podrá usar las reglas del Editor de texto para modificar una tabla. Modifique la colocación de texto en las celdas con los botones de alineación de la barra de herramientas de formato y los controles de tabulación de la regla. Al guardar el documento en un archivo, podrá elegir si va a exportar las tablas en cuadrículas o como columnas separadas por tabuladores. LECTURA DE TEXTO EN VOZ ALTA La función de texto a lenguaje se activa o desactiva en el elemento Modo de lenguaje hablado del menú Herramientas o con la tecla F5. Un segundo elemento de menú Parámetros de lenguaje hablado... permite seleccionar una voz (por ejemplo, hombre o mujer para un determinado idioma), una velocidad de lectura y el volumen. La facilidad de lectura en voz alta no está incluida en OmniPage SE. Está disponible en OmniPage Pro 11. Esta función de lenguaje está diseñada para discapacitados visuales, pero también puede ser muy útil para cualquier persona durante la revisión y verificación de texto. El habla se controla mediante movimientos del punto de inserción en el Editor de texto, ya sea mediante el ratón o el teclado. 72 VERIFICACIÓN Y EDICIÓN Para escuchar texto: Utilice estas teclas: Un carácter a la vez, hacia adelante o hacia atrás Flecha derecha o izquierda. Se nombran las letras, números o signos de puntuación. Palabra actual Ctrl + teclado numérico 1 Una palabra a la derecha Ctrl + flecha derecha * Una palabra a la izquierda Ctrl + flecha izquierda * Una sola línea Coloque el punto de inserción en la línea Línea siguiente Flecha abajo Línea anterior Flecha arriba Oración actual Ctrl + teclado numérico 2 Desde el punto de inserción al final de la oración Ctrl + teclado numérico 6 Desde el inicio de la oración al punto de inserción Ctrl + teclado numérico 4 Página actual Ctrl + teclado numérico 3 Desde el inicio de la página al punto de inserción Ctrl + Inicio Desde el punto de inserción al final de la página actual Ctrl + Fin Página anterior, siguiente o cualquier otra Ctrl + RePág, AvPág o botones de navegación Caracteres mecanografiados Cada carácter mecanografiado se pronuncia, uno por uno, incluyendo la puntuación. * Si el cursor está en el medio de una palabra, se escuchará primero un fragmento de la palabra, pero de ahí en adelante se escucharán las palabras completas. Las tres teclas básicas para el lenguaje hablado están juntas en el teclado numérico. + 1 Leer palabra actual 2 Leer oración actual 3 Leer página actual LECTURA DE TEXTO EN VOZ ALTA 73 También contará con los siguientes controles de teclado: Para hacer esto: Utilice lo siguiente: Pausa/Reanudar Ctrl + teclado numérico 5 Aumentar la velocidad Ctrl + teclado numérico Disminuir velocidad Ctrl + teclado numérico Restablecer velocidad Ctrl + asterisco, teclado numérico (*) Esta previsto proporcionar programas de lenguaje hablado para los siguientes idiomas: inglés, francés, alemán, italiano, portugués y español. En el archivo Léame encontrará la información más reciente. Sólo se instalará un sistema de lenguaje hablado en OmniPage Pro, dependiendo del idioma elegido al comienzo de la instalación. Si especifica un idioma que no disponga de un sistema de lenguaje hablado, se instalará el inglés. Si tiene otros sistemas de lenguaje compatibles con SAPI en su equipo, serán detectados y quedarán disponibles para su uso. Sus voces quedarán disponibles en el cuadro de diálogo Parámetros de lenguaje hablado. Una vez que ha asociado una voz con un idioma, OmniPage Pro lo recordará y cambiará las voces según el idioma de reconocimiento del documento. CONTORNO DE PÁGINA La ventana Contorno de página permite cambiar el orden de las áreas en una página o de los párrafos dentro de las áreas. También permite definir cómo fluirá el texto si se realiza la exportación con la vista Mantener flujo de columnas. Abra la ventana de contorno de página en el menú Ver. Las áreas corresponden a las zonas utilizadas durante el reconocimiento y también a los marcos empleados en el Editor de texto. Haga clic en un elemento y arrástrelo a la ubicación deseada. Los párrafos reordenados aparecen inmediatamente en el Editor de texto y se exportan. Las áreas reordenadas aparecen y se exportan en las vistas Sin formato y Mantener fuentes y párrafos. En la vista True Page no surten efecto práctico. En la vista Mantener flujo de columnas, las flechas muestran el orden del flujo de texto. Muevas las áreas para cambiar su orden. Las posiciones de las áreas no cambian, pero las flechas muestran el cambio en el texto de corrido. 74 VERIFICACIÓN Y EDICIÓN 5 Guardar y exportar Una vez que haya obtenido por lo menos una imagen para un documento, podrá exportarla a un archivo. Una vez que haya reconocido al menos una página, podrá exportar los resultados del reconocimiento a una aplicación de destino, para lo cual deberá: 1. Guardar en un archivo 2. Copia de un documento al Portapapeles 3. Enviar un documento adjunto a un mensaje de correo electrónico. El documento permanece en OmniPage SE tras la exportación. Esto permite guardar, copiar o enviarlo varias veces, por ejemplo con diferentes niveles de formato, utilizando diferentes tipos de archivos, nombres o ubicaciones. También podrá agregar o volver a reconocer las páginas, o bien modificar el texto ya reconocido. Con el procesamiento automático y utilizando el Asistente de OCR, usted especifica el primer destino donde se guardará el archivo antes de comenzar dicho proceso. Cuando se reconoce (o se verifica, si ello fue solicitado) la última página disponible, comienza la exportación. Podrá especificar la exportación en cualquier momento en que no esté ocupando el programa. Si solicita exportar un documento con páginas no reconocidas, se le consultará si primero desea reconocerlas. Si su respuesta es No, sólo se exportarán los resultados de las páginas reconocidas. Si se han modificado zonas en las páginas reconocidas, se le solicitará que reconozca dichas páginas antes de exportar. OMNIPAGE SE MANUAL DEL USUARIO 75 PREPARAR RESULTADOS DEL RECONOCIMIENTO PARA LA EXPORTACIÓN El texto se exporta a un archivo, al Portapapeles, o al correo electrónico con el nivel de formato definido por la vista fijada en el Editor de texto en el momento de la exportación, si ello es posible. Sin embargo, algunos tipos de archivos de exportación y aplicaciones de destino no son compatibles con todos los elementos de formato. Puede que se le advierta si hay una incompatibilidad y se le ofrezca la mejor vista disponible. Puede aceptarla, o bien cancelar la exportación, fijar otra vista y reiniciar la exportación. La tabla de la sección Tipos de archivos para guardar los resultados del reconocimiento en el capítulo 6 le indica qué tipos de archivos son compatibles con qué niveles de formato. A continuación se indica cómo se pueden usar las vistas para la exportación: Vista Sin formato Esta vista es necesaria para exportar a ASCII, Unicode u otros formatos con extensión .TXT. Estos tipos de archivo no pueden aceptar gráficos o tablas. Evidentemente, podrá exportar texto normal a cualquier tipo de archivo y aplicación de destino. Vista Mantener fuentes y párrafos Esta vista es muy práctica para todos los formatos salvo los que tienen extensiones TXT o PDF. Todos estos formatos pueden contener gráficos y tablas. Vista True Page Esta vista es apta sólo para los tipos de archivos y aplicaciones de destino en las que se pueden manipular marcos o cuadros de texto. Al exportar a PDF, True Page se utiliza como origen, sin importar la vista del editor (El formato PDF no se aplica a OmniPage SE). El orden de lectura de las zonas, o las áreas reordenadas en la ventana Contorno de página, no influyen cuando se utiliza True Page para la exportación. Vista Mantener flujo de columnas Fije esta opción en el momento de la exportación para mantener el diseño original de las páginas, incluyendo las columnas. Esto se efectúa cada vez que es posible con parámetros de columnas, no con marcos. El texto fluirá de una columna a otra, lo que no ocurre cuando se utilizan marcos. Las flechas muestran el orden del flujo de texto. Podrá cambiar este orden con la ventana Contorno de página, tal como se describe al final del capítulo 4. 76 GUARDAR Y EXPORTAR GUARDAR EN UN ARCHIVO Podrá guardar páginas reconocidas e imágenes originales en el disco en una gran variedad de tipos de archivos. En el capítulo 6 encontrará una completa lista de los tipos de archivos compatibles para guardar imágenes y resultados de reconocimiento. Guardar imágenes originales 1. Seleccione Guardar imagen... en el menú Archivo. En el cuadro de diálogo que aparece, seleccione la ubicación de la carpeta y un tipo de archivo para las imágenes. Escriba un nombre de archivo. 2. Seleccione guardar sólo la imagen actual o bien todas las imágenes del documento. En el segundo caso puede guardar todas las imágenes en un solo archivo de imagen de varias páginas, siempre y cuando elija TIFF o DCX como tipo de archivo. De lo contrario cada imagen se colocará en un archivo independiente. OmniPage SE agregará sufijos numéricos al nombre de archivo que se proporcione, para generar nombres de archivo exclusivos. 3. Haga clic en Aceptar para guardar las imágenes según se especifique. Las zonas y el texto reconocidos no se guardan con el archivo. Si es posible, el archivo se guarda tal como se ve: es decir, en blanco y negro, escala de grises o en color. Las imágenes en blanco y negro se guardan con su resolución original. Las imágenes en escala de grises y en color se reducen aproximadamente a 150 ppp. Consejo Para ver el tamaño y la resolución original de una imagen, coloque el cursor sobre la imagen en el área de Imagen original o bien sobre su miniatura en el Administrador de documentos. Nota OmniPage Pro permite guardar un documento con las cuatro variantes de formato PDF, incluido el formato “sólo imagen”. Este último guarda como imagen los resultados del reconocimiento, no la imagen original. No está disponible la opción guardar a PDF en OmniPage SE. GUARDAR EN UN ARCHIVO 77 Guardar los resultados del reconocimiento 1. Seleccione Guardar como... en el menú Archivo, o bien haga clic en el botón Exportar resultados en la barra de herramientas OCR manual con la opción Guardar como archivo seleccionada en la lista desplegable. 2. Aparecerá el cuadro de diálogo Guardar como, tal como se indica en su forma expandida. Haga clic en Avanzadas para abrir el panel inferior y en Básicas para cerrarlo. Seleccione esta opción para abrir automáticamente el archivo guardado en su aplicación de destino. Elija entre: Seleccione esta opción para que los estilos de párrafo del Editor de texto se exporten junto con el texto reconocido. Crear un solo archivo para todas las páginas Crear un archivo por página Crear un archivo nuevo después de cada página en blanco. 3. Seleccione una ubicación de carpeta y un tipo de archivo para el documento. El tipo de archivo OPD especial es el último en la lista de tipos de archivo. 4. Escriba un nombre de archivo. Haga clic en el botón Avanzadas a fin de ver todas las opciones para guardar. Seleccione la opción deseada. 5. Haga clic en Aceptar. El documento se guardará en el disco según se especifique. Si se selecciona ‘Guardar e iniciar’, el archivo exportado aparecerá en la aplicación de destino, que es la asociada con el tipo de archivo seleccionado en su sistema Windows. 78 GUARDAR Y EXPORTAR Nota Los gráficos y formato se guardan en el documento sólo si el tipo de archivo seleccionado es compatible. El nivel de formato para la exportación corresponde a la vista del Editor que se fijó al momento de guardar. Se le advertirá si el nivel de formato no es compatible con el tipo de archivo de exportación. Nota Si se crea más de un archivo de exportación, OmniPage SE agregará un sufijo numérico al nombre de archivo a fin de crear nombres de archivo exclusivos. Si selecciona ‘Crear un archivo nuevo después de cada página en blanco’ con la entrada desde archivos de imagen, consulte la sección Entrada desde archivos de imagen en el capítulo 3 para averiguar cómo colocar imágenes en blanco. GUARDAR UN DOCUMENTO MIENTRAS TRABAJA Haga clic en el botón Guardar en la barra de herramientas Estándar o bien seleccione Guardar en el menú Archivo para guardar los cambios en el documento actual mientras trabaja. Si lo hace con un documento sin título, aparecerá el cuadro de diálogo Guardar como. Con un documento con nombre, el comando Guardar lo almacena con el nombre y formato de la última vez que se guardó, tal como se aprecia en la barra de título. Si el documento se guardó la última vez como documento de OmniPage, el comando para guardar lo actualizará: se guardarán las imágenes nuevas o cambiadas, las separación de zonas modificada, los resultados del reconocimiento y los datos de capacitación. Si el documento se guardó por última vez como tipo de archivo de texto, sólo se guardarán los cambios de los resultados del reconocimiento. Si desea trabajar nuevamente con su documento en OmniPage SE en una sesión futura, guárdelo como documento de OmniPage. Este es un tipo especial de archivo de salida. Guarda las imágenes originales del archivo junto con los resultados del reconocimiento, los parámetros y los datos de capacitación. Consulte la sección Documentos OmniPage en el capítulo 2. El cuadro de diálogo Guardar como enumera los tipos de archivo disponibles en la lista desplegable Guardar como archivo de tipo. El documento de OmniPage es el último formato de esa lista. GUARDAR UN DOCUMENTO MIENTRAS TRABAJA 79 Si guarda el documento por primera vez como documento de OmniPage (por ejemplo llamándolo memo.opd), lo puede modificar guardándolo posteriormente como archivo de texto (por ejemplo memo.txt), y volver a hacerle cambios, para luego hacer clic en Guardar, y los cambios recientes se guardarán en el archivo memo.txt, no en el archivo OPD. Al cerrar el documento o salir del programa, se le solicitará que guarde el documento si no lo ha guardado como un documento de OmniPage, o si hay cambios desde la última vez que lo almacenó como OPD. Sus documentos OmniPage pueden cambiarse de OmniPage SE a OmniPage Pro 11 e inversamente. En OmniPage SE, todos los datos de capacitación de los archivos OPD se pasan por alto, y no puede realizarse la capacitación. COPIA DE UN DOCUMENTO AL PORTAPAPELES Podrá copiar al Portapapeles los resultados del reconocimiento de cualquier página reconocida de un documento. El proceso de copia se indica mediante un monitor que refleja su progreso. Podrá pegar el contenido del Portapapeles en otra aplicación. El formato del texto, como negrita y cursiva, se mantiene al pegar el contenido en otra aplicación compatible con la información RTF. De lo contrario, sólo se pegará el texto normal. Los gráficos se mantienen si la aplicación es compatible con la inserción de imágenes. t Para copiar un documento al Portapapeles 80 GUARDAR • Con el procesamiento automático, seleccione el comando Copiar al Portapapeles de la lista desplegable Exportar resultados en la barra de herramientas AutoOCR o en el Asistente de OCR. El texto se envía al Portapapeles apenas se reconozca o verifique la última página disponible. • Con el procesamiento manual, seleccione el comando Copiar al Portapapeles en la lista desplegable Exportar resultados y luego haga clic en su botón en la barra de herramientas OCR manual. El proceso de copia comienza de inmediato. Y EXPORTAR ENVIAR UN DOCUMENTO ADJUNTO A UN MENSAJE DE CORREO ELECTRÓNICO Podrá enviar los resultados del reconocimiento como uno o más archivos adjuntos a un mensaje de correo electrónico si tiene instalada una aplicación de correo compatible con MAPI, como por ejemplo, Microsoft Outlook. t Para enviar un documento por correo electrónico • Con el procesamiento automático, seleccione el comando Enviar como correo en la lista desplegable Exportar resultados en la barra de herramientas AutoOCR. Aparecerá el cuadro de diálogo Enviar correo apenas se reconozca o verifique la última página disponible del documento. • Con el procesamiento manual, seleccione el comando Enviar como correo en la lista desplegable Exportar resultados y luego haga clic en su botón en la barra de herramientas OCR manual. Aparecerá de inmediato el cuadro de diálogo Enviar correo. En cualquier momento en que no esté ocupado el programa, seleccione Enviar como correo en el menú Archivo para invocar el cuadro de diálogo Enviar correo. 1. El cuadro de diálogo Enviar correo permite especificar un tipo de archivo y las opciones para adjuntar documentos: un adjunto para todas las páginas, un adjunto por cada página, un nuevo adjunto cada vez que haya una página en blanco. Fije todas las opciones y haga clic en Aceptar. 2. Regístrese en su aplicación de correo electrónico si se le solicita hacerlo. ENVIAR UN DOCUMENTO ADJUNTO A UN MENSAJE DE CORREO ELECTRÓNICO 81 3. La aplicación de correo aparecerá con el documento o documentos adjuntos en un nuevo mensaje vacío. Los adjuntos toman el mismo nombre utilizado la última vez que se guardó el documento en OmniPage SE, o bien aparecen como ‘Sin título desde OmniPage’. Se agrega la correspondiente extensión de archivo y los sufijos numéricos en caso de haber más de un documento adjunto. 4. Escriba la dirección de destino de su mensaje de correo, agregue texto al mensaje si lo desea y luego haga clic en el botón Enviar. 82 GUARDAR Y EXPORTAR 6 Información técnica En este capítulo se proporciona información sobre resolución de problemas y demás información técnica acerca del uso de OmniPage SE. Consulte también el archivo en línea Léame y los demás temas de la ayuda, o bien visite las páginas web de ScanSoft. La página web con información sobre escáneres contiene información detallada y actualizada regularmente acerca de la configuración y asistencia técnica de escáneres. El archivo Léame contiene la información más reciente acerca de OmniPage SE. Podrá acceder al archivo Léame y a las páginas web de ScanSoft mediante el menú Ayuda. Este capítulo contiene la siguiente información: u Resolución de problemas • • • • Soluciones iniciales Probar OmniPage SE Problemas de memoria insuficiente Problemas de espacio de disco insuficiente u Tipos de archivos compatibles • Tipos de archivos para abrir y guardar imágenes • Tipos de archivos para guardar los resultados del reconocimiento • Guardar en PDF u Problemas de OCR • El texto no se reconoce correctamente • Problemas con el reconocimiento de fax • Problemas de sistema o rendimiento durante el OCR u Desinstalación del software OMNIPAGE SE MANUAL DEL USUARIO 83 RESOLUCIÓN DE PROBLEMAS Si bien OmniPage SE está diseñado para un fácil uso, en ocasiones ocurren problemas. Muchos de los mensajes de error contienen descripciones autoexplicativas de lo que se debe hacer: revisar las conexiones, cerrar otras aplicaciones para liberar memoria, etc. En ocasiones bastará con esas indicaciones. En la documentación de Windows encontrará información para optimizar su sistema y el rendimiento de las aplicaciones. Soluciones iniciales Intente estas soluciones si experimenta problemas al iniciar o usar OmniPage SE: u Cerciórese de que el sistema cumpla todos los requisitos mencionados en la lista Requisitos del sistema del capítulo 1. u Cerciórese de que el escáner esté enchufado y que todas las conexiones de cables estén fijas. u En la sección de asistencia técnica del sitio web www.scansoft.com de ScanSoft encontrará notas técnicas sobre temas comúnmente mencionados al usar OmniPage SE. Nuestras páginas web también pueden ofrecer asistencia acerca del proceso de instalación y resolución de problemas. u Apague su equipo y el escáner, encienda nuevamente este último y luego reinicie su equipo. Cerciórese de que las demás aplicaciones estén funcionando correctamente. u Utilice el software que viene con el escáner para verificar que éste funciona correctamente antes de usarlo con OmniPage SE. u Cerciórese de contar con los controladores correctos para el escáner, la impresora y la tarjeta de vídeo. Encontrará más información sobre escáneres en la página web de ScanSoft, a la cual se puede acceder mediante el menú Ayuda. u Ejecute ScanDisk para Windows 95, 98 o Me, o bien Check Disk para Windows NT y Windows 2000 a fin de revisar si la unidad de disco duro presenta errores. Encontrará más información en la ayuda en línea de Windows. 84 INFORMACIÓN TÉCNICA u Haga una defragmentación en el disco duro. Encontrará más información en la ayuda en línea de Windows. u Desinstale y reinstale OmniPage SE, tal como se describe en la última sección, Desinstalación del software. Probar OmniPage SE Al reiniciar Windows 95, 98, 2000 o Me en el modo a prueba de errores o Windows NT en el modo VGA se podrá probar OmniPage SE en un sistema simplificado. Esto se recomienda si no puede resolver problemas de bloqueo del sistema o si OmniPage SE ha dejado de funcionar por completo. Encontrará más información en la ayuda en línea de Windows. Nota El escáner no funcionará con OmniPage SE en el modo a prueba de errores o en el modo VGA, de modo que no intente diagnosticar problemas con el escáner en esta configuración. t Para probar OmniPage SE en el modo a prueba de errores (Windows 95, 98, 2000 o Me): 1. Reinicie su equipo en el modo a prueba de errores pulsando F8 inmediatamente después de que aparezca el mensaje que indica que se está reiniciando Windows. 2. Inicie OmniPage SE y trate de efectuar el OCR con una imagen. Utilice un archivo de imagen conocido, por ejemplo uno de los archivos de imagen de ejemplo suministrados. • Si OmniPage SE no se inicia ni funciona correctamente en el modo a prueba de errores, puede que haya un problema en la instalación. Desinstale y reinstale OmniPage SE (consulte la parte final de este capítulo), y luego ejecútelo en el modo a prueba de errores de Windows. • Si OmniPage SE se ejecuta correctamente en el modo a prueba de errores, entonces puede que un controlador de dispositivos del sistema esté interfiriendo con el funcionamiento de OmniPage SE. Solucione el problema reiniciando Windows en el modo de confirmación paso a paso. Encontrará más información en la ayuda en línea de Windows. RESOLUCIÓN DE PROBLEMAS 85 t Para probar OmniPage SE en el modo VGA (Windows NT): 1. Reinicie su ordenador. 2. Seleccione la estación de trabajo Windows NT versión 4.00 [modo VGA] y pulse Intro. 3. Pulse Ctrl+Alt+Supr y seleccione el Administrador de tareas. 4. En el cuadro de diálogo Administrador de tareas, seleccione todas las aplicaciones en segundo plano y haga clic en la opción para terminar el proceso. Encontrará más información en la ayuda en línea de Windows. 5. Inicie OmniPage SE y trate de efectuar el OCR con una imagen. Utilice un archivo de imagen conocido, por ejemplo uno de los archivos de ejemplo suministrados. Nota También puede ejecutar OmniPage SE desde una línea de comando en su propio modo a prueba de errores. Seleccione Inicio É Ejecutar, explore en busca del archivo OmniPage.exe y agregue la opción /safe a la línea de comandos. Esto iniciará el programa, pero ignorará los parámetros almacenados anteriormente y no intentará recuperar un documento proveniente de la finalización anormal del programa. Problemas de memoria insuficiente OmniPage SE puede ejecutarse deficientemente en condiciones de memoria insuficiente. Esto se puede indicar mediante diversos mensajes de error o si OmniPage SE funciona lentamente y accede al disco duro con mucha frecuencia. Intente las siguientes soluciones para los casos de memoria insuficiente: u Reinicie su equipo. u Cierre las demás aplicaciones para liberar memoria. u Cierre aplicaciones innecesarias de OmniPage SE. u Defragmente el disco duro para liberar bloques contiguos de espacio en el disco. Encontrará más instrucciones en la ayuda en línea de Windows. u Aumente la cantidad de espacio libre en el disco. 86 INFORMACIÓN TÉCNICA u Aumente la memoria física (RAM) de su equipo. u De esa manera podrá optimizar el rendimiento de OCR. En la sección Requisitos del sistema en el capítulo 1 encontrará más información al respecto. Problemas de espacio de disco insuficiente Si al sistema le queda poco espacio libre en el disco duro, se pueden producir problemas. Intente las siguientes soluciones en caso de que surjan problemas por espacio de disco insuficiente: u Vacíe la Papelera de reciclaje de Windows. u Cierre todas las aplicaciones y elimine los archivos *.tmp en la carpeta Temp. Ésta generalmente se encuentra dentro de la carpeta Windows. u Ejecute ScanDisk para Windows 95, 98 o Me, o bien Check Disk para Windows NT o Windows 2000 a fin de revisar si hay errores que estén utilizando espacio en el disco. Encontrará más instrucciones en la ayuda en línea de Windows. u Realice una copia de seguridad de los archivos que no necesite en disquetes o en otros medios y elimínelos del disco duro. u Elimine aplicaciones de Windows que no use. u Haga una defragmentación en el disco duro. Encontrará más instrucciones en la ayuda en línea de Windows. u Borre la caché para el explorador web y limite su tamaño. RESOLUCIÓN DE PROBLEMAS 87 TIPOS DE ARCHIVOS COMPATIBLES El programa admite una amplia gama de formatos de archivo. Numerosos formatos importantes han sido incluidos en OmniPage SE. Tipos de archivos para abrir y guardar imágenes Tipo de archivo Extensión Varias páginas Abrir / Guardar Blanco y negro, escala de grises, color BMP, mapa de bits *.bmp No Abrir y guardar Todos DCX *.dcx Sí Abrir y guardar Todos GIF *.gif N/A N/A N/A JPEG *.jpg No Abrir y guardar Escala de grises, color PCX *.pcx No Abrir y guardar Todos PDF *.pdf N/A N/A (ver nota) N/A PNG *.png No Abrir y guardar Todos TIFF comprimido G3 *.tif Sí Abrir Blanco y negro TIFF comprimido G4 *.tif Sí Abrir y guardar Blanco y negro TIFF comprimido LZW *.tif N/A N/A N/A TIFF FX *.xif N/A N/A N/A TIFF PackBits (bits empaquetados) *.tif Sí Abrir y guardar Todos TIFF sin comprimir *.tif Sí Abrir y guardar Todos Los archivos de imagen de entrada pueden tener resoluciones de hasta 600 ppp, pero se recomiendan 300 ppp (tanto horizontal como verticalmente) para una exactitud óptima de OCR. El programa almacena imágenes en blanco y negro con su resolución original, pero las imágenes en escala de grises y en color generalmente no se guardan con más de 150 ppp. Coloque el cursor sobre una imagen para que aparezca una ventana emergente mostrando el tamaño y la resolución de la imagen original. Nota Si intenta guardar una imagen en blanco y negro con formato JPEG, el programa le sugerirá la conversión a escala de grises. Con TIFF G3 y G4 le sugerirá la conversión a blanco y negro. 88 INFORMACIÓN TÉCNICA Nota OmniPage Pro 11 permite guardar un documento con las cuatro variantes de formato PDF, uno de los cuales permite exportar con formato de sólo imagen. Este último exporta como imagen los resultados del reconocimiento, no las imágenes originales, en el Guardar como cuadro de diálogo. No está disponible la opción guardar a PDF en OmniPage SE. OmniPage SE tampoco puede utilizar los formatos de archivo GIF, LZW TIFF and TIFF FX. Tipos de archivos para guardar los resultados del reconocimiento Tipo de archivo Extensión Niveles de formato (vistas del Editor de texto) Compatibilidad con gráficos Adobe PDF con imagen en texto *.pdf N/A N/A Adobe PDF con sustitutos de imagen *.pdf N/A N/A Adobe PDF, normal *.pdf N/A N/A Adobe PDF, sólo imagen *.pdf N/A N/A *.opd Todos Sí Excel (3.0 a 7.0, 97, 2000) *.xls NFV, RFP (hoja de cálculo) Sí Formato de texto enriquecido (RTF) 6.0/95 3 *.rtf Todos Sí FrameMaker 5.5.3 *.mif Todos Sí Freelance Graphics *.txt Vista Sin formato (NFV) No Harvard Graphics *.txt Vista Sin formato (NFV) No *.htm Todos Sí 2 Microsoft Publisher 98 *.rtf Todos Sí PageMaker (6.5.2) *.doc Todos Sí PowerPoint 97 *.rtf Todos Sí Quattro Pro para Windows 4.0, 8 *.xls NFV, RFP (hoja de cálculo) No *.txt/.csv Vista Sin formato (NFV) No Texto Unicode 1 4 *.txt/.csv Vista Sin formato (NFV) No Ventura Publisher *.doc Todos Sí Word para Windows (6.0, 97, 2000) *.doc Todos WordPad *.rtf NFV, RFP WordPerfect (5.1, 5.2, 6.0, 6.1, 8, 9, 10) *.wpd Todos Documento de OmniPage HTML (3.2 ó 4.0) Texto ASCII 6 2 1 TIPOS Sí 5 Sí Sí DE ARCHIVOS COMPATIBLES 89 1 El texto ASCII y Unicode puede incluir texto de corrido, con saltos de línea o separado por comas. Este último tiene extensión .csv y se utiliza para introducir tablas con texto normal en programas de hojas de cálculo. 2 Al guardar archivos en formato HTML, se almacenan todos los gráficos como archivos de imagen independientes con el formato JPEG. La compatibilidad con el formato HTML 4.0 sólo existe en OmniPage Pro 11. La compatibilidad de OmniPage SE está limitada a HTML 3.2. 3 Los resultados del reconocimiento se envían al Portapapeles y en este formato se pegarán en RTF si ello es posible o, de lo contrario, como texto Unicode o ASCII. 4 El texto Unicode acepta la máxima variedad de caracteres acentuados. 5 Las vistas True Page o Mantener flujo de columnas no se rechazarán, pero aparecerán en la vista Mantener fuentes y párrafos, es decir, sin columnas. 6 OmniPage SE es capaz de abrir documentos creados con OmniPage SE y con OmniPage Pro 11. También puede abrir archivos OPD creados con OmniPage Pro 10 así como los archivos MET (equivalentes) creados con OmniPage Pro 9. OmniPage SE realiza la conversión a partir de una copia de estos archivos, que conservan su formato anterior. Guardar en PDF Esta sección no se aplica a OmniPage SE. En OmniPage Pro 11, contará con cuatro opciones al guardar resultados de reconocimiento en archivos de Formato de documento portátil (conocido como PDF). Normal: Las páginas se exportan tal como aparecieron en el Editor de texto en la vista True Page. Este archivo PDF se puede ver con el visor de PDF y modificar en un editor de PDF. Con sustitutos de imagen: Tal como en el caso anterior, pero los caracteres rechazados y dudosos tienen superposiciones de imagen, de modo que estos caracteres inciertos aparecen como estaban en el documento original. El archivo PDF se puede ver y editar. Sólo imagen: El archivo en PDF sólo se puede ver pero no modificar en un editor de PDF y tampoco es posible buscar texto. 90 INFORMACIÓN TÉCNICA Imagen en texto: El archivo PDF sólo se puede ver pero no modificar en un editor de PDF. No obstante hay un archivo de texto vinculado detrás de cada imagen, lo cual sí permite buscar texto. La palabra buscada se resalta en la imagen. PROBLEMAS DE OCR Esta sección contiene información y soluciones para los posibles problemas de OCR. En primer lugar proporcionamos soluciones para mejorar la exactitud del reconocimiento, y luego para obtener buenos resultados al manipular documentos de fax y, finalmente, soluciones para los problemas de sistema o rendimiento que pudieran surgir durante el OCR. El texto no se reconoce correctamente Intente estas soluciones si parte del documento original no se convierte en texto correctamente durante el OCR: u Observe la imagen de la página original y cerciórese de que todas las áreas de texto queden delimitadas por zonas de texto. Si un área no queda delimitada en una zona, generalmente será ignorada durante el OCR. Consulte la sección acerca de cómo crear y modificar zonas, Trabajo con zonas en el capítulo 3. u Cerciórese de identificar correctamente las zonas de texto. Vuelva a identificar tipos y contenidos de zonas, si fuese necesario, y vuelva a llevar a cabo el OCR en el documento. Consulte la sección Propiedades de zona en el capítulo 3. u Cerciórese de no haber cargado una plantilla incorrecta por error. Si los bordes de la zona cortan texto, el reconocimiento será deficiente. u Ajuste los controles deslizantes del brillo y el contraste en el panel Escáner del cuadro de diálogo Opciones. Puede que sea necesario experimentar con diferentes combinaciones de parámetros para obtener los resultados deseados. u Compruebe la resolución de la imagen original. Coloque el cursor sobre el área Imagen original para ver una pantalla emergente. Si la resolución es considerablemente superior o inferior a 300 ppp, es probable que el reconocimiento sea deficiente. PROBLEMAS DE OC R 91 u Cerciórese de seleccionar los idiomas correctos para los documentos en el panel OCR del cuadro de diálogo Opciones. Sólo se deben incluir los idiomas incluidos en el documento. u Active IntelliTrain y efectúe algunas correcciones de verificación. Es probable que esto ayude más en el caso de fuentes estilizadas o documentos que estén deteriorados uniformemente. Si ya estaba activado IntelliTrain, intente desactivarlo; en algunos tipos de documentos deteriorados puede que esta aplicación no resulte de gran ayuda. Esto último no se aplica a OmniPage SE. u Si utiliza True Page como vista del Editor de texto o para la exportación, el texto reconocido se colocará en marcos (cuadros de formato). Parte del texto puede quedar oculto si un marco es muy pequeño. Para ver el texto, coloque el cursor en el marco del texto y utilice las teclas de dirección del teclado para desplazarse hacia arriba, hacia abajo a la izquierda o a la derecha del marco. u Verifique que el cristal, espejos y lentes del escáner no tengan polvo, manchas ni estén rayados. Límpielos si fuese necesario. Nota OmniPage SE sólo reconoce caracteres de texto impresos, tales como mecanografiados o generados en una impresora láser. Puede manejar caracteres impresos mediante matriz de puntos, aun cuando el nivel de exactitud puede disminuir en el caso de texto con calidad de borrador; pero no tiene la capacidad para leer impresión manual o texto manuscrito. Sin embargo, sí puede mantener firmas u otro texto manuscrito, en forma de gráfico. Problemas con el reconocimiento de fax Intente estas soluciones para mejorar la exactitud del OCR en imágenes de fax: u Solicite a los remitentes que en lo posible usen documentos limpios y originales. u Solicite a los remitentes que seleccionen el modo Fino u Óptimo cuando le envíen un fax. Esto produce una resolución de 200 x 200 ppp. 92 INFORMACIÓN TÉCNICA u Solicite a los remitentes que transmitan los archivos directamente a su equipo vía fax módem si cuenta con dicho aparato. Podrá guardar imágenes de fax como archivos de imagen y luego cargarlos en OmniPage SE. Consulte la sección Entrada desde archivos de imagen en el capítulo 3. Problemas de sistema o rendimiento durante el OCR Intente estas soluciones si se produce un bloqueo durante el OCR o si el procesamiento tarda demasiado: u Resuelva problemas de memoria insuficiente. Consulte la sección Probar OmniPage SE. u Resuelva problemas de espacio de disco insuficiente. Consulte la sección Probar OmniPage SE. u Minimice todas las aplicaciones o bien haga clic en Alt+Tab para ver si hay mensajes de error de Windows. u Revise la calidad de la imagen que está reconociendo. u Consulte la documentación del escáner para averiguar formas de mejorar la calidad de las imágenes exploradas. u Divida imágenes de páginas complejas (mucho texto y gráficos o formato complicado) en trabajos más pequeños. Dibuje zonas manualmente o bien modifique las zonas creadas automáticamente y efectúe el OCR en un área de una página a la vez. Consulte la sección del capítulo 3 acerca de cómo crear y modificar zonas. u Reinicie Windows 95, 98, Me y 2000 en el modo a prueba de errores, o bien en Windows NT en el modo VGA y pruebe OmniPage SE efectuando un OCR en los archivos de imágenes de ejemplo incluidos. Consulte la sección Probar OmniPage SE. Si está efectuando varias tareas simultáneamente, tales como reconocer e imprimir, puede que el OCR tarde más. PROBLEMAS DE OC R 93 DESINSTALACIÓN DEL SOFTWARE En algunas ocasiones la solución puede consistir en desinstalar y luego volver a instalar OmniPage SE. También conviene desinstalar OmniPage SE antes de instalar OmniPage Pro 11 o cualquier programa OmniPage de evaluación. El programa de desinstalación de OmniPage SE no eliminará ninguno de los siguientes archivos creados por el usuario: Plantillas de zonas (*.zon) Archivos de capacitación (*.otd) (No se aplica a OmniPage SE) Diccionarios del usuario (*.ud) Documentos de OmniPage (*.opd) Para desinstalar el producto en Windows NT o Windows 2000, debe registrarse en su equipo con privilegios de administrador. t Para desinstalar o reinstalar OmniPage SE: u Cierre OmniPage SE. u Haga clic en Inicio en la barra de tareas de Windows y seleccione Configuración É Panel de control É Agregar o quitar programas. u Seleccione OmniPage SE y haga clic en Cambiar. u Haga clic en Siguiente en el cuadro de diálogo que aparecerá a continuación. u Seleccione la opción para eliminar o reparar y luego Siguiente. u Siga las instrucciones hasta terminar el procedimiento. 94 INFORMACIÓN TÉCNICA I A Abrir archivos de imagen, 88 Acercar o alejar pantallas, 25 Acomodación de texto, 34 Actualización a la versión OmniPage Pro, 19 ADF, 33 Administración de documentos, 28 Administrador documentos, 24, 28 tareas, 86 Agregar a zonas, 57 páginas a un documento, 43 palabras a un diccionario del usuario, 64 Alimentador automático de documentos, 33, 51, 54 Alineación de párrafos, 26 Alternar entre el procesamiento manual y automático, 27, 46 entre las vistas del Editor de texto, 71 Archivos adjuntos a mensajes de correo electrónico, 81 capacitación, 69 como destino de exportación, 77 como origen de imagen, 51 imagen, 22 imagen de ejemplo, 85 imagen de varias páginas, 51, 77, 88 imágenes TIFF, 88 nuevo para cada página en blanco, 51 OPD, 31 N D E X C retenidos durante la desinstalación, 94 Áreas Imagen original, 24 reordenar, 74 Asistente Agregar trabajo, 50 escáner, 14 OCR, 38, 39, 41 Atributos caracteres, 71 párrafo, 72 AutoOCR, 27 Ayuda contextual, ix, 25, 33 en línea, ix en línea HTML, ix B Barra de herramientas AutoOCR, 42 Estándar, 24, 25 formato, 24, 26 Imagen, 26 Barra de menús, 25 Blanco y negro, explorar, 52, 77 Botones comandos para el procesamiento automático, 43 Obtener página, 42, 44 Realizar OCR, 42, 45 Brillo, 53, 91 escáner, 33 Buscar palabras dudosas, 64 palabras que no están en el diccionario, 64 salida en PDF, 90 Caja de herramientas de OmniPage, 24, 27, 42 Calidad de las imágenes, 53 Cambiar flujo de texto entre columnas, 74 orden de las áreas, 74 orden de las zonas, 26 orden de los párrafos, 74 tamaño de zonas, 26, 57 tipos de zonas, 59 Capacitación, 67 Caracteres no imprimibles, 26 Características nuevas en la versión 11 de OmniPage Pro, 18 Cargar archivo de capacitación, 69 diccionario del usuario, 66 Cerrar un documento, 31 Colocar divisores en las tablas, 26 gráficos desde la exportación, 78 Color, explorar, 53 Columnas cambiar flujo de texto, 74 en tablas, 60 Comandos del teclado para escuchar texto, 73 Comparación de las palabras reconocidas con las originales, 65 Compatibilizar la vista del editor con el tipo de archivo, 76, 89 Configuración Direct OCR, 47 escáner, 14 Contenido documentos de OmniPage, 79 OMNIPAGE SE MANUAL DEL USUARIO 95 zonas, 58 Contorno de página, 74 Contraste, 53, 91 escáner, 33 Control sobre el reconocimiento, 44 Controladores para escáneres, 15 Conversión de imágenes, 88 Copiar documento al Portapapeles, 40, 80 y pegar texto, 25 Correo adjuntos, 81 como destino de exportación, 81 Cortar y pegar texto, 25 Crear datos de capacitación, 69 Cuadros de diálogo Cargar archivo, 51 Enviar correo, 81 Opciones, 33 Verificador, 41, 64 Cursiva, texto, 26 D Datos de capacitación no guardados, 31 Descargar archivo de capacitación, 69 diccionario del usuario, 66 plantilla de zona, 61 Descripción del diseño del documento, 40, 42, 55 Desinstalación de OmniPage SE, 94 Desplazamiento entre páginas, 28 Detalles, vista de, 24 Detención del procesamiento automático, 43 Dibujar zonas, 48 Diccionarios del usuario, 64, 66 Direct OCR, 33, 47 Diseño descripción, 42 documento, descripción, 55 personalizado, 34, 56 Dividir zonas, 57 Divisores, colocar en tablas, 26 96 ÍNDICE Documentos diseño variado, 55 exportar, 23 generalidades, 28 por ambas caras, 54 sin terminar, 31 Documentos de OmniPage, 14, 31, 79 guardar, 32 objetivo, 32 Documentos en OmniPage, 23 E Editar archivo de capacitación, 69 atributos de caracteres, 71 atributos de párrafo, 71 cuadrículas de tablas, 59 diccionario del usuario, 66 divisores de tablas, 26 gráficos, 72 salida en PDF, 90 separadores de tablas, 60 tablas, 72 texto reconocido, 26, 71 Editor de texto, 24, 34, 63, 70 Efecto de los parámetros, 34 Ejemplos de archivos de imagen, 85 Eliminar páginas, 28, 30 plantilla de zona, 61 separadores de tabla, 60 Entrada archivo PDF, 51 desde escáner, 52 desde un archivo de imagen, 51 Enviar un documento adjunto a un mensaje de correo electrónico, 81 Escala de grises, explorar, 53 Escáner, 52, 92 configuración, 14 controladores, 15 doble, 54 Escritorio, 24 OmniPage SE, 24 Escuchar lectura de texto en voz alta, 72 Espacio de disco, 12, 87 Estado de la página, 28 Estilos de párrafo, 26, 72, 78 Exactitud, 52 Explorar blanco y negro, 52 color, 53 escala de grises, 53 imágenes, 53 Exportaciones múltiples, 75, 79 preparación, 76 tipos de archivos, 89 Exportar, 23, 44, 75, 76 a un archivo, 78 al Portapapeles, 80 gráficos, 78 Exportar resultados, botón, 42, 46 F Fijar tipos de zonas, 59 Filas en tablas, 60 Función texto a lenguaje, 14, 72 Funciones de OmniPage SE, 19 G Generalidades de documentos, 28 Generar separadores de tablas, 60 Gráficos archivos JPEG, 90 edición, 72 en la exportación, 78 exportación, 89 Guardar archivo de capacitación, 69 como documento de OmniPage, 32, 79 documento mientras trabaja, 32, 79 documentos, 75 e iniciar, 78 en un archivo, 41, 77 formato OPD, 32 imágenes originales, 77, 88 PDF, 90 plantilla de zona, 61 resultados del reconocimiento, 78 I Idioma instalación, 13 interfaz del usuario, 13, 34 reconocimiento, 33, 40, 92 texto a lenguaje, 13 Ignorar zona, 59 Imágenes barra de herramientas, 24 color, 77 conversión, 88 entrada desde archivo de, 51 escala de grises, 77 guardar, 77 obtener, 23 originales, guardar, 77 resolución, 29, 77, 88, 91 rotación, 26 Imprimir, 25, 30 Información técnica, 83 Iniciar aplicación de destino, 78 diccionario del usuario, 66 Inicio del programa, 14 Insertar separadores de tabla, 60 Instalación escáner, 14 OmniPage SE, 13 Instrucciones de separación de zonas, 45 IntelliTrain, 31, 34, 50, 67, 92 Interrupción del procesamiento automático, 43 J Juntar zonas, 57 L Lectura de texto en voz alta, 72 M Manipular tablas en el Editor de texto, 72 Mantener estilos de párrafo, 78 Marcadores de color, 65 Marcos, 92 documento de exportación, 76 Matriz de puntos, 92 Mejorar la exactitud, 33, 52, 67 Menú rápido, 59 Método de OCR, 33, 40 Miniatura, vista de, 24 Modificar una plantilla de zona, 61 Modo a prueba de errores, 85 VGA, 86 Mover separadores de tabla, 60 MS Outlook, 81 N Navegación de páginas, 24 Negrita, texto, 26 Niveles de formato, 40, 50, 63, 70, 89 exportación, 76 Nuevas características en la versión 11 de OmniPage Pro, 18 O Objetivo de los archivos OPD, 32 Obtener ayuda en línea, ix imágenes, 23, 44 parámetros del texto, 48 Obtener texto, elemento de menú, 48 OCR, 22, 33, 64 Ocultar o mostrar marcadores, 70 OmniPage versión anterior, 13 OmniPage Pro actualización a la versión, 19 nuevas características, 18 OmniPage SE, x, 19 desinstalación, 94 funciones, 19 inicio, 14 instalación, 13 prueba, 85 registro, 17 reinstalación, 94 Opciones procesamiento, 34 separación de archivos, 78, 81 verificación, 34, 40, 64 Optimizar la calidad de la imagen, 53 Orden de lectura de archivos de imagen, 51 P Páginas hojas de cálculo, 56 obtenida, 28 reconocida, 28 separada por zonas, 28 una sola columna, 55, 57 una sola columna con tablas, 55 varias columnas, 55 verificada, 28 Palabras dudosas al verificar, 64 marcadas en el Editor de texto, 70 que no están en el diccionario al verificar, 64 PaperPort, 49 Para, 19 Parámetros, 33, 41 Direct OCR, 48 Párrafos, reordenar, 74 Pasos de procesamiento básicos, 23 generalidades, 23 Personalizar columnas en la vista de detalles, 30 Plantillas, 61 zonas, 56, 61, 91 Portapapeles, 80 Preparar resultados del reconocimiento para la exportación, 76 Probar OmniPage SE, 85 OMNIPAGE SE MANUAL DEL USUARIO 97 Problemas espacio de disco insuficiente, 87 memoria insuficiente, 86 OCR, 91 reconocimiento de fax, 92 rendimiento durante el OCR, 93 sistema o rendimiento durante el OCR, 93 Procesamiento a partir de otras aplicaciones, 47 automático, 27 automático de documentos, 42 automático incompleto, 43 diferido, 31 documento en futuras sesiones, 31 manual, 27, 44 manual de documentos, 44 paso a paso, 44 Programar OCR, 50 Propiedades de zona, 26, 58 Q Quitar de zonas, 57 R Realizar OCR, 23 Reconocer todas las páginas, 43 Reconocimiento efectuar, 44 fax, 92 lento, 93 óptico de caracteres, 22 Reemplazar una plantilla de zona, 61 Registro aplicaciones para Direct OCR, 47 en línea, 17 OmniPage SE, 17 Reinicio del procesamiento automático, 43 Reinstalación de OmniPage SE, 94 98 ÍNDICE Reordenar páginas, 28 párrafos y áreas, 74 zonas, 57 Requisitos memoria, 12, 86 mínimos del sistema, 12 Resolución imágenes, 29, 88, 91 imágenes guardadas, 77 problemas, 83, 84 Rotación de imágenes, 26 S Salida PDF, 90 texto ASCII, 90 texto Unicode, 90 Selección de varias páginas, 28 Separación de zonas automática, 34, 42, 55 manual, 26, 56, 91, 93 Soluciones en caso de rendimiento deficiente, 84 Subrayado, texto, 26 Sugerencia de los diccionarios para la verificación, 64 Suplementar zonas de plantillas, 61 Sustitutos de imagen en PDF, 90 T Tabla, zonas de, 26 Tamaño de la imagen, 29 Terminar un documento, 43 Texto, guardar, 78 Tipos archivo, 78 archivos compatibles, 88, 89 archivos de imagen, 88 archivos para la exportación, 76, 89 zonas, 58, 91 Trabajo Programar OCR, 50 zonas, 57 TWAIN, 15 U Unidad de medición, 34 Uso de Direct OCR, 48 V Velocidad maximizada, 33 Ver salida en PDF, 90 Verificación documentos en sesiones posteriores, 31 remota, 31 resultados de OCR, 64, 65 texto, 65 Versiones anteriores de OmniPage, 13 Vista detalles, 29 detalles de columnas, 30 Editor, 63, 70 Mantener flujo de columnas, 63, 71, 76 Mantener fuentes y párrafos, 63, 70, 76 miniatura, 28 Sin formato, 63, 70, 76 True Page, 63, 70, 76 Z Zonas alfanumérica, 58 columna única, 58 detección automática, 55, 58 gráfica, 59 irregulares, 26, 57 numérica, 58 propiedades, 26 rectangulares, 57 separación manual, 26, 45, 56 tablas, 26, 58, 59 varias columnas, 58
  • Page 1 1
  • Page 2 2
  • Page 3 3
  • Page 4 4
  • Page 5 5
  • Page 6 6
  • Page 7 7
  • Page 8 8
  • Page 9 9
  • Page 10 10
  • Page 11 11
  • Page 12 12
  • Page 13 13
  • Page 14 14
  • Page 15 15
  • Page 16 16
  • Page 17 17
  • Page 18 18
  • Page 19 19
  • Page 20 20
  • Page 21 21
  • Page 22 22
  • Page 23 23
  • Page 24 24
  • Page 25 25
  • Page 26 26
  • Page 27 27
  • Page 28 28
  • Page 29 29
  • Page 30 30
  • Page 31 31
  • Page 32 32
  • Page 33 33
  • Page 34 34
  • Page 35 35
  • Page 36 36
  • Page 37 37
  • Page 38 38
  • Page 39 39
  • Page 40 40
  • Page 41 41
  • Page 42 42
  • Page 43 43
  • Page 44 44
  • Page 45 45
  • Page 46 46
  • Page 47 47
  • Page 48 48
  • Page 49 49
  • Page 50 50
  • Page 51 51
  • Page 52 52
  • Page 53 53
  • Page 54 54
  • Page 55 55
  • Page 56 56
  • Page 57 57
  • Page 58 58
  • Page 59 59
  • Page 60 60
  • Page 61 61
  • Page 62 62
  • Page 63 63
  • Page 64 64
  • Page 65 65
  • Page 66 66
  • Page 67 67
  • Page 68 68
  • Page 69 69
  • Page 70 70
  • Page 71 71
  • Page 72 72
  • Page 73 73
  • Page 74 74
  • Page 75 75
  • Page 76 76
  • Page 77 77
  • Page 78 78
  • Page 79 79
  • Page 80 80
  • Page 81 81
  • Page 82 82
  • Page 83 83
  • Page 84 84
  • Page 85 85
  • Page 86 86
  • Page 87 87
  • Page 88 88
  • Page 89 89
  • Page 90 90
  • Page 91 91
  • Page 92 92
  • Page 93 93
  • Page 94 94
  • Page 95 95
  • Page 96 96
  • Page 97 97
  • Page 98 98

Xerox PE16/i Guía del usuario

Tipo
Guía del usuario