You are on page 1of 10

Pagina de ayuda del canal #biblioteca de Undernet

COMO DESCARGAR COMO SERVIR ENLACES DIGITALIZACIONES ARCHIVOS HOME

bibliotecas #biblioteca libros books e-books ebooks literatura formatos digitales poesias cifi undernet canales irc biblioteca libro
book e-book ebook formato digital poesia canal

DIGITALIZAR TEXTOS - TUTORIAL

Para digitalizar libros, necesitarás:

1 libro
1 escáner (de cualquier tipo, modelo, antigüedad)
FineReader (un programa de OCR, es decir, de reconocimiento de textos. Se encuentra
fácilmente en la red, y, naturalmente, en el canal de Undernet #biblioteca; se instala él
solito, simplemente siguiendo las indicaciones del asistente). Este es el aspecto de la
ventana del FR al abrirlo:

Las fases de trabajo son las siguientes:

Configurar el FR
Escanear
Analizar las zonas a reconocer
Corregir / Revisar

CONFIGURAR EL FR

http://biblioteca.d2g.com/[30/09/2010 9:55:44]
Pagina de ayuda del canal #biblioteca de Undernet

Abre el FineReader (en adelante FR), y elige


en File la opción "new batch" (batch, o lote
de imágenes con las que vamos a trabajar).

Elige la ubicación en que se va a guardar, y


dale un nombre (el título del libro, por
ejemplo).

Ahora, establece las opciones para trabajar con


ese lote de imágenes. En el menú Tools, ve al
ítem Options, como indica la imagen de la
derecha.

Estas son las opciones que debes asegurarte:

http://biblioteca.d2g.com/[30/09/2010 9:55:44]
Pagina de ayuda del canal #biblioteca de Undernet

ESCANEAR

Vamos a escanear. En File, scan multiple images.


Aparecerá la ventana de control de tu escáner;
elige la opción blanco y negro, a 300 dpi.

Sitúa el libro abierto por la primera página a escanear sobre el


cristal del escaner (salvo libros muy grandes, entrará abierto, lo
que permite escanear las páginas de dos en dos), y haz click en
Preview (o previsualizar).

Cuando tengas en pantalla la imagen del libro,


busca la opción que corresponda a cambiar

http://biblioteca.d2g.com/[30/09/2010 9:55:44]
Pagina de ayuda del canal #biblioteca de Undernet

orientación (en la ventana del escáner). Si ya


está correctamente colocado, ajusta el tamaño
del cuadro (el área seleccionada) al texto que
quieres escanear (deja fuera los números de
página, y los títulos que las encabezan).
Ahora, haz click en Scan (o Escanear).

Ya tienes una primera imagen; maximiza la ventana del FineReader, ahí la verás;
comprueba que se lea correctamente (puedes adaptar el tamaño de cada ventanita o
subdivisión de la ventana del FR moviendo sus límites con el cursor). Si la imagen obtenida
tiene zonas claras, o demasiado oscuras, cambia en la pantalla del escaner la intensidad y
el brillo, hasta que consigas una imagen correcta, siempre con las mismas páginas. Una
vez conseguido, borra las otras (selecciona la imagen haciendo click en el thumbnail en la
ventanita izquierda de la pantalla del FR, y en la barra de herramients, haz click en Batch
y al abrirse el menú, en Delete page).

Sigue escaneando el resto del libro; cuando termines,


haz click en el botón Stop Scanning en la ventana del
FR (empieza con un cuento corto, o un capítulo...
pocas páginas, sólo estás haciendo un ejercicio
práctico).

ANALIZAR ZONAS A RECONOCER

En la ventana del FR, haz click en Process,


y al desplegarse el menú, en Analize layout
in all pages. Aparecerán unos recuadros
verdes sobre las imágenes.
Cada cuadrado determina un área de texto

http://biblioteca.d2g.com/[30/09/2010 9:55:44]
Pagina de ayuda del canal #biblioteca de Undernet

a reconocer; puedes ajustarlo moviendo


sus límites (para incluir algo que quedó
fuera, o para dejar fuera algo que no
deseas que aparezca en el texto final,
como un número de página, por ejemplo);
también puedes borrar el recuadro,
haciendo click sobre él y pulsando la tecla
Del (Supr). El texto que no este dentro de
un área no será reconocido luego.

Si borras un recuadro por error, haz click sobre el botón con una letra T que está a la
izquierda de la imagen (entre la ventana de imagen escaneada y la ventana de
thumbnails), y selecciona de nuevo la zona que quieres reconocer (ten en cuenta que
están numeradas, y eso decide el orden en que quedará el texto; si borraste la número 1,
borra todas las de la página y seleccionalas de nuevo en el orden correcto, o bien haz click
con el botón derecho del ratón, elige propiedades y cambia el número). Comprueba todas
las páginas (para pasar de una página a otra, selecciona la siguiente en la ventanita de la
izquierda, o pulsa las flechas verdes de la barra de herramientas).

Un recuadro con los vértices


remarcados en el extremo
izquierdo de cada página (en la
ventanita izquierda del FR)
indicará que se han reconocido
las áreas a leer. Todo está
dispuesto entonces para que se
reconozca el texto de tu libro.

http://biblioteca.d2g.com/[30/09/2010 9:55:44]
Pagina de ayuda del canal #biblioteca de Undernet

LEER (RECONOCER TEXTO)

Ahora vamos a leer (reconocer)


el texto, a partir de las imágenes
obtenidas en el paso anterior. Para ello,
en la ventana del FR, haz click
en el botón Read All, tal como se indica
en la imagen de la derecha.

o bien haz click en Process, y cuando


se despliegue el menú, en Read All
pages. Este proceso llevará algún
tiempo, dependiendo de la cantidad de
texto por reconocer y la velocidad de
tu procesador.

Al terminar, observarás que todas las imágenes de la ventanita de


la izquierda (thumbnails) tienen en la esquina inferior izquierda,
en lugar del cuadrado de antes, una hojita con líneas. Eso indica
que el texto de la imagen ha sido reconocido.

CORREGIR / REVISAR

http://biblioteca.d2g.com/[30/09/2010 9:55:44]
Pagina de ayuda del canal #biblioteca de Undernet

Pulsa la flecha lateral del botón


Word; a continuación haz click
sobre la opción Send All Pages
to, y nuevamente sobre
Microsoft Word. Esto cargará la
aplicación Word de MS,
mostrando el texto leído en un
documento nuevo.

Grábalo con el nombre definitivo, establece tipo y tamaño de fuente, márgenes, etc. Y ya
estás listo para corregir el texto; yo prefiero empezar por la lectura atenta, corrigiendo los
posibles errores, y luego utilizo el corrector ortográfico de Word (Herramientas, Ortografía
y Gramática), para luego comprobar la paginación en previsualización; me resulta más
cómodo trabajar en modo de impresión (Ver, formato de impresión).

NOTA: Si no vas a encargarte tú de la corrección, graba el documento de word para


enviarlo al corrector, y las imágenes del escaneo. Para esto, sigue los siguientes pasos:

Para grabar las imágenes, haz click en Edit en la


pantalla de FR, y al desplegarse el menú, en Select All.
<-- donde indica la imagen de la izquierda

Ahora, haz click en File, y en el menú desplegado, en


Save Image as, donde indica la imagen.-->

http://biblioteca.d2g.com/[30/09/2010 9:55:44]
Pagina de ayuda del canal #biblioteca de Undernet

Guárdalo con el nombre que


quieras (el título del libro, por
ejemplo), eligiendo la opción
"TIFF, black and white, Group4
(*.tiff), y marcando el cuadrito de
"Save as multipage image file",
para tener todas las imágenes en
un solo archivo.

Luego, comprímelo todo, el archivo que contiene las imágenes y el archivo de texto, en un
solo archivo (zip, rar, o el que elijas) para enviarlo más fácilmente al corrector. Asegúrate
de conservar ese archivo comprimido, por si se pierde el que envías.

PASO FINAL

Una vez terminado el trabajo (o, al menos, una vez


salvado el documento de word, y las imágenes si las
vas a enviar), tienes que borrar el lote de imágenes
con el que has trabajado. En el FR, Batch, Delete
Batch (Sí, borrar es imprescindible, si... ocupan

http://biblioteca.d2g.com/[30/09/2010 9:55:44]
Pagina de ayuda del canal #biblioteca de Undernet

muchísimo espacio en el disco duro, no puedes dejar


ahí todas las que usas).

Y ya puedes cerrar el FR. ¡Buena suerte!

De este modo podrás realizar copias de respaldo de tus libros para el caso que los pierdas
o se te arruinen.

http://biblioteca.d2g.com/[30/09/2010 9:55:44]
Pagina de ayuda del canal #biblioteca de Undernet

http://biblioteca.d2g.com/[30/09/2010 9:55:44]

You might also like