You are on page 1of 6

5 Herramientas de Software Gratuito de OCR Para Convertir

Imgenes en Texto
El OCR consta de reconocimiento ptico de caracteres. El software de OCR permite
extraer texto de una imagen y convertirla en un documento de texto editable. Si necesita el
texto de una imagen para que no tenga que sentarse y escribir todo el texto. Slo chele un
vistazo al texto y luego usar una herramienta de OCR para convertirlo en texto editable.
Hay muchos software OCR disponibles, sin embargo, la mayora de ellos tienen ms
caractersticas, pero tiene que instalarlos y son comerciales y costosos. No tiene mucho
sentido

gastar

tanto

dinero

en

si

dispone

de

herramientas

gratuitas.

Pero no se olvide que querr hacer una comprobacin de validez de ese texto que se
devuelve a usted, ya que hay una gran cantidad de complicaciones que pueden surgir en el
reconocimiento y el proceso de traduccin. Pero corregir su texto es mucho ms rpido y
ms fcil que tener que escribir todo en un carcter a la vez.

La tecnologa moderna es maravillosa, tomar una imagen escaneada (o tomar una


instantnea con una cmara mvil / Digicam) y el software OCR extrae toda la
informacin

de

la

imagen

en

formato

de

texto

fcilmente

editable.

Optical character recognition (OCR) es un sistema de conversin de escaneados


impresos / archivos de imgenes escritas a mano en su formato de texto mquina legible.
El software deOCR funciona mediante el anlisis de un documento y comparndolo con
las fuentes almacenadas en su base de datos y / o sealando las caractersticas tpicas de
caracteres. Algunos software de OCR tambin lo expresan a travs de un corrector
ortogrfico para "adivinar" las palabras no reconocidas. Una precisin del 100% es dificil
de conseguir, pero la aproximacin cercana es lo por que la mayora del software lucha.
Tal vez ya sabe cmo extraer texto de imgenes (OCR) de correos y utilizar JOCR, la
herramienta gratuita de software OCR. O bien, podra haber establecido su preferencia con
algunas herramientas de OCR en lnea. Por otra parte, si ha pensado en las maneras de
explotar el software de OCR para los atajos de productividad, entonces vamos a darle

algunas

herramientas

ms

para

jugar.

Vamos a describir 5 piezas libres de software OCR y para empezar a ver los dos vecinos
que ya estn instalados en nuestros sistemas.

OCR con Microsoft OneNote 2007


Para el ocasional OCR bsico, MS OneNote tiene funcin ptica de reconocimiento de
caracteres que es un ahorro de tiempo. Es posible que lo haya perdido "| Se llama Copiar
Texto de Imagen. OneNote puede reconocer el texto incluido en imgenes que haya
insertado en sus notas. Esto le permite volver a utilizar o buscar la informacin de su bloc
de notas, aunque est dentro de imgenes, como:

Recortes de pantalla del Web

Copias impresas de documentos o diapositivas en OneNote (Insertar > Archivos


como copias impresas)

Las imgenes realizadas desde su dispositivo mvil con OneNote Mobile, como la
imagen de una tarjeta de presentacin

Arrastre desde un escner o una imagen guardada en OneNote. Tambin puede


utilizarOneNote para recortar parte de la pantalla o una imagen en OneNote.

Haga clic con el botn derecho sobre la imagen insertada y seleccione Copy Text
from Picture. El texto copiado pticamente reconocido entra en el portapapeles y
ahora se puede pegar en cualquier programa como Word o Bloc de notas.

OneNote es la simplicidad personificada. Pero no es demasiado grande para los


caracteres escritos a mano o en sus formas ms difusas. Pero para un trabajo rpido, yo
estoy a favor del clip de OneNote.

OCR usando Microsoft Office Document Imaging


Otra herramienta poco utilizada dentro de la familia Microsoft. Est ah en
el Men Microsoft Office Herramientas Microsoft Office Microsoft Office Document

Imaging.
Haciendo uso de la herramienta OCR Document Imaging que es un poco limitante, ya que
slo acepta los formatos TIFF (o MDI). Pero eso no es demasiada molestia ya que cualquier
aplicacin grfica se puede utilizar para convertir una imagen a TIFF. Puede utilizar MS
Paint para convertir un archivo JPEG a TIFF.

Abrir el archivo en Microsoft Office Document Imaging File Abrir.

Haga clic en el icono Reconocer Texto Usando OCR.

Clic en el icono MS Word Enviar Texto a Word.

Un archivo de MS Word se abre con el texto editable convertido.

Como alternativa, tambin se puede usar MS Paint para seleccionar un rea


especfica y copiarla en el portapapeles. Abrir MS Office Document Imaging ""
Seleccionar Pgina "" Pegar para copiar la pgina de seleccin de OCR.

Una vez ms, MODI (MS Office Document Imaging) maneja hbilmente texto impreso,
pero mi texto manuscrito fue recibido con un "~ OCR realizado pero no poda reconocer el
texto

del

mensaje.

Por

supuesto,

intntalo

con

su

puo

letra.

Por lo tanto, ahora vamos a dejar a la familia Microsoft atrs y mirar tres herramientas
gratuitas que se llaman "software OCR".

SimpleOCR
SimpleOCR es el popular software freeware de OCR con cientos de miles de usuarios en
todo el mundo. SimpleOCR es tambin libre de regalas SDK OCR para que los
desarrolladores

lo

utilicen

en

sus

aplicaciones

personalizadas.

Si tiene un escaner y desea evitar volver a escribir sus documentos, SimpleOCR es la


manera rpida, y libre de hacerlo. El freeware SimpleOCR es 100% libre y no se limita en

modo alguno. Cualquier persona puede utilizar SimpleOCR gratis - los usuarios
domsticos, las instituciones educativas, incluso los usuarios corporativos.

El software puede ser configurado para leer directamente desde un escaner o


mediante la adicin de una pgina (jpg, tiff, bmp).

SimpleOCR ofrece cierto control sobre la conversin a travs de la seleccin de


texto, la seleccin de imagen y las caractersticas de ignorar texto.

La conversin a texto toma el proceso en una etapa de validacin, el usuario puede


corregir las discrepancias en el texto convertido usando un incorporado corrector
ortogrfico.

El archivo convertido se pueden guardar en un formato doc o txt.

SimpleOCR estaba bien con texto normal, pero su manejo con los diseos de varias
columnas dan un bajn. En mi opinin, la precisin de la conversin de las herramientas
de Microsoft era considerablemente mejor que SimpleOCR. SimpleOCR (v3.1) es una
descarga de 9 MB y es compatible con Windows.

TopOCR
TopOCR est diseado para ser simple y fcil de usar para la digitalizacin de
documentos con cmaras fotogrficas, cmaras de documentos, cmaras web, telfonos
inteligentes, enfoque automtico y s, incluso los escneres. Slo tiene que conectar el
dispositivo en el puerto USB de su PC, y puede abrir archivos de imagen en la ventana de la
imagen y ver automticamente el resultado del OCR en la ventana de texto. TopOCR
combina un completo editor de imagen y funciones del procesador de textos con
procesamiento avanzado de imgenes de alta velocidad y tecnologa de reconocimiento
ptico de caracteres. Para cmaras de documentos y cmaras web de enfoque automtico,
un solo clic con el botn "Previsualizacin" en tiempo real la imagen de la webcam y el
dilogo "Capture" hace que sea fcil el colocar adecuadamente los documentos para
escanear.
La imagen procedente de una cmara o un escaner en la ventana de la izquierda se

convierte al formato de texto en el editor de texto de la derecha. Las funciones del editor de
texto como WordPad pueden utilizar el texto a motor de voz.

El software soporta los formatos JPEG, TIFF, GIF y BMP.

Los ajustes de imagen como brillo, color, contraste, afilar, etc, se puede utilizar
para mejorar la legibilidad de la imagen.

La configuracin de la cmara de filtro tambin se puede configurar para mejorar la


imagen.

El archivo convertido se pueden guardar en una variedad de formatos PDF, RTF,


HTMLy TXT.

Las funciones TopOCR estn bien con el texto directamente orientado, pero la falta
de costumbre de OCR con el texto de columnas permanece.

El software, sin embargo, analiza una pgina mixta (texto ms grficos) y procesa
bien el texto nico.

El software funciona con 11 idiomas.

Para obtener los mejores resultados con su cmara leer aqu: Cmo conseguir los
mejores

resultados

con

TopOCR.

TopOCR

(v4.4)

es

una

descarga

de

aproximadamente 8 MB y es compatible con Windows.

FreeOCR
Este software gratuito de OCR utiliza el motor de OCR Tesseract. Tesseract OCR, este
cdigo fue desarrollado en los laboratorios de HP entre 1985 y 1995 y en la actualidad con
Google. Est considerado como uno de los ms precisos motores de OCR de cdigo abierto
disponibles.
FreeOCR tiene una sencilla interfaz de Windows para el cdigo subyacente.

Es compatible con la mayora de los archivos de imagen y archivos de varias


pginas TIFF.

Puede manejar formatos PDF y tambin es compatible con dispositivos TWAIN


como escneres.

FreeOCR tambin tiene la interfaz familiar de doble ventana con la configuracin


fcil de entender.

Antes de iniciar el proceso de conversin con un solo clic, puede ajustar el contraste
de la imagen para una mejor legibilidad.

FreeOCR (v.2.03) require Microsoft Net 2.0 framework. El Software compatible


(4.38MB) para Windows XP/Vista tambin se puede descargar desde este sitio alternativo.
Las herramientas FreeOCR vienen con sus propias limitaciones. Y si est escaneando una
pgina tiene que ver mucho con las resoluciones, los contrastes y la claridad de las fuentes.
Desde la perspectiva de un usuario medio, el 100% de precisin OCR sigue siendo una
quimera.
Aunque las herramientas gratuitas eran adecuadas con el texto impreso, no pudieron con
normalidad con el texto manuscrito en cursiva. Mi preferencia personal para el uso
de OCRimproviso se inclina hacia los dos productos de Microsoft que he mencionado al
principio.
Sus propios asuntos dicen. Cul es su herramienta de eleccin? Es gratis su
software OCR y que reconoce a travs de l? Y lo ms importante, reconoces lo que tira
hacia usted? Hganos saber.