Buscar este blog

16 octubre, 2011

¿CÓMO SE DIGITALIZA DESDE GIMP 2.6 PORTABLE?



           1.   Menú -> Archivo -> Crear -> Escaner/Cámara 


      
           2.    Se abre un cuadro donde se debe seleccionar el escáner


                                 
            3.    Se visualiza el resultado



Después de obtener el resultado del documento digitalizado, se puede proceder a realizar los cambios en los parámetros de acuerdo a las necesidades, por ejemplo, resolución, profundidad, además, se puede guardar en diferentes formatos como se menciono anteriormente y escoger si se desea con comprensión o sin comprensión.




“LOS DOCUMENTOS DE TEXTO Y SU ESTRUCTURA”


Los documentos son algún tipo de información que contiene texto específico con el fin de transmitir un conocimiento. Estos documentos poseen una estructura que se basa en los metadatos, se puede hablar de documentos estructurados, semiestructurados y no estructurados.


Los documentos estructurados son los que poseen una delimitación de la información, los documentos semiestructurados son más flexibles y cambiantes, no poseen un esquema definido, pueden presentar muchas veces la información como una base de datos y por último los documentos no estructurados que son los que no poseen una estructura definida que facilite la interpretación de su contenido por alguna interfaz, es decir, no se diferencia la información por lo que se hace necesario modificarla para agregarle datos que faciliten la obtención de la información necesaria.


Con respecto a la utilización de los metadatos se puede decir que son los datos que analizan datos que pueden no ser explícitos en el texto, proporcionado información básica y útil para que los usuarios recuperen información; existen dos escuelas, la primera es la de Catalogación que habla de los metadatos del mundo bibliotecario en el cual se ve la aplicación con el formato MARC que define campos para ingresar entradas bibliográficas. Y la segunda escuela, la estructuralista, dio a conocer el término de lenguaje de marcado, del cual el más conocido y usado es el XML, que básicamente lo que trata es de utilizar nuevos elementos dentro del texto para describir mejor la información.

Existen varias opiniones en cuanto a la clasificación y tipos de metadatos, pero los más precisos son los metadatos descriptivos que se refieren a la manera como fue creado o producido el documento y el metadato semántico trata del contenido del documento.

Finalmente, se habla de la búsqueda de la información que satisfaga las necesidades de los usuarios en cuanto a tiempos, cantidad y sobre todo calidad, para esto se deben utilizar adecuadamente los metadatos y así poder atender dos necesidades primordiales, el acceso a la información y la utilidad de la información. Teniendo en cuenta que existen dos perspectivas en la búsqueda y consulta de la información, estas son Recuperación de la Información que se encamina hacia la cantidad de documentos en una búsqueda específica, y la segunda es Extracción de la Información, orientada a la precisión de documentos.


¿QUÉ IMPORTANCIA TIENE EL MANEJO DE DOCUMENTOS ESTRUCTURADOS PARA LAS ORGANIZACIONES?

En una entidad cualquiera que sea, los documentos estructurados ayudan a saber información específica, con registros y datos precisos. Si se tienen los documentos estructurados, significa que están ordenados de alguna manera para poder ser recuperados por los usuarios de la información.

Lo importante a la hora de estructurar los documentos, es asignarle los metadatos adecuados de acuerdo a las necesidades de los usuarios para poder recuperar y extraer la información y los documentos adecuadamente. También se debe tener en cuenta que por ejemplo tener y manejar una base de datos hace que algunos datos importantes se pierdan, es por esto que se debe tener claro el planteamiento de los metadatos en el momento de describir la información tanto del entorno de creación y producción como de su contenido, que es lo primordial, e igualmente para garantizar el acceso y utilidad de la información porque es la historia y trascendencia de las actividades que realiza la organización. 

GIMP 2.6 PORTABLE



Es un software gratuito que sirve para editar imágenes, en este caso se utilizo la versión portátil, tiene la ventaja que se puede llevar en un dispositivo de almacenamiento de datos como una USB y se puede usar en cualquier equipo sin necesidad de una instalación previa.





Algunas de sus características son:
  •  Tiene herramientas que permiten editar o retocar imágenes
  •  Permite trabajar con diferentes extensiones como tiff, jpg, gif, png, entre otras
  •  Se pueden manipular las imágenes, es decir, se puede parametrizar según las necesidades
  •  Trabaja con animaciones
  •  Se puede utilizar en varios sistemas operativos

Además, cuenta con unas herramientas, algunas de ellas son:
  • “Herramientas de selección (rectangular, esférica, lazo manual, varita mágica, por color),
  • Tijeras inteligentes,
  • Herramientas de pintado como pincel, brocha, aerógrafo, relleno, texturas, etc.
  •  Herramientas de modificación de escala, de inclinación, de deformación, clonado en perspectiva o brocha de curado (para corregir pequeños defectos).
  • Herramientas de manipulación de texto.
  • Posee también muchas herramientas o filtros para la manipulación de los colores y el aspecto de las imágenes, como enfoque y desenfoque, eliminación o adición de manchas, sombras, mapeado de colores, etc.
  • También posee un menú con un catálogo de efectos y tratamientos de las imágenes”[1].
________________________________
[1] Colaboradores de Wikipedia. GIMP [en línea]. Wikipedia, La enciclopedia libre, 2011 [fecha de consulta: 12 de octubre del 2011]. Disponible en: <//es.wikipedia.org/w/index.php?title=GIMP&oldid=50467092>.

RECONOCIMIENTO ÓPTICO DE CARACTERES (OCR)

Es una aplicación asociada a la digitalización de documentos, la cual realiza un reconocimiento de caracteres o símbolos presentados en un texto; permitiendo así que el contenido del documento se pueda usar y moldear de acuerdo a nuestros requerimientos. Existen varios programas que realizan este procedimiento, uno de ellos es:

ABBY FINE READER 10

Éste programa a parte de realizar el reconocimiento a los textos planos tambien reconoce elementos en las imágenes, tablas e incluso logra identificar el idioma en el cual está escrito el documento. Es compatible con todos los escáneres, exporta la copia del resultado en pdf, soporta las siguientes extensiones: DOC, DOCX, PDF, RTF, TXT, XLS, XSLX, HTML, CSV ; exporta de e-books a html. Por otra parte para hacer uso de este programa se requiere sistema operativo winxp/7/vista.  

¿CÓMO FUNCIONA?

Éste programa es muy fácil de usar, a continuación se hace una explicación a partir de imágenes para dejar claro su uso y funcionamiento:


1. Abre el programa y selecciona la opción que requiere



 2. Seleccionamos el archivo a pasar por ocr


3. Inicio de reconocimiento de caracteres




4. Finalización del reconocimiento 

En la parte izquierda se muestra el documento al cual se le está realizando el reconocimiento y en la parte derecha se muestra el resultado del documento.



5. Resultado final


Finalmente nuestro documento queda automáticamente en una hoja de word, lista para guardar. 


Lo anterior muestra la forma tan sencilla de manejar este programa de OCR, dejando ver que es rápido, fácil y de buena calidad.



EXTENSIONES PARA FORMATO DE VIDEO


ü  AVI: este formato es útil para ver películas o videos; su funcionamiento se basa en que guarda una capa de video y otra de sonido. Se puede abrir con los programas DirectShow y Windows Media.

ü  MOV: este tipo de archivos fue desarrollado por Apple para visualizar imágenes dinámicas. Se pueden ver solo con Quick Time u otros reproductores como Moopeg.

ü  MPEG: es un compresor de imágenes, ofreciendo compatibilidad, no degrada la calidad de la imágen y permite una alta comprensión de las imágenes.

ü  WMV: es propiedad de Microsoft. Este tipo de archivos tiene mucho que ver con WMA pero este es un compresor de videos. Se abre con el programa Windows Media Player.

ü  FLV: formato que se utiliza para realizar transmisión de videos por Internet. Se puede reproducir por medio de Adobe Flash Player, Real Player, FLV Player, entre otro.

EXTENSIONES PARA FORMATO DE SONIDO


ü  WAV: posee una amplia calidad pero ocupa gran espacio de la memoria debido a que no están comprimidos, están codificados por unos y ceros, codificación binaria. Este tipo de archivos se pueden reproducir por medio del programa Windows Media player.

ü  MP3: este tipo de archivos están comprimidos pero los cambios no son notables para el oído humano así que no baja la calidad del sonido, esto conlleva a que se reduzca el espacio de almacenamiento.

ü  RM: esta extensión de archivos se da en los sonidos reproducidos online, la agilidad en la recepción de este tipo de archivos está sometido a la conexión de Internet que tenga el usuario.

ü  WMA: “es un formato de compresión de audio con pérdida aunque también existe este formato con compresión sin pérdida. Y está desarrollado básicamente con fines comerciales para el reproductor integrado en Windows, Windows Media Player. Está por debajo del nivel de los anteriores formatos”[1].

ü  AIF: este formato permite guardar archivos de audio sin ninguna perdida, permitiendo una rápida reproducción del contenido. Lo abren programas como TUNES y Windows Media Player.


[1] RODRÍGUEZ Navarro, Juan Ignacio. Tipos de formatos o archivos de audio. [termino de búsqueda: formatos de audio]. [en línea]. [Fecha de consulta: 31 de Agosto de 2011]. Disponible en: <http://www.desarrollomultimedia.es/articulos/tipos-de-formatos-o-archivos-de-audio-y-codecs.html

EXTENSIONES PARA FORMATO DE IMÁGEN


  • TIF: es un tipo de formato que almacena imágenes rasterizadas de alta calidad; es compatible con varios Sistemas Operativos como Linux, Mac y Windows, entre otros. Permite además almacenar las imágenes a color y a escala de grises. Se puede abrir con los programas: Visor de imágenes y fax de Windows, Picture Viewer, Paint y Microsoft Picture Manager
  • JPG: este formato es el más conocido para compresión de imágenes, pero debido a que esto afecta la calidad de la imagen, se puede seleccionar el nivel de compresión que se desea, según las necesidades. La ventaja de este formato es que así se comprima hasta a un 10% la imagen, no se percibe la diferencia con respecto al original. Se puede abrir con los programas: Microsoft Picture Manager, Picture Viewer, Paint e internet Explorer
  • RAW: este formato realiza el proceso llamado negativo digital, ya que los pixeles que el capta no los procesa  ni los transforma se mantienen tal cual, adicional a esto este archivo no se le realiza ninguna comprensión de imágenes lo que hace que mantenga la calidad de la imagen. Uno de los programas por los que se puede manejar este archivo es el de camera RAW  de adobe.
  • BMP: este programa es utilizado para usar imágenes de fondos de Windows y su usa más frecuentemente para generar  imágenes de bajo peso. Los programas que maneja este archivo son: Windows y el MS-2.
  • Eps Encapsulated Postscript: se usa básicamente para la impresión profesional, también es bueno utilizarlo para intercambiar creaciones de maquetación. Se puede usar con los siguientes programas: page maker y quarkxpress.

 

ALGUNAS EXTENSIONES PARA FORMATOS TEXTO


ü  TXT: Es texto plano, por lo tanto no se le pueden realizar cambios, es decir, no se puede editar. Se abre con el programa Bloc de notas/WordPad.

ü  PDF: Es un almacenador de archivos, que se ha convertido en un estándar de distribución debido a sus ventajas como protección a ciertas actividades como la impresión, modificaciones, entre otros. El programa utilizado para visualizarlo es Acrobat Reader.

ü   RTF: Es un formato que es compatible con varios programas. Se puede abrir con Microsoft Word, WordPad, OpenOffice.org Writer y Corel WordPerfect, o con la mayoría de las aplicaciones de edición de texto.

ü  HTML: Por medio de este se utilizan etiquetas para desarrollar el contenido de textos de forma organizada, y así permitir que este texto se proyecte en las páginas web.

ALGUNOS CONCEPTOS IMPORTANTES


·         Qué es la Resolución?
Se trata de la nitidez con la que cuenta la imagen y además del detalle que se puede observar,
entre más pixeles tenga una imagen mayor es la resolución.

·         Qué es la Profundidad de Bits?
Es la cantidad de bits utilizados para definir cada pixel, es decir, que es la cantidad de colores disponibles en cada pixel de una imagen. Entre mayor sea la cantidad de bits por pixel, mayor es la precisión de la imagen.

·         Qué es RGB?
Es la que hace referencia a la composición y la intensidad de los colores primarios, rojo, azul y verde, los cuales son la base para realizar mezclas haciendo posible representar un color.

·         Qué es y para qué sirve la compresión de imágenes?
Se reduce el tamaño de un archivo para facilitar su almacenamiento, transmisión y procesamiento, es decir, que hace que un archivo de imagen pese menos. 

¿QUÉ ES LA DIGITALIZACIÓN DE DOCUMENTOS?


Es un proceso mediante el cual se convierten en imágenes los documentos en cualquier soporte, para luego poder ser reproducidos en una pantalla de computador; este proceso se hace con la ayuda de un escáner y los programas adecuados para manipular este tipo de archivos.

La digitalización se puede utilizar para:

·         Preservar y Conservar la información importante
·         Facilitar y optimizar el proceso de consulta
·         Varias usuarios a la vez pueden acceder a la imagen