Tema: Tecnologías web
Subtema: Introducción a los archivos digitales
Autor: Omar Villota Hurtado
© 2004
Objetivo del Tema: Comprender los usos de las tecnologías para promover la productividad y construir publicaciones bajo competencias de manejo informacional, proporcionando los estándares y las sintaxis HTML a fin de almacenar convenientemente las páginas web en Bases de Datos en línea.
Objetivo del Subtema: Identificar las tipologías de archivos web según sus formatos y su extensión como necesidad para saber si funcionará en la computadora o si requiere de algún tipo especial de software para descomprimirlo, reproducirlo o verlo.
Introducción
La información de un computador está almacenada en archivos digitales (agrupación de información de cualquier tipo de contenido: texto, ejecutables, gráficos, audiovisuales, que puede ser manipulada de forma unitaria por el sistema operativo o por software de computación). Normalmente los archivos están formados por un nombre, un punto y una extensión. El nombre del archivo sirve para diferenciar unos archivos de otros y la extensión, para atribuirle unas propiedades concretas.
Estas propiedades asociadas o "tipo de archivo" vienen dadas por las letras que conforman la extensión. Normalmente su máximo son tres letras aunque existen algunas excepciones (.jpeg, .html, .java, etc.). Cada uno de estos pequeños grupos de caracteres está asociado a un tipo de archivo. Confróntese este website para listar las extensiones de archivos.
Las consideraciones importantes para determinar el formato de los archivos para los diferentes tipos de información en el web son:
- Portabilidad. Distribución electrónica a través de la red y visualización en cualquier plataforma.
- Accesibilidad. Acceso o de fácil comprensión para que el documento se vea en línea o se pueda bajar o imprimir.
- Editabilidad. Administración del documento con el fin de que acepte cambios desde varias fuentes.
- Compatibilidad. Funcionamiento directo del documento con otro dispositivo, aparato o programa para ser usado por cualquiera que lo necesite, sin importar la plataforma.
1. Formatos de texto
Los formatos de archivo más comunes en Internet se pueden delimitar en archivos de texto plano, como
- .HTM (documento hipertexto codificado para ser visualizado por browsers), y
- .TXT (documento sin formato para ser visualizado por editores simples de texto)
y documentos con formato, como:
- .DOC (textos formateados desde estilos de fuentes, párrafos, numeración, viñetas, tabulaciones, etc.),
- .RFT (documento sencillo de texto o formato de texto enriquecido para documentos que utilizan varios idiomas),
- .PDF (documento portable que permite que los documentos formateados sean transferidos por Internet y que se visualicen de la misma manera en cualquier máquina),
- .PS (documento PostScript de texto plano, esencialmente ilegible excepto por una impresora Postscript).
Estos formatos editados bajo los procesadores de texto con formato permiten escribir el documento y ver directamente su resultado final exactamente igual a como aparecerá impreso. El formateador de texto es consecuencia de la propiedad Wysiwyg (What You See Is What You Get: lo que se ve es lo que se obtiene) de ciertos programas procesadores de texto de presentar en pantalla la edición con formato. El concepto se aplica a los documentos que permiten escribir la página sobre una vista preliminar.
De otro lado, los contenidos de todos aquellos formatos de texto pueden ser digitados a través del código ASCII o del estándar de codificación de caracteres Unicode.
El código ASCII es el estándar de American Standard Code for Information Interchange, un código que representa numéricamente un carácter o una acción determinada ya que los computadores entienden solamente números.
El estándar de codificación de caracteres en 16 bits desarrollado por el Consorcio Unicode entre 1988 y 1991 utiliza dos bytes para representar cada carácter. Es decir, Unicode permite representar todos los lenguajes escritos del mundo mediante un único juego de carácteres. Por el contrario, ASCII (de 8 bits) no puede representar todas las combinaciones de letras y marcas diacríticas que utiliza el alfabeto latino; razón por la cual los ideogramas chinos requieren códigos de caracteres especiales.
La siguiente condensación de los tipos de archivos de texto refleja las características fundamentales de cada uno.
Creación: Requiere comprensión básica del HTML, del editor de textos o de software de autor
Formato: Disponibles a partir de HTML 3.2
Visualización: Acceso inmediato desde cualquier browser en pantalla o en línea
Edición: Sujeta a la comprensión HTML
Tamaño: Tienden a ser ligeros por su descarga rapida
Conexión: Se proporcionan desde hipervínculos relacionados
Creación: Cualquier editor de textos
Formato: Opciones limitadas: ningún tipo de letra, ni alineación del texto, etc.
Visualización: Acceso inmediato en línea con la mayoría de los browsers
Edición: Cualquier editor de textos
Tamaño: Tienden a ser muy ligeros
Conexión: Ninguna
Creación: Cualquier editor de textos
Formato: Algunas opciones disponibles: capacidad de alineación, estilos de letra, inserción de imágenes, etc.
Visualización: No puede ser visto directamente en línea; debe ser descargado y abierto en un software de procesamiento de textos
Edición: Cualquier software de procesamiento de texto
Tamaño: Tienden a ser muy ligeros
Conexión: Ninguna
Documento de Formato Portable (.pdf)
Creación: Como todo archivo Postscript necesita del software fuente o de creación para imprimirlo en formato PDF por medio de Distiller, de PDF Writer, de Adobe Acrobat, de Acrobat Capture
Formato: Preserva el del archivo fuente
Visualización: Directamente en línea usando el lector Acrobat Reader o Exchange; de lo contrario, los archivos se descargan para abrir en Acrobar Reader o en Acrobat Exchange
Edición: Necesita Adobe Acrobat para realizar edición total o Acrobat Exchange para ediciones menores (adición de notas, de conexiones, mantenimiento de paginación, etc.)
Tamaño: Significativamente más pequeños si están creados en una fuente electrónica
Conexión: Desde Adobe Acrobat o Acrobat Exchange
2. Formatos de imagen
Estos tipos de archivos también se generan desde una variedad de formatos. De tal manera que los browser deben poder visualizar los formatos o tener la capacidad de convertir fácilmente los formatos.
- Para los documentos digitales en línea, el número de formatos de archivos gráficos o de imágenes es limitado. Los más comunes siguen siendo .GIF y .JPEG.
- Para los gráficos visualizados en un PC, los archivos de imágenes a menudo pueden ser guardados en formato .BMP.
- Para las imágenes Offset, el archivo de mayor resolución es el formato .tiff pero el de mayor uso es el .jpeg o .jpg.
Impresión de Imágenes Externas
Los browser son más flexibles con los formatos que muestran imágenes externas porque estas frecuentemente son impresas usando la Interfaz para Programas de Aplicación (API: un conjunto de convenciones de programación que definen cómo se invoca un servicio desde un programa).
Las API manejan el formato en particular. Por ejemplo, es muy común que ambientes científicos y técnicos hospeden imágenes en formato Postscript. Internet Explorer no puede mostrar los Postscript directamente, pero puede ser configurado de tal manera que cuando se encuentre con un tipo de este archivo aplique la API como ayuda para mostrar el archivo en una ventana separada.
Cada formato de archivo de imágenes utiliza un método de representación que ofrece diversas calidades en los contenidos. También cabe destacar que muchos programas de edición gráfica utilizan sus propios formatos de trabajo con imágenes.
Los siguientes formatos estándar de archivos de imagen reflejan sus características fundamentales.
- .BMP: Extensión originada del nombre del formato BitMaP o Mapa de Bits de gran calidad pero excesivo tamaño no muy utilizado en Internet por su carga lenta.
- .JPEG: Joint Photographic Experts Group también conocido como .JPE y sobre todo .JPG es uno de los archivos más extendidos por su compresión de imágenes fotográficas, ampliamente usado en páginas webs para logotipos y cabeceras.
- .GIF: Graphics Interchange Format cuya característica lo hace ideal para mostrar imágenes estáticas o animadas con fondos transparentes en páginas web.
- .TIFF: Tagget Image File Format es el más común para almacenar imágenes trazadas en bits debido a su posibilidad de manejar varios algoritmos en la compresión. Sin embargo, para ser visualizado por los browser más habituales se necesita instalar plugin específicos.
Esta imagen en blanco y negro es de 1 bit. Lo que significa que cada punto o píxel de la imagen sólo puede tener dos valores solamente: blanco y negro.
Imagen escala grises de 8 bits
La anterior imagen en escala de grises es de 8 bits, lo que significa que cada punto puede tener un valor máximo de 256 tonos. Por lo tanto, un píxel de una imagen en escala de grises puede ser de color negro, blanco, o de un tono de gris entre 254 valores posibles.
Esta imagen de 16 colores es una imagen de 4 bits, ya que cada punto puede mostrar un color entre 16 posibles.
La imagen de la izquierda visualiza 256 colores, esto significa que es una imagen de 8 bits ya que cada punto puede mostrar un color entre 256 posibles.
La anterior imagen es llamada de color auténtico o verdadero debido a que es una imagen de 24 bits (3 x 8 bits = 24 bits) compuesta de puntos rojos, verdes y azules, cada uno de los cuales puede mostrar un valor entre 256 posibles. Una imagen digital de color auténtico es lo más parecido a una imagen de calidad fotográfica, ya que puede mostrar un color entre 16,7 millones de tonos posibles.
3. Formatos de sonido
Igual que los archivos de imágenes, los de sonidos también se diseñan en una variedad de formatos de acuerdo a la plataforma.
Para iniciar expliquemos lo elemental. Los archivos de sonido son todos aquellos que contienen audios (música, voces, emisoras, etc.). La multitud de formatos obedecen a los sistemas de compresión utilizados para convertir el sonido análogo en digital.
Generalmente los browser no tienen capacidad para reproducir los sonidos configurados, pero pueden usar otros programas fácilmente para escucharlos. Se requiere, naturalmente, que sean descargados tanto el archivo como el plugin de sonido.
De manera general, los formatos actuales dependen de cada plataforma. Así, por ejemplo .AIFF es un formato de audio nativo para Macintosh; .WAV es propio de Windows, pero ambas plataformas pueden reproducir y guardar sonidos en formatos .AU, .SND y .MPEG. Ambas también usan el formato .MIDI, pero sólo para música.
Otros formatos comunes
- AU: es un formato de Sun Microsystems, muy popular en Unix cuya ventaja es que está disponible para una variedad de sistemas: máquinas PC, Mac y Unix pueden escuchar estos sonidos. No obstante, este archivo comparativamente tiene una calidad de sonido muy pobre.
- MIDI: es un formato muy eficiente para diversos tipos de música y algunos sonidos excluyendo la voz. Aún así, no está suficientemente apoyado como recurso para la Web.
- MP3: es el formato más extendido para la compresión de música en Internet. Su alta calidad lograda en su pequeño tamaño lo hace el favorito de la mayoría de los usuarios para comprimir su música y compartirla en red.
- OGG: este formato es de fuente abierta y libre de patentes. Muy profesional y de alta calidad como cualquier otro.
4. Formatos de video
Es posible enviar y ver archivos de películas a través de la Web a pesar de su gran tamaño. Por ello se aconseja una conexión de red rápida como las ofrecidas por sistemas de cable y las relacionadas con tecnologías de bandas anchas.
Como los formatos de sonido, los browser no ruedan películas que reciben directamente del servidor. Es necesario, guardar la película en un CD-Rom o disco duro para activarla mediante un programa ayudante que pueda rodar la película, pues sus formatos son especiales.
Esto debido al formato de compresión usado, que no siempre es reconocido por el computador a excepción que tenga actualizados los codecs para cada uno de los formatos. Es muy común entonces escuchar sólo el sonido y no ver la imagen al intentar visualizar un vídeo.
Los siguientes formatos de películas o de video no sólo contienen imágenes sino también sonidos acompañantes.
- QuickTime: es posiblemente el "formato" (en verdad se trata de un paquete de desarrollo de software que permite la sincronización de audio, vídeo, texto y música) más popular para Windows y Macintosh, junto al MPEG, por su gran disponibilidad de conexiones desde diversos browser y por su habilidad de sincronizar multimedias múltiples comunes. Versiones de QuickTime Multimedia están gratuitamente disponibles para Macintosh, Windows 95 y Windows 98/NT desde el sitio oficial quicktime. Los archivos de QuickTime generalmente tienen la extensión .mov o .QT.
- QuickTime VR: es la reciente adición a la tecnología de QuickTime. QTVR está diseñado para proveer la sensación de realidad virtual al usuario bajo una vista de 360 grados. De esta forma el observador se mueve a través de las escenas y de los objetos a su alrededor.
- Microsoft Video for Windows: es el formato creado para muchas películas que se originan en los sistemas de Windows y están en formato .AVI. Este formato no utiliza una sola línea de tiempo común para rodar imágenes y sonidos, así que estas películas algunas veces exhiben problemas de sincronización en audio y vídeo.
- Moving Pictures Experts Group: también conocido como MPEG o MPG es un modo estándar para comprimir vídeo e imágenes en movimiento.
5.Formatos de compresión Los formatos de compresión son de gran utilidad a la hora de almacenar la información en los distintos soportes (CD-Rom, disco duro, diskete, memoria USB, servidores web, servidores de e-mail) ya que hacen que el contenido ocupe el menor espacio posible y que se puedan reunir muchos archivos en uno sólo. Los siguientes formatos de compresión son los más empleados en el mercado.







