Atlas & Maps

Definición de Fichero

0

 {m.} Caja o mueble donde se guardan las fichas o cédulas.

 [Informática] Fichero.
Conjunto homogéneo y organizado de información referente a un mismo tema. Un fichero o archivo es en realidad un conjunto de registros referentes a entidades u objetos del mismo tipo.
Una primera clasificación de ficheros puede ser la siguiente:
– ficheros de texto
– ficheros binarios
– ficheros de datos.

Ficheros de texto.
Los ficheros de texto están formados por una agrupación de caracteres alfanuméricos codificados en binario, utilizando los códigos ASCII o EBCDIC.
Existe un programa para crear el fichero; independientemente de dicho programa, el sistema operativo añade un carácter (no imprimible y comprendido entre los números 0 y 31 del código ASCII y EBCDIC) que indica el final del fichero. Normalmente este carácter, que se designa como EOF (End Of File) o fin de fichero, es el carácter ASCII 26, que en el citado código se llama abreviadamente SUB.
Este tipo de ficheros se organiza normalmente en líneas o registros de iguales o diferentes longitudes. Para diferenciar las líneas entre sí, al final de cada una de ellas los programas editores de texto, que crean este tipo de ficheros, añaden uno o dos caracteres no imprimibles, que hacen las veces de separador entre registros. La mayor parte de los editores de texto añaden los caracteres 13 y 10 del ASCII. Ambos caracteres sirven para separar líneas, a efectos de visualización en el monitor de impresión.
El carácter 13 o CR (Carriage Return), o de retorno de carro, lleva al cursor o cabezal al principio de línea o registro actual.
El carácter 10 o LF (Line Feed) hace que el cursor o el cabezal se sitúen en la línea siguiente a la actual en la misma columna que ocupan. Algunos editores emplean la combinación de ambos caracteres, para que el cursor o el cabezal de la impresora se sitúen al principio de la línea siguiente, desde la posición actual en la que se encuentren. Otros editores utilizan únicamente el carácter LF para separar las diferentes líneas o registros del fichero.

Ficheros binarios.
Los ficheros binarios están constituidos por un conjunto de bytes. Se les conoce también como ficheros de código máquina. No se pueden imprimir y suelen ser programas ejecutables directamente desde el sistema operativo del ordenador.
En estos ficheros, los caracteres LF y CR no tienen los efectos reseñados en los ficheros o archivos de texto, y tampoco existe el carácter de EOF con el significado de final de fichero.
Durante el tratamiento de ficheros binarios, el ordenador puede detectar cuándo se llega al final de los mismos a través una tabla que contiene el nombre, comienzo y número de bytes de cada fichero. Dicha tabla la crea el sistema en el dispositivo (en el directorio de trabajo) donde se almacenan los ficheros, durante su creación o modificación. Existe otra tabla situada en las primeras pistas del disco: la FAT (File Allocation Table), que contiene un índice de las posiciones físicas que ocupa cada fichero, e indica cómo está distribuido el espacio en el dispositivo (disco).

Ficheros de datos.
Están formados por un cierto número de registros, cada uno de los cuales contendrá información relativa a un elemento del fichero.
Si se piensa en las estructuras que conforman un fichero: carácter (estructura más pequeña), campo, subcampo y registro, la estructura de un fichero puede entenderse como la manera jerárquica en la que se presenta la forma en que el fichero es visto por el usuario del mismo; Por ello, el agrupamiento lógico de las informaciones, según las relaciones que lo componen, reciben el nombre de “registros lógicos”.
Aunque sea temporalmente, todo fichero necesita de los soportes externos de almacenamiento, por lo que su estructura física viene determinada por las características de dichos soportes.
Lógicamente, se entiende que un registro va a continuación de otro, pero físicamente esto no ocurre así, normalmente suelen estar distanciados unos de otros, dependiendo de la disponibilidad de espacio del soporte. En cualquier caso, siempre conservan la relación lógica entre ellos.
Al tratar la estructura física del fichero surge el concepto de “registro físico”, al cual se le puede definir como la unidad física de información que el ordenador es capaz de leer o grabar en una operación de entrada/salida de una sola vez.
No se puede hablar de forma general de un registro físico, ya que depende del soporte de almacenamiento en el que se considere que está ubicado. En un disco suele considerarse como registro físico un sector y en la impresora una línea impresa.
De todo esto se deduce que la longitud del registro lógico no tiene nada que ver con la del registro físico.
Puede ocurrir que un registro físico contenga exactamente uno o varios registros lógicos, cuando la longitud del registro físico sea igual o mayor a la de los registros lógicos, en cuyo caso se pueden transferir varios registros lógicos de la memoria al disco o del disco a la memoria empleando una sola operación de lectura/escritura. A este fenómeno se le conoce como “bloqueo” y a los registros físicos, en tal caso “bloques”. El número de registros lógicos contenidos en un bloque se conoce como “factor de bloqueo”.
También puede ocurrir que la longitud del registro lógico sea mayor que la del registro físico e hiciera falta más de un registro físico para contener un registro lógico, de lo que se deduce que no tiene por qué existir una relación directa entre bloque y registro físico, aunque a veces se traten ambos términos indistintamente. Desde luego que la situación óptima es aquella en que uno o más bloques de registros ocupan el espacio exacto de un registro físico, pero esto no ocurre con frecuencia.
Cuando no se consigue que el tamaño de uno o varios bloques sea igual a la longitud del registro físico, debido, por ejemplo, a que la longitud de este último se halle condicionada al dispositivo particular de entrada/salida, ocurre que existe un espacio físico desaprovechado. Cuando se transfiere la información, desde el punto de vista lógico, da la impresión de que se transfieren bloques sin que el espacio desaprovechado sea apreciable; es por eso que parece que existe una similitud entre bloque y registro físico.
En la relación entre registro físico y lógico pueden presentarse las siguientes situaciones:
1.- Que el registro lógico sea menor que el registro físico.
2.- Que el registro lógico sea igual que el registro físico.
3.- Que el registro lógico sea mayor que el registro físico; se habla en este caso de registros expandidos.
En general, se puede decir que el registro lógico está enfocado al problema (software) y el registro físico a la máquina (hardware). Existen otros registros que el ordenador utiliza internamente en la unidad aritmético lógica, los cuales no son considerados ni lógicos ni físicos, ya que resuelven problemas lógicos de la máquina (firmware).

Operaciones con ficheros.
Sea cual fuere la estructura interna con la que esté organizado un fichero, sobre éste se pueden realizar una serie de operaciones básicas, que implican a la mayoría de sus registros. Estas operaciones son:
A. Creación del fichero: Consiste en crear espacio para al menos un registro, en el soporte externo.
B. Actualización y mantenimiento: Consiste en renovar los registros del fichero realizando cualquier operación de: inserción de un nuevo registro, borrado de un registro y/o modificación del contenido de los campos de que se compone. La actualización también consiste en modificar el valor de algunos de los campos de los registros por valores nuevos o actuales.
C. Consulta: Con la que se puede acceder a uno o más registros del fichero. La localización de estos registros se hace utilizando un identificativo de búsqueda. La operación de consulta resultará más fácil si previamente se realizó una operación de clasificación, la cual consiste en alterar el orden de los registros del fichero, según el criterio de orden elegido por el usuario.
D. Extracción: Consiste en consultar varios o la mayoría de los registros de un fichero, con el objeto de que sean copiados sobre otro fichero. Esta operación también suele llamarse de reorganización. En líneas generales, de lo que se trata es de restaurar la estructura inicial del fichero, la cual se habrá ido modificando por las sucesivas operaciones.
E. Supresión del fichero: Consiste en crear todo el espacio que ocupa el fichero en el soporte externo.
El control de estas operaciones lo efectúa el Sistema de Gestión de Ficheros. Dicho sistema está formado por un conjunto de programas que realizan la labor de interface entre las estructuras lógica y física, y se encuentra integrado en el sistema operativo del ordenador.

Clasificación de ficheros.
Se pueden establecer dos criterios diferentes para clasificar a los ficheros:
1.- Según la forma de utilización de los mismos:
– Ficheros de entrada
– Ficheros de salida
– Ficheros de entrada/salida
2.- Según el objeto o la función a la que se destinan:
– Ficheros maestros
– Ficheros de movimiento
– Ficheros de trabajo

Ficheros de entrada
Son aquellos cuya información va directamente a la memoria del ordenador. También se denominan ficheros de procedencia u origen, y se crean con anterioridad al proceso que los utiliza en un momento determinado.

Ficheros de salida
Se utilizan para almacenar la información que pasa de la memoria del ordenador a los soportes de almacenamiento externo. Se generan durante la ejecución de un programa.

Ficheros de entrada/salida
Son los que se utilizan tanto para introducir datos a la memoria del ordenador como para almacenar los datos procesados por el mismo. Un ejemplo de fichero de entrada/salida es aquel cuya información se introduce al ordenador, donde es actualizada y pasada finalmente de nuevo al fichero.

Ficheros maestros
Son aquellos en los que sus registros permanecen inalterables (o casi inalterables) a través de los distintos procesos en los que intervienen. Así pues, un fichero que se procese realizando una sola operación de consulta se puede considerar como fichero maestro o permanente. Son ficheros muy estables y perdurables en el tiempo, por lo que exigen protecciones contra cualquier alteración no deseada de su contenido, y deben contar con los medios precisos para reconstruirlos en caso de pérdida total o parcial de la información que contienen.
Dentro de los ficheros maestros se puede hacer una triple subdivisión, según la frecuencia de su actualización:
– Ficheros de situación.
– Ficheros de constantes.
– Ficheros históricos.

Ficheros de situación
Son los que contienen registros que se actualizan con más frecuencia. Contienen en cada momento la información actualizada, por lo que las operaciones de actualización y consultas sobre ellos suelen ser frecuentes.
Las modificaciones de la información contenida en los ficheros se hace en tiempo real, es decir, en el instante en que ocurren los cambios.
A veces se les llama “ficheros en línea”, puesto que el proceso de actualización debe hacerse de forma instantánea. Estos ficheros reciben datos que le han sido enviados al ordenador a través de líneas de telecomunicación.
Un ejemplo de este tipo de ficheros es aquél en el que estén contenidas todas las cuentas corrientes de los clientes de una entidad bancaria, en las que se producen continuas modificaciones y es preciso que éstas se computen al instante. Otro ejemplo puede ser el fichero de reservas de una empresa de transportes, de las existencias de un almacén, etc.

Ficheros de constantes
Los datos de este tipo de ficheros no sufren modificaciones habitualmente, aunque a veces ocurre que forzosamente deben ser actualizados. En general, los registros que forman estos ficheros tienen una serie de campos, unos perennes y otros susceptibles de ser modificados. Toda la información que contienen es información de consulta, nunca contienen resultados.
Ficheros maestros de situación podrían ser, por ejemplo, aquéllos que contengan una tabla de valores de una función trigonométrica, o una tabla de logaritmos, o una lista de los departamentos de la empresa.

Ficheros históricos
Son aquellos cuyos registros contienen información referente a resultados de operaciones. Constituyen, para el ordenador, el resultado del tratamiento de la información.
En general se utilizan para confeccionar estadísticas y preparar informes. La información que utilizan pueden tomarla, bien de los ficheros de constantes o de ficheros de situación.
El índice de crecimiento de este tipo de ficheros es normalmente elevado.
Su contenido puede ser información ya resumida y directamente tratable, o información detallada a partir de la cual se debe confeccionar el resultado final.
Un ejemplo de este tipo de ficheros puede ser aquél que contenga todas las incidencias ocurridas en un determinado período de tiempo en una empresa de ferrocarril, desvíos de trenes, salidas aplazadas, llegadas puntuales, etc. con la finalidad de elaborar estadísticas.

Ficheros de movimientos
Son los que contienen los registros resultantes del tratamiento de las transacciones o modificaciones, de ahí que también se les llame ficheros de transacciones. Van a servir, en la mayoría de los casos, para actualizar o consultar ficheros permanentes y para producir, junto con los maestros, la información final.
Estos ficheros contienen la información sólo durante el tiempo que dure el proceso de actualización o consulta; cuando el proceso termina, no tiene ningún sentido mantenerlos activos. Su desaparición puede ocurrir en el momento de terminar la actualización del fichero maestro, o cuando ya haya otro nuevo fichero de movimientos que intervenga en el proceso.
Un ejemplo de fichero de movimiento que modifique una determinada información de un fichero maestro podría ser aquél que contuviera todas las variaciones sufridas por los empleados, cuyos datos se encontrarían en el fichero maestro de la empresa. Las variaciones que podrían sufrir los datos de los empleados serían, por ejemplo, la categoría profesional, las retenciones, el número de hijos, etc.

Ficheros de trabajo
También denominados ficheros de maniobra o scratch.
Son aquéllos cuyos registros contienen información referente a resultados intermedios, resultados definitivos, o bien van a servir para suministrar información a otros procesos. Estos ficheros se confeccionan en el mismo proceso y se utilizan en el propio programa para tomar esos resultados o en programas totalmente ajenos.
Este tipo de ficheros puede ser diseñado automáticamente por el sistema o bien por el programador.
Una vez utilizados, estos ficheros desaparecen, ya que sus datos se introducen y se procesan en tiempo real.
Su necesidad viene impuesta cuando un proceso requiere una capacidad de memoria principal que sobrepasa la existente, con el fin de conservar los resultados intermedios que se van produciendo.
Si quisiéramos emitir resultados de la contabilidad de una empresa, necesitaríamos almacenar resultados parciales en estos ficheros auxiliares para utilizarlos más tarde.

Características de los ficheros.
Como características inherentes a cualquier fichero se conocen las siguientes:
– Tamaño
– Crecimiento
– Volatilidad
– Actividad
Tamaño: Se calcula en función de las longitudes de los registros y del número de registros que se prevé que pueda contener el fichero. Generalmente se mide en bytes o caracteres.
El tamaño del fichero está directamente relacionado con el tiempo necesario para procesarlo, tiempo que a su vez se ve afectado por la organización del fichero.
Si un fichero es pequeño no habrá problema a la hora de elegir la organización, ya que el tiempo que se puede tardar en procesarlo será prácticamente el mismo. Si el fichero es grande, el tiempo de proceso puede variar mucho, dependiendo de la organización elegida.
Crecimiento: Este parámetro indica el incremento del tamaño del fichero. El crecimiento del fichero debe ser evaluado en la etapa de creación del fichero. Este parámetro debe comprobarse de forma periódica, sobre todo en aquellos en los que no sean habituales los borrados y sí las inserciones de registros.
El crecimiento viene dado en % y se calcula aplicando la siguiente fórmula:

Nº de inserciones (altas) – Nº de borrados (bajas)
C
Nº Inicial de Registros

Si el parámetro de crecimiento de un fichero es próximo a 0, diremos que dicho fichero es estable. Cuando se dé este caso, el número de altas y bajas en el fichero será prácticamente el mismo.
Volatilidad: Indica en % el movimiento de registros que tendrá el fichero. Expresa, pues, el número de altas y bajas que se pueden producir en un cierto período de tiempo en el fichero.
Se calcula aplicando la siguiente fórmula:

Nº de inserciones (altas) + Nº de borrados (bajas)
V*100
Nº Inicial de Registros

Si el número de altas y bajas en un fichero es elevado, se dice que el fichero es volátil. En caso contrario se dice que es estático.
La volatilidad influirá directamente en la elección de la organización del fichero y del soporte de almacenamiento que deba contenerlo.
Actividad: Nos da el porcentaje de registros que son accedidos en el proceso normal de un fichero. Se tienen en cuenta, para efectuar el cálculo, todos los accesos que se efectúen, es decir, los de consulta, modificaciones, inserciones y borrados.
La actividad viene dada en % y se calcula aplicando la siguiente fórmula:

Nº de Accesos
A =  *100
Nº Inicial de registros

Cuando la actividad de un fichero es alta conviene calcular la actividad frente a las consultas, modificaciones, inserciones y los borrados. De esta forma se consigue una evaluación más exacta de la utilización del fichero, de manera que la organización elegida considere la actividad que más alto porcentaje presente.
Por ejemplo, si un fichero tiene un elevado índice de acceso para consultas, mientras que el número de inserciones y borrados es muy bajo (fichero estático), convendrá dotarlo de una organización que permita tiempos de búsqueda muy pequeños, con el fin de que la información requerida esté rápidamente disponible.
Se pueden definir también las características de los ficheros que deben precisar un análisis:
– Características físicas: dependen directamente del soporte elegido.
– Características no físicas: son relativamente independientes del soporte.

Las características físicas de un fichero que se han de tener en cuenta en la fase de análisis son:
– El soporte: reutilizable o no.
– El lugar geográfico donde se encuentra el fichero.
– La longitud y el factor de bloqueo.
– El volumen que ocupa el fichero.
– Organización. Acceso: secuencial, directa, encadenada…
– La frecuencia de reorganización.
– Los criterios de clasificación.

Las características no físicas son:
– El tipo de fichero.
– Las tasas de actividades.
– El número de versiones de retención.
– La fecha de creación, frecuencia de puesta al día, período de retención, etc.
– Los niveles de elaboración.
– Designación (codificación) de los ficheros.

Bibliografía.
LEWIS y SMITH, Estructuras de Datos. Programación y Aplicaciones, Paraninfo.
ÁLVARO, J. y RODRIGUEZ, A., Introducción a la Informática y Archivos de Datos. Alhambra Informática.
JIMÉNEZ SERRANO, J.P. y LÓPEZ ALONSO, C., Conceptos Básicos de Informática.
LINFO CASTELLANI, X. Método General de Análisis de una Aplicación Informática. Tomos I y II. Masson.

Enlaces a Internet.

http://www.matisse.net/files/formats.html; Página en la que se describen los principales formatos de ficheros empleados.

FICHERO

Fuente: Britannica

So, what do you think ?