Base de datos de archivo plano
A base de datos de archivo plano es un base de datos que, cuando no se utiliza, se almacena en su ordenador host como un ordinario, no indizados "plana" archivo. Para acceder a la estructura de los datos y manipularlo, el archivo debe ser leído en su totalidad en la memoria del ordenador. Sobre la terminación de las operaciones de base de datos, el archivo se escribe otra vez en su totalidad para el sistema operativo anfitrión. En este modo almacenado, la base de datos dispone de ninguna estructura que puede verse externos al archivo y por lo tanto se refiere como un "archivo plano".
El término generalmente ha implicado una base de datos pequeño y simple. Como memoria de la computadora se ha vuelto más barata, bases de datos más grandes y más sofisticados pueden celebrarse ahora en la memoria en su totalmente para un acceso más rápido, pero estos no generalmente se remitirían a como bases de datos de archivos planos.
Una lima plana puede ser una texto sin formato archivo o un archivo binario. No suelen ninguna relación estructural entre los registros.
Contenido
- 1 Resumen
- 2 Historia
- 2.1 Implementaciones contemporáneas
- 3 Las operaciones de transferencia de datos
- 4 Terminología
- 5 Base de datos de ejemplo
- 6 Referencias
Resumen
Archivos de texto plano generalmente contienen una registro por línea,[2] Existen diferentes convenciones para representar datos. En valores separados por comas y valores separados por delimitadores archivos, campos pueden ser separados por delimitadores tales como coma o ficha caracteres. En otros casos, cada campo puede tener una longitud fija; valores cortos pueden ser rellenados con caracteres de espacio. Formato adicional puede ser necesaria para evitar colisión delimitador. Soluciones más complejas son lenguajes de marcado y lenguajes de programación.
Utilizar delimitadores incurre en algunos Overhead en la localización de los cada vez que son procesados (a diferencia del formato ancho fijo), que puede tener rendimiento implicaciones. Sin embargo, el uso de delimitadores de carácter (especialmente comas) es también una forma cruda de compresión de datos que puede ayudar el rendimiento global mediante la reducción de los volúmenes de datos — especialmente para transmisión de datos propósitos. Uso de delimitadores de carácter que incluyen un componente () longitudNotación declarativa) es comparativamente raro pero reduce enormemente los gastos asociados con la localización de la medida de cada campo.
Son ejemplos típicos de archivos planos / etc/passwd
y / etc/group
en Unix-like sistemas operativos. Otro ejemplo de un archivo plano es una lista de nombres y direcciones de los campos Nombre, Dirección, y Número de teléfono.
Una lista de nombres, direcciones y números de teléfono escritos a mano en una hoja de papel es una base de datos de archivos planos. Esto también puede hacerse con cualquiera máquina de escribir o procesador de texto. A hoja de cálculo o editor de texto programa puede utilizarse para implementar una base de datos del archivo plano, que luego puede ser impresa o usado en línea para capacidades de búsqueda mejorada.
Historia
Los primeros usos de máquinas de computación fueron las implementaciones de bases de datos simples. Herman Hollerith concibió la idea de ese censo datos podrían ser representados por los agujeros perforados en tarjetas de papel y tabulados por la máquina. Vendió su concepto para el U.S. Census Bureau; por lo tanto, la Censo de Estados Unidos de 1890 fue la primera base de datos informatizada, que consiste, en esencia, de miles de cajas llenas de tarjetas perforadas.
Empresa de Hollerith creció en computadora gigante IBM, que dominaron el mercado de procesamiento de datos para la mayor parte del siglo XX. Campo de longitud fija de IBM, las tarjetas perforadas de 80 columnas se convirtió en medio ubicuo de introducción de datos electrónicos hasta la década de 1970.
En la década de 1980, configurable de base de datos de archivos planos aplicaciones informáticas eran populares en DOS y el Macintosh. Estos programas fueron diseñados para facilitar a los individuos para diseñar y utilizar sus propias bases de datos y estaban casi a la par con procesadores de texto y hojas de cálculo en popularidad.[citación necesitada] Ejemplos de productos de base de datos de archivos planos fueron las primeras versiones de FileMaker y el Shareware PC-archivo. Algunos de éstos, como dBase II, oferta limitada relacionales capacidades, permitiendo que algunos datos ser compartido entre archivos.
Implementaciones contemporáneas
FairComes c-árbol es un ejemplo de una solución de nivel empresarial moderna, y hoja de cálculo software y editores de texto puede ser utilizado para este propósito. WebDNA es un lenguaje de script diseñado para la World Wide Web, con un sistema de base de datos en memoria de archivo plano híbrido haciéndolo fácil crear sitios web de bases de datos resistente. Con el concepto en la memoria, busca WebDNA y actualizaciones de base de datos son casi en tiempo real mientras que los datos se almacenan como archivos de texto dentro de la propia página web. De lo contrario, la base de datos de archivo plano está implementado en Microsoft Works y Obras de Apple. Con el tiempo, como productos Borlandde paradoja, y Microsoftes Acceso comenzó a ofrecer algunas capacidades relacionales, así como los lenguajes de programación incorporados. Gestión de bases de datos (sistemasDBMS) como MySQL o Oracle generalmente requieren programadores para crear aplicaciones.
Motores de base de datos de archivo plano sin rostro se utilizan internamente por Mac OS X, Firefoxy otros programas de computadora para almacenar datos de configuración. Programas para el manejo de colecciones de libros o de las citas y libreta de direcciones archivo plano esencialmente único propósito es las aplicaciones de bases de datos, permitiendo a los usuarios almacenar y recuperar información de archivos planos utilizando un conjunto predefinido de campos. A partir de 2011[actualización], es uno de los motores de base de datos de archivos planos más populares SQLite, que es utilizado por el motor Firefox y Android y es parte de la PHPdistribución estándar de 5.
Las operaciones de transferencia de datos
Archivos planos se utilizan no sólo como almacenamiento de datos tools en sistemas DB y CMS, pero también como datos transferencia a servidores remotos (en cuyo caso se conocen como flujos de información).
En los últimos años, esta última implementación ha sido sustituida por XML archivos, que no sólo contienen pero también describen los datos. Seguir utilizando archivos planos para transferir información son mainframes empleando los procedimientos específicos que son demasiado caros para modificar.
Una crítica a menudo levantada contra el formato XML como una forma de realizar las operaciones de transferencia de datos masivos es que el tamaño del archivo es significativamente mayor que la de archivos planos, que generalmente se reduce a lo mínimo. La solución a este problema consiste en la compresión del archivo XML (una solución que se aplica igualmente bien a archivos planos), que ha ganado en la actualidad EXI normas (es decir, eficiente XML Interchange, que a menudo es utilizado por dispositivos móviles).
Es recomendable que sea realizado transferencia de datos vía EXI en lugar de archivos planos porque define el método de compresión no es necesario, porque las bibliotecas leyendo el contenido del archivo son fácilmente disponibles, y porque no hay necesidad para los dos sistemas que se comunican preliminarmente establecer un protocolo que describe las propiedades de datos tales como posición, alineación, tipo y formato. Sin embargo, en esas circunstancias donde la masa de datos o la insuficiencia de los sistemas heredados se convierte en un problema, la única solución viable es el uso de archivos planos. Con el fin de manejar con éxito los problemas relacionados con la comunicación de datos, formato, validación, control y mucho más (ya sea un archivo plano o un origen de datos del archivo XML), es recomendable adoptar un Firewall de calidad de datos.
Terminología
"Base de datos de archivo plano" puede definirse muy estrecho, o en términos más generales. La interpretación más estrecha es correcta en teoría de base de datos; las cubiertas más amplias el término como se utiliza generalmente.
Estrictamente, una base de datos de archivo plano debe consistir en nada más que datos y, si los registros varían en longitud, delimitadores. En términos más generales, el término se refiere a cualquier base de datos que existe en un único archivo en forma de filas y columnas, sin relaciones o vínculos entre registros y campos excepto la estructura de la tabla.
Términos usados para describir diferentes aspectos de una base de datos y sus herramientas difieren de una aplicación a otra, pero los conceptos siguen siendo los mismos. FileMaker Pro utiliza el término "Encontrar", mientras que MySQL utiliza el término "Consulta"; Pero el concepto es el mismo. FileMaker "archivos", en versión 7 y superiores, son equivalentes a MySQL "bases de datos" y así sucesivamente. Para evitar confundir al lector, se utiliza un conjunto consistente de términos a lo largo de este artículo.
Sin embargo, el "campo" y "registro de términos básicos" son utilizados en casi todos los implementación de base de datos de archivos planos.
Base de datos de ejemplo
En el siguiente ejemplo ilustra los elementos básicos de una base de datos de archivos planos. El datos arreglo consiste en una serie de columnas y filas organizaron en un formato tabular. Este ejemplo concreto utiliza solamente una tabla.
Las columnas incluyen: nombre (nombre de una persona, segunda columna); equipo (el nombre de un equipo deportivo, apoyado por la persona, tercera columna); y un numérico ID único, (sirve para identificar unívocamente registros, primera columna).
Esta es una representación textual de ejemplo de los datos descritos:
ID Nombre equipo 1 Amy Blues 2 Bob rojos 3 Chuck Blues 4 Dick Blues 5 Ethel rojos 6 Fred Blues 7 Gilly Blues 8 Hank rojos
Este tipo de representación de datos es bastante estándar para una base de datos de archivos planos, aunque hay algunas consideraciones adicionales que no son evidentes en el texto:
- Tipos de datos: cada columna en una tabla de base de datos como la que se arriba es normalmente restringido a un específico tipo de datos. Tales restricciones son generalmente establecidas por convenio, pero no formalmente indicadas a menos que los datos se transfieren a una base de datos relacional sistema.
- Columnas separadas: En el ejemplo anterior, columnas individuales se separan mediante whitespace caracteres. Esto también se llama sangría o formato de datos "ancho fijo". Otra convención común es separar las columnas usando uno o más delimitador caracteres. Soluciones más complejas son marcado y lenguajes de programación.
- Álgebra relacional: Cada fila o registro en la tabla anterior cumple con la definición estándar de un tupla bajo Álgebra relacional (el ejemplo anterior muestra una serie de 3-tuplas). Además, la primera fila especifica el nombres de campo se asocian con los valores de cada fila.
- Sistema de gestión de base de datos: Puesto que las operaciones formales posibles con un archivo de texto son generalmente más limitadas de lo deseado, el texto en el ejemplo anterior normalmente representarían un estado intermediario de los datos antes de ser transferido a un sistema de gestión de base de datos.
Referencias
Wikimedia Commons tiene medios relacionados con Modelos de archivo plano. |
- ^ Glosario de integración de datos, U.S. Department of Transportation, agosto de 2001.
- ^ Fowler, Glenn (1994), "cql: lenguaje de consulta de base de datos de archivo plano", WTEC 94: actas de la conferencia técnica del invierno 1994 USENIX en USENIX invierno 1994 conferencia técnica
|