Conjunto de datos (IBM mainframe)
|
Este artículo Necesita referencias adicionales para verificación. (Septiembre de 2014) |
En el contexto de IBM computadoras mainframe, un conjunto de datos (arcaico) o conjunto de datos (preferido) es un archivo de computadora tener un Organización de registro. Uso de este término comenzó con OS/360 y todavía es usado por sus sucesores, incluyendo la corriente z/OS. Documentación para estos sistemas históricamente preferido este término en lugar de archivo.
Típicamente, un conjunto de datos se almacena en un dispositivo de almacenamiento de acceso directo (DASD) o cinta magnética, sin embargo dispositivos récord unidad, tales como lectores de tarjetas perforadas, tarjetas perforadas y las impresoras de línea pueden proporcionar entrada/salida (E/S) para un conjunto de datos (archivo).[1]
Leer más: https://www.answers.com/topic/Unit-record-Device#ixzz3E3BYpRJL también son compatibles.
Conjuntos de datos no son corrientes no estructurados de bytes, pero más bien están organizados en varias estructuras registro y bloque lógicas determinadas por la DSORG
(conjunto de datos organización), RECFM
(formato de registro) y otros parámetros. Estos parámetros se especifican en el momento de la asignación de conjunto de datos (creación), por ejemplo con Job Control Language DD
declaraciones. Dentro de un trabajo que se almacenan en el Bloque de Control de datos (DCB), que es un dato de estructura utilizada para acceder a bases de datos, por ejemplo usando métodos de acceso.
Contenido
- 1 Organización de DataSet
- 2 Formato de registro (RECFM)
- 3 Conjuntos de datos particionadas
- 4 Véase también
- 5 Referencias
Organización de DataSet
|
Para OS/360, parámetro de la DCB DSORG especifica cómo se organiza el conjunto de datos. Puede ser físicamente secuencial ("PS"), indexadas secuencial ("IS"), particiones ("PO") o acceso directo ("DA"). Conjuntos de datos en la cinta sólo pueden ser DSORG = PS. La elección de organización depende de cómo están acceder a los datos, y en particular, cómo es ser actualizados.
Los programadores utilizan varios métodos de acceso (tales como QSAM o VSAM) en los programas de lectura y escritura de conjuntos de datos. Método de acceso depende de la organización del conjunto de datos determinado.
Formato de registro (RECFM)
Independientemente de la organización, la estructura física de cada registro es esencialmente la misma y es uniforme en todo el conjunto de datos. Esto se especifica en el DCB RECFM
parámetro. RECFM = F
significa que los registros son de longitud, especificado mediante fija el LRECL
parámetro, y RECFM = V
especifica un registro de longitud variable. Registros de V cuando se almacena en los medios de comunicación van prefijados por un registro Descriptor de palabra (RDW) que contiene la longitud entera del registro en bytes. Con RECFM = FB
y RECFM = VB
, varios registros lógicos se agrupan en una sola bloque físico en cinta o disco. FB y VB son fijo-bloqueado
, y variable-bloqueado
, respectivamente. El BLKSIZE
parámetro especifica la longitud máxima del bloque. RECFM = FBS
podría también ser especificado, significado estándar fijo-bloqueado
, lo que significa todos los bloques excepto el último debían ser en su totalidad BLKSIZE
longitud. RECFM = VBS
, o variable-bloqueado abarcó
, significa un registro lógico podría ser atravesado a través de dos o más bloques, con las banderas en el RDW indicando si un segmento de registro se continúa en la siguiente cuadra o fue continuado de la anterior.
Este mecanismo elimina la necesidad de utilizar cualquier valor de byte "delimitador" para separar los registros. Así datos pueden ser de cualquier tipo, incluyendo binarios enteros, flotando punto o caracteres, sin introducir una falsa condición de fin-de-registro. El conjunto de datos es una abstracción de una colección de discos, en contraste con archivos como desestructurados secuencias de bytes.
Conjuntos de datos particionadas
Por ejemplo, un PDS o Conjunto de datos de particiones es un conjunto de datos que contiene múltiples miembros, cada una de ellas posee un dato secundario independiente establecido, similar a un directorio en otros tipos de sistemas de archivos. Este tipo de conjunto de datos se utiliza a menudo para contener programas ejecutables (módulos de carga), bibliotecas de programas (especialmente las definiciones macro Assembler) de la fuente. Un PDS puede ser comparada con una Zip archivo o COM estructurado almacenamiento.
El conjunto de datos particionados sólo puede asignar en un solo volumen con el tamaño máximo de 65535 pistas.
Además de los miembros, un PDS consiste también en su directorio. Cada miembro puede accederse directamente a través de la estructura de directorios. Una vez que un miembro se encuentra, los datos almacenados en ese miembro se manejan de la misma manera que un conjunto de datos (secuencial) PS.
Cuando un miembro se elimina, el espacio que ocupa es inutilizable para almacenar otros datos. Asimismo, si un miembro se vuelvan a escribir, se almacena en un nuevo lugar en la parte posterior del PDS y hojas desperdicia espacio "muerto" en el medio. La única forma de recuperar espacio "muerto" es realizar compresión del archivo frecuente, que se mueve a todos los miembros al frente del espacio de datos y deja espacio libre utilizable en la parte posterior. (Tenga en cuenta que en el lenguaje moderno, este tipo de operación puede ser llamado desfragmentación o recolección de basura; compresión de datos hoy en día se refiere a un concepto diferente, más complicado). PDS archivos sólo pueden residir en el disco para poder utilizar la estructura de directorios de acceso a los miembros individuales, no en la cinta. Más a menudo se utilizan para almacenar múltiples archivos JCL, declaraciones de control utilidad y módulos ejecutables.
Una mejora de este esquema es un repartido conjunto de datos extendidos (PDSE o PDS/E, a veces bibliotecas) introducido con MVS/XA sistema.
Estructura PDS/E es similar al PDS y se utiliza para almacenar los mismos tipos de datos. Sin embargo, los archivos PDS/E tienen una mejor estructura de directorios que no requiere previa asignación de bloques de directorio cuando el PDS/E se define (y por lo tanto no funciona fuera de bloques de directorio si no se especifica). Además, PDS/E almacena automáticamente los miembros de tal manera que la operación de compresión no es necesaria para recuperar espacio "muerto". PDS/E archivos sólo pueden residir en el disco para poder utilizar la estructura de directorios de acceso a los miembros individuales.
Véase también
- Tabla de volúmenes de contenido (VTOC), una estructura que describe los conjuntos de datos almacenados en el disco
Referencias
- ^ https://publib.Boulder.IBM.com/infocenter/ZVM/V5R4/index.jsp?topic=/ com.ibm.zvm.v54.hcpa7/hcse7b3050.htm
- Introducción a la nueva unidad central: z/OS conceptos básicos, Cap. 5, "Trabajando con conjuntos de datos", 29 de marzo de 2011. ISBN 0738435341