Repositorio de metadatos
A repositorio de metadatos se crea una base de datos para almacenar metadatos. Metadatos están información sobre las estructuras que contienen los datos reales. Metadatos a menudo se dicen que es "datos sobre datos", pero eso es engañoso. Perfiles de datos son un ejemplo de "datos sobre datos" reales. Metadatos están una capa de abstracción extraído esto – es datos acerca de las estructuras que contienen datos. Metadatos pueden describir la estructura de datos, de cualquier tema, en cualquier formato.
Un repositorio de metadatos bien diseñados normalmente contiene datos más allá de simples definiciones de las diferentes estructuras de datos. Repositorios típicos almacenan docenas a cientos de piezas separadas de información acerca de cada estructura de datos.
Comparación de los metadatos de un par de elementos de datos - una digital y uno físico - uno le ayudará a entender qué metadatos están realmente:
En primer lugar, digital: para los datos almacenados en una base de datos uno pueden tener una tabla llamada "Paciente" con muchas columnas, cada una conteniendo datos que describen un atributo diferente de cada paciente. Una de estas columnas puede ser nombrada "Patient_Last_Name". ¿Qué es algunos de los metadatos de la columna que contiene los apellidos reales de los pacientes en la base de datos? Ya hemos utilizado dos elementos: el nombre de la columna que contiene los datos (Patient_Last_Name) y el nombre de la tabla que contiene la columna (paciente). Otros metadatos podrían incluir la longitud máxima del apellido que puede ingresarse, sea o no el apellido es requerido (podemos tener un paciente sin Patient_Last_Name?), y si la base de datos convierte cualquier apellidos entrados en minúsculas a mayúsculas. Metadatos de una naturaleza de seguridad pueden mostrar las restricciones que limitan quién puede ver estos nombres.
En segundo lugar, física: para los datos almacenados en una biblioteca de ladrillo y mortero, uno tiene muchos volúmenes y puede tener varios medios, incluyendo los libros. Metadatos de libros incluiría ISBN, Binding_Type, Page_Count, autor, etc.. Dentro de Binding_Type, metadatos incluiría posibles vinculaciones, material, etc..
Esta información contextual de los datos empresariales incluyen significado y contenido, las políticas que rigen, atributos técnicos, especificaciones que transforman y programas que manipulan.[1]:: 171
Contenido
- 1 Definición
- 2 Repositorio vs registro
- 3 Razón para el uso
- 4 Diseño
- 4.1 Entidad-relación/orientada a objetos
- 5 Véase también
- 6 Referencias
Definición
El repositorio de metadatos es responsable de almacenar físicamente y catalogación metadatos. Datos en un repositorio de metadatos deben ser genérica, integrada, actual e histórico. Genérico: metamodelo debe almacenar los metadatos de términos genéricos en lugar de guardarlo en una forma definida de aplicaciones específicas, por lo que si sus datos basan estándar cambios de un producto a otro el modelo físico de la meta del repositorio de metadatos no tendría que cambiar. Integración repositorio permite que todos los metadatos áreas del negocio de una manera integrada que cubre todas las direcciones y áreas de la organización de los metadatos los metadatos repositorio debería tener acceso actuales e históricos metadatos.[2] Repositorios de metadatos solían denominar como un Diccionario de datos.[1]:: 239
Con la transición de necesidades para los metadatos uso para inteligencia de negocios ha aumentado tan es el alcance del repositorio de metadatos aumentada. Diccionarios de datos anteriores son el lugar más cercano para interactuar tecnología con los negocios. Diccionarios de datos son el universo de repositorio de metadatos en las etapas iniciales, pero como el ámbito aumentó Business glossary y sus etiquetas a variedad de banderas del Estado surgieron en el lado empresarial mientras que el consumo de los metadatos de la tecnología, su linaje y vínculos hizo el repositorio, la fuente de valiosos informes para reunir a negocios y tecnología y ayudó a las decisiones de gestión de datos más fáciles así como evaluar el coste de los cambios.
Repositorio de metadatos explora el gobierno amplia información empresarial, calidad de datos y gestión de datos maestros (incluye datos de referencia y datos maestros) e integra esta riqueza de información con metadatos integrada en toda la organización para proporcionar un sistema de soporte de decisión para estructuras de datos, aunque sólo refleja las estructuras consumidas desde diversos sistemas.
Repositorio vs registro
Repositorio tiene las siguientes funciones adicionales en comparación con el registro. Repositorio de metadatos no sólo almacena metadatos como registro de metadatos pero también agrega las relaciones con los tipos de metadatos relacionados. Metadatos cuando relacionadas en un flujo desde su punto de entrada en la organización hasta las entregas se consideran como el linaje de ese punto de datos. Metadatos cuando se relaciona a través de otros relacionados con tipos de metadatos se llama los vínculos. Al proporcionar las relaciones con todos los puntos de metadatos en toda la organización y mantener su integridad con una arquitectura para manejar los cambios, repositorio de metadatos proporciona el material básico para entender el flujo de datos completos y sus definiciones y su impacto. También la característica importante es mantener el control de versiones, aunque esta declaración para contrastar está abierta a la discusión. Estas definiciones siguen evolucionando, de manera que la precisión de las definiciones de refinamiento.
Propósito del registro es definir el elemento de metadatos y mantenido en toda la organización. y modelos de datos y otros equipos de gestión de datos se refiere al registro de los cambios a seguir. Mientras que el repositorio de metadatos fuentes metadatos de diversos sistemas de metadatos en las organizaciones y refleja lo que está en el ascendente. Repositorio nunca actúa como un río arriba mientras que el registro se utiliza como un río arriba para cambios de metadatos.
Razón para el uso
Repositorio de metadatos permite que toda la estructura de los contenedores de datos de las organizaciones a un lugar integrado. Esto abre la plétora de recursos información para tomar decisiones de negocio calculado. Esta herramienta utiliza una forma genérica del modelo de datos para integrar todos los modelos así trae todas las aplicaciones y programas de la organización en un formato. Y encima aplicando las definiciones de negocio y procesos de negocio trae el negocio y tecnología que ayudará a las organizaciones hacer planes confiables con metas definidas. Con una información, negocio tendrá más control sobre los cambios y puede afectar el análisis de la herramienta. Generalmente negocios gasta un montón de tiempo y dinero para tomar decisiones basadas en el descubrimiento y la investigación sobre los impactos para realizar cambios o para agregar nuevas estructuras de datos o eliminar las estructuras de gestión de datos de la organización. Con un repositorio estructurado y bien mantenido, mover el producto de ideas hasta la entrega toma la menor cantidad de tiempo (teniendo en cuenta otras variables son constantes). Para resumir:
- . Integración de los metadatos en toda la organización.
- . Construir la relación entre varios tipos de metadatos
- . Construir la relación entre varios sistemas dispares.
- . Definir negocio oro copia de las definiciones.
- . Versión control de los cambios en el nivel de la estructura.
- . interacción con Datos de referencia
- . ver enlace a datos maestros.
- . Automático sincronizaciónhronization con varios autorizado sistemas de fuente de metadatos.
- . Más control para decisiones de negocios.
- . validar las estructuras mediante la superposición de los modelos
- . descubriendo discrepancias, lagunas, linaje, métricas a nivel de estructura de datos.
Cada sistema de gestión de base de datos (DBMS) y herramientas de base de datos tienen su propio lenguaje para los componentes de metadatos dentro. Aplicaciones de base de datos ya tienen sus propios repositorios o que se esperan que proporcionen toda la funcionalidad necesaria para acceder a los datos almacenados en los registros. Los vendedores no quieren otras compañías para ser capaz de migrar fácilmente los datos de sus productos y en productos de la competencia, así que son propietarios con la forma en que manejan metadatos. CAJA de herramientas, DBMS diccionarios, herramientas ETL, herramientas de limpieza de datos, herramientas OLAP y datamining herramientas todo manejar y almacenan metadatos diferentemente. Sólo un repositorio de metadatos puede diseñarse para almacenar los metadatos componentes de todas estas herramientas.[3]
Diseño
Repositorios de metadatos deben almacenar metadatos en cuatro clasificaciones: propiedad, características descriptivas, reglas y políticas y características físicas. Propiedad, mostrando el titular de los datos y el propietario de la aplicación. Las características descriptivas, definir los nombres, tipos y longitudes y definiciones que describen datos comerciales o procesos de negocio. Se definen las normas y políticas, seguridad, limpieza de datos, líneas de tiempo para los datos y las relaciones. Características físicas definen el origen o la fuente y la ubicación física.[1]:: 176 Edificio un modelo de datos lógicos para crear una base de datos, un metamodelo lógica puede ayudar a identificar los requerimientos de metadatos para datos del negocio.[1]:: 185 El repositorio de metadatos será centralizado, descentralizado o distribuido. Un diseño centralizado significa que hay una base de datos para el repositorio de metadatos que almacena metadatos para todos los negocios de usos amplio. Un repositorio de metadatos centralizado tiene las mismas ventajas y desventajas de un base de datos centralizada. Fáciles de manejar porque todos los datos están en una base de datos, pero la desventaja es que se produzcan cuellos de botella.
Un repositorio de metadatos descentralizada almacena metadatos en múltiples bases de datos, ya sea separado por su ubicación y o departamentos de la empresa. Esto hace que la gestión del repositorio más complicado que un repositorio centralizado de metadatos, pero la ventaja es que los metadatos pueden dividirse en diferentes departamentos.
Un repositorio de metadatos distribuidos utiliza un método descentralizado, pero a diferencia de un repositorio de metadatos descentralizado los metadatos permanece en su aplicación original. Un XML puerta de enlace se crea[1]:: 246 que actúa como un directorio para acceder a los metadatos dentro de cada aplicación diferente. Las ventajas y desventajas de un repositorio de metadatos distribuidos del espejo de una base de datos distribuida.
Diseño del modelo de información debería incluir varias capas de tipos de metadatos para ser comprometidos para crear una visión integrada de los datos. Varios tipos de metadatos deben ser cosidos con elementos de metadatos relacionados en un top modelo vincular Glosario de negocios.
Capas de metadatos:
- Glosario de negocios: contiene relación recursiva a condiciones comerciales.
- Etiquetas de negocio: contiene varios afiliación a ese término o términos.
- Diccionario de datos: contiene información de herramientas de modelo de datos para la definición de elementos de metadatos y sus definiciones técnicas proporcionados por datos o empresa de arquitectura.
- Modelos de datos conceptuales:
- Modelos de datos lógicos
- Modelos de datos físicos
- Bases de datos
- las reglas de validación y las normas de calidad de datos
- ETL, reglas de negocio y su relación con entidades y atributos
- Informes
- Fuente de artefactos de asignación de destino (relaciones)
- Requisitos de presentación de informes (relaciones)
- los procesos de negocio y su relación con la tecnología
- jerarquía de personas y su relación
- relación dueño
Entidad-relación/orientada a objetos
Repositorios de metadatos pueden ser diseñados como tampoco una Modelo entidad-relación, o un Diseño orientado a objetos.
Véase también
- Metadatos
- Registro de metadatos
- Normas de metadatos
- ISO/IEC 11179
- Diccionario de datos
- Modelado de datos
Referencias
- ^ a b c d e Moss, T. L.; Atre, S. (2003). Plan de inteligencia de negocios: El proyecto completo ciclo de vida para las aplicaciones de soporte de decisiones. Addison-Wesley Professional. ISBN0-201-78420-3.
- ^ Marco, D.; Jennings, M. (2004). Modelos de metadatos universal. Wiley. págs. 36-43. ISBN0-471-08177-9.
- ^ Marco, D. (2000). Construir y administrar el repositorio de metadatos: una guía completa del ciclo de vida. Wiley. ISBN978-0471355236.