7.3 Creacion De Un Entorno De Base De Datos

Para crear u entorno de base de datos se debe entender las relaciones que hay entre los datos, el tipo de datos que se almacenara en la base de datos, como se utilizaran los datos y de qué manera necesitara cambiar la organización para administrar los datos desde una perspectiva total de la compañía. Cada vez más, el diseño de bases de datos también tendrá que considerar la manera en que la organización. A continuación se describen principios importantes del diseño de bases de datos y los requerimientos administrativos y organizacionales de un entorno de base de datos.

DISEÑO DE BASES DE DATOS

Para crear una base de datos se deben llevar a cabo dos ejercicios: un diseño conceptual y un diseño físico. El diseño conceptual, o lógico, de una base de datos es un modelo abstracto de la base de datos desde una perspectiva de negocios, en tanto que el diseño físico muestra el arreglo real de la base de datos sobre dispositivos de almacenamiento de acceso directo. El diseño lógico requiere una descripción detallada de las necesidades de información de los usuarios finales reales de la base de datos de la empresa. Idealmente, el diseño de la base de datos será parte de un esfuerzo de planeación de datos a todo lo largo de la organización.
El diseño conceptual de la base de datos describe como se deben agrupar los elementos de datos. El proceso de diseño identifica las relaciones entre los elementos de datos y la manera más eficiente de agrupar los elementos de datos entre sí para cumplir con los requerimientos de la información. El proceso también identifica los elementos de datos redundantes y las agrupaciones de elementos de datos requeridos para programas específicos de aplicaciones. Los grupos de datos se organizan, refinan y dinamizan hasta que surja una vista general lógica de las relaciones entre todos los elementos de datos en la base de datos.

Photobucket

Photobucket

Los diseñadores de bases de datos documentan el modelo conceptual de datos con undiagrama de relaciones entre entidades, que se ilustra en la figura 7-13. Los cuadros representan las entidades y los rombos las relaciones. El 1 o la M a los lados de los rombos representan las relaciones entres las entidades ya sean de uno a uno, de uno a muchos o de muchos a muchos. La figura 7-13 muestra que la entidad PEDIDO puede tener más de una PARTE y una PARTE solo puede tener un PROVEEDOR. Un mismo proveedor puede proporcionar varias partes. Los atributos de cada entidad se enlistan junto a la entidad y el campo clave va subrayado.

Para utilizar con eficiencia un modelo de base de datos relacional, se deben agilizar las agrupaciones complejas de datos para eliminar los elementos de datos redundantes y las relaciones muchos a muchos inadecuadas. Al proceso de crear estructuras de datos pequeñas y estables a partir de grupos complejos de datos se le llama normalización. Las figuras 7-14 y 7-15 ilustran este proceso. En el negocio especifico que se modela aquí, un pedido puede tener más de una parte, pero solamente puede ser surtido por un proveedor. Si construyéramos una relación llamada PEDIDO con todos los campos incluidos aquí, tendríamos que repetir el nombre, la descripción y el precio de cada parte en el pedido y el nombre y la dirección de cada proveedor. Esta relación contiene lo que se llama grupos repetitivos porque para cada pedido puede haber muchas partes y proveedores y eso describe realmente múltiples entidades: tanto partes y proveedores como pedidos. Una manera más eficiente de ordenar los datos es dividir PEDIDO en relaciones más pequeñas, cada una de las cuales describe a una entidad única. Si se va de etapa en etapa y se normaliza la relación PEDIDO, el resultado son las relaciones que se ilustran en la figura 7-15.

Si se ha considerado cuidadosamente una base de datos, con una clara comprensión de las necesidades y uso de la información de la empresa, muy probablemente el modelo de base de datos resultara en un formato normalizado. Muchas bases de datos en el mundo real no están totalmente normalizadas porque es posible que esta no sea la mejor manera de satisfacer los requerimientos de información de la empresa. Observe que la base de datos relacional ilustrada en la figura 7-6 no está totalmente normalizada porque podría haber más de una parte para cada pedido. Los diseñadores prefieren no utilizar las cuatro relaciones descritas en la figura 7-15 porque la mayoría de los pedidos manejados por esta empresa en particular constan de una sola parte. Es posible que los diseñadores hayan sentido que para esta empresa en particular no era eficiente mantener cuatro tablas diferentes.

Distribución De Bases De Datos

El diseño de bases de datos también tiene presente como se distribuyen los datos. Se pueden diseñar sistemas de información con una base de datos centralizada que sea utilizada por un procesador central único o por múltiples procesadores en una red cliente/servidor. Alternativamente, la base de datos puede ser distribuida. Una base de datos distribuida es aquella que se almacena en más de un lugar físico. Unas partes de la base de datos se almacenan físicamente en un lugar y otras se almacenan y mantienen en otros lugares. Hay dos formas principales de distribuir una base de datos (véase la figura 7-16). La base de datos central se puede particionar (véase la figura 7-16a) de manera que cada procesador remoto tenga los datos necesarios para abastecer su área local. Los cambios en los archivos locales se pueden justificar con la base de datos central basada en lotes, con frecuencia por la noche. Otra estrategia es duplicar la base de datos central (véase la figura 7-16b) en todas las ubicaciones remotas.

Photobucket

Por ejemplo, Lufthansa Airlines reemplazo su base de datos mainframe centralizada con una base de datos replicada para que la información estuviera disponible de manera más inmediata para los despachadores de vuelos. Cualquier cambio que se haga al DBMS de Lufthansa en Frankfort se duplica automáticamente en New York y en Hong Kong. Esta estrategia también requiere que la actualización de la base de datos central se haga en horas de menos carga.

Los sistemas distribuidores reducen la vulnerabilidad de un solo sitio central masivo. Incrementando el servicio y el nivel de respuestas para los usuarios locales y con frecuencia pueden correr en computadoras más pequeñas y menos caras. Sin embargo, los sistemas distribuidores dependen de las líneas de telecomunicaciones de alta calidad, que por naturaleza son vulnerables. Más aun, las bases de datos locales en ocasiones pueden desviarse de los estándares y definiciones centrales de datos y plantear problemas de seguridad por la amplia distribución del acceso a datos delicados. Los diseñadores de bases necesitan ponderar estos factores en sus decisiones.

Requisitos Administrativos Para Sistemas De Bases De Datos

Para el desarrollo de sistemas de bases de datos se requieren mucho más que simplemente seleccionar un modelo de bases de datos lógico. La base de datos es una disciplina organizacional, un método más que una herramienta o una tecnología. Requiere un cambio organizacional y conceptual. Si no se cuenta con el apoyo y la comprensión de la administración, los esfuerzos de una base de datos fracasan. Los elementos críticos en un entorno de base de datos son (1) la administración de los datos, (2) una metodología para la planeación y el modelado de los datos, (3) la tecnología y la administración de la base de datos y (4) los usuarios. Este entorno se delinea en la figura 7-17.

Photobucket

Administracion De Datos

Photobucket

Los sistemas de bases de datos requieren que la organización reconozca el rol estratégico de la información y empiecen a administrar y planear activamente la información como un recurso corporativo. Esto significa que la organización debe desarrollar una función deadministración de datos con el poder para definir los requisitos de información para toda la compañía y con acceso directo a los directores de la empresa. El director de información (CIO) o el vicepresidente de información se convierte en el principal defensor de los sistemas de bases de datos en la organización.

La administración de datos es responsable de las políticas y procedimientos expresos mediante los cuales se pueden administrar los datos como un recurso organizacional. Estas responsabilidades incluyen desarrollar una política de la información, planear los datos, inspeccionar el diseño lógico de la base de datos y desarrollar un diccionario de datos, así como vigilar como utilizan los datos los especialistas de sistemas de información y los grupos de usuarios finales.

El principio fundamental de la administración de datos es que todos los datos son propiedad total de la organización. Los datos no son propiedad exclusiva de ningún área de negocios o unidad organizacional. Todos los datos se deben poner a disposición de cualquier grupo que los requiera para cumplir con su misión. Una organización necesita formular una política de la información que especifique sus normas para compartir, distribuir, adquirir, estandarizar, clasificar e inventariar la información a través de toda la organización. La política de la información determina procedimientos específicos, responsabilidades formales, definiendo que unidades organizacionales comparten información, donde se puede distribuir esta y quien tiene la responsabilidad personal de actualizarla y mantenerla. Aunque la administración de datos es una función organizacional muy importante, se ha comprobado que su implantación representa un reto importante.

Metodología De Planeación y Modelado De Datos

Los intereses organizacionales satisfechos con el DBMS son mucho más amplios que los del entorno tradicional de archivos; por consiguiente, la organización requiere planear los datos a nivel de toda la empresa. Para desarrollar las bases de datos se requiere el análisis empresarial, el cual determina los requerimientos de información de toda la organización (en oposición a los requerimientos de aplicaciones individuales). El propósito del análisis empresarial es identificar las entidades clave, atributos y relaciones que constituyen los datos de la organización. Estas tecnologias se describen con mayor detalle en el capitulo 12.

Tecnología De Bases De Datos, Administración Y Usuarios

Las bases de datos requieren software nuevo y un nuevo equipo de personal entrenado especialmente en las técnicas de DBMS, así como nuevas estructuras administrativas de datos. La mayoría de las corporaciones desarrollan un grupo de diseño y administración de datos dentro de la división corporativa del sistema de información que es responsable de definir y organizar la estructura y contenido de la base de datos y de mantenerla. En cooperación estrecha con los usuarios, el grupo de diseño establece la base de datos física, las relaciones lógicas entre los elementos y las normas y procedimientos de acceso. Las funciones que desempeña se denominan administración de bases de datos.
Una base de datos da servicio a una comunidad mayor de usuarios que los sistemas tradicionales. Los sistemas relacionales con lenguaje de consulta de cuarta generación permiten a los empleados con pocos conocimientos en computadoras el acceso a grandes bases de datos. Además, entre los usuarios hay especialistas entrenados en computación. Para optimizar el acceso de los empleados con pocos conocimientos se deben dedicar más recursos a su capacitación.