lunes, 27 de agosto de 2012

BASES DE DATOS


BASE DE DATOS DISTRIBUIDA.
Definición:
Los computadores de un sistema distribuido se comunican entre sí a través de diversos medios de comunicación, tales como cables de alta velocidad o líneas telefónicas.
Los procesadores de un sistema distribuido pueden variar en cuanto su tamaño y función. Pueden incluir microcomputadores pequeños, estaciones de trabajo y sistemas de computadores grandes de aplicación general. Estos procesadores reciben diferentes nombres, tales como localidades, nodos o computadores.
Un sistema distribuido de bases de datos consiste en un conjunto de localidades, cada uno de las cuales puede participar en la ejecución de transacciones que accedan a datos de una o varias localidades. La diferencia principal entre los sistemas de base de datos centralizados y distribuidos es que, en los primeros, los datos residen en una sola localidad, mientras que, en los últimos, se encuentran en varias localidades.
Ventajas:
Expandibilidad. Al crecer una organización por la adición una nueva unidad, el nuevo nodo o unidad de localización de dato pasa a formar parte de la base de datos distribuida sin reconfigurar la BD completamente – el nuevo nodo casi automáticamente forma parte de la BD global.
Confiabilidad o Disponibilidad. Fácil conexión entre los datos de varias localizaciones sin tener en cuenta los Sistemas Operativos y/o el hardware y software utilizados.
La disponibilidad es fundamental para los sistemas de base de datos que se utilizan en aplicaciones de tiempo real. Por ejemplo, si una línea aérea no puede tener acceso a la información, es posible que pierda clientes a favor de la competencia.
Flexibilidad. Al realizar un movimiento en un dato de un lugar a otro o algún cambio en una localización física de ciertos nodos requeridos no hay que realizar cambios en la BD o su arquitectura.
Distribución de la carga de trabajo: La distribución de la carga de trabajo sobre los sitios se hace sobre la base de utilizar la potencia de las computadoras de cada sitio y maximizar paralelismo en la ejecución de las aplicaciones.
Sharing o Compartición. Los datos pueden ser compartidos por sucursales o usuarios diferentes de la misma organización u organizaciones diferentes, permitiendo así comunicación eficiente entre usuarios distantes.
La ventaja principal de compartir los datos por medio de la distribución es que cada localidad puede tener mejor control de sus datos almacenados localmente. Confiabilidad. La confiabilidad se logra al tener replicas de los datos, pues es posible recuperar una copia dañada o destruida a partir de otra. Razones económicas. Cuando se maximiza el acceso local de las aplicaciones a los datos se disminuye el tráfico en las comunicaciones.
Desventajas:
Complejidad. Un sistema distribuido, que oculta su naturaleza distribuida al usuario, es más complejo que el sistema centralizado. Las consideraciones adicionales tales como el control de concurrencia y la seguridad deberían tenerse en cuenta, no para mencionar la complejidad alta de la optimización de consultas, comparado con una base de datos centralizada, sino que las actualizaciones se complicanproporcionalmente con el aumento de replicas en el sistema.
La confiabilidad /Eficiencia. Se deben implementar mecanismos que garanticen la consistencia y permitan detectar fallas en el sistema y su posterior recuperación. Al ocurrir alguna falla en sitios distintos, el sitio que contenga una réplica de esa base de datos, y además sea operable debe garantizar la consistencia y actualización de su base de datos. Al reponerse los diferentes sitios el sistema de gestión de base de datos debe granizar la actualización de esos sitios que estaban sin operar.
AL estar particionada la red que une los diferentes sitios es un poco más difícil garantizar las actualizaciones de las bases de datos. Puesto que las localidades del sistema distribuido operan en paralelo, es más difícil garantizar que los algoritmos sean correctos. Existe la posibilidad de errores extremadamente sutiles. (Profundizar)
Mayor tiempo extra de procesamiento. El intercambio de mensajes y los cálculos adicionales que se requieren para coordinar las localidades son una forma de tiempo extra que no existe en los sistemas centralizados.
Costo. La complejidad aumentada significa que los costos de mantenimiento y adquisición del sistema son mucho más altos que los de un DBMS centralizado.
La capacidad de almacenamiento de cada sitio debe tenerse en cuenta, usualmente el costo de almacenamiento no es importante comparado con otros costos, no obstante, las limitaciones de almacenamiento deben ser consideradas.
Aumento del tráfico de comunicación. Cuando un sitio accede frecuentemente a los datos de otros sitios, aumenta el tráfico de mensaje y transacciones en la red, y por tanto las comunicaciones, lo que puede convertirse en un cuello de botella.
Integridad. Debido a que no todos los datos se ubican en un lugar centralizado – una estación (nodo) - el fracaso podría ocasionar una pérdida de datos para otros nodos.

BASE DE DATOS CENTRALIZADA.
Definición.
Es una base de datos almacenada en su totalidad en un solo lugar físico, es decir, es una base de datos almacenada en una sola máquina y una sola CPU, y en donde los usuarios trabajan en terminales “tontas” que sólo muestran resultados.
Los sistemas de bases de datos centralizadas son  aquellos que se ejecutan en un único sistema informático sin interaccionar con ninguna otra computadora. Tales sistemas comprenden el rango desde los sistemas de base de datos monousuario ejecutándose en computadoras personales hasta los sistemas  de bases de datos de alto rendimiento ejecutándose en grandes sistemas. 
Características.
Se almacena completamente en una localidad central (mainframe o macrocomputadora), es decir, todos los componentes del sistema residen en un solo computador o sitio.
*      No posee múltiples elementos de procesamiento ni mecanismos de intercomunicación como las Bases de Datos Distribuidas.
*      Los componentes de la Bases de Datos Centralizadas son: los datos, el software del SGBD (Sistema de Gestión de Base de Datos) y los dispositivos de almacenamiento secundario asociados, como disco de almacenamiento en línea de la base de datos y cintas para las copias de seguridad.
*      El problema de seguridad es inherentemente fácil en estos sistemas de bases de datos.
Ventajas.
*      Se evita la redundancia.  En sistemas que no usan Bases de Datos Centralizadas, cada aplicación tiene sus propios archivos privados o se encuentran en diferentes localidades.  Esto a menudo origina enorme redundancia en los datos almacenados, así como desperdicio resultante del espacio de almacenamiento; por ejemplo, una aplicación de personal y otra de registros educativos pueden poseer cada una un archivo que contenga información de departamento de los empleados.   Estos dos archivos pueden integrarse (para eliminar la redundancia) si el Administrador de la Base de Datos (DBA) está consciente de los requerimientos de información para ambas aplicaciones, es decir, si el DBA tiene el control global necesario.
*      Se evita la inconsistencia.  Ya que si un hecho específico se representa por una sola entrada (es decir, si la redundancia se elimina), la no-concordancia de datos no puede ocurrir.
*      Pueden hacerse cumplir las normas establecidas.  Con un control central de la base de datos, el DBA puede garantizar que se cumplan todas las formas aplicables a la representación de los datos.   Las normas aplicables pueden comprender la totalidad o parte de lo siguiente:   normas de la compañía, de instalación, departamentales, industriales, nacionales o internacionales.  Es muy deseable unificar los formatos de los datos almacenados como ayuda para el intercambio o migración de datos entre sistemas.
*      Pueden aplicarse restricciones de seguridad.
Al tener jurisdicción completa sobre los datos de operación, el DBA puede:
a)     Asegurar que el único medio de acceder la base de datos sea a través de los canales establecidos y, por tanto,
b)     Definir controles de autorización para que se apliquen cada vez que se intente el acceso a datos sensibles.   Diferentes controles pueden establecerse para cada tipo de acceso (recuperación, modificación, supresión, etc.) a cada parte de la información de la base de datos.
*      Puede conservarse la integridad. El problema de la integridad es garantizar que los datos de la base de datos sean exactos.  El control centralizado de la base de datos, es decir, que los datos se encuentren en una sola máquina, ayuda a evitar la inconsistencia de los datos, por el mismo hecho de encontrarse en una sola máquina.  Es conveniente señalar que la integridad de los datos es un aspecto muy importante en una base de datos, porque los datos almacenados se comparten y porque sin procedimientos de validación adecuados es posible que un programa con errores genere datos incorrectos que afecten a otros programas que utilicen esa información.
*      Pueden equilibrarse los requerimientos contradictorios. Cuando se conocen los requerimientos globales de la empresa, en contraste con los requerimientos de cualquier usuario individual, el DBA puede estructurar el sistema de bases de datos para brindar un servicio que sea el mejor para la empresa en términos globales.  Por ejemplo, puede elegirse una representación de los datos almacenados que ofrezca rápido acceso a las aplicaciones más importantes a costa de un desempeño  de menor calidad en algunas otras aplicaciones.
El procesamiento de los datos ofrece un mejor rendimiento y resulta más confiable que en los sistemas distribuidos.
Desventajas.
*      Los mainframes (computadora central) no ofrecen mejor proporción precio/rendimiento que los microprocesadores de los sistemas distribuidos.
*      Por lo general, cuando un sistema de Base de Datos Centralizada falla, se pierde toda la disponibilidad de procesamiento y sobre todo de la información confiada al sistema. 
*      En caso de un desastre o catástrofe, la recuperación es difícil de sincronizar.
*      Las cargas de trabajo no se pueden difundir entre diferentes computadoras, ya que los trabajos siempre se ejecutarán en la misma máquina.
*      Un mainframe en comparación con un sistema distribuido no tiene mayor poder de cómputo.
*      No se puede añadir poder de cómputo en pequeños incrementos, debido a lo complicado de esta operación.

Tabla Comparativa de Bases De Datos.
Bases De Datos Distribuidas
Bases De Datos Centralizadas
Los computadores de un sistema distribuido se comunican entre sí a través de diversos medios de comunicación, tales como cables de alta velocidad o líneas telefónicas.
Se almacena completamente en una localidad central (mainframe o macro computadora), es decir, todos los componentes del sistema residen en un solo computador o sitio.
Al crecer una organización por la adición una nueva unidad, el nuevo nodo o unidad de localización de dato pasa a formar parte de la base de datos distribuida sin reconfigurar la BD completamente – el nuevo nodo casi automáticamente forma parte de la BD global.
No posee múltiples elementos de procesamiento ni mecanismos de intercomunicación como las Bases de Datos Distribuidas.
Los componentes de la Bases de Datos Centralizadas son: los datos, el software del SGBD (Sistema de Gestión de Base de Datos) y los dispositivos de almacenamiento secundario asociados
Integridad. Debido a que no todos los datos se ubican en un lugar centralizado – una estación (nodo) - el fracaso podría ocasionar una pérdida de datos para otros nodos.
 Puede conservarse la integridad. El problema de la integridad es garantizar que los datos de la base de datos sean exactos
Distribución de la carga de trabajo: La distribución de la carga de trabajo sobre los sitios se hace sobre la base de utilizar la potencia de las computadoras de cada sitio y maximizar paralelismo en la ejecución de las aplicaciones.
 Por lo general, cuando un sistema de Base de Datos Centralizada falla, se pierde toda la disponibilidad de procesamiento y sobre todo de la información confiada al sistema.
Costo. La complejidad aumentada significa que los costos de mantenimiento y adquisición del sistema son mucho más altos que los de un DBMS centralizado.
Por lo general, la manutención de estas bases de datos no son muy costosas ya que se mantienen en un solo computador y el mantenimiento no utiliza muchos recursos en comparación con las distribuidas.







http://basesdedatos.wordpress.com/7-bases-de-datos-distribuidas/
http://jcarlosba.blogspot.mx/2007/08/diferencias-entre-bases-de-datos.html