Taller de Base de Datos

March 30, 2018 | Author: tilsma | Category: Sql, Databases, Data Model, Table (Database), Data Management


Comments



Description

2CONTENIDO CONTENIDO.............................................................................................................................2 UNIDAD 1.................................................................................................................................4 INTRODUCCIÓN AL SISTEMA MANEJADOR DE BASE DE DATOS (DBMS)................................4 1.1 CONCEPTOS...................................................................................................................7 1.2 CARACTERÍSTICAS DE UN DBMS....................................................................................8 UNIDAD 2.................................................................................................................................9 LENGUAJE DE DEFINICIÓN DE DATOS...................................................................................9 2.1 CREACIÓN DE BASE DE DATOS....................................................................................10 2.2 CREACIÓN DE TABLAS..................................................................................................11 2.2.1 INTEGRIDAD..........................................................................................................12 2.2.2 INTEGRIDAD REFERENCIAL DECLARATIVA.............................................................13 2.2.3 CREACIÓN DE ÍNDICES..........................................................................................14 UNIDAD 3...............................................................................................................................15 CONSULTAS Y LENGUAJE DE MANIPULACIÓN DE DATOS....................................................15 3.1 INSTRUCCIONES INSERT, UPDATE, DELETE..................................................................15 3.2 CONSULTAS BÁSICAS SELECT, WHERE Y FUNCIONES A NIVEL DE REGISTRO................18 3.3 CONSULTAS SOBRE MÚLTIPLES TABLAS.......................................................................19 3.3.1 SUBCONSULTAS.....................................................................................................20 3.3.2 OPERADORES JOIN................................................................................................20 3.4 AGREGACIÓN GROUP BY, HAVING................................................................................22 4.1 PROPIEDAD DE UNA TRANSACCIÓN..............................................................................27 4.2 GRADOS DE CONSISTENCIA.........................................................................................28 4.3 NIVELES DE AISLAMIENTO............................................................................................29 4.4 INSTRUCCIONES COMMIT Y ROLLBACK.........................................................................30 UNIDAD 5...............................................................................................................................31 VISTAS...............................................................................................................................31 5.1 DEFINICIÓN Y OBJETIVO DE LAS VISTAS.......................................................................32 5.2 INSTRUCCIONES PARA LA ADMINISTRACIÓN DE VISTAS...............................................33 UNIDAD 6...............................................................................................................................33 SEGURIDAD........................................................................................................................33 6.1 ESQUEMAS DE AUTORIZACIÓN.....................................................................................34 6.2 INSTRUCCIONES GRANT Y REVOKE..............................................................................35 UNIDAD 7...............................................................................................................................36 INTRODUCCIÓN AL SQL PROCEDURAL................................................................................36 7.1 PROCEDIMIENTOS ALMACENADOS...............................................................................37 7.2 DISPARADORES (TRIGGERS).........................................................................................38 BIBLIOGRAFÍA........................................................................................................................39 3 INTRODUCCIÓN Una base de datos o banco de datos es un conjunto de datos pertenecientes a un mismo contexto y almacenados sistemáticamente para su posterior uso. En este sentido, una biblioteca puede considerarse una base de datos compuesta en su mayoría por documentos y textos impresos en papel e indexados para su consulta. En la actualidad, y debido al desarrollo tecnológico de campos como la informática y la electrónica, la mayoría de las bases de datos están en formato digital (electrónico), que ofrece un amplio rango de soluciones al problema de almacenar datos. Existen programas denominados sistemas gestores de bases de datos, abreviados SGBD, que permiten almacenar y posteriormente acceder a los datos de forma rápida y estructurada. Las propiedades de estos SGBD, así como su utilización y administración, se estudian dentro del ámbito de la informática. Las aplicaciones más usuales son para la gestión de empresas e instituciones públicas. También son ampliamente utilizadas en entornos científicos con el objeto de almacenar la información experimental. Aunque las bases de datos pueden contener muchos tipos de datos, algunos de ellos se encuentran protegidos por las leyes de varios países. Por ejemplo, en España los datos personales se encuentran protegidos por la Ley Orgánica de Protección de Datos de Carácter Personal (LOPD). 4 UNIDAD 1 INTRODUCCIÓN AL SISTEMA MANEJADOR DE BASE DE DATOS (DBMS) El sistema manejador de bases de datos es la porción más importante del software de un sistema de base de datos. Un DBMS es una colección de numerosas rutinas de software interrelacionadas, cada una de las cuales es responsable de alguna tarea específica. Las funciones principales de un DBMS son: • • • • • • • Crear y organizar la Base de datos. Manejar los datos de acuerdo a las peticiones de los usuarios. Registrar el uso de las bases de datos. Interacción con el manejador de archivos. Respaldo y recuperación. Control de concurrencia. Seguridad e integridad. Los Sistemas Gestores de Bases de Datos son un tipo de software muy específico, dedicado a servir de interfaz entre las bases de datos y las aplicaciones que la utilizan. Se compone de un lenguaje de definición de datos, de un lenguaje de manipulación de datos y de un lenguaje de consulta. En los textos que tratan este tema, o temas relacionados, se mencionan los términos SGBD y DBMS, siendo ambos equivalentes, y acrónimos, respectivamente, de Sistema Gestor de Bases de Datos y DataBase Management System, su expresión inglesa. Motor ò Núcleo DBMS: recibe los requerimientos lógicos de E/S y los convierte en operaciones de lectura y escritura. Lógicos: son cualquier tipo de consulta requerimiento de lectura con ingreso de datos (requerimiento de estructura) es ayudado por el Sistema Operativo para convertir estos requerimientos lógicos en físicos que actúan sobre dispositivos de almacenamiento. Herramientas de definición: permite definir y modificar la estructura de la Base de Datos, a este nivel definimos lo que se conoce como "Esquema " que es la definición total de Base de Datos, es que definimos la estructura de la tabla, los tipos de campos, las restricciones para los campos. • • Subesquema: manejo de vistas de datos, de niveles externos. Esquema: manejo de niveles conceptuales. 5 • • • Interface de Procesamiento: me provee de las facilidades de actualización, despliegue y visualización de datos. Desarrollo de Aplicaciones: me permite generar una aplicación por Diccionario de Datos: este es el componente al subsistema con el que interactúan directamente el DBA, le proporciona niveles de consulta y reportes útiles para su trabajo de administración. Es la descripción de la estructura de Base de Datos y relaciones entre datos, y programas. DBMS Características y Objetos: • Independencia de Datos: el DBMS me provee una independencia de mis datos vs. las aplicaciones. • Cambio en datos no implica cambio en programas y viceversa (Menor coste de mantenimiento). • Minimizar Redundancia (Datos repetidos): desperdicio de Espacio de Almacenamiento. Independencia de datos es proteger nuestro programa de aplicaciones frente a las modificaciones en la estructura de datos y viceversa, ya sea en forma física ò lógica. 6 Independencia Física: es protección a los programas de aplicación debido a cambios en la estructura de archivos, con cambios en las características de los campos. Independencia Lógica: protección a los programas de aplicación cuando se modifica el esquema. • Redundancia, datos repetidos y distribuidos en cualquier parte. El efecto que ocasiona la redundancia es tener inconsistencia de datos y desperdicio de espacio de almacenamiento. Esta se presenta cuando se repiten innecesariamente datos en los archivos que conforman la base de datos. • Inconsistencia de Datos: dato que esta en lugar con un valor y encuentra en otro lugar con otro valor. Ocurre cuando existe información contradictoria o incongruente en la base de datos. • 1.1 CONCEPTOS 7 Un sistema de administración de bases de datos DBMS (Database Management System, por sus siglas en inglés) es un sistema basado en computador (software) que maneja una base de datos, o una colección de bases de datos o archivos. La persona que administra un D0BMS es conocida como el DBA (Database Administrator, por sus siglas en ingles). Esta compuesto por: • • • DDL (Data Definition Language): Lenguaje de Definición de Datos. DML (Data Manipulation Language): Lenguaje de Manipulación de Datos. SQL: Lenguaje de Consulta. Los sistemas de administración de bases de datos son usados para: • • Permitir a los usuarios acceder y manipular la base de datos proveyendo métodos para construir sistemas de procesamiento de datos para aplicaciones que requieran acceso a los datos. Proveer a los administradores las herramientas que les permitan ejecutar tareas de mantenimiento y administración de los datos. Algunas de las funciones de un DBMS son: • • • • • • • Definición de la base de datos - como la información va a ser almacenada y organizada. Creación de la base de datos - almacenamiento de datos en una base de datos definida. Recuperación de los datos - consultas y reportes. Actualización de los datos - cambiar los contenidos de la base de datos. Programación de aplicaciones de para el desarrollo de software. Control de la integridad de la base de datos. Monitoreo del comportamiento de la base de datos. 8 1.2 CARACTERÍSTICAS DE UN DBMS Las principales características de un manejador de base de datos son: • CONTROL DE LA REDUNDANCIA DE DATOS Este consiste en lograr una mínima cantidad de espacio de almacenamiento para almacenar los datos evitando la duplicación de la información. • MANTENIMIENTO DE LA INTEGRIDAD La integridad de los datos es la que garantiza la precisión o exactitud de la información contenida en una base de datos. Los datos interrelacionados deben siempre representar información correcta a los usuarios. SOPORTE PARA CONTROL DE TRANSACCIONES Y RECUPERACIÓN DE FALLAS. Se conoce como transacción toda operación que se haga sobre la base de datos. Las transacciones deben por lo tanto ser controladas de manera que no alteren la integridad de la base de datos. La recuperación de fallas tiene que ver con la capacidad de un sistema DBMS de recuperar la información que se haya perdido durante una falla en el software o en el hardware. • INDEPENDENCIA DE LOS DATOS. En las aplicaciones basadas en archivos, el programa de aplicación debe conocer tanto la organización de los datos como las técnicas que el permiten acceder a los datos. En los sistemas DBMS los programas de aplicación no necesitan conocer la organización de los datos en el disco duro. Este totalmente independiente de ello. • SEGURIDAD La disponibilidad de los datos puede ser restringida a ciertos usuarios. Según los privilegios que posea cada usuario de la base de datos, podrá acceder a mayor información que otros. • 9 • VELOCIDAD Los sistemas DBMS modernos poseen altas velocidades de respuesta y proceso. • INDEPENDENCIA DEL HARDWARE La mayoría de los sistemas DBMS están disponibles para ser instalados en múltiples plataformas de hardware. UNIDAD 2 LENGUAJE DE DEFINICIÓN DE DATOS Un lenguaje de definición de datos (Data Definition Language, DDL por sus siglas en inglés) es un lenguaje proporcionado por el sistema de gestión de base de datos que permite a los usuarios de la misma llevar a cabo las tareas de definición de las estructuras que almacenarán los datos así como de los procedimientos o funciones que permitan consultarlos. El lenguaje de programación SQL, el más difundido entre los gestores de bases de datos, admite las siguientes sentencias de definición: CREATE, DROP y ALTER, cada una de las cuales se puede aplicar a las tablas, vistas, procedimientos almacenados y triggers de la base de datos. Otras que se incluyen dentro del DDL, pero que su existencia depende de la implementación del estándar SQL que lleve a cabo el gestor de base de datos son GRANT y REVOKE, los cuales sirven para otorgar permisos o quitarlos, ya sea a usuarios específicos o a un rol creado dentro de la base de datos. Una vez finalizado el diseño de una base de datos y escogido un SGBD para su implementación, el primer paso consiste en especificar el esquema conceptual y el esquema interno de la base de datos, y la correspondencia entre ambos. En muchos SGBD no se mantiene una separación estricta de niveles, por lo que el administrador de la base de datos y los diseñadores utilizan el mismo lenguaje para definir ambos esquemas, es el lenguaje de definición de datos (LDD). El SGBD posee un compilador de LDD cuya función consiste en procesar las sentencias del lenguaje para identificar las 10 descripciones de los distintos elementos de los esquemas y almacenar la descripción del esquema en el catálogo o diccionario de datos. 2.1 CREACIÓN DE BASE DE DATOS Una base de datos en un sistema relacional está compuesta por un conjunto de tablas, que corresponden a las relaciones del modelo relacional. En la terminología usada en SQL no se alude a las relaciones, del mismo modo que no se usa el término atributo, pero sí la palabra columna, y no se habla de tupla, sino de línea. A continuación se usarán indistintamente ambas terminologías, por lo que tabla estará en lugar de relación, columna en el de atributo y línea en el de tupla, y viceversa. Antes de poder proceder a la creación de las tablas, normalmente hay que crear la base de datos, lo que a menudo significa definir un espacio de nombres separado para cada conjunto de tablas. De esta manera, para una DBMS se pueden gestionar diferentes bases de datos independientes al mismo tiempo sin que se den conflictos con los nombres que se usan en cada una de ellas. Para crear una base de datos por ejemplo en Mysql debes de utilizar la instrucción CREATE DATABASE nombre_base_datos que es similar en los otros manejadores de bases de datos Prácticamente, la creación de la base de datos consiste en la creación de las tablas que la componen. En realidad, antes de poder proceder a la creación de las tablas, normalmente hay que crear la base de datos, lo que a menudo significa definir un espacio de nombres separado para cada conjunto de tablas. De esta manera, para una DBMS se pueden gestionar diferentes bases de datos independientes al mismo tiempo sin que se den conflictos con los nombres que se usan en cada una de ellas. El sistema previsto por el estándar para crear los espacios separados de nombres consiste en usar las instrucciones SQL "CREATE SCHEMA". A menudo, dicho 11 sistema no se usa pero cada DBMS prevé un procedimiento propietario para crear una base de datos. Normalmente, se amplía el lenguaje SQL introduciendo una instrucción no prevista en el estándar: "CREATE DATABASE". La sintaxis empleada por PostgreSQL, pero también por las DBMS más difundidas, es la siguiente: CREATE DATABASE nombre_base de datos 2.2 CREACIÓN DE TABLAS En general, la mayoría de las bases de datos poseen potentes editores de bases que permiten la creación rápida y sencilla de cualquier tipo de tabla con cualquier tipo de formato. Sin embargo, una vez la base de datos está alojada en el servidor, puede darse el caso de que queramos introducir una nueva tabla ya sea con carácter temporal (para gestionar un carrito de compra por ejemplo) o bien permanente por necesidades concretas de nuestra aplicación. En estos casos, podemos, a partir de una sentencia SQL, crear la tabla con el formato que deseemos lo cual nos puede ahorrar más de un quebradero de cabeza. Este tipo de sentencias son especialmente útiles para bases de datos como Mysql, las cuales trabajan directamente con comandos SQL y no por medio de editores. Para crear una tabla debemos especificar diversos datos: El nombre que le queremos asignar, los nombres de los campos y sus características. Además, puede ser necesario especificar cuáles de estos campos van a ser índices y de qué tipo van a serlo. 12 La sintaxis de creación puede variar ligeramente de una base de datos a otra ya que los tipos de campo aceptados no están completamente estandarizados. Tras la creación de la base de datos el siguiente paso que se debe realizar es la creación de la tabla, o tablas, que almacenarán la información. Los datos de los clientes, de los pedidos, de los socios, etc.… Esta información será la que gestionen todos los demás objetos de la base de datos (consultas, formularios, etc.), por lo que es muy importante planificar bien la estructura que van a tener los datos (como van a estar dispuestos en la tabla, de que naturaleza o tipo va a ser cada uno, en que orden estarán colocados, etc…), con el fin de poder dar respuesta a todas las cuestiones que se puedan plantear sobre el manejo de dicha información. Para crear una tabla debemos especificar diversos datos: El nombre que le queremos asignar, los nombres de los campos y sus características. Además, puede ser necesario especificar cuáles de estos campos van a ser índices y de qué tipo van a serlo. La sintaxis de creación puede variar ligeramente de una base de datos a otra ya que los tipos de campo aceptados no están completamente estandarizados. A continuación os explicamos someramente la sintaxis de esta sentencia y os proponemos una serie de ejemplos prácticos: Sintaxis Create Table nombre_tabla (nombre_campo_1 tipo_1 nombre_campo_2 tipo_2 nombre_campo_n tipo_n Key(campo_x,...) 2.2.1 INTEGRIDAD El término integridad de datos se refiere a la corrección y completitud de los datos en una base de datos. Cuando los contenidos se modifican con sentencias INSERT, DELETE o UPDATE, la integridad de los datos almacenados puede perderse de muchas maneras diferentes. Pueden añadirse datos no válidos a la base de datos, tales como un pedido que especifica un producto no existente. Pueden modificarse datos existentes tomando un valor incorrecto, como por ejemplo si se reasigna un vendedor a una oficina no existente. Los cambios en la base de datos pueden perderse debido a un error del sistema o a un fallo en el suministro de energía. Los cambios pueden ser aplicados parcialmente, como por ejemplo si se añade un pedido de un producto sin ajustar la cantidad disponible para vender. Una de las funciones importantes de un DBMS relacional es preservar la integridad de sus datos almacenados en la mayor medida posible. 13 Tipos de restricciones de integridad Datos Requeridos: establece que una columna tenga un valor no NULL. Se define efectuando la declaración de una columna es NOT NULL cuando la tabla que contiene las columnas se crea por primera vez, como parte de la sentencia CREATE TABLE. • Chequeo de Validez: cuando se crea una tabla cada columna tiene un tipo de datos y el DBMS asegura que solamente los datos del tipo especificado sean ingresados en la tabla. • Integridad de entidad: establece que la clave primaria de una tabla debe tener un valor único para cada fila de la tabla; si no, la base de datos perderá su integridad. Se especifica en la sentencia CREATE TABLE. El DBMS comprueba automáticamente la unicidad del valor de la clave primaria con cada sentencia INSERT Y UPDATE. Un intento de insertar o actualizar una fila con un valor de la clave primaria ya existente fallará. • Integridad referencial: asegura la integridad entre las claves ajenas y primarias (relaciones padre/hijo). Existen cuatro actualizaciones de la base de datos que pueden corromper la integridad referencial: ✔ La inserción de una fila hijo se produce cuando no coincide la clave ajena con la clave primaria del padre. ✔ La actualización en la clave ajena de la fila hijo, donde se produce una actualización en la clave ajena de la fila hijo con una sentencia UPDATE y la misma no coincide con ninguna clave primaria. ✔ La supresión de una fila padre, con la que, si una fila padre -que tiene uno o más hijos- se suprime, las filas hijos quedarán huérfanas. ✔ La actualización de la clave primaria de una fila padre, donde si en una fila padre, que tiene uno o más hijos se actualiza su clave primaria, las filas hijos quedarán huérfanas. 2.2.2 INTEGRIDAD REFERENCIAL DECLARATIVA La integridad de los datos es la propiedad que asegura que información dada es correcta, al cumplir ciertas aserciones. Las restricciones de integridad aseguran que la información contenida en una base de datos es correcta. Las restricciones de integridad son propiedades de la base de datos que se deben satisfacer en cualquier momento. Las restricciones de integridad aseguran que la información contenida en la base de datos cumple ciertas restricciones para los diferentes estados. 14 La integridad referencial es una propiedad deseable en las bases de datos. Gracias a la integridad referencial se garantiza que una entidad (fila o registro) siempre se relaciona con otras entidades válidas, es decir, que existen en la base de datos. Implica que en todo momento dichos datos sean correctos, sin repeticiones innecesarias, datos perdidos y relaciones mal resueltas. Todas las bases de datos relacionales gozan de esta propiedad gracias a que el software gestor de base de datos vela por su cumplimiento. En cambio, las bases de datos jerárquicas requieren que los programadores se aseguren de mantener tal propiedad en sus programas. Ejemplo: Supongamos una base de datos con las entidades Persona y Factura. Toda factura corresponde a una persona y solamente una. Implica que en todo momento dichos datos sean correctos, sin repeticiones innecesarias, datos perdidos y relaciones mal resueltas. Supongamos que una persona se identifica por su atributo DNI (Documento nacional de identidad). También tendrá otros atributos como el nombre y la dirección. La entidad Factura debe tener un atributo DNI_cliente que identifique a quién pertenece la factura. Por sentido común es evidente que todo valor de DNI_cliente debe corresponder con algún valor existente del atributo DNI de la entidad Persona. Esta es la idea intuitiva de la integridad referencial. Existen tres tipos de integridad referencial: • Integridad referencial débil: si en una tupla de R todos los valores de los atributos de K tienen un valor que no es el nulo, entonces debe existir una tupla en S que tome esos mismos valores en los atributos de J; Integridad referencial parcial: si en una tupla de R algún atributo de K toma el valor nulo, entonces debe existir una tupla en S que tome en los atributos de J los mismos valores que los atributos de K con valor no nulo; y Integridad referencial completa: en una tupla de R todos los atributos de K deben tener el valor nulo o bien todos tienen un valor que no es el nulo y entonces debe existir una tupla en S que tome en los atributos de J los mismos valores que toman los de K. • • 2.2.3 CREACIÓN DE ÍNDICES Un índice (o KEY, o INDEX) es un grupo de datos que MySQL asocia con una o varias columnas de la tabla. En este grupo de datos aparece la relación entre el contenido y el número de fila donde está ubicado. 15 Los índices -como los índices de los libros- sirven para agilizar las consultas a las tablas, evitando que mysql tenga que revisar todos los datos disponibles para devolver el resultado. Podemos crear el índice a la vez que creamos la tabla, usando la palabra INDEX seguida del nombre del índice a crear y columnas a indexar (que pueden ser varias): INDEX nombre_indice (columna_indexada, columna_indexada2...) La sintaxis es ligeramente distinta segun la clase de índice: PRIMARY KEY (nombre_columna_1 [,nombre_columna2...]) UNIQUE INDEX nombre_indice (columna_indexada1 [,columna_indexada2 ...]) INDEX nombre_index (columna_indexada1 [,columna_indexada2...]) Podemos también añadirlos a una tabla después de creada: ALTER TABLE nombre_tabla ADD INDEX nombre_indice (columna_indexada); Si queremos eliminar un índice: ALTER TABLE tabla_nombre DROP INDEX nombre_indice Los index permiten mayor rápidez en la ejecución de las consultas a la base de datos tipo SELECT ... WHERE La regla básica es pues crear tus índices sobre aquellas columnas que vayas a usar con una cláusula WHERE, y no crearlos con aquellas columnas que vayan a ser objeto de un SELECT: SELECT texto from tabla_libros WHERE autor = Vazquez; En este ejemplo, la de autor es una columna buena candidata a un indice; la de texto, no. Otra regla básica es que son mejores candidatas a indexar aquellas columnas que presentan muchos valores distintos, mientras que no son buenas candidatas las que tienen muchos valores idénticos, como por ejemplo sexo (masculino y femenino) porque cada consulta implicará siempre recorrer prácticamente la mitad del índice. Tipos de índice En algunas bases de datos existen diferencias entre KEY e INDEX. No así en MySQL donde son sinónimos. Un índice que sí es especial es el llamado PRIMARY KEY. Se trata de un índice diseñado para consultas especialmente rápidas. Todos sus campos deben ser UNICOS y no admite NULL Un indice UNIQUE es aquel que no permite almacenar dos valores iguales. Los indices FULL TEXT permiten realizar búsquedas de palabras. Puedes crear indices FULLTEXT sobre columnas tipo CHAR, VARCHAR o TEXT. UNIDAD 3 16 CONSULTAS DATOS Y LENGUAJE DE MANIPULACIÓN DE Un Lenguaje de Manipulación de Datos (Data Manipulation Language, DML) es un lenguaje proporcionado por el sistema de gestión de base de datos que permite a los usuarios de la misma llevar a cabo las tareas de consulta o manipulación de los datos, organizados por el modelo de datos adecuado. El lenguaje de manipulación de datos más popular hoy día es SQL, usado para recuperar y manipular datos en una base de datos relacional. Otros ejemplos de DML son los usados por bases de datos IMS/DL1, CODASYL u otras. Clasificación del lenguaje de manipulación de datos: Son DML: Select Insert Delete Update Se clasifican en dos grandes grupos: • Lenguajes de consulta procedimentales Lenguajes procedimentales. En este tipo de lenguaje el usuario da instrucciones al sistema para que realice una serie de procedimientos u operaciones en la base de datos para calcular un resultado final. • lenguajes de consulta no procedimentales En los lenguajes no procedimentales el usuario describe la información deseada sin un procedimiento específico para obtener esa información. 3.1 INSTRUCCIONES INSERT, UPDATE, DELETE En SQL, hay fundamental y básicamente dos formas para insertar datos en una tabla: Una es insertar una fila por vez, y la otra es insertar filas múltiples por vez. Primero observemos como podemos insertamos datos a través de una fila por vez: La sintaxis para insertar datos en una tabla mediante una fila por vez es la siguiente: INSERT INTO "nombre_tabla" ("columna1", "columna2", ...) VALUES ("valor1", "valor2", ...) Suponiendo que tenemos una taba con la siguiente estructura, Tabla Store_Information Column Name Data Type store_name char(50) Sales float Date datetime Y ahora deseamos insertar una fila adicional en la tabla que represente los datos de ventas para Los Ángeles el 10 de enero de 1999. En ese día, este negocio tenía $900 dólares estadounidenses en ventas. Por lo tanto, utilizaremos la siguiente escritura SQL: 17 INSERT INTO Store_Information (store_name, Sales, Date) VALUES ('Los Angeles', 900, '10-Jan-1999') El segundo tipo de INSERT INTO nos permite insertar filas múltiples en una tabla. A diferencia del ejemplo anterior, donde insertamos una única fila al especificar sus valores para todas las columnas, ahora utilizamos la instrucción SELECT para especificar los datos que deseamos insertar en la tabla. Si está pensando si esto significa que está utilizando información de otra tabla, está en lo correcto. La sintaxis es la siguiente: INSERT INTO "tabla1" ("columna1", "columna2", ...) SELECT "columna3", "columna4", ... FROM "tabla2" Note que esta es la forma más simple. La instrucción entera puede contener fácilmente cláusulas WHERE, GROUP BY, y HAVING, así como también uniones y alias. Entonces por ejemplo, si deseamos tener una tabla Store_Information, que recolecte la información de ventas para el año 1998, y ya conoce en donde reside la fuente de datos en tabla Sales_Information table, Ingresaremos: INSERT INTO Store_Information (store_name, Sales, Date) SELECT store_name, Sales, Date FROM Sales_Information WHERE Year(Date) = 1998 Aquí hemos utilizado la sintaxis de Servidor SQL para extraer la información anual por medio de una fecha. Otras bases de datos relacionales pueden tener sintaxis diferentes. Por ejemplo, en Oracle, utilizará to_char (date,'yyyy')=1998. Una vez que hay datos en la tabla, podríamos tener la necesidad de modificar los mismos. Para hacerlo, utilizamos el comando UPDATE. La sintaxis para esto es, UPDATE "nombre_tabla" SET "columna_1" = [nuevo valor] WHERE {condición} Por ejemplo, digamos que actualmente tenemos la tabla a continuación: Tabla Store_Information store_name Sales Date Los Angeles 1500 € 05-Jan-1999 San Diego 250 € 07-Jan-1999 Los Angeles 300 € 08-Jan-1999 Boston 700 € 08-Jan-1999 Y notamos que las ventas para Los Angeles el 08/01/1999 es realmente de 500€ en vez de 300€ dólares estadounidenses, y que esa entrada en particular necesita actualizarse. Para hacerlo, utilizamos el siguiente SQL: 18 UPDATE Store_Information SET Sales = 500 WHERE store_name = "Los Angeles" AND Date = "08-Jan-1999" La tabla resultante ser vería Tabla Store_Information store_name Sales Date Los Angeles 1500 € 05-Jan-1999 San Diego 250 € 07-Jan-1999 Los Angeles 500 € 08-Jan-1999 Boston 700 € 08-Jan-1999 En este caso, hay sólo una fila que satisface la condición en la cláusula WHERE. Si hay múltiples filas que satisfacen la condición, todas ellas se modificarán. También es posible UPDATE múltiples columnas al mismo tiempo. La sintaxis en este caso se vería como la siguiente: UPDATE "nombre_tabla" SET colonne 1 = [[valor1], colonne 2 = [valor2] WHERE {condición} A veces podemos desear deshacernos de los registros de una tabla. Para ello, utilizamos el comando DELETE FROM. La sintaxis para esto es, DELETE FROM "nombre_tabla" WHERE {condición} Es más fácil utilizar un ejemplo. Por ejemplo, digamos que actualmente tenemos la siguiente tabla: Tabla Store_Information store_name Sales Date Los Angeles 1500 € 05-Jan-1999 San Diego 250 € 07-Jan-1999 Los Angeles 300 € 08-Jan-1999 Boston 700 € 08-Jan-1999 Y decidimos no mantener ninguna información sobre Los Ángeles en esta tabla. Para lograrlo, ingresamos el siguiente SQL: DELETE FROM Store_Information WHERE store_name = "Los Angeles" store_name Sales Date San Diego 250 € 07-Jan-1999 Boston 700 € 08-Jan-1999 3.2 CONSULTAS BÁSICAS SELECT, WHERE Y FUNCIONES A NIVEL DE REGISTRO. Para qué utilizamos los comandos SQL El uso común es la selección de datos desde tablas ubicadas en una base de datos. Inmediatamente, vemos 19 dos palabras claves: necesitamos SELECT la información FROM una tabla. (Note que la tabla es un contenedor que reside en la base de datos donde se almacena la información. Para obtener más información acerca de cómo manipular tablas. Por lo tanto tenemos la estructura SQL más básica: SELECT "nombre_columna" FROM "nombre_tabla" Para ilustrar el ejemplo anterior, suponga que tenemos la siguiente tabla: Tabla Store_Information store_na Sales Date me Los 1500 05-JanAngeles € 1999 07-JanSan Diego 250 € 1999 Los 08-Jan300 € Angeles 1999 08-JanBoston 700 € 1999 Podemos utilizar esta tabla como ejemplo a lo largo de la guía de referencia (esta tabla aparecerá en todas las secciones). Para seleccionar todos los negocios en esta tabla, ingresamos: SELECT store_name FROM Store_Information Resultado: store_na me Los Angeles San Diego Los Angeles Boston Pueden seleccionarse los nombres de columnas múltiples, así como también los nombres de tablas múltiples. Luego, podríamos desear seleccionar condicionalmente los datos de una tabla. Por ejemplo, podríamos desear sólo recuperar los negocios con ventas mayores a $1.000 dólares. Para ello, utilizamos la palabra clave WHERE. La sintaxis es la siguiente: SELECT "nombre_columna" FROM "nombre_tabla" WHERE "condición" Por ejemplo, para seleccionar todos los negocios con ventas mayores a 1.000€ en la Tabla Store_Information, 20 Tabla Store_Information store_na me Los Angeles Sales Date 1500 05-Jan€ 1999 07-JanSan Diego 250 € 1999 Los 08-Jan300 € Angeles 1999 08-JanBoston 700 € 1999 Ingresamos: SELECT store_name FROM Store_Information WHERE Sales > 1000 Resultado: store_name Los Angeles 3.3 CONSULTAS SOBRE MÚLTIPLES TABLAS En una base de datos relacional, la información está distribuida entre diferentes tablas relacionadas. Las cláusulas obligatorias en unaconsulta son: • SELECT. Lista de la información (columnas, expresiones, funciones, …) que debe visualizarse • FROM. Detalla de que tablas o vistas debe obtenerse la información Para obtener información de más de una tabla, es necesario identificar las columnas comunes entre cada par de tablas relacionadas. En la cláusula WHERE se definen las relaciones entre las tablas listadas en la cláusula FROM. La SELECT puede tener columnas o expresiones de una o más de estas tablas. Una JOIN es una consulta que combina filas de dos o más tablas o vistas. Las tablas de la JOIN deben aparecer en el FROM. 21 3.3.1 SUBCONSULTAS Es posible incorporar una instrucción SQL dentro de otra. Cuando esto se hace en las instrucciones where o having, tenemos una construcción de subconsulta. La sintaxis es la siguiente: SELECT "nombre1_columna" FROM "nombre1_tabla" WHERE "nombre2_columna" [Operador de Comparación] (SELECT "nombre3_columna" FROM "nombre2_tabla" WHERE [Condición]) Una subconsulta es una sentencia select que aparece dentro de otra sentencia select que llamaremos consulta principal. Se puede encontrar en la lista de selección, en la cláusula where o en la cláusula having de la consulta principal. Una subconsulta tiene la misma sintaxis que una sentencia select normal exceptuando que aparece encerrada entre paréntesis, no puede contener la cláusula order by, ni puede ser la unión de varias sentencias select, además tiene algunas restricciones en cuanto a número de columnas según el lugar donde aparece en la consulta principal. A menudo, es necesario, dentro del cuerpo de una subconsulta, hacer referencia al valor de una columna en la fila actual de la consulta principal, ese nombre de columna se denomina referencia externa. Una referencia externa es un nombre de columna que estando en la subconsulta, no se refiere a ninguna columna de las tablas designadas en la from de la subconsulta sino a una columna de las tablas designadas en la from de la consulta principal. Ejemplo: SELECT numemp, nombre, (SELECT MIN(fechapedido) FROM pedidos WHERE rep = numemp) FROM empleados; 3.3.2 OPERADORES JOIN Ahora miremos las uniones. Para realizar uniones en SQL se requieren mucho de los elementos que ya hemos presentado. Digamos que tenemos las siguientes dos tablas: Tabla Store_Information store_na Sales Date me Los 1500 05-JanAngeles € 1999 07-JanSan Diego 250 € 1999 Los 08-Jan300 € Angeles 1999 Boston 700 € 08-Jan- 22 1999 Tabla Geography region_na store_na me me East Boston East New York Los West Angeles West San Diego Y queremos saber las ventas por región. Vemos que la tabla Geography incluye información sobre regiones y negocios, y la tabla Store_Information contiene información de ventas para cada negocio. Para obtener la información de ventas por región, debemos combinar la información de las dos tablas. Al examinar las dos tablas, encontramos que están enlazadas a través del campo común “nombre_negocio” Primero presentaremos la instrucción SQL y explicaremos el uso de cada segmento después: SELECT A1.region_name REGION, SUM(A2.Sales) SALES FROM Geography A1, Store_Information A2 WHERE A1.store_name = A2.store_name GROUP BY A1.region_name Resultado: REGIÓ SALE N S East 700 € 2050 West € Las primeras dos líneas le indican a SQL que seleccione dos campos, el primero es el campo "nombre_región" de la tabla Geography (denominado REGIÓN), y el segundo es la suma del campo "Sales" de la tabla Store_Information (denominado SALES). Note como se utilizan los alias de tabla aquí: Geografía se denomina A1, e Información_Negocio se denomina A2. Sin los alias, la primera línea sería SELECT SALES Geography.region_name REGION, SUM(Store_Information.Sales) Que es mucho más problemática. En esencia, los alias de tabla facilitan el entendimiento de la totalidad de la instrucción SQL, especialmente cuando se incluyen tablas múltiples. Luego, pongamos nuestra atención en la línea 2, la instrucción WHERE. Aquí es donde se especifica la condición de la unión. En este caso, queremos 23 asegurarnos que el contenido en “nombre_negocio” en la tabla Geografía concuerde con la tabla Store_Information, y la forma de hacerlo es igualarlos. Esta instrucción WHEREes esencial para asegurarse de que obtenga el resultado correcto. Sin la correcta instrucción WHERE se producirá una Unión Cartesiana. Las uniones cartesianas darán por resultado que de la consulta se arroje toda combinación posible de las dos tablas (o cualquiera que sea el número de tablas en la instrucción FROM). En este caso, una unión cartesiana resultaría en un total de 4x4 = Se presenta un resultado de16 filas. 3.4 AGREGACIÓN GROUP BY, HAVING Las funciones de agrupación operan sobre conjuntos de filas para dar un resultado por grupo. Así tenemos para atributos numéricos. Las funciones de agrupación ignoran los valores NULL en las consultas, aunque se puede utilizar NVL (en Oracle) para forzar a que considere a NULL como un valor determinado. La cláusula GROUP BY seguida de una lista de atributos permite agrupar las tuplas en Grupos que tengan los mismos valores en todos los atributos de esa lista Ejemplo: “Obtener el número de profesores de cada área” SELECT COUNT(*) ,AREA FROM PROFESORES GROUP BY AREA; Si quisiéramos calcular el total de ventas para cada negocio entonces, necesitamos hacer dos cosas: Primero, necesitamos asegurarnos de que hayamos seleccionado el nombre del negocio así como también las ventas totales. Segundo, debemos asegurarnos de que todas las sumas de las ventas estén group by negocios. La sintaxis SQL correspondiente es, SELECT "nombre1_columna", SUM("nombre2_columna") FROM "nombre_tabla" GROUP BY "nombre1-columna" Ilustremos utilizando la siguiente tabla, Tabla Store_Information store_na Sales Date me Los 1500 05-JanAngeles € 1999 07-JanSan Diego 250 € 1999 Los 08-Jan300 € Angeles 1999 Boston 700 € 08-Jan- 24 1999 Deseamos saber las ventas totales para cada negocio. Para hacerlo, ingresaríamos, SELECT store_name, SUM(Sales) FROM Store_Information GROUP BY store_name Resultado: store_na SUM(Sale me s) Los 1800 € Angeles San 250 € Diego 700 € Boston> La palabra clave group by se utiliza cuando estamos seleccionado columnas múltiples desde una tabla (o tablas) y aparece al menos un operador aritmético en la instrucción select. Cuando esto sucede, necesitamos group by todas las otras columnas seleccionadas, es decir, todas las columnas excepto aquella(s) que se operan por un operador aritmético. La cláusula HAVING permite establecer una condición sobre los grupos de manera que Sólo se seleccionan aquellos grupos que la cumplen “listar los profesores y el nº de clases que imparten, pero sólo de aquellos profesores que Imparten más de 10 clases” SELECT PROFESOR,COUNT(*) FROM DOCENCIA GROUP BY PROFESOR HAVING COUNT(*)>10; Otra cosa que las personas pueden hacer es limitar el resultado según la suma correspondiente (o cualquier otra función de agregado). Por ejemplo, podríamos desear ver sólo los negocios con ventas mayores a 1 500 €. En vez de utilizar la cláusula where en la instrucción sql, a pesar de que necesitemos utilizar la cláusula having, que se reserva para funciones de agregados. La cláusula having se coloca generalmente cerca del fin de la instrucción sql, y la instrucción sql con la cláusula having. Puede o no incluir la cláusula group by sintaxis para having es, Select "nombre1_columna", sum("nombre2_columna") from "nombre_tabla" group by "nombre1_columna" having (condición de función aritmética) Nota: la cláusula group by es opcional. En nuestro ejemplo, tabla store_information, 25 Tabla store_information store_na Sales Date me Los 1500 05-JanAngeles € 1999 07-JanSan Diego 250 € 1999 Los 08-Jan300 € Angeles 1999 08-JanBoston 700 € 1999 Ingresaríamos, SELECT store_name, SUM(sales) FROM Store_Information GROUP BY store_name HAVING SUM(sales) > 1500 Resultado: store_na SUM(Sale me s) Los 1800 € Angeles 3.5 FUNCIONES DE CONJUNTO DE REGISTROS COUNT, SUM, AVG, MAX, MIN Funciones de agregación Son funciones que toman una colección de valores como entrada y producen un único valor de salida. SQL proporciona cinco funciones de agregación primitivas: • avg: media aritmética de un atributo o una expresión numérica • min: mínimo de un atributo o expresión numérica • max: máximo de un atributo o expresión numérica • sum: suma total de atributos o expresiones numéricas • count (*): contador de tuplas • count (distinct): contador de tuplas parcial, no tiene en cuenta Todos los operadores, excepto avg y sum, pueden operar con números y cadenas de caracteres. La función de agregación se coloca en la línea select. La cláusula group by se utiliza cuando las funciones de agregación se aplican a un grupo de conjuntos de tuplas, y la cláusula having se utiliza para poner una condición a los grupos. SQL tiene varias funciones aritméticas, y estas son: - AVG - COUNT - MAX 26 - MIN - SUM La sintaxis para el uso de funciones es, SELECT "tipo de función"("nombre_columna") FROM "nombre_tabla" Por ejemplo, si deseamos obtener la sumatoria de todas las ventas de la siguiente tabla, Tabla Store_Information store_na Sales Date me Los 1500 05-JanAngeles € 1999 07-JanSan Diego 250 € 1999 Los 08-Jan300 € Angeles 1999 08-JanBoston 700 € 1999 Ingresaríamos SELECT SUM(Sales) FROM Store_Information Resultado: SUM(Sales) 2750 € 2 750 € representa la suma de todas las entradas de Ventas: 1500 € + 250 € + 300 € + 700 €. Además de utilizar dichas funciones, también es posible utilizar SQL para realizar tareas simples como suma (+) y resta (-). Para ingresar datos del tipo caracter, hay también varias funciones de cadenas disponibles, tales como funciones de concatenación, reducción y subcadena. Los diferentes proveedores RDBMS tienen diferentes implementaciones de funciones de cadenas, y es mejor consultar las referencias para sus RDBMS a fin de ver cómo se utilizan estas funciones. Otra función aritmética es COUNT. Esto nos permite COUNT el número de filas en una tabla determinada. La sintaxis es, SELECT COUNT("nombre_columna") FROM "nombre_columna" Por ejemplo, si deseamos encontrar el número de entradas de negocios en nuestra tabla, Tabla Store_Information store_na Sales Date me Los 1500 05-JanAngeles € 1999 07-JanSan Diego 250 € 1999 27 Los Angeles Boston 08-Jan1999 08-Jan700 € 1999 300 € Ingresamos, SELECT COUNT(store_name) FROM Store_Information Resultado: Count(store_name) 4 COUNT y DISTINCT pueden utilizarse juntos en una instrucción para determinar el número de las distintas entradas en una tabla. Por ejemplo, si deseamos saber el número de los distintos negocios, ingresaríamos, SELECT COUNT(DISTINCT store_name) FROM Store_Information Resultado: Count(DISTINCT store_name) 3 UNIDAD 4 CONTROL DE TRANSACCIONES Los sistemas que tratan el problema de control de concurrencia permiten que sus usuarios asuman que cada una de sus aplicaciones se ejecuta atómicamente, como si no existieran otras aplicaciones ejecutándose concurrentemente. Esta abstracción de una ejecución atómica y confiable de una aplicación se conoce como una transacción. Un algoritmo de control de concurrencia asegura que las transacciones se ejecuten atómicamente controlando la intercalación de transacciones 28 concurrentes, para dar la ilusión de que las transacciones se ejecutan serialmente, una después de la otra, sin ninguna intercalación. Las ejecuciones intercaladas cuyos efectos son los mismos que las ejecuciones seriales son denominadas serializables y son correctos ya que soportan la ilusión de la atomicidad de las transacciones. El concepto principal es el de transacción. Informalmente, una transacción es la ejecución de ciertas instrucciones que accedan a una base de datos compartida. El objetivo del control de concurrencia y recuperación es asegurar que dichas transacciones se ejecuten atómicamente, es decir: Cada transacción accede a información compartida sin interferir con otras transacciones, y si una transacción termina normalmente, todos sus efectos son permanentes, en caso contrario no tiene afecto alguno. Una transacción es la ejecución de ciertas instrucciones que accedan a una base de datos compartida. El objetivo del control de concurrencia y recuperación es asegurar que dichas transacciones se ejecuten atómicamente, es decir: Cada transacción accede a información compartida sin interferir con otras transacciones, y si una transacción termina normalmente, todos sus efectos son permanentes, en caso contrario no tiene afecto alguno. Una base de datos está en un estado consistente si obedece todas las restricciones de integridad (significa que cuando un registro en una tabla haga referencia a un registro en otra tabla, el registro correspondientes debe existir) definidas sobre ella. Los cambios de estado ocurren debido a actualizaciones, inserciones y supresiones de información. Por supuesto, se quiere asegurar que la base de datos nunca entre en un estado de inconsistencia. 4.1 PROPIEDAD DE UNA TRANSACCIÓN PROPIEDADES FUNDAMENTALES DE UNA TRANSACCIÓN: • Atomicidad Se refiere al hecho de que una transacción se trata como una unidad de operación. Por lo tanto, o todas las acciones de la transacción se realizan o ninguna de ellas se lleva a cabo. La atomicidad requiere que si una transacción se interrumpe por una falla, sus resultados parciales sean anulados. Consistencia La consistencia de una transacción es simplemente su correctitud. En otras palabras, una transacción es un programa correcto que lleva a la base de datos de un estado consistente a otro • 29 con la misma característica. Debido a esto, las transacciones no violan las restricciones de integridad de una base de datos. Aislamiento Una transacción en ejecución no puede revelar sus resultados a otras transacciones concurrentes antes de finalizar. Más aún, si varias transacciones se ejecutan concurrentemente, los resultados deben ser los mismos que si ellas se hubieran ejecutado de manera secuencial. Permanencia Es la propiedad de las transacciones que asegura que una vez que una transacción finaliza exitosamente, sus resultados son permanentes y no pueden ser borrados de la base de datos por alguna falla posterior. Por lo tanto, los sistemas manejadores de base de datos aseguran que los resultados de una transacción sobrevivirán a fallas del sistema. Esta propiedad motiva el aspecto de recuperación de base de datos, el cual trata sobre cómo recuperar la base de datos a un estado consistente donde todas las acciones que han finalizado con éxito queden reflejadas en la base. En esencia, lo que se persigue con el procesamiento de transacciones es, por una parte obtener una transparencia adecuada de las acciones concurrentes a una base de datos y por otra, manejar adecuadamente las fallas que se puedan presentar en una base de datos. La mayoría de medianas y grandes compañías modernas utilizan el procesamiento de transacciones para sus sistemas de producción, y es tan imprescindible que las organizaciones no pueden funcionar en ausencia de él. • • • El procesamiento de transacciones representa una enorme y significativa porción del mercado de los sistemas informáticos (más de cincuenta billones de dólares al año) y es, probablemente, la aplicación simple más amplia de las computadoras. Además, se ha convertido en el elemento que facilita el comercio electrónico. Como puede percibirse, el procesamiento de transacciones es una de las tareas más importantes dentro de un sistema de base de datos, pero a la vez, es una de las más difíciles de manejar debido a diversos aspectos, tales como: • • • • • • Confiabilidad Puesto que los sistemas de base de datos en línea no pueden fallar. Disponibilidad Debido a que los sistemas de base de datos en línea deben estar actualizados correctamente todo el tiempo. Tiempos de Respuesta En sistemas de este tipo, el tiempo de respuesta de las transacciones no debe ser mayor a doce segundos. hroughput Los sistemas de base de datos en línea requieren procesar miles de transacciones por segundo. Atomicidad En el procesamiento de transacciones no se aceptan resultados parciales. Permanencia No se permite la eliminación en la base de datos de los efectos de una transacción que ha culminado con éxito 4.2 GRADOS DE CONSISTENCIA Consistencia es un término más amplio que el de integridad. Podría definirse como la coherencia entre todos los datos de la base de datos. Cuando se 30 pierde la integridad también se pierde la consistencia. Pero la consistencia también puede perderse por razones de funcionamiento. Una transacción finalizada (confirmada parcialmente) puede no confirmarse definitivamente (consistencia). • • Si se confirma definitivamente el sistema asegura la persistencia de los cambios que ha efectuado en la base de datos. Si se anula los cambios que ha efectuado son deshechos. La ejecución de una transacción debe conducir a un estado de la base de datos consistente (que cumple todas las restricciones de integridad definidas). • • Si se confirma definitivamente el sistema asegura la persistencia de los cambios que ha efectuado en la base de datos. Si se anula los cambios que ha efectuado son deshechos. Una transacción que termina con éxito se dice que está comprometida (commited), una transacción que haya sido comprometida llevará a la base de datos a un nuevo estado consistente que debe permanecer incluso si hay un fallo en el sistema. En cualquier momento una transacción sólo puede estar en uno de los siguientes estados. • • • • • Activa (Active): el estado inicial; la transacción permanece en este estado durante su ejecución. Parcialmente comprometida (Uncommited): Después de ejecutarse la última transacción. Fallida (Failed): tras descubrir que no se puede continuar la ejecución normal. Abortada (Rolled Back): después de haber retrocedido la transacción y restablecido la base de datos a su estado anterior al comienzo de la transacción. Comprometida (Commited): tras completarse con éxito. Aspectos relacionados al procesamiento de transacciones Los siguientes son los aspectos más importantes relacionados con el procesamiento de transacciones: • Modelo de estructura de transacciones. Es importante considerar si las transacciones son planas o pueden estar anidadas. • Consistencia de la base de datos interna. Los algoritmos de control de datos semántico tienen que satisfacer siempre las restricciones de integridad cuando una transacción pretende hacer un commit. • Protocolos de confiabilidad. En transacciones distribuidas es necesario introducir medios de comunicación entre los diferentes nodos de una red para garantizar la atomicidad y durabilidad de las transacciones. Así también, se requieren protocolos para la recuperación local y para efectuar los compromisos (commit) globales. • Algoritmos de control de concurrencia. Los algoritmos de control de concurrencia deben sincronizar la ejecución de transacciones concurrentes bajo el criterio de correctitud. La consistencia entre transacciones se garantiza mediante el aislamiento de las mismas. 4.3 NIVELES DE AISLAMIENTO 31 Las transacciones especifican un nivel de aislamiento que define el grado en que se debe aislar una transacción de las modificaciones de recursos o datos realizadas por otras transacciones. Los niveles de aislamiento se describen en cuanto a los efectos secundarios de la simultaneidad que se permiten, como las lecturas desfasadas o ficticias. Control de los niveles de aislamiento de transacción: • Controla si se realizan bloqueos cuando se leen los datos y qué tipos de bloqueos se solicitan. • Duración de los bloqueos de lectura. • Si una operación de lectura que hace referencia a filas modificadas por otra transacción: ✔ Se bloquea hasta que se libera el bloqueo exclusivo de la fila. ✔ Recupera la versión confirmada de la fila que existía en el momento en el que empezó la instrucción o la transacción. ✔ Lee la modificación de los datos no confirmados. El estándar ANSI/ISO SQL define cuatro niveles de aislamiento transaccional en función de tres eventos que son permitidos o no dependiendo del nivel de aislamiento. Estos eventos son: Lectura sucia. Las sentencias SELECT son ejecutadas sin realizar bloqueos, pero podría usarse una versión anterior de un registro. Por lo tanto, las lecturas no son consistentes al usar este nivel de aislamiento. • • Lectura no repetible. Una transacción vuelve a leer datos que previamente había leído y encuentra que han sido modificados o eliminados por una transacción cursada. Lectura fantasma. Una transacción vuelve a ejecutar una consulta, devolviendo un conjunto de registros que satisfacen una condición de búsqueda y encuentra que otros registro que satisfacen la condición han sido insertadas por otra transacción cursada. Los niveles de aislamiento SQL son definidos basados en si ellos permiten a cada uno de los eventos definidos anteriormente. Es interesante notar que el estándar SQL no impone un esquema de cierre específico o confiere por mandato comportamientos particulares, pero más bien describe estos niveles de aislamiento en términos de estos teniendo muchos mecanismos de cierre/coincidencia, que dependen del evento de lectura. Niveles de aislamiento: 32 Comportamiento permitido Nivel de aislamiento Lectura Sucia No repetible Fantasma Sí Sí No Sí Sí Sí Lectura no comprometida Sí Lectura comprometida Lectura repetible No No Según el estándar SQL, SQL Server permite todos Secuenciable No No No estos niveles, Oracle sólo permite la lectura comprometida y secuenciable. Los niveles se pueden establecer en ambos para cada transacción. Sin embargo esto no es necesariamente cierto. El estándar SQL trataba de establecer los niveles de aislamiento que permitirían a varios grados de consistencia para querys ejecutadas en cada nivel de aislamiento. Las lecturas repetibles "REPEATABLE READ" es el nivel de aislamiento que garantiza que un query un resultado consistente. En la definición SQL estándar, la lectura comprometida "READ COMMITTED" no regresa resultados consistentes, en la lectura no comprometida "READ UNCOMMITTED" las sentencias SELECT son ejecutadas sin realizar bloqueos, pero podría usarse una versión anterior de un registro. Por lo tanto, las lecturas no son consistentes al usar este nivel de aislamiento. A mayor grado de aislamiento, mayor precisión, pero a costa de menor concurrencia. El nivel de aislamiento para una sesión SQL establece el comportamiento de los bloqueos para las instrucciones SQL. 4.4 INSTRUCCIONES COMMIT Y ROLLBACK Rollback transaction sin savepoint_name o transaction_name revierte todas las instrucciones hasta el principio de la transacción. Cuando se trata de transacciones anidadas, esta misma instrucción revierte todas las transacciones internas hasta la instrucción begin transaction más externa. En ambos casos, rollback transaction disminuye la función del sistema @@trancount a 0, mientras que rollback transaction con savepoint_name no disminuye @@trancount. Una instrucción rollback transaction que especifica un savepoint_name no libera ningún bloqueo. Rollback transaction no puede hacer referencia a un savepoint_name en transacciones distribuidas que se iniciaron explícitamente con begin distributed transaction o que se escalaron a partir de una transacción local. Una transacción no se puede revertir después de ejecutar una instrucción commit transaction. En una transacción se permiten nombres de puntos de almacenamiento duplicados, pero una instrucción rollback transaction que utilice este nombre sólo revierte las transacciones realizadas hasta la instrucción save transaction más reciente que también utilice este nombre. 33 Si se emite la instrucción ROLLBACK TRANSACTION en un desencadenador: • • Se revierten todas las modificaciones de datos realizadas hasta ese punto de la transacción actual, incluidas las que realizó el desencadenador. El desencadenador continúa la ejecución del resto de las instrucciones después de la instrucción ROLLBACK. Si alguna de estas instrucciones modifica datos, no se revierten las modificaciones. La ejecución de las instrucciones restantes no activa ningún desencadenador anidado. Tampoco se ejecutan las instrucciones del lote después de la instrucción que activó el desencadenador. • COMMIT TRANSACTION Si la transacción que se ha confirmado era una transacción Transact-SQL distribuida, COMMIT TRANSACTION hace que MS DTC utilice el protocolo de confirmación en dos fases para confirmar los servidores involucrados en la transacción. Si una transacción local afecta a dos o más bases de datos de la misma instancia del Database Engine (Motor de base de datos), la instancia utiliza una confirmación interna en dos fases para confirmar todas las bases de datos involucradas en la transacción. Cuando se utiliza en transacciones anidadas, las confirmaciones de las transacciones anidadas no liberan recursos ni hacen permanentes sus modificaciones. Las modificaciones sobre los datos sólo quedan permanentes y se liberan los recursos cuando se confirma la transacción más externa. Cada commit transaction que se ejecute cuando @@trancount sea mayor que 1 sólo reduce @@trancount en 1. Cuando @@trancount llega a 0, se confirma la transacción externa entera. Como database engine (motor de base de datos) omite transaction_name, la ejecución de una instrucción commit transaction que haga referencia al nombre de una transacción externa cuando haya transacciones internas pendientes sólo reduce @@trancount en 1. UNIDAD 5 VISTAS Una vista de base de datos es un resultado de una consulta SQL de una o varias tablas; también se le puede considerar una tabla virtual. Las vistas tienen la misma estructura que una tabla: filas y columnas. La única diferencia es que sólo se almacena de ellas la definición, no los datos. Los datos que se recuperan mediante una consulta a una vista se presentarán igual que los de una tabla. De hecho, si no se sabe que se está 34 trabajando con una vista, nada hace suponer que es así. Al igual que sucede con una tabla, se pueden insertar, actualizar, borrar y seleccionar datos en una vista. Aunque siempre es posible seleccionar datos de una vista, en algunas condiciones existen restricciones para realizar el resto de las operaciones sobre vistas. Una vista se especifica a través de una expresión de consulta (una sentencia SELECT) que la calcula y que puede realizarse sobre una o más tablas. Sobre un conjunto de tablas relacionales se puede trabajar con un número cualquiera de vistas. Una vista se caracteriza porque: • • • • –Se considera que forma parte del esquema externo. Una vista es una tabla virtual (no tiene una correspondencia a nivel físico) Se puede consultar como cualquier tabla básica. Las actualizaciones se transfieren a la/s tabla/s original/es (con ciertas limitaciones). 5.1 DEFINICIÓN Y OBJETIVO DE LAS VISTAS Una vista en SQL es el resultado de una consulta de varias tablas que te aparece como una sola tabla. Una vista es como una ventana a través de la cual se puede consultar o cambiar información de la tabla a la que está asociada. Las vistas tienen la misma estructura que una tabla: filas y columnas. La única diferencia es que sólo se almacena de ellas la definición, no los datos. Los datos que se recuperan mediante una consulta a una vista se presentarán igual que los de una tabla. De hecho, si no se sabe que se está trabajando con una vista, nada hace suponer que es así. Al igual que sucede con una tabla, se pueden insertar, actualizar, borrar y seleccionar datos en una vista. Aunque siempre es posible seleccionar datos de una vista, en algunas condiciones existen restricciones para realizar el resto de las operaciones sobre vistas. • Las vistas pueden proporcionar un nivel adicional de seguridad. Por ejemplo, en la tabla de empleados, cada responsable de departamento sólo tendrá acceso a la información de sus empleados. La siguiente sentencia produce la creación de la vista de los empleados del departamento de administración (cod_dep=100). Las vistas permiten ocultar la complejidad de los datos. Una BD se compone de muchas tablas. La información de dos o más tablas puede recperarse utilizando una combinación de dos o más tablas, y estas combinaciones pueden llegar a ser muy confusas. Creando una • 35 vista como resultado de la combinación se puede ocultar la complejidad al usuario. Las vistas ayudan a mantener unos nombres razonables. • Las vistas tienen la misma estructura que una tabla: filas y columnas. La única diferencia es que sólo se almacena de ellas la definición, no los datos. Los datos que se recuperan mediante una consulta a una vista se presentarán igual que los de una tabla. De hecho, si no se sabe que se está trabajando con una vista, nada hace suponer que es así. Al igual que sucede con una tabla, se pueden insertar, actualizar, borrar y seleccionar datos en una vista. Aunque siempre es posible seleccionar datos de una vista, en algunas condiciones existen restricciones para Las vistas son útiles: • Proporcionan un poderoso mecanismo de seguridad, ocultando partes de la base de datos a ciertos usuarios. El usuario no sabrá que existen aquellos atributos que se han omitido al definir una vista. 5.2 INSTRUCCIONES PARA LA ADMINISTRACIÓN DE VISTAS Muchas bases de datos relacionales que se utilizan en aplicaciones del mundo real tienen esquemas complejos y formados por muchas tablas. En ocasiones, es conveniente que algunos grupos o perfiles de usuarios tengan una vista parcial de ese esquema, o que tengan una visión de la misma con una estructura diferente a la del esquema que realmente está almacenado. Precisamente para estos casos, el lenguaje SQL permite definir vistas. Una vista es esencialmente una consulta almacenada que devuelve un conjunto de resultados y a la que se le pone un nombre. Una vista es una “tabla virtual”, aparece como una tabla más del esquema, aunque realmente no lo es. Sintaxis La sintaxis general para crear una vista es la siguiente: CREATE VIEW view_name [(column_list)] AS sentencia_select UNIDAD 6 36 SEGURIDAD La ejecución de una operación en los datos de la base de datos por parte de un usuario está supeditada a la posesión por parte del usuario de los privilegios necesarios para la operación concreta ejecutada en el conjunto de datos específico. En general, los privilegios se asignan del siguiente modo: • Un usuario que crea una tabla o cualquier otro objeto de la base de datos es el propietario y se le garantizan automáticamente todos los privilegios aplicables a dicho objeto, con la posibilidad de darles también a otros usuarios dichos privilegios (privilegio de concesión). Un usario que tenga un privilegio y posea además sobre él el privilegio de concesión puede asignarle tal pricilegio a otro usuario y pasarle también el privilegio de concesión. Los privilegios los concede quien tiene el permiso (es decir el propietario del objeto y quien tiene el privilegio de concesión) mediante la orden GRANT, y los revoca mediante la orden REVOKE. • • En SQL Server nos encontramos con tres niveles o capas en los cuales podemos gestionar la seguridad. El primero de ellos se encuentra a nivel de servidor, en él podemos gestionar quién tiene acceso al servidor y quién no, y además gestionamos que roles va a desempeñar. Para que alguien pueda acceder al servidor debe tener un inicio de sesión (login) asignado, y a éste se asignaremos los roles o funciones que puede realizar sobre el servidor. El que alguien tenga acceso al servidor no quiere decir que pueda acceder a las bases de datos que se encuentran en él. Para ello hay que tener acceso a la siguiente barrera de seguridad, que es a nivel de base de dato. Para que un login tenga acceso a una base de datos, tenemos que crear en ella un usuario (user). Deberemos crear un usuario en cada una de las bases de datos a las que queramos que acceda un login. Análogamente, el que un usuario tenga acceso a una base de datos no quiere decir que tenga acceso a todo su contenido, ni a cada uno de los objetos que la componen. Para que esto ocurra tendremos que irle concediendo o denegando permisos sobre cada uno de los objetos que la componen. 6.1 ESQUEMAS DE AUTORIZACIÓN Un esquema SQL se identifica con un nombre de esquema, y consta de un identificador de autorización que indica el usuario o la cuenta propietaria del esquema, además de los descriptores de cada elemento del esquema. Los elementos del esquema comprenden tablas, restricciones, vistas, dominios y otros integrantes (como concesiones de autorización) que describen el esquema. Un esquema se crea mediante la sentencia CREATE SCHEMA, que puede contener todas las definiciones de elementos del esquema. Como alternativa, podemos asignar un nombre y un identificador de autorización de esquema y definir dichos elementos más adelante. 37 Además del concepto de esquema, SQL2 emplea el concepto de catálogo o diccionario de datos DD (colección nombrada de esquemas). Un catálogo siempre contiene un esquema especial llamado INFORMATION_SCHEMA, que proporciona a los usuarios autorizados información sobre todos los descriptores de elementos de todos los esquemas del catálogo. Se pueden definir restricciones de integridad entre relaciones, como la integridad referencial, sólo si dichas relaciones existen en esquemas dentro del mismo catálogo. Además, los esquemas del mismo catálogo pueden compartir ciertos elementos, como las definiciones de dominio. Tipos de Autorización para la modificación del esquema de datos: • Autorización de índices Permite creación y borrado de índices • Autorización de recursos Permite la creación de relaciones nuevas • Autorización de alternación Permite el añadido o el borrado de atributos de las relaciones • Autorización de eliminación Permite el borrado de relaciones 6.2 INSTRUCCIONES GRANT Y REVOKE Los comandos GRANT y REVOKE permiten a los administradores de sistemas crear cuentas de usuario MySQL y darles permisos y quitarlos de las cuentas. La información de cuenta de MySQL se almacena en las tablas de la base de datos mysql . Esta base de datos y el sistema de control de acceso se discuten extensivamente en que puede consultar para más detalles. Si las tablas de permisos tienen registros de permisos que contienen nombres de tablas o bases de datos con mayúsculas y minúsculas y la variable de sistema lower_case_table_names está activa, REVOKE no puede usarse para quitar los permisos. Es necesario manipular las tablas de permisos directamente. Grant permite al creador de un objeto el dar permisos específicos a todos los usuarios (public) o a un cierto usuario o grupo. Usuarios distintos al 38 creador pueden no tener permisos de acceso a menos que el creador se los conceda, una vez que el objeto ha sido creado. Una vez que un usuario tiene privilegios sobre un objeto, tiene posibilidad de ejecutar ese privilegio. No hay necesidad de conceder privilegios al creador de un objeto; el creador obtiene automáticamente todos los privilegios, y puede también eliminar el objeto. Privilege los posibles privilegios son: select acceso a todas las columnas de una tabla/vista específica. Insert inserta datos en todas las columnas de una tabla específica. Update actualiza todas las columnas de una tabla específica. Delete elimina filas de una tabla específica. • RULE Define las reglas de la tabla(vista (cer sentencia CREATE RULE). • ALL Otorga todos los privilegios• object El nombre de un objeto al que se quiere conceder el acceso. Los posibles objetos son: tabla vista secuencia indice • PUBLIC Una abreviación para representar a todos los usuarios. • GROUP group Un grupo al que se otorgan privilegios. En la actual versión, el grupo debe haber sido creado explícitamente como se describe más adelante. • username El nombre de un usuario al que se quiere conceder privilegios. PUBLIC es una abreviatura para representar a todos los usuarios. • CHANGE Mensaje devuelto se la acción se ha realizado satisfactoriamente. • ERROR: Change Acl: class “object” not found Mensaje devuelto si el objeto especificado no está disponible o si es imposible dar los provilegios a grupo o usuarios especificado. UNIDAD 7 INTRODUCCIÓN AL SQL PROCEDURAL El SQL PL es, en realidad, un subconjunto del SQL que proporciona construcciones de procedimiento que se pueden utilizar para implementar la lógica alrededor de las sentencias de SQL tradicionales. El SQL PL es un lenguaje de programación de alto nivel con una sintaxis sencilla y sentencias habituales de control de programación, que incluyen las sentencias IF, ELSE, WHILE, FOR, ITERATE y GOTO, así como otras sentencias. Procedimientos de SQL PL y de SQL. Los procedimientos de SQL PL pueden contener parámetros, variables, sentencias de asignación, sentencias de control de SQL PL y sentencias de SQL compuestas. Los procedimientos de SQL PL también dan soporte a un 39 potente mecanismo de manejo de errores y condiciones, a las llamadas anidadas y repetitivas y a la devolución de varios conjuntos de resultados al llamante o a la aplicación cliente. Para conocer el conjunto completo de elementos del lenguaje soportado en los procedimientos de SQL PL, vea la sentencia CREATE PROCEDURE (SQL) en la Consulta de SQL. Funciones, activador y sentencias dinámicas compuestas de SQL PL en línea y de SQL A partir de DB2 Versión 7.2, está soportado un subconjunto de SQL PL en los cuerpos de los activadores y las funciones de SQL. Este subconjunto de SQL PL se conoce como SQL PL en línea. La palabra en línea hace resaltar una diferencia importante entre el SQL PL en línea y el lenguaje SQL PL completo. Mientras que un procedimiento de SQL PL se implementa compilando estáticamente sus consultas de SQL individuales en secciones de un paquete, una función de SQL PL en línea se implementa, como su nombre sugiere, colocando en línea el cuerpo de la función en la consulta que la utiliza. De esta diferencia, surgen algunas consideraciones relativas al rendimiento y se deben tener en cuenta cuando planifique si ha de implementar la lógica de procedimiento en SQL PL en un procedimiento o utilizar el SQL PL en línea. Una sentencia dinámica compuesta es una sentencia que, en realidad, le permite agrupar varias sentencias de SQL en un bloque lógico atómico pequeño, en el cual puede declarar variables y elementos para el manejo de condiciones. DB2 compila estas sentencias como una sola sentencia de SQL, y pueden contener elementos de SQL PL. Dentro de una sentencia dinámica compuesta, es posible incluir el subconjunto de SQL PL conocido como SQL PL en línea y tan sólo un pequeño conjunto de sentencias de SQL básicas. Las sentencias dinámicas compuestas son útiles para crear scripts reducidos que realicen pequeñas unidades de trabajo lógico con un mínimo flujo de control, pero con un flujo de datos significativo. Si le interesa una lógica más compleja que requiera parámetros, pase de conjuntos de resultados u otros elementos de procedimiento más avanzados, pueden convenirle más los procedimientos y las funciones de SQL. 7.1 PROCEDIMIENTOS ALMACENADOS Un procedimiento almacenado (stored procedure en inglés) es un programa (o procedimiento) el cual es almacenado físicamente en una base de datos. Su implementación varía de un manejador de bases de datos a otro. La ventaja de un procedimiento almacenado es que al ser ejecutado, en respuesta a una petición de usuario, es ejecutado directamente en el motor de bases de datos, el cual usualmente corre en un servidor separado. Como tal, posee acceso directo a los datos que necesita manipular y sólo necesita enviar sus resultados de regreso al usuario, deshaciéndose de la sobrecarga resultante de comunicar grandes cantidades de datos salientes y entrantes. 40 Usos típicos para procedimientos almacenados incluyen la validación de datos siendo integrados a la estructura de base de datos (los procedimientos almacenados utilizados para este propósito a menudo son llamados disparadores; triggers en inglés), o encapsular un proceso grande y complejo. El último ejemplo generalmente ejecutará más rápido como un procedimiento almacenado que de haber sido implementado como, por ejemplo, un programa corriendo en el sistema cliente y comunicándose con la base de datos mediante el envío de consultas SQL y recibiendo sus resultados. Los procedimientos pueden ser ventajosos: Cuando una base de datos es manipulada desde muchos programas externos. Al incluir la lógica de la aplicación en la base de datos utilizando procedimientos almacenados, la necesidad de embeber la misma lógica en todos los programas que acceden a los datos es reducida. Esto puede simplificar la creación y, particularmente, el mantenimiento de los programas involucrados. Podemos ver un claro ejemplo de estos procedimientos cuando requerimos realizar una misma operación en un servidor dentro de algunas o todas las bases de datos y a la vez dentro de todas o algunas de las tablas de las bases de datos del mismo. Para ello podemos utilizar a los Procedimientos almacenados auto creable que es una forma de generar ciclos redundantes a través de los procedimientos almacenados. Estos procedimientos, se usan a menudo, pero no siempre, para realizar consultas SQL sobre los objetos del banco de datos de una manera abstracta, desde el punto de vista del cliente de la aplicación. Un procedimiento almacenado permite agrupar en forma exclusiva parte de algo específico que se desee realizar o, mejor dicho, el SQL apropiado para dicha acción. Los usos 'típicos' de los procedimientos almacenados se aplican en la validación de datos, integrados dentro de la estructura del banco de datos. Los procedimientos almacenados usados con tal propósito se llaman comúnmente disparadores, o triggers. Otro uso común es la 'encapsulación' de un API para un proceso complejo o grande que podría requerir la 'ejecución' de varias consultas SQL, tales como la manipulación de un 'dataset' enorme para producir un resultado resumido. También pueden ser usados para el control de gestión de operaciones, y ejecutar procedimientos almacenados dentro de una transacción de tal manera que las transacciones sean efectivamente transparentes para ellos. La ventaja de un procedimiento almacenado, en respuesta a una petición de usuario, está directamente bajo el control del motor del manejador de bases de datos, lo cual corre generalmente en un servidor separado de manejador de bases de datos aumentando con ello, la rapidez de procesamiento de requerimientos del manejador de bases de datos. El servidor de la base de datos tiene acceso directo a los datos necesarios para manipular y sólo necesita enviar el resultado final al usuario. Los procedimientos almacenados pueden permitir que la lógica del negocio se encuentre como un API en la base de datos, que pueden simplificar la gestión de datos y reducir la necesidad de codificar la lógica en el resto de los programas cliente. Esto puede reducir la probabilidad de que los datos sean corrompidos por el uso de programas clientes defectuosos o erróneos. De este modo, el motor de base de datos puede asegurar la integridad de los datos y la consistencia, con la ayuda de procedimientos almacenados. 41 Algunos afirman que las bases de datos deben ser utilizadas para el almacenamiento de datos solamente, y que la lógica de negocio sólo debería ser aplicada en la capa de negocio de código, a través de aplicaciones cliente que deban acceder a los datos. Sin embargo, el uso de procedimientos almacenados no se opone a la utilización de una capa de negocio. 7.2 DISPARADORES (TRIGGERS) Un trigger (o disparador) en una Base de datos, es un procedimiento que se ejecuta cuando se cumple una condición establecida al realizar una operación de inserción (INSERT), actualización (UPDATE) o borrado (DELETE). Son usados para mejorar la administración de la Base de datos, sin necesidad de contar con que el usuario ejecute la sentencia de SQL. Además, pueden generar valores de columnas, previene errores de datos, sincroniza tablas, modifica valores de una vista, etc. Permite implementar programas basados en paradigma lógico (sistemas expertos, deducción). Un trigger es un bloque PL/SQL asociado a una tabla, que se ejecuta cuando una determinada instrucción en SQL se va a ejecutar sobre dicha tabla. La sintaxis para crear un trigger es la siguiente: CREATE [OR REPLACE] TRIGGER {BEFORE|AFTER} {DELETE|INSERT|UPDATE [OF col1, col2, . . ., colN] [OR {DELETE|INSERT|UPDATE [OF col1, col2, . . ., colN]. . .]} ON table [REFERENCING OLD AS oldname, NEW as newname] [FOR EACH ROW [WHEN (condition)]] pl/sql_block El uso de OR REPLACE permite sobreescribir un trigger existente. Si se omite, y el trigger existe, se producirá, un error. El modificador FOR EACH ROW indica que el trigger se disparará cada vez que se desee hacer operaciones sobre una fila de la tabla. Si se acompaña del modificador WHEN, se establece una restricción; el trigger solo actuará, sobre las filas que satisfagan la restricción. BIBLIOGRAFÍA http://www.programatium.com/tutoriales/cursos/oracle/11.htm http://tallerbd.hostoi.com/index.php? option=com_content&view=article&id=70&Itemid=91 http://sql.1keydata.com/es/sitemap.php http://www.paginasprodigy.com.mx/evaristopacheco/taller 42 http://es.wikipedia.org/wiki/
Copyright © 2024 DOKUMEN.SITE Inc.