Bases de données
Une base de données (BD) est un ensemble structuré d'informations. Dans le langage courant, le terme peut désigner toute source importante de données telle qu'une encyclopédie. Dans le domaine de l'informatique, c'est un ensemble d'informations regroupées sous la forme d'enregistrements stockés sur un système de fichiers structurés et organisées de manière à pouvoir être facilement
manipulées.
L'organisation logique des données se fait selon un modèle de données et la structure physique des fichiers comporte des index destinés à accélérer les opérations de recherche et de tri.
Le modèle de données relationnel est aujourd'hui le plus utilisé parce qu'il permet l'indépendance entre la structure physique et l'organisation logique des données.
Une base de données (BD) est un ensemble structuré d'informations. Dans le langage courant, le terme peut désigner toute source importante de données telle qu'une encyclopédie. Dans le domaine de l'informatique, c'est un ensemble d'informations regroupées sous la forme d'enregistrements stockés sur un système de fichiers structurés et organisées de manière à pouvoir être facilement
manipulées.
L'organisation logique des données se fait selon un modèle de données et la structure physique des fichiers comporte des index destinés à accélérer les opérations de recherche et de tri.
Le modèle de données relationnel est aujourd'hui le plus utilisé parce qu'il permet l'indépendance entre la structure physique et l'organisation logique des données.
Le logiciel qui manipule les bases de données est appelé système de gestion de base de données (SGBD). Il permet d'organiser, de contrôler, de consulter et de modifier la base de données. Les opérations sont parfois formulées dans un langage de requête tel que SQL, qui est le plus connu et employé pour les modèles relationnels.
Un exemple pour tout expliquer rapidement
Replongeons-nous avant les années 1980, lorsque la téléphonie mobile n'existait pas. Nous allons
imaginer un opérateur de téléphonie qui veut créer une base de données pour gérer ses clients. Les
clients peuvent obtenir plusieurs numéros de téléphone auprès de cet opérateur. Pour chacun de ces
numéros, l'opérateur enregistrera les informations nécessaires pour établir une facture mensuelle
détaillée.
Quelles sont ces données nécessaires ? Il faudra tout d'abord identifier de manière non équivoque
le client : on enregistrera donc son nom, son prénom et son adresse. On stockera aussi le numéro de
téléphone qu'il a utilisé (rappelons qu'il peut en avoir plusieurs ; on fera une facture par numéro). Il
faudra aussi connaître, pour calculer les prix de la communication, le numéro appelé, la date et
l'heure de l'appel (pour établir la facture détaillée) ainsi que la durée de l'appel. Enfin, comme le prix
de l'appel peut varier selon l'heure et le numéro appelé, on mentionnera le tarif appliqué.
Première approche : un tableur
Une première idée pour implémenter une base de données consiste à utiliser un tableur. En effet,
une base de données « plate » peut se voir comme un simple tableau : les colonnes représenteront des
champs (nom, prénom, numéro de téléphone, etc.), et les lignes des enregistrements (ici des appels).
Par exemple, voici un extrait de cette base de données :
L'avantage de cette méthode est sa simplicité : tout ce qui concerne un appel tient sur une ligne, et tous les appels sont répertoriés dans une table. Cette approche a aussi des inconvénients :
1. Les informations sont redondantes : l'adresse du client apparaît plusieurs fois, encombrant inutilement la mémoire. Il aurait été plus judicieux d'avoir une autre table où l'on aurait enregistré les coordonnées des clients une fois pour toutes.
2. Pour identifier un client, on a besoin de trois champs. Il aurait été plus simple d'associer à chaque client un numéro de client unique (ce que toutes les entreprises font).
3. Si un utilisateur change d'adresse, il faut reporter ce changement sur chaque ligne où il apparaît, sous peine d'avoir une table incohérente.
4. Un tableur n'est tout simplement pas fait pour gérer une grande base de données.
Deuxième approche : base de données relationnelle
Une autre solution est d'utiliser plusieurs tables reliées entre elles. On parle alors de base de données relationnelle. La liaison de différentes tables se fera en utilisant un logiciel de gestion de bases de données (SGBD).
Reprenons l'exemple de l'entreprise de téléphonie. On va utiliser trois tables au lieu d'une : la première contiendra les coordonnées des clients, la seconde les numéros de téléphone des clients, et la troisième la liste des appels.
La table des numéros permet de faire la liaison entre un abonné et son ou ses numéros de téléphone. Elle est indispensable du fait qu'un abonné peut avoir plusieurs numéros de téléphone différents.
Si cela n'avait pas été le cas, on aurait simplement pu ajouter un champ « numéro » à la table des
clients. Ce champ aurait alors pu être utilisé comme identifiant et remplacer le champ « Id_Client ».
Cette manière de faire est moins lisible au premier coup d'oeil : il faut par exemple consulter deux tables pour connaître le propriétaire d'un numéro de téléphone. Mais cet inconvénient est vite balayé par les avantages :
1. Les informations ne sont plus redondantes : par exemple, l'adresse d'un client apparaît une
seule fois et est donc facilement modifiable.
2. Un client est identifié par un numéro, ce qui évite des confusions.
3. Il est très facile de tirer la liste des clients, puisqu'ils sont tous rassemblés dans une table. etc.
Les bases de données relationnelles
C'est l'article d'Edgar Frank Codd (1923-2003) « A Relational Model of Data for Large Shared Data Banks », CACM 13, No. 6, June 1970 qui fonde le modèle relationnel, mais une première description de ce modèle avait déjà été publiée l'année précédente dans un rapport technique d'IBM :
« Derivability, Redundancy, and Consistency of Relations Stored in Large Data Banks », IBM
Research Report RJ599.
Tables
Dans les bases de données relationnelles, une table est un ensemble de données organisées sous forme d'un tableau où les colonnes correspondent à des champs et les lignes à des enregistrements, également appelés entrées.
La notion de table est apparue dans les années 1970 chez IBM avec l'algèbre relationnelle qui est une théorie mathématique en relation avec la théorie des ensembles. Cette théorie a pour but de clarifier et de faciliter l'utilisation d'une base de données.
Conception d'une table
Lors de la conception d'une base de données relationnelle, il est important de clairement définir toutes les tables qui la composeront et les différentes relations qui les lient, de manière à pouvoir dresser le schéma conceptuel qui permettra de décrire le fonctionnement de la base de données avant de la mettre «physiquement » en place.
On distinguera les tables courantes, qui contiendront divers champs contenant des informations,
et les tables de liaison, qui feront les liens entre deux tables courantes.
Contenu d'une table
Par nature, chaque colonne d'une table, également nommé « champ », doit contenir des données d'un même type et ce champ doit être nommé. Chaque table est l'implémentation physique d'une relation entre les différents champs. Chaque correspondance est définie par une ligne de la table. Il y a certaines règles à respecter, notamment le fait qu'il faille mettre un identifiant pour chaque enregistrement dans la table. Il y a deux possibilités :
• Mettre un identifiant qui s'auto-incrémente au fur et à mesure des données entrées (par exemple «Id_appel» dans la « table des appels »)
• Choisir un identifiant unique (par exemple « Id_client » dans la « table des clients »).
Travail sur une table
Il y a deux niveaux de travail sur une table :
• un niveau de définition des données d'une table, qui permet de définir, lier, et contraindre les données via un langage de définition de données ;
• un niveau de manipulation des données d'une table, qui permet d'ajouter, supprimer, rechercher des données via un langage de manipulation de données
Actuellement, le langage standardisé pour travailler sur les tables est le SQL. Il est utilisé avec
quelques variantes sur la plupart des systèmes de gestion de bases de données.
Modèle entité-association
Le modèle entité-association (aussi appelé « modèle entité-relation ») est un type de schéma conceptuel très utilisé pour les bases de données, notamment les bases de données relationnelles. Il a été inventé par Peter Pin-Shan Chen en 1975 et est destiné à clarifier l'organisation des données dans les bases de données relationnelles en notifiant :
les entités
• Ce sont des objets concrets que l'on peut identifier (client, livre, individu, voiture, etc.).
• On peut représenter un ensemble d'entités de la réalité par une entité type (un client pour l'ensemble des clients).
• Ces entités sont caractérisées par leurs attributs (pour un client : nom, prénom, adresse, ...). Parmi ces attributs, on définit un identifiant qui va permettre de caractériser de façon unique l'entité dans l'ensemble (un numéro de client).
les relations entre les entités
• Elles représentent les liens existant entre une ou plusieurs entités.
• Elles sont caractérisées par un nom, une propriété d'association et éventuellement des attributs.
le degré de relation et cardinalités
• Le degré de la relation (ou dimension de la relation) est le nombre d'entités qui sont impliquées dans cette relation.
• La cardinalité (d'une entité par rapport à une relation) exprime le nombre de participations possibles d'une entité à une relation. Comme c'est un nombre variable, on note la cardinalité minimum (0 ou 1) et maximum pour chaque entité.
Dans notre exemple, un abonné peut avoir de 1 à N numéros de téléphone, mais le numéro de téléphone n'appartient qu'à un client ou aucun client (numéro pas encore attribué ou plus attribué). Il ne peut pas avoir 0 numéro, car dans ce cas il ne serait plus client de l'opérateur.
Représentation graphique
• Les entités sont représentées dans des rectangles et s'écrivent en lettres majuscules.
• L'identifiant d'une entité (aussi appelé « clé primaire ») est le premier attribut cité et est souligné. Les autres attributs sont placés à la suite.
• Les relations sont placées dans des losanges avec leurs attributs éventuels.
• Les cardinalités sont placées à côté de l'entité qu'elles caractérisent.
Démarche de conception
Voici une méthode possible pour réaliser un schéma entité-association :
1. établir la liste des entités ;
2. déterminer les attributs de chaque entité en choisissant un identifiant :
3. établir les relations entre les différentes entités et définir les cardinalités.
Exemple
Reprenons un exemple d'un opérateur de téléphonie fixe.
1. Il y a 3 entités : les clients, les numéros de téléphone et les appels.
2. Les attributs :
-Pour les clients : id, nom, prénom, adresse.
-Pour les numéros de téléphone : le numéro.
-Pour les appels : le numéro appelé, la date, la durée et le tarif.
3. Les relations et les cardinalités :
-Un client possède 1 ou plusieurs numéros.
-Un numéro appartient à 0 ou 1 client.
-Un numéro peut faire 0 ou plusieurs appels.
-Un appel est fait depuis 1 et un seul numéro.
Représentation graphique
On peut classer les relations en 3 types selon leur cardinalité maximale :
• les relations un à un (par exemple 1:1 – 0:1)
• les relations un à plusieurs (c'est le cas des deux relations ci-dessus)
• les relations plusieurs à plusieurs (par exemple 0:N – 1:N)
Exercice 1
On veut créer une petite base de données permettant de garder le contact avec nos copains de classe. On supposera qu'ils sont tous domiciliés en Suisse. On veut stocker les renseignements suivants : nom, prénom, sexe, date de naissance, numéro de téléphone, rue, numéro postal, ville et canton.
Réalisez un schéma entité-association en suivant la démarche décrite au dessus.
Exercice 2
On veut créer une base de données permettant de gérer les clients étrangers d'une entreprise et les pays de ces clients. La table des clients sera simplifiée et comportera leur nom, leur prénom, le code de leur pays de résidence et le solde de leur compte, dans la monnaie du pays.
On veut aussi que les clients aient la possibilité de faire des réclamations et que la base de données gère toutes ces réclamations pour chacun des clients.
Réalisez un schéma entité-association en suivant la démarche décrite au dessus.
Exercice 3
Une école veut informatiser ses listes de classe. Une classe est formée d'élèves (toujours les mêmes et un élève n'appartient qu'à une seule classe). Il y a un maître de classe par classe. Un prof peut enseigner plusieurs disciplines.
Réalisez un schéma entité-association en suivant la démarche décrite au dessus.
Traduction du schéma conceptuel en un modèle relationnel
Les règles principales de transformation d'un schéma conceptuel entité-association en un schéma relationnel sont :
Règle I
Toute entité est traduite en une table relationnelle dont les caractéristiques sont les suivantes :
• le nom de la table est le nom de l'entité ;
• la clé de la table est l'identifiant de l'entité ;
• les autres attributs de la table forment les autres colonnes de la table.
Règle II
Toute relation binaire plusieurs à plusieurs est traduite en une table relationnelle dont les caractéristiques sont les suivantes :
• le nom de la table est le nom de la relation ;
• la clé de la table est formée par « l'addition » des identifiants des entités participant à la relation ;
• les attributs spécifiques de la relation forment les autres colonnes de la table.
Règle III
Toute relation binaire un à plusieurs est traduite :
1. soit par un report de clé (voir schéma ci-dessous) : l'identifiant de l'entité participant à la relation côté N est ajoutée comme colonne supplémentaire à la table représentant l'autre entité. Cette colonne est parfois appelée clé étrangère. Le cas échéant, les attributs spécifiques à la relation sont eux aussi ajoutés à la même table ;
2. soit par une table spécifique dont les caractéristiques sont les suivantes :
• le nom de la table est le nom de la relation ;
• la clé de la table est l'identifiant de l'entité participent à la relation côté 1 ;
• les attributs spécifiques de la relation forment les autres colonnes de la table.
Règle IV
Toute relation binaire un à un est traduite, au choix, par l'une des trois solutions suivantes :
• choix 1 : fusion des tables des entités qu'elle relie ;
• choix 2 : report de clé d'une table dans l'autre (voir ci-dessous);
• choix 3 : création d'une table spécifique reliant les clés des deux entités.