Thème 5 : Les données structurées et leur traitement Activité : Présentation et travail sur les tables de données
Publié le 05/03/2024
Extrait du document
«
Thème 5 : Les données structurées et leur traitement
Activité : Présentation et travail sur les tables de données
Cette activité est à faire pendant les vacances de Pâques pour semaine de la rentrée.
Vous pouvez poser des questions via l’ENT.
Une donnée est la représentation d’une information.
Bien avant la naissance
de l’informatique, on a eu besoin de stocker, puis de structurer ces
informations, pour pouvoir les utiliser.
Les données constituent désormais la matière première de toute activité
numérique.
À ce titre, de nouvelles formes de stockage, de structuration et
d’exploitation ont vu le jour au regard de l’explosion de la quantité de
données disponibles, jusqu’à l’émergence d’une science du traitement des
données : la data science.
• Repères historiques
1928 : cartes perforées 80 colonnes de
IBM
1956 : invention du disque dur
1979 : VisiCalc premier tableur,
2000 : émergence de la data science
2013 : charte du G8 pour l’ouverture des
données publiques.
1) Structuration des données
• Une donnée est un élément (chaîne de caractères, nombre, image…) décrivant un objet (individu, société, événement, machine,
fichier…).
Par exemple, le numéro de téléphone d’un contact est une donnée.
Une donnée peut être créée par un individu ou par un appareil.
• Une donnée personnelle est une information se rapportant à une personne physique identifiée ou identifiable par référence à
des éléments qui lui sont propres (nom, numéro de sécurité sociale…).
• Structurer correctement des données permet de les utiliser et les exploiter aisément afin de produire de l'information.
Il faut
donc organiser et classer les données.
• Plusieurs descripteurs peuvent être utiles pour décrire un objet.
Par exemple, un passeport français contient plusieurs
descripteurs comme le numéro du passeport, le nom, les prénoms, le sexe, la taille, la couleur des yeux, la date de naissance, le
lieu de naissance…
Par exemple, sur le passeport de l'acteur français Pierre Richard :
• à côté du descripteur lieu de naissance, il est inscrit la valeur Valenciennes ;
• à côté du descripteur date de naissance, il est inscrit la valeur 16/08/1934.
• Une collection de données est un moyen de regrouper de manière structurée des objets partageant les mêmes descripteurs
(par exemple, la collection des contacts d’un carnet d’adresses).
:
les descripteurs en colonne, les objets en ligne et les valeurs dans les cellules situées à l'intersection.
• Une base de données regroupe plusieurs collections de données reliées entre elles.
Par exemple, la base de données d’une
bibliothèque conserve les données sur les livres, les abonnés et les emprunts effectués.
• Comme sur papier, on utilise souvent des tableaux pour organiser les données
numériques en colonnes et en lignes.
En informatique, on appelle table, un tableau
dans lequel la première ligne sert à décrire la forme des lignes suivantes et on appelle
nom de champ (ou critère) l’intitulé qui sert à décrire la nature des informations
notées dans les colonnes.
Les descripteurs en colonne, les objets en ligne et les
valeurs dans les cellules situées à l'intersection.
•
• Dans la table ci-contre, présentant des données sur la France et ses pays limitrophes :
Les champs sont : Pays, Population, Superficie
Les objets sont France, Allemagne
Les descripteurs sont : Population et Superficie ; les objets sont France, Allemagne ….
;
les valeurs sont 66 992 699, 551 695….
Chapitre N5 SNT Données structurées Activité 1
page 1/4
2) Stockage des données
Format : Pour mémoriser les tables dans un ordinateur, on les stocke dans des fichiers à différents formats
dont le rôle est de préciser comment sont organisées les différentes lignes et colonnes.
Plusieurs formats sont couramment utilisés parmi lesquels :
- Le format CSV (Comma Separated Values) dans lequel chaque ligne contient des valeurs sous un format texte
simple et séparées par des symboles de ponctuations (la virgule ; le point-virgule ; l’espace ; la tabulation par
exemple).
La première ligne contenant les noms des champs.
• On peut ouvrir un fichier csv avec un éditeur de texte basique (notepad ++).
Voici un exemple (avec
séparateur « , »):
Nom,Prénom,Date de naissance,Lieu de naissance
Macron,Emmanuel,21 12 1977,Amiens
Hollande,François,12 08 1954,Rouen
• Le caractère de séparation choisi ne doit pas figurer dans les valeurs sinon un logiciel ne pourra pas
identifier correctement les descripteurs.
- Le format ODS (Open Document Spreadsheet), utilisé par les logiciels tableur (du type : Excel).
- Le format JSON (JavaScript Object Notation), format de données textuelles en paires de nom/valeur.
Les nom et valeur sont séparés par deux points « : » et chaque paire est séparée de la suivante par une
virgule.
Métadonnées : À tout fichier sont associées des métadonnées qui permettent d’en décrire le contenu.
Ces
métadonnées varient selon le type de fichier (date et coordonnées de géolocalisation d’une photographie,
auteur et titre d’un fichier texte, etc.)
Propriétés des données : Certaines des données sont dites ouvertes (OpenData) et permettent des usages libres.
Mais on assiste aussi au développement d’un marché de collecte et de vente de données par des entreprises
spécialisées, parfois sans informer les usagers.
La France a donc choisi de mettre en place un cadre juridique
permettant de protéger les usagers : le règlement général sur la protection des données
(RGPD).
3) Traitement des données
Les logiciels tableur sont des outils pour traiter des données organisées en colonnes et en lignes.
Ils permettent de :
- trier des....
»
↓↓↓ APERÇU DU DOCUMENT ↓↓↓
Liens utiles
- syndicat 1 PRÉSENTATION syndicat, groupement de personnes exerçant leur activité dans une même branche de métier ou dans un même secteur d'activité, visant à assurer la défense de leurs intérêts professionnels et de leurs conditions de travail.
- Sujet : l'activité artistique est-elle une forme de travail ?
- Le travail est-il davantage, pour l’homme, qu’une activité matérielle ?
- Art: Travail ou activité ludique ?
- Les jeux collectifs Présentation de l'activité : Définition : C'est résoudre à