Menu
× Accueil Blog Créer un compte

Qu'est-ce qu'une donnée ?

La donnée est l'atome du numérique

Les scandales numériques se multiplient à une vitesse impressionnante ces dernières années : Affaire Facebook/Cambridge Analytica, vol de données chez Yahoo, Affaire Snowden/Prism, etc. D’après une étude publié en juillet 2019 par Opinion Way pour Dolmen : 65% des français envisagent de sensibiliser d’avantage leurs proches sur la menace qui pèse sur leurs données personnelles. Pour bien expliquer les menaces, faut-il savoir d’où elles peuvent venir et pour cela il est nécessaire de comprendre ce que sont les données. A travers cet article, nous tenterons d’apporter quelques éléments pour expliquer ce qu’est une donnée et pourquoi elles font le buzz aujourd’hui.

Comment expliquer La donnée ?

Quelques recherches s’imposent

Tous les jours ou presque, nous en entendons parler : données personnelles, données cellulaires, données de géolocalisation, base de données, données mobiles… Elle semble pouvoir prendre une infinité de forme : un chiffre, une lettre, un nombre, un mot, une image, un son... Alors comment définir précisément ce qu’est une donnée ?

Comme 9 français sur 10, j’ai demandé à Google. J’ai ouvert un navigateur puis j’ai tapé dans le moteur de recherche : « donnée », « définition donnée » et « qu’est-ce qu’une donnée ? ». Et les résultats étaient plutôt décevants. Les dictionnaires en ligne différencient la donnée selon qu’elle soit issue des mathématiques, de la biologie ou de l’informatique, mais ne proposent pas une vision d’ensemble de la donnée.

La plupart des définitions se réfèrent aux données personnelles mais rien ou presque sur « LA » donnée. Excepté sur Wikipédia : « La donnée est une description élémentaire d’une réalité. ». Wikipédia est une encyclopédie ouverte très intéressante. Elle permet d’obtenir une première vision du sujet. Mais comme la définition peut avoir été écrit par Monsieur ou Madame Tout le Monde, qui n’y connaissent peut-être rien aux données, il est important de compléter les recherches.

Définition de la donnée

Et de toute façon, la définition est relativement abstraite et n’apporte pas un éclairage clair et précis. Il m’a fallu encore plusieurs recherches pour comprendre ce que signifiait « d’une réalité » et de nombreuses lectures pour définir un mot pourtant si courant. Je vais vous épargner toutes ces recherches et vous faire gagner du temps en partageant avec vous ma définition subjective issue de ce travail de recherche : une donnée est un élément de base d’un ensemble.

La donnée est l’élément de base d’un ensemble.

Illustrons à présent cette définition avec un exemple simple et concret pour mieux comprendre le concept de la donnée.

« Le mois de … fait 31 jours », alors quel est-ce mois ? Difficile sans l’élément de base [le mois concerné] car il y a de nombreuses possibilités dans cet ensemble [la phrase] : l’absence de cette donnée saute aux yeux.

Calendrier

Avec un autre exemple : « le mois de … peut faire 28 ou 29 jours », l’absence de la donnée [le mois concerné] n’est pas aussi percutante car l’ensemble [la phrase] permet d’interpréter et de deviner par relation que la donnée manquante est « février ».

Chaque exemple a permis d’illustrer que « le mois » est un élément de base de l’ensemble et que sans cette donnée la phrase perd son sens. Nous venons également d’aborder deux notions importantes de la donnée :

  • Avec le 1er exemple, nous avons vu que l’interprétation a ses limites et pour éviter cela il est nécessaire que la donnée soit considérée dans un ensemble clair et bien défini.
  • Avec le 2nd exemple, nous avons pu identifier une donnée par le jeu des relations. Une donnée prend tout son sens en étant mis en relation avec d’autres données.

Apportons enfin une dernière précision entre le terme de donnée et celui d’information. Ces termes très souvent utilisé pour désigner la même chose sur internet sont pourtant bien distincts. La donnée peut être qualifié comme un fragment de l’information. Et à l’inverse l’information est le regroupement de plusieurs données.

La donnée et la notion d’interprétation

Terminons sur un point important relatif à la notion d’interprétation : la donnée ne représente pas la même chose suivant le point de vue duquel on se situe. Prenons pour cela un exemple informatique avec cette suite de bits. Un bit ? C’est l’unité la plus petite du langage binaire. Le bit peut prendre 2 valeurs : 0 ou 1.

hello_world

Prenez la chaîne suivante : "01001000 01100101 01101100 01101100 01101111 00100000 01010111 01101111 01110010 01101100 01100100 00100001"

Alors, êtes-vous inspiré par cette suite ? Vous restez certainement comme moi totalement circonspect devant cette suite de 0 et de 1. Nos connaissances ne nous permettent pas de comprendre – A moins que vous soyez un expert du langage binaire. En revanche, un ordinateur comprendra tout à fait cet enchainement de caractères et par le biais de différents mécanismes affichera « hello world ! ».

La donnée est étroitement liée aux systèmes de stockage

La mémoire, les livre et le numérique

Cela fait très longtemps que l’être humain traite avec les données. Elles ont toujours été présentes et elles sont au cœur de tous les progrès : agriculture, astronomie, imprimerie, industrie, informatique et dans bien d’autres domaines. Tous ces développements n’ont rien à voir entres eux si ce n’est que les femmes et les hommes ayant permis ces révolutions se sont appuyés sur des informations accumulées avec le temps pour acquérir ces connaissances.

Ciel étoilé

Considérons l’astronomie - la science des astres - en particulier. Pour comprendre les mouvements des planètes, il a d’abord fallu cartographier le ciel. Et pour cela rien de mieux que les étoiles : il a donc fallu noter une à une la position des étoiles dans le ciel. Il s’agit là d’une donnée : la position de l’étoile étant l’élément de base et le ciel étant l’ensemble.

Savez-vous au sein de quelle constellation se trouve l’étoile d’Acrux ? Peut-être ne connaissez-vous pas la réponse, ce qui ne vous empêche pas de pouvoir la trouver par vous-même : dans un livre, grâce à votre ordinateur ou en sortant votre smartphone de votre poche. Cela nous permet d’aborder un point crucial de la donnée : le stockage.

Reprenons l’exemple d’Acrux :

  • Si vous connaissez la réponse à la question le système de stockage utilisé est votre cerveau et vous vous servez de votre mémoire ;
  • Si vous avez pris un livre, le système de stockage utilisé a été l’écriture ;
  • Si vous avez utilisé un ordinateur ou un smartphone, vous vous êtes très certainement connecté à un site web qui s’appuie sur un système de stockage numérique.

La donnée peut être stockée sous de nombreuses formes : mémoire, écriture et numérique.

Chaque système a ses propres caractéristiques, nous allons en étudier trois mais sachez qu’il en existe une infinité avec des caractéristiques toutes très différentes.

Le stockage sous toutes ses formes

Les caractéristiques : vitesse, conservation et diffusion

Si c’est votre mémoire qui conserve la donnée, vous pouvez y accéder rapidement si vous avez une bonne mémoire. L’être humain ne vivant rarement plus de 100 ans, les données issues de la mémoire ont une durée de vie très limitée dans le temps. Par ailleurs, il est difficile de diffuser cette mémoire car celle-ci n’est pas duplicable : il sera nécessaire de parler/écrire à chaque fois pour exprimer une donnée stockée dans votre mémoire.

En écrivant dans un livre, la donnée peut être conservée plus longtemps : de plusieurs siècles à des millénaires. La retrouver demande cependant plus de temps : il faut trouver le bon livre puis la bonne page et enfin la bonne ligne. La diffusion des données stockées grâce à l’écriture a été simplifiée par l’invention de l’imprimerie.

Concernant le stockage numérique : la donnée est accessible facilement grâce au web et aux moteurs de recherche, la conservation d’une donnée est quasi-éternelle (Cela pouvant poser des problèmes notamment en ce qui concerne le droit à l’oubli, nous y reviendrons) et sa diffusion est très simple et rapide, presque instantanée.

Vitesse de restitution (réactivité) Conservation Diffusion
Mémoire +
Ecriture + +
Numérique + + +

De nombreux autres paramètres existent pour comparer ces systèmes de stockage : délai de transmission, taille de stockage, capacité d’oubli : le stockage numérique n’est pas toujours le plus efficace mais il dispose d’un grand nombre de qualité par rapport à la concurrence.

Le stockage numérique dispose de nombreux atouts par rapport aux autres systèmes de stockage.

La mémoire et l’écriture sont deux éléments fondamentaux pour partager des données. Mais imaginez un instant que l’être humain n’ait jamais appris à parler ou à écrire. Il aurait alors été très difficile voire impossible de transmettre les données issues de la mémoire. L’apprentissage de la parole et de l’écriture au même titre que l’imprimerie ont été des révolutions ayant favorisé la transmission des données. Et le numérique a fait entrer la donnée dans une nouvelle ère, c’est ce que nous allons voir dans un prochain billet consacré à la première révolution de la donnée.

NB : pour les curieux, Acrux est l’étoile la plus brillante de la constellation de la Croix du Sud et elle a pour caractéristique d’être une étoile binaire. Je vous laisse découvrir par vous-même ce dont il s’agit sur le web ou dans les livres.

Pour approfondir :