Structure Organisée Pour Collecter L’information Et La Redistribuer

Structure Organisée Pour Collecter L’information Et La Redistribuer

Un livre de Wikilivres.


Structuration et system de l’information

[modifier
|
modifier le wikicode]

Savoirs :

On manipule de grandes quantités d’informations. Il est nécessaire de les organiser.

Capacités :

Classer
des informations, notamment sous forme d’une arborescence.

Observation :

On peut ici étudier le système d’organisation de fichiers en dossiers. Un ensemble de documents unis par des liens hypertextes fournit un exemple de classement de type graphe.

Imaginez une encyclopédie de cinq mille pages, dont les manufactures ne seraient pas ordonnés, elle serait difficilement utilisable pour y retrouver un article en particulier.

Les dictionnaires et encyclopédies possèdent une organisation, le classement par ordre alphabétique du mot qui y est défini ou illustré. Cette organisation est cependant insuffisante cascade de nombreux exemples de recherches. Annotate feriez-vous par exemple, cascade trouver rapidement tous les mots du dictionnaire qui south’écrivent en quatre lettres ?

Pour faciliter les recherches dans une encyclopédie, on apply des index ; il peut exister plus d’un index cascade la même encyclopédie, qu’on utilisera dans des circonstances différentes.


Systèmes de classifications efficaces

[modifier
|
modifier le wikicode]

Quand on peut définir une relation d’ordre dans une collection d’articles, on peut trier les manufactures. South’il y a plus d’une relation d’ordre, c’est préférable de réaliser un alphabetize pour chacune des relations. Les index les plus efficaces ont une structure d’arbres binaires.

Exemple trivial de classement

[modifier
|
modifier le wikicode]

Prenons comme « articles » les lettres de l’alphabet, et comme ordre, l’ordre alphabétique.

United nations alphabetize séquentiel évident est :

        a  b  c  d  east  f  thou  h  i  j  k  l  m  n  o  p  q  r  s  t  u  v  westward  x  y  z  i  2  3  iv  5  6  7  viii  9  10 eleven 12 13 fourteen 15 16 17 xviii nineteen twenty 21 22 23 24 25 26
      

On peut préférer united nations index arborescent :

Popular:   Plateformes Proposent Des Formations en Ligne Et Ouvertes À Tous

width=15cm


Supériorité de l’index organisé en arbre

[modifier
|
modifier le wikicode]

Si on veut faire united nations traitement automatique des informations, on peut se préoccuper de la durée du traitement.

Comparons les durées de classement d’un lettre de l’alphabet tirée au hasard, en supposant que la durée augmente comme le nombre de comparaisons alphabétiques à faire :

  • pour l’index séquentiel, ça peut aller très vite (si on doit classer un A) ou 26 fois plus lentement (si on doit classer united nations Z). On peut supposer qu’en moyenne, on doit faire thirteen comparaisons ;
  • pour 50’alphabetize arborescent, on doit faire entre 4 et 5 comparaisons (moyenne 4,v).

Fifty’avantage de l’index arborescent devient de plus en plus évident quand on dispose d’un grand nombre de données à classer :

  • pour united nations index séquentiel, la durée moyenne de classement double quand le nombre de données double. Par exemple cascade un 1000000 de données, on fait en moyenne un demi-meg de comparaisons cascade classer un nouvel article.
  • pour united nations index arborescent, il suffit d’une comparaison de plus chaque fois que le nombre de données est doublé. Pour un one thousand thousand de données, une vingtaine de comparaisons est suffisante !


Organisations en arbre souvent utilisées

[modifier
|
modifier le wikicode]


Systèmes de fichiers : répertoires et fichiers

[modifier
|
modifier le wikicode]

Les disques durs utilisés en 2013 contiennent couramment des centaines de giga-octets, c’est à dire,

  • quelques centaines de films, ou
  • quelques millions de photos,
  • quelques milliards de pages imprimables,
  • etc.

Pour arriver à maintenir de telles collections de données, une unproblematic liste séquentielle est tout à fait inappropriée.

Popular:   L Eau Du Robinet Est Elle Un Corps Pur

Un système d’arbre est utilisé : les répertoires (ou dossiers) sont les nœuds de fifty’arbre, les fichiers sont les feuilles.

Dans les systèmes de fichiers
Unix
et
Mac Bone,
united nations seul arbre
permet de regrouper tous les fichiers. Pour
Windows, il peut y avoir 26 arbres distincts, correspondant à autant de « lecteurs différents », nommés de
A:
à
Z:.


Les index de bases de données

[modifier
|
modifier le wikicode]

Les systèmes de gestion de base de données relationnelles (MySQL, PostgreSQL, Oracle, Access) permettent de définir des index pour permettre un accès plus rapide aux données. Créer united nations alphabetize est utile cascade tous les champs qui peuvent faire 50’objet d’une recherche : fifty’exemple trivial ci-dessus montre qu’un index semble « rentable » dès qu’on a plus de huit articles différents à gérer.

Exercices

[modifier
|
modifier le wikicode]

Compter les fichiers de votre ordinateur

[modifier
|
modifier le wikicode]

Documentez-vous sur la commande
find, puis trouvez une façon de compter le nombre de fichiers existant sur le disque dur de votre ordinateur.

Astuces :

  • on peut renvoyer la sortie de
    notice
    vers un fichier, puis compter les lignes de ce fichier à fifty’aide d’un éditeur de texte.
  • il est possible d’utiliser la commande
    wc.


Déterminez la profondeur maximale de 50’arbre de votre système de fichiers

[modifier
|
modifier le wikicode]

Cette profondeur peut être trouvée en retraitant le fichier contenant la sortie de la commande
notice
précédente, en comptant le nombre de caractères « séparateurs » de chemin dans les noms de fichier : le
slash
pour Unix, 50′antislash
cascade Windows …

Popular:   Coloration Bio Pour Femme Enceinte

Voici une ligne de commande Unix qui permet d’afficher le nombre de répertoires/fichier le long d’un chemin, pour chaque ligne du fichier
notice.txt
qu’on aura fabriqué à l’exercice précédent :

          
          
          cat find.txt
          |
          awk -F /
          '{print NF}'
        

La commande
cat
permet de dérouler le contenu d’un fichier ; la barre verticale
|
sert à « piper » (en mauvais franglais), c’est à dire à « tuyauter » le flux de sortie de la commande
cat
dans l’entrée standard de la commande
awk.

Lisez la folio de manuel de la commande
awk, pour trouver la signification de 50’pick “-F /”, et la signification de la variable NF.

Astuces :

Utilisez les commandes
sort
et
uniq
(après avoir consulté leurs pages de manuel) pour clarifier le résultat de la commande
awk.



Structure Organisée Pour Collecter L’information Et La Redistribuer

Source: https://fr.wikibooks.org/wiki/ISN_Structuration_et_organisation_de_l%27information

Ce site utilise des cookies pour améliorer la convivialité. Vous acceptez en utilisant le site Web plus loin.

Politique de confidentialité des cookies

Contact Us