COMPRENDRE-INFORMATIQUE.COM

Deviens autonome dans l’utilisation de l’informatique et comprends ce que tu fais !

Un format de fichier, c’est quoi et comment ça fonctionne ?

Formats de fichiers

Que ce soit pour partager des documents, enregistrer des images ou lire des vidéos, ton ordinateur a un format de fichier spécifique. Mais c’est quoi au juste, un format de fichier ? Et comment ça fonctionne ? Au travers de cet article, je vais te dévoiler tout ça. Je vais aussi te faire découvrir des notions clés sur les formats de fichiers, comme les extensions et d’autres mécanismes qui permettent à ton ordinateur de gérer tout ça en douceur.

C’est quoi un format de fichier ?

Les fichiers de ton ordinateur (ou de ton téléphone ou de ta tablette) renferment différents types de contenu :

📄 Des documents textes
🖼️ Des images
🎵 Des contenus audio
🎞️ Des vidéos
⚙️ Des programmes
Etc.

Ces contenus sont enregistrés sur ton ordinateur sous forme de données. Ces données sont structurées et organisées de manière différente par ton ordinateur selon le type de contenu. C’est ce qu’on appelle un format de fichier.

Un format de fichier, c’est une manière spécifique dont ton ordinateur va structurer et organiser les données dans un fichier informatique, afin qu’il puisse les lire, les interpréter et les utiliser correctement.

Un même type de contenu peut avoir plusieurs formats de fichier

Un même type de contenu peut être enregistré dans différents formats. Par exemple, un document texte 📄 peut être enregistré sous les formats suivants :

  • TXT
  • DOCX
  • PDF
  • CSV
  • etc.

Mais comment choisir le bon format ? C’est ce que nous verrons plus loin.

Un format de fichier est associé à un logiciel par défaut

Pour que ton ordinateur puisse lire et interpréter correctement les données d’un fichier, il doit utilliser un logiciel spécifique.

Par exemple, quand tu double-cliques sur un document texte au format DOCX, le système d’exploitation de ton ordinateur lance le logiciel Microsoft Word. Ce dernier va pouvoir lire et interpréter ton fichier DOCX et te l’afficher à l’écran.

Un logiciel n’a souvent pas le monopole d’un format de fichier. Par exemple, un fichier au format MP3 peut être ouvert par de nombreux logiciels comme iTunes, VLC Media Player, Windows Media Player, Spotify, etc.

Mais comment fait l’ordinateur pour savoir quel logiciel exécuter quand on double-clique dessus ?

Eh bien, dans le système d’exploitation de ton ordinateur, chaque format de fichier est associé à un logiciel par défaut.

Associations entre formats de fichiers et logiciels

Quand tu installes un nouveau logiciel sur ton ordinateur, le ou les formats de fichier pris en charge par ce logiciel seront associés à ce dernier. Cette association est enregistrée dans ce qu’on appelle une table des associations de fichiers. Cette table est enregistrée dans le système d’exploitation (par exemple, Windows) de ton ordinateur.

À chaque fois que tu ouvres un fichier en double-cliquant dessus, le système d’exploitation de ton ordinateur consulte cette table d’associations pour déterminer quel logiciel il doit exécuter. Et il l’exécute.

Comment l'OS associe un format de fichier à un logiciel avec la table d'association des fichiers
Quand l’utilisateur double-clique sur un fichier pour l’ouvrir, le système d’exploitation consulte sa table d’associations de fichiers pour déterminer avec quel logiciel ouvrir le ficher en fonction de son format.

Et ce mécanisme est le même pour la grande majorité des systèmes d’exploitation : Windows, Mac ou encore Linux.

Et si j’ai plusieurs logiciels qui peuvent lire un même format de fichier ?

Ton système d’exploitation doit normalement te permettre d’ouvrir un fichier avec tout autre logiciel capable de prendre en charge son format.

Par exemple, si u désires ouvrir un fichier MP3 sous Windows avec un autre logiciel que celui par défaut, il faut faire un clic droit sur le fichier et cliquer sur « Ouvrir avec ». Une fenêtre s’affiche et te permet de choisir le logiciel :

Fenêtre de sélection du logiciel avec lequel ouvrir un fichier d'un certain format sous Windows
Fenêtre de sélection d’un logiciel avec lequel ouvrir un fichier au format MP3, sous Windows

De plus, tu as la possibilité de définir le logiciel comme sélectionné comme nouveau logiciel par défaut pour le format du fichier.

Que se passe-t-il si aucun logiciel n’est associé à un format de fichier ?

C’est typiquement le cas si quelqu’un t’envoie un fichier qu’elle ou il a créé avec un logiciel que tu ne possèdes pas.

Par exemple, imagine que tu as demandé à un ami designer de te créer un montage Photoshop et au lieu de t’envoyer l’image finale, il t’envoie un fichier au format PSD. Le format PSD est en fait le format de fichier projet utilisé par Photoshop pour créer une image. Mais tu n’as pas Photoshop installé sur ton ordinateur ! Que va-t-il donc se passer ?

Lorsque tu double-cliques sur le fichier PSD pour l’ouvrir, le système d’exploitation va chercher dans sa table des associations de fichiers l’association qui correspond au format PSD. Mais comme Photoshop n’est pas installé sur ton ordinateur, cette association n’existe pas ! Le système d’exploitation n’ayant rien trouvé, il pourrait alors t’afficher un message d’erreur. Mais tu conviendras que ça serait pas terrible comme résultat.

À la place de cela, ce que la plupart des systèmes d’exploitation font, c’est demander avec quel logiciel l’utilisateur souhaite associer le format de fichier PSD.

Exemple sous Windows :

Fenêtre Windows qui demande à l'utiisateur avec quel logiciel ouvrir un fichier enregistré dans un format non reconnu
Fenêtre Windows qui me demande avec quel logiciel j’aimerais ouvrir mon fichier Photoshop. Dans mon exemple, je possède le logiciel GIMP, qui est un logiciel gratuit permettant de réaliser des montages comme avec Photoshop. GIMP prend également en charge le format de fichier PSD.

Ce que ton ami designer aurait dû faire, c’est d’exporter son montage Photoshop au format PNG, qui est un format d’image de bonne qualité et que tout le monde peut ouvrir avec les logiciels photo de base installés sur la majorité des systèmes d’exploitation. Les images au format PNG peuvent également être ouvertes avec un navigateur web.

C’est super tout ça, mais…

Comment l’ordinateur fait-il pour reconnaître le format d’un fichier ?

Eh bien, c’est une excellente question, merci de me l’avoir posée !

L’ordinateur doit-il analyser le contenu du fichier pour déterminer son format ? Ça aurait pu être une option, oui. Mais s’il s’agit d’un énorme fichier, ça prendrait des plombes !

Heureusement, une solution simple a été trouvée :

L’extension d’un fichier

C’est quoi l’extension d’un fichier ?

L’extension d’un fichier, c’est un « code » composé de quelques lettres (parfois aussi des chiffres) qui se trouve à la fin du nom d’un fichier, juste après le point. Ce code correspond au format du fichier.

Un fichier Word
Un fichier au format DOCX (Microsoft Word). L’extension du fichier apparaît ici en surbrillance jaune.

L’extension peut être en MAJUSCULES, en minuscules ou encore uN MélAnGe dEs deUX, cela ne change rien à son fonctionnement.

Le rôle de l’extension est d’indiquer au système d’exploitation le format du fichier. Pour déterminer le format d’un fichier, le système d’exploitation n’a qu’à lire l’extension qui se trouve à la fin du nom du fichier et interroger la table d’associations des fichiers pour déterminer le logiciel à utiliser. Pas besoin d’analyser le contenu du fichier !

« Mais je ne vois pas d’extension à la fin du nom de mes fichiers ! »

Si tu ne vois pas l’extension, pas de panique ! C’est tout à fait normal. De nos jours, la plupart des systèmes d’exploitation sont pré-configurés pour masquer l’extension aux utilisateurs.

« Mais c’est scandaleux ! On nous cache des choses, je le savais !!! »

Du calme, du calme. C’est pour ton propre bien. 🙂

Plus sérieusement, les extensions des formats de fichiers connus (présents dans la table d’associations des fichiers) sont masquées par défaut pour rendre l’interface plus simple et épurée pour l’utilisateur moyen. Cela évite aussi les erreurs de format quand on renomme un fichier. Par exemple, si on renomme son fichier en vitesse et qu’on efface l’extension, quand on double-clique ensuite sur le fichier pour l’ouvrir, le système d’exploitation ne sait plus de quel format il s’agit et il demande à l’utilisateur avec quel logiciel il doit l’ouvrir.

Attention aux fausses extensions !

Une attaque de pirates informatiques courante (surtout dans les années 90 et début des années 2000, mais toujours d’actualtié) consiste à déguiser un logiciel malveillant en document ou en image. Et si notre système d’exploitation est configuré pour masquer les extensions des fichiers connus, on ne s’aperçoit pas de la supercherie :

Un fichier Word
Un programme malveillant déguisé en document Word

Et si on affiche les extensions, on s’aperçoit que la véritable extension est « exe » (le format d’un programme exécutable) :

Un logiciel malveillant déguisé en fichier Word
Faux document avec sa vraie extension affichée

Pour cette raison, je te recommande, si ce n’est pas déjà fait, de modifier le réglage de ton système d’exploitation pour que les extensions des fichiers soient affichés.

Comment afficher l’extension des fichier ?

Sous Windows

  1. Ouvre n’importe quel dossier.
  2. Clique sur le menu Affichage.
  3. Coche la case Extensions de noms de fichiers.

Sous macOS

  1. Ouvre le Finder.
  2. Va dans le menu Finder > Préférences.
  3. Dans l’onglet Avancées, coche l’option Afficher toutes les extensions de fichiers.

Quelle est la différence entre un format de fichier et une extension de fichier ?

Le format de fichier, c’est la structure interne du fichier, définissant comment les informations sont codées et comment elles doivent être lues.

L’extension de fichier est le signe visible qui aide le système d’exploitation à identifier le format du fichier et à associer le fichier au bon logiciel.

Le problème avec les extensions de fichier

Imagine le scénario suivant :

On est dimanche matin et tu te décides de faire de l’ordre dans tes fichiers. Tu les classes, tu les renommes, tu en supprimes, TAC TAC TAC ! Super, tu as fait du beau boulot aujourd’hui !

Organisation de fichiers

Mais quelques mois plus tard, tu rallumes ton ordinateur, te ballades dans tes dossiers et tu aperçois un des nombreux fichiers que tu avais réaorganisés. Tu l’avais renommé par erreur et avait supprimé l’extension. Le nom du fichier est vague et tu ne vois pas vraiment de quoi il s’agit. D’ailleurs, comme tu as supprimé son extension, l’icône du fichier a changé et est devenue générique. Tu ne possèdes aucun indice qui te permette de rajouter l’extension !

Un fichier sans extension ni icône
Fichier sans extension

Eh ben bravo ! Comment tu vas faire maintenant pour savoir de quel format il s’agit et ajouter la bonne extension au nom du fichier ? Tester plusieurs extensions et voir si le fichier s’ouvre ?

Oui, c’est une option. Mais à partir de ce problème, on peut se poser une question encore plus large :

Existe-t-il un moyen plus fiable que l’extension pour déterminer le format d’un fichier ?

OK, les extensions, c’est super pour aider le système d’exploitation à reconnaître facilement le format d’un fichier. Mais ça n’est pas une solution très fiable. Il doit forcément y avoir un moyen de faire en sorte qu’un ordinateur puisse reconnaître facilement le format d’un fichier sans avoir à analyser tout son contenu et sans dépendre du nommage du fichier. 🤔

Et oui, il existe bel et bien une solution ! Et cette solution, ce sont :

Les nombres magiques

C’est quoi les nombres magiques ?

Les nombres magiques, c’est…

Des nombres magiques

Non, pas ça, arrête de rêver !

Les nombres magiques (oui, on les appelle vraiment comme ça), c’est une séquence arbitraire d’octets qui se trouvent au début d’un fichier. Ces nombres font partie du contenu du fichier et non de son nom. Ils sont comme un tampon qu’on appose sur un fichier pour l’associer à un format de fichier spécifique.

On pourrait aussi les comparer à l’étiquette d’un vêtement. Peu importe l’apparence extérieure du vêtement, l’étiquette à l’intérieur te dit avec certitude de quel type de tissu il est fait ou comment il doit être entretenu. De la même manière, les nombres magiques sont des marqueurs à l’intérieur des fichiers qui indiquent leur véritable format, même si leur nom ou leur apparence extérieure (comme l’extension) a changé. Plusieurs vêtements peuvent avoir la même étiquette, tout comme plusieurs fichiers peuvent avoir la même séquence de nombres magiques.

Quelques exemples de nombres magiques

Voici quelques exemples de formats de fichiers avec leur extension ainsi que leurs nombres magiques :

FormatExtension(s)Nombres magiques
PNG (image).png89 50 4E 47 0D 0A 1A 0A
JPEG (image).jpg ou .jpegFF D8 FF E0
PDF (document).pdf25 50 44 46
MP3 (audio).mp349 44 33
Quelques exemples de formats de fichiers et leurs nombres magiques
Source : Gary Kessler’s File Signature Table

Ces nombres comportent des lettres de A à F. C’est normal, car la convention en informatique est d’utilise notation hexadécimale (base 16) pour représenter les nombres sous formes d’octets. Par exemple, FF en base 16 est l’équivalent de 255 en base 10.

Quand on ouvre un fichier, on ne voit pas ces nombres magiques. Par exemple, si tu ouvres une image au format PNG, tu ne verras pas de nombres en tout petit. Même si tu zoomes à fond. Pour pouvoir voir ces nombres magiques, une possibilité est d’ouvrir cette image avec un éditeur hexadécimal. Un éditeur hexadécimal est un logiciel qui permet d’afficher /(et éditer) le contenu brut d’un fichier, c’est-à-dire ses octets au format hexadécimal (car c’est plus pratique et c’est une convention).

Voyons un exemple concret !

Par exemple, sur la capture d’écran ci-dessous, tu peux voir un aperçu du contenu brut d’une image PNG.

Une capture d'écran d'une image PNG ouverte avec l'éditeur hexadécimal HxD
Fichier image au format PNG ouvert avec l’éditeur hexadécimal HxD. Les octets du fichier sont représentés sous forme de suites de nombre hexadécimaux. Les 8 premiers octets sélectionnés en bleu « 89 50 4E 47 0D 0A 1A 0A » sont les nombres magiques du format PNG. Le reste des octets sont des métadonnées et données qui constituent l’image PNG. Les nombres en bleu sur la colonne de gauche (offsets) et les nombres en bleu sur la première ligne sont comme des coordonnées qui permettent de localiser les différents octets du fichier. Sur la colonne de droite, on peut voir une traduction des octets en caractères lisibles. L’ensemble de ces caractères est cependant incompréhensible pour un humain.

Les octets que j’ai sélectionnés (en bleu) sont les nombres magiques du fichier image. Ils identifient le format du fichier comme PNG. Sur la droite se trouve une traduction en texte de ces octets.

Ainsi, tu remarqueras que les octets magiques 89 50 4E 47 0D 0A 1A 0A sont la représentation de �PNG����. Le � représente un caractère qui ne peut pas être rendu à l’écran.

Les nombres magiques du format MP3, 49 44 33, représentent ID3. Ceux du format PDF, 25 50 44 46, représentent %PDF.

Si ça t’intéresse, je te recommande les éditeurs hexadécimaux gratuits suivants :

↪ Pour Windows, HxD. C’est celui que j’ai utilisé dans ma capture d’écran ci-dessus.

↪ Pour macOS, Hex Fiend. Il est gratuit et open source.

Tous les formats de fichier n’utilisent pas de nombres magiques

Il existe deux grandes catégories de fichier :

  • Les fichiers texte, dont le contenu brut est lisible. Si tu ouvres un fichier texte avec le bloc-note de Windows par exemple, tu ne verras pas tout plein de codes incompréhensibles, mais tu pourras t’attendre à y découvrir un contenu intelligible. Du moins, cela dépend de la personne qui l’a rédigé, bien entendu.
  • Les fichiers binaires, dont le contenu brut est inintelligible pour un humain (comme dans l’exemple de notre PNG ouvert avec notre éditeur hexadécimal). Contrairement aux fichiers texte, qui contiennent des caractères lisibles, les fichiers binaires sont destinés à être interprétés par un programme ou un matériel spécifique pour en extraire l’information correcte.

Les fichiers texte n’ont, en général, pas de nombres magiques car leur contenu est lisible et ne nécessitent pas de structure complexe comme les fichiers binaires. Ils sont en général bien plus faciles à manipuler par un ordinateur.

Les nombres magiques sont très utiles pour récupérer des fichiers supprimés

Permets-moi d’ouvrir une petite parenthèse intéressante sur les nombres magiques. (

Quand un fichier est supprimé d’un disque, ce n’est en fait pas son contenu qui est supprimé, mais sa référence. Sans entrer trop dans les détails, si cette référence est détruite, le système d’exploitation considère que le fichier n’existe plus malgré le fait que son contenu est toujours présent sur le disque. À moins que l’ordinateur ne réécrive un autre fichier par dessus au fil du temps. Car l’emplacement du fichier est considéré comme libre.

Les logiciels de récupération de fichiers tel que Recuva fonctionnent de la manière suivante : le logiciel va scanner tous les octets du disque et essayer de repérer des nombres de magiques typiques. Si on se mettait à la place du logiciel : « Oh, j’ai trouvé une marque de fichier PDF à l’adresse XYZ du disque. Je vais essayer d’estimer où ce contenu s’arrête en fonction d’autres éléments comme des métadonnées qui devraient normalement suivre pour pouvoir déterminer à quelle adresse le contenu du fichier s’arrête afin de pouvoir le récupérer.

)

Quels sont les formats de fichiers les plus courants ?

C’est ce que nous verrons dans le prochain article qui sera publié la semaine prochaine. 🙂

Stay tuned!

Ce qu’il faut retenir sur les formats de fichiers

  • Un format de fichier détermine comment les données sont structurées pour être lues et interprétées par un ordinateur.
  • Chaque format de fichier est généralement associé à un logiciel par défaut, mais peut être ouvert avec plusieurs logiciels.
  • Les extensions indiquent le format du fichier, mais il est possible de modifier l’affichage des extensions sous Windows et macOS pour plus de sécurité.
  • Les nombres magiques sont des séquences d’octets utilisées pour identifier le format d’un fichier indépendamment de son extension, ce qui est utile en cas de suppression de fichiers ou d’extensions manquantes.
Cet article t'a plu ? Partage-le !

5 réponses à “Un format de fichier, c’est quoi et comment ça fonctionne ?”

  1. Merci David. J’avoue ne pas être toujours à l’aise avec l’outil. J’y comprends enfin quelque chose grâce à ton article. L’information y est limpide ! Je repasserai sur ton blog 🙂

  2. Très bon article 🙂
    Accessible pour les débutants, tu places cependant un peu de technique, car oui, il en faut pour expliquer les choses. En plus, tu mets de l’humour, ce qui rend le contenu léger et très agréable à parcourir (+1 pour ta blague sur les nombres magiques).
    En tout cas, il m’a fait un bon rappel sur les codes hexa des fichiers que j’avais un peu oubliés 🙂

    • Merci pour ton commentaire positif, Jérémy. 🙂
      Oui, je n’ai pu m’empêcher de parler de ces fameux nombres magiques, car je trouve le concept très intéressant.

Laisser un commentaire