Compression de données

La compression de données traite de la manière dont on peut réduire la quantité de symboles utilisés pour représenter une information quelconque. En cela, elle se rattache donc à la théorie de l'information.

La compression peut par exemple concerner, un flux d'information, un fichier.

Table of contents
1 Compression sans pertes
2 Compression avec pertes
3 Récapitulatif

Compression sans pertes

La compression est dite sans perte lorsqu'il n'y aucune perte de données sur l'information d'origine. Il y a autant d'information après la compression qu'avant, elle est seulement réécrite d'une manière plus concise (c'est par exemple le cas de la compression GZIP).

L'information à compresser est vue comme la sortie d'une source de symboles qui produit des textes finis selon certaines règles. Le but est de réduire la taille moyenne des textes obtenus après la compression tout en ayant la possibilité de retrouver exactement le message d'origine (on trouve aussi la dénomination codage de source en opposition au codage de canal qui désigne le codage correcteurs d'erreurs).

Les formats de fichier de compression sans perte les plus courants sont:

Les standards ouverts les plus courants sont décrits dans plusieurs RFCs:

Codage Huffman

Codage RLE

Lempel-Liz

Voir à LZW

Compression avec pertes

Utilisée pour compresser des photos, des bandes musicales, des films, ...

Il y a moins d'information après la compression qu'avant, l'information retranchée étant sélectionnée d'après des critères fixés selon le type de données traitées. La compression d'une image en format jpeg est un exemple de compression avec perte. Puisque l'œil ne perçoit pas nécessairement tous les détails d'une image, il est possible de retrancher des données, dans l'espace des fréquences, de telle sorte que le résultat soit très ressemblant à l'original, voire pareil, pour l'œil. Le tout est de savoir quelles données retrancher. L'image finale n'étant pas, numériquement parlant, identique à l'image initiale, il s'agit d'une compression avec perte.

Récapitulatif

Domainessans pertesavec pertes
Général
binaires/données
RLE (Run-Length Encoding),
LZW (dictionnaire)
DCT (Discrete Cosine Transform),
Ondelettes (wavelet),
Compression fractale
Audio-MP3 (DCT), Ogg Vorbis
ImagePCX (RLE), GIF, TIFF, PNG, BMP, TGA, IMG, IFFJPEG (DCT), SPIHT (ondelettes)
Vidéo-MPEG (DCT)

Note: certains algorithmes peuvent être brevetés.



Tous les textes sont disponibles sous les termes de la Wikipedia se publica bajo la Licencia de Documentación Libre GNU.

Legal  -  Contacto