圧縮と解答ってなに?

IT用語

ファイルやデータの「圧縮・解凍」のお話

よく耳にする言葉ですが……いまいち、ピンと来ないもののひとつ「圧縮・解凍」について、スキルアップを兼ね、触れてみましょう。

インターネットではもはや常識!?

「圧縮と解凍」ですが、インターネットを使っていると、それら技術の恩恵を100パーセント受けています。こう言って過言ではありません。

とくに画像や「YouTuber(ユーチューバー)」も使う動画や配信、さらに音楽のデータ(ファイル)は「圧縮」されているものばかりです。そしてそれぞれ「どんな風に圧縮するか」仕様があります。

画像ならば「JPEG(ジェーピグ)形式」や「PNG(ピング)形式」、動画でしたら「MP4(エムピーヨン)形式」(スマートフォンがあつかう動画)や「WMV形式」(ウインドウズでの一般形式)、DVD/Blu-ray/レコーダーで使われている「MPEG(エムペグ)2/4形式」、音楽は「MP3形式」と、用途に応じて細かく仕様が分かれています。

これら圧縮とは、そのままの意味で「普通なら大きなサイズになる情報(データ)を、ふとん圧縮袋のようにサイズを小さくし、素早いやり取りと、データをコンパクトにして、扱いやすくする」技術や作業を示しています。

やり取りするデータのサイズが小さければ、とりわけインターネットを使った送受信が速くなり、データ利用量が減り、通信費は低くできます。また、データを保存するストレージの使用容量も減らせます。

次に、圧縮と反対の技術や作業は「解凍」と呼んでいます。これは小さなサイズに「圧縮したデータ」を普通に使えるように、元のデータサイズ(状態)に戻す行為を示します。今では、付属している一般的なソフト(アプリ)で自動的に「圧縮や解凍」作業ができるようになってきました。

どうやってデータサイズを小さくするの?

圧縮の考え方は、FAXが使っている「ランレングス法」を使用する場合は、例えば「AAAAABBBAAAA」という12文字(データ)があったとすると、普通なら1文字は「1バイト(日本語でしたら2バイト以上)のサイズになるので、やり取りから保存には、12バイト分のサイズが必要になります。

しかし「A5B3A4」=(Aが5文字、Bが3文字、Aが4文字の意味)、こんな圧縮処理をしてから、やり取りすると、なんということでしょう!データのサイズは6バイトで済んでしまうではありませんか!見事にデータを圧縮出来ました!(ビフォーアフター風)

ただ、ポイントは「圧縮されたデータ」が置き換え等された特殊なもののため、そのままの状態では普通に扱えません。

なので「解凍」作業を行って「Aが5文字、Bが3文字」……とデータを元の文字や並び方へ戻してから扱う必要があります。さらに重要な点は、圧縮には「2つの形式」があることです。

それは可逆圧縮形式と不可逆圧縮形式――!

可逆圧縮形式と不可逆圧縮形式、2つの形式の違いは?

データを圧縮しても、完璧に元の状態へ戻せる形式が前者で、いったん圧縮したら元の状態に戻せないタイプが、後者です。

コンピュータプログラムやソフト(アプリ)、そして作成した文書データなど「1文字でも違うものに変わると、間違いになる」データ類は、必ず可逆圧縮形式のLHA形式か、ZIP形式(ジップ形式)が多く使われています。

では、完全に元に戻せない「不可逆圧縮」形式を使うメリットは何なのでしょう?

ひと言で「高い圧縮率にできる点」となります。可逆圧縮形式の数十倍~数百倍以上、データのサイズを小さくできるのです。

音楽のデータなら、元のデータサイズの2割程度にまで圧縮しても、元のデータとの違いは、あまり感じられません。人間の目や耳は、細かい変化に気づきにくいため、データの細部が不完全な解凍でも、ごまかせるからです。

これが動画になってくると現在、30FPS(エフピーエス・1秒間に30回画面が変わる意味)のものが一般的になりました。ところが1つ前の画面と、1つ「先」の画面との変化は小さいことが、ほとんどです。

そこで、動きの小さい(少ない)画面同士を比べて、あいまいに保存したり、動きのほとんどない部分を「カット」したりして、動画データのサイズを小さくするタイプ。これが不可逆圧縮で、通信量(パケット)などを大きく抑えて、やり取りも手軽にできる最大のメリットを発揮しています。

まとめ

駆け足で圧縮と解凍について触れました。

実は、アーティストの一部の方は圧縮したものは「生」のデータと違う! こう怒った歴史があります。しかしユーザ(利用者)が便利さとコストパフォーマンスを認め、現在へ至っています。

これら技術はどんどん進歩し、データの未来予測まで行われ、ストリーミング(音楽・動画のネットを使った配信)を身近なものにしました。インターネットを扱うブラウザは、送られてくる圧縮されたデータを、ひたすらに「解凍」して、ウェブページから動画表示、音楽の再生をこなしています。

蛇足ですが、手描きイラストを「連続して使う」ときは、不可逆圧縮形式でしたら、ごまかした保存となって蓄積し、読み込むとノイズや、にじみが出てきます。ですから画像や動画も作成していく途中では、一般に「不可逆圧縮」形式は使いません。

俗に言う「ベタ(そのまま・未圧縮)保存」をして、劣化を防ぐのが基本となっています。

コメント

タイトルとURLをコピーしました