通常の文字データは1バイトあるいは2バイトで表現できますし,数値のデータも数バイトで表現できます。それはこれらがコード化されているからです。それに対してマルチメディアのデータは,画像や音声のアナログデータを1点ずつデジタルデータにするのですから,非常に大きなバイト数になります。それで,データを圧縮する技術が重要になります☆。なお,画像,音声,文字などの素材を画面上で組み合わせて,マルチメディアコンテンツを作るためのツールをマルチメディアオーサリングツールといいます。
- 静止画像データ
は600バイト
デジタルカメラ(300万画素)で撮った写真は1枚約1MB
- 音声データ
- 電話は8KB/秒(非圧縮)
音楽は約200KB/秒(非圧縮),約20KB/秒(MP3に圧縮)
CD1枚は740MB
- 動画データ
- 約30,000KB/秒(非圧縮,表示画面の大きさにより異なる),約330KB/秒(圧縮)
テレビ番組は約1000KB/秒(圧縮)
静止画像 BMP (非圧縮)
JPEG(非可逆,フルカラー,写真など)
GIF (可逆,256色,イラストなど)
音声 WAV (非圧縮)
MIDI(シンセサイザなど)
MP3 (MPEG-1準拠)
動画 MPEG-1(ビデオCD用)
MPEG-2(DVDビデオ,デジタル衛星放送用)
MPEG-4(インターネットでの動画配信用)
静止画像
ビットマップ画像とベクトル画像
- ビットマップ情報
- 画像を小さな点にわけ,その点を3原色の濃淡を数値化して表現する方法です。デジタルカメラやスキャナで取り込んだ画像や,ペイントソフトやPhotoshopなどのペイント系グラフィックソフトで作成した画像がそれにあたります。画像を拡大したり縮小したりすると画像が見にくくなります。なお,写真などのビットマップ画像を補正するソフトをフォトレタッチソフトといいます。Photoshopなどが有名です。
- ベクトル情報
- 線や長方形などの図形を起点と終点を与える方法です。この方法は,画像そのものではなくこれらの情報だけを持つので,容量が非常に小さくなる特徴があります。また,PowerPointで作成した図形のように,拡大・縮小をしても画像が乱れないという特徴があります。ベクトル画像を作成するソフトをドロー系グラフィックソフトといいます。
静止画像のファイル形式
ビットマップ画像は容量が大きくなるので,なんらかの方式によって容量を小さくする工夫がなされています。それを画像圧縮といいます。圧縮した画像が元の画像に完全に復元できる方式を可逆圧縮方式,完全には復元できない方式を非可逆圧縮方式といいます。次によく用いられているファイル形式を掲げます。
| タイプ | 復元 | カラー | その他の特徴 |
| BMP | 可逆 | フルカラー | Windows標準装備,圧縮性が悪い |
| JPEG | 非可逆 | フルカラー | 写真など |
| GIF | 可逆 | 256色 | イラストなど |
- BMP
- Windowsで標準的に装備されています。ほとんど圧縮をしないか単純な圧縮しかしないので,この形式のファイルは容量が大きく,保管したりWebページに掲げるのには適していません。
- JPEG(JPG)
- きめが細かく色彩が微妙に変化する写真などの画像を圧縮するのに適した方式です。非可逆圧縮方式です。圧縮度を与えることができるので,圧縮度を少なくして画質を重視したり,画質を犠牲にして圧縮度をたかめたりすることができます。
- GIF
- イラストのように境界がはっきりしており,色の変化が少ない画像に適しています。可逆圧縮方式ですが,256色に減色されます。1色について透明化(背景が見える)ができるとか,複数の画像を順番に表示するアニメーション機能
(服部宣広氏「Animation GIF Maker」より)などがあります。
音声
音声のデジタル化
音声をデジタル情報に変換するには,まず音声をマイクロホンで電気信号に変えます。すると,図の曲線のような波形になります。音声は大きさと高さで決められます。音声が大きいことは波形が高いことで,音声が高いことは波形の幅が狭い(周波数が大きい)ことで表されます。この波形を図の棒線で近似することによりデジタル化するのです。デジタル化された音声の品質は標本化と量子化で決まります。
- 標本化
- 棒線の間隔を狭くすれば(サンプリングの回数を増やせば)波形に近くなるので,よい品質になります。しかし,それだけデータ量が大きくなります。
波形の幅の半分の間隔にすれば波形が再現できるという理論(標本化理論)があります。たとえば,人間の声は最大4KHzですので,1秒間に8000回サンプリングすればよいことになります。音楽では,もっと高い周波数の音が含まれますので,サンプリングの回数を多くする必要があります。
- 量子化
- 棒線の高さを数値化することです。図では0~7の8段階に数値化していますが,16段階,32段階と増やせば,それだけ波形に近くなるので品質がよくなります。しかし,8段階ならば1サンプリングを3ビットで表現できます(23=8)が,16段階にすれば4ビットが必要になります。☆
電話の音声をデジタル化したらどの程度の容量になるかを計算してみます。
人声は最大4KHzです。Hzは周波数ですから,波の周期はその逆数で4000回/秒になります。標本化理論により,サンプリングは2×4000=8000回/秒になります。通常は人声は8段階程度で十分ですので,1サンプルあたり3ビットになります。それで,8000×3ビット/秒,すなわち3KB/秒となります。ちなみにフロッピーの容量は1.4MBですから,8分間程度しか記憶できないことになります。
このように品質とデータ量は逆の関係があるのですが,品質をあまり劣化させずにデータ量を減らすための
圧縮技術が工夫されています。
- WAV(WAVE)
- Windowsで標準に用いられているサウンドデータの形式です◇。圧縮はしていません。
- MIDI
- シンセサイザメーカーのコンソーシアムが開発した音楽・音声データ通信規格。
- MP3
- MPEG-1規格(後述)に準拠した音声圧縮方式で,WAVデータの10分の1程度に圧縮します。
動画
Windowsの標準形式にはAVI◇があります。
MPEGが国際標準になっており,主なものには,次のものがあります。
MPEG-1(ビデオCD用)
MPEG-2(DVDビデオ,デジタル衛星放送用)
MPEG-4(インターネットでの動画配信用)
なお、MPEG-7は圧縮形式ではなく、マルチメディアコンテンツを有効に検索するための記述方法の標準です。
その他,各社からRealVideo,QuickTime,WindowsMedia,Shockwaveなど,動画をWebブラウザで再生するソフトが開発されています。
その他のファイル
- PDF(Portable Document Format)
- 文字や画像を組み合わせた印刷用文書-WORDやPowrPointなどで作成した文書-を,そのままの体裁で保存でき,拡大縮小してもあまり乱れず,不正な更新ができないようにしたツールです。重要文書の保存や文書の配布などに用いられます。
- PostScript
- 文字や画像を含むページをビットマップに変換するプリンター制御言語です。印刷・出版業界で広く用いられています。
- CSVファイル
- Excelなどの表計算ソフトのファイルを,データ間をコンマで区切り,レコード間は改行で区切ってテキスト形式にしたものです。容量が少なくてすむこと,多くの表計算ソフトに使える特徴があります。