pafuイーランスクール 学んでできる

Web学習室TOPへ戻る >  メニューへ戻る

コンピュータでのデータ表現(基礎理論)

学習のポイント

コンピュータ内部では、「数値」は「文字コード」で管理され、画像・音声・動画も各種の規格があります。また、整数は、「固定小数点数」、実数は、「浮動小数点数」により管理されています。浮動小数点では「計算誤差」が発生する場合があります。コンピュータ内部での様々なデータ表現の仕組みをマスターしましょう。

1. 文字コード
文字コードには、色々な種類があります。特徴を押さえましょう。
コード名 内容
EBCDIC IBMが規定した汎用コンピュータ用のコードで、8ビットで1文字を表現します。
ASCII ANSIが規定した7ビットのコード。パソコンなどで使用。
ISOコード ISOがASCIIを基に勧告。7ビット情報交換用の符号。
JISコード JISが規定。漢字も含む。漢字は2パイトで1文字。
シフトJIS JIS漢字コードをシフトさせることでASCIIとの混在が可能。パソコンで利用。
Unicode 世界各国の文字を統一コードで表現するための規格。すべての文字を2バイトで表現。
EUC Unix上で2バイトと1バイトを混在して使用。
2. マルチメディア
マルチメディア(画像・音声・動画)の各種規格を押さえましょう。
●画像
コンピューターなどで画像を表現する場合の一番小さな要素を「画素(ピクセルやドット)」といいます。この「画素」1つ1つが、色や明るさなどの情報を持っています。1つずつの形は正方形や長方形です。それら「画素」がたくさん集まって、絵や写真などを表現しています。 また、「解像度」とは、画像の密度のことです。 その単位が「dpi」で1インチにどれだけ「ピクセル」が含まれているかを表しています。 10dpiでは以下のようになります。
※以下は、代表的な画像の形式
GIF 画像データを圧縮して記録するファイル形式の一つ。256色までの画像を無劣化で圧縮することができ、図やイラストなどの画像に向いている。
JPEG カラー静止画の圧縮形式で、フルカラーの画像を多少の劣化を伴いながら高い圧縮率で圧縮できるのが特徴。ISOとITU-Tの共同組織の名称。
PNG 主にWebページ上で画像を扱うための形式として開発されたもので、GIF形式と並んでよく用いられます。PNG形式はGIF形式と比べても圧縮率が高く、その割に画像が劣化しないことが特徴。

過去問題
200dpiのプリンタを使って画像を加工せずに9×6(㎝)の大きさで印刷したい。この時、ディジタルカメラの解像度を幾つにして撮影すべきか。ここで、1インチ=2.5㎝とする。
解説
(9÷2.5)×(6÷2.5) = 3.6(インチ)×2.4(インチ)
よって、200dpiより1インチあたり200ドットですから
200(ドット)×3.6 × 200(ドット)×2.4 = 720(ドット)×480(ドット)
●音声
1. PCM
アナログ信号をディジタル信号へ変換
原理としては以下のようになります。
PCMを使用した音声形式
・mp3…映像データ圧縮方式のMPEG-1で利用される音声圧縮方式の一つ。最も広く普及している音声圧縮方式の一つ。
・AAC…動画圧縮規格「MPEG-2」や「MPEG-4」で利用される音声圧縮形式で、MPEGでの復号を出来なくした結果圧縮率が高く音質が良い形式となった。同音質のMP3より1.4倍ほど圧縮率が高いといわれています。

2. MIDI
コンピュータと楽器を接続するインターフェイス

過去問題 平成25年春期 問3
●動画
MPEG MPEGとは、動画・音声データの圧縮方式の標準規格を検討するため、ISO(国際標準化機構)とIEC(国際電気標準会議)が合同で設置した専門家委員会での規格群の総称です。
MPEG-1
CD-ROMへの動画記録用として策定。
MPEG-2
ディジタルテレビ放送やDVDビデオに利用。
MPEG-4
携帯端末での利用を目的として開発。ブルーレイディスクで利用。
3. 固定小数点数
小数点の位置を通常、右端に固定して、数値を表現します。格納できる数値の範囲は決まってあり、これを超えると「オーバフロー」となります。
27 26 25 24 23 22 21 20  
0 1 1 1 0 1 0 1
(小数点の位置)▲ 
10進数の117です。
この方法では、負の数については、「補数」を使用します。固定小数点数で表現できる範囲は以下の通りです。
(nビットの場合)
●正の数のみ
0~2n-1
●負の数に1の補数を使用した場合
-2n-1+1 ~ +2n-1-1
●負の数に2の補数を使用した場合
-2n-1 ~ +2n-1-1
※この表現方法は、演算速度は遅いが、正確に数値を表現できます。プログラム言語では「整数型」に使用されています。
4. 浮動小数点数
浮動小数点」は、指数形式を使用したデータ表現です。
10進数の-1625は、- 0.1625 × 104 となります。
「符号部」「仮数」「底」「指数」で表現しています。
有効けた数…意味のある情報が格納されたけたの数を言います。
正規化…仮数部が「1」となるようにすることです。(例) 101.1101の時、「1.011101×22
表現形式…IEEE754によって提案。32ビット
1ビット 8ビット 23ビット
S E M
S仮数部の符号…0が正の数、1が負の数
E指数部の値
M仮数部の値
表現される値 (-1)S×2E-127×(1+M)
指数部
指数の値を2進数で格納します。ただし、負の数の扱えるように+127した値を8ビットの2進数で表現して格納します。
仮数部
小数点以下の部分を23ビット分格納します。


10進数「5.75」を浮動小数点で表記してみましょう。
5.75を2進数へ基数変換します。2進数で「101.11」となります。
正の数のため「+101.11」となります。
正規化をすると「+1.0111×22
仮数部の符号…正の数のため「0」となります
指数部…2のため、2+127で129となり、これを2進数へ変換すると「10000001」となります。
仮数部の値…「0111…」となります。

0 10000001 0111 000
S E M
※この表現方法は、少ないメモリで大きな数値から小さな数値を扱え、演算速度も速い仮数部の桁数の制約より「計算誤差」が発生する場合があり、指数部の桁数の制約より、「オーバーフロー」「アンダーフロー」をおこす場合があります。プログラム言語では「実数型」に使用されています。

5. 計算誤差
浮動小数点では、計算誤差が発生する場合がありますので、プログラミングする際は、注意が必要です。以下は代表的な計算誤差です。
オーバフロー
演算結果の絶対値が大きくなり、表現できる値の範囲を超えてしまうこと。
アンダフロー
絶対値が小さくなり、表現できる値の範囲を超えてしまうこと(0の近くは表現できない)
絶対誤差
真値と計算値(近似値)との差
相対誤差
絶対誤差÷真値
丸め誤差
限られた範囲内に入りきらない部分を切り捨てたことによる誤差。
打切り誤差
計算を途中で打ち切ることによる誤差。
けた落ち
絶対値の近い同符号の加減算において有効桁数が減少すること。
情報落ち
絶対値の大きい数と小さな数の加減算で、小さな数の情報が計算結果に反映されないこと。回避方法としては、絶対値の小さい数から加減算を行うようにする。
6. 2進化10進数
2進化10進コード(BCD)」とは、「10進数の1桁を2進数4桁」で表現すること。以下のように2種類があります。

ゾーン10進数
1バイトが「ゾーン部」と「数値部」から構成されて、最後の1バイトが「符号部(4ビット)」と「数値部(4ビット)」からなります。つまり、10進数の1桁が1バイトで格納されます。
n桁の整数をゾーン10進数で表現すると「nバイト」が必要です。

パック10進数
4ビツトで数値部を構成して、最後の4ビットが符号部となります。
n桁の整数をパック10進数で表現すると「n/2+1バイト」が必要です。

※符号部は、正の数は「(1100)2=(C)16」、負の数は「(1101)2=(D)16です。
Web学習室TOPへ戻る >  メニューへ戻る

pafuイーランスクール

pafuイーランスクール 学んでできる