生徒実習課題例>>データの伝達とディジタル化、圧縮

生徒実習課題例

データの伝達とディジタル化、圧縮

科目の中の位置づけ

社会と情報（１）イ情報のディジタル化
社会と情報（１）ウ情報の表現と伝達
社会と情報（２）ウ情報通信ネットワークの活用とコミュニケーション
情報の科学（１）アコンピュータと情報の処理
情報の科学（２）イ問題の解決と処理手順の自動化

実習内容

ねらい

　文字情報には、アルファベット、数字、ひらがな、カタカナ、漢字、その他の記号など、様々なものがある。文字情報を伝達する方法について考えてみよう。ここでは、説明を簡単にするため、アルファベットの大文字２６文字と空白だけを考えることとする。

実習に必要な機器、材料

授業プリント例
　授業用プリント、確認テスト、評価規準の例を作成しました。
　　

"36_digit.doc" Word 97-2003文書（45KB）

課題および解答例

課題
　例えば、次の文

ＪＹＯＵＨＯＵ　ＮＯ　ＤＥＮＴＡＴＵ

を、遠く離れた場所に伝達する方法を考える。
　なお、０～９の数字だけが伝達することができるとし、どのような方法があるか考えよう。ただし、情報を受け渡しする双方が同じ変換表を持っているとする。

解答例
　アルファベットの大文字26文字と空白の合計27文字だから、次のような変換表を作ればよい。
　　

Ａ	０１	Ｈ	０８	Ｏ	１５	Ｖ	２２
Ｂ	０２	Ｉ	０９	Ｐ	１６	Ｗ	２３
Ｃ	０３	Ｊ	１０	Ｑ	１７	Ｘ	２４
Ｄ	０４	Ｋ	１１	Ｒ	１８	Ｙ	２５
Ｅ	０５	Ｌ	１２	Ｓ	１９	Ｚ	２６
Ｆ	０６	Ｍ	１３	Ｔ	２０	空白	２７
Ｇ	０７	Ｎ	１４	Ｕ	２１

　　この表にしたがって、上記の文を

１０２５１５２１０８１５２１２７１４１５２７０４０５１４２００１２０２１

というように変換して送れば、受信先は再変換して、送信元と同じ文を読むことができる。

発展課題および解答例

発展課題１
　解答例では、どうして、Ａ～Ｉを１～９としないで、０１～０９と考えたのだろうか？

解答例１
　文字の区切りがわからなくなるから

発展課題２
　上記の変換方法について、実際に人間が変換を行ってみたときの不便な点を考えてみよう。
　また、実際にこれらの方法が使われている情報機器を探してみよう。

解答例２－１
　文章が日本語である場合は、次のような変換表の方が変換しやすいのではないか？
　例えば、「アイウエオ」に該当するローマ字「ＡＩＵＥＯ」を、それぞれ「０１、０２、０３、０４、０５」とし、「カサタナハマヤラワ」の子音部に該当するローマ字「ＫＳＴＮＨＭＹＲＷ」をそれぞれ「１０、２０、３０、４０、５０、６０、７０、８０、９０」、濁音等はそれに準じて１桁目を「５、６」とする。また、残りのものを「９１、９２・・・」とする。

Ａ	０１	Ｈ	５０	Ｏ	０５	Ｖ	９６
Ｂ	５５	Ｉ	０２	Ｐ	５６	Ｗ	９０
Ｃ	９１	Ｊ	９３	Ｑ	９５	Ｘ	９８
Ｄ	３５	Ｋ	１０	Ｒ	８０	Ｙ	７０
Ｅ	０４	Ｌ	９４	Ｓ	２０	Ｚ	２５
Ｆ	９２	Ｍ	６０	Ｔ	３０	空白	９９
Ｇ	１５	Ｎ	４０	Ｕ	０３

解答例２－２
　それならば、ローマ字表記にしたがって、「あ～お」は「１１～１５」、「か～こ」は「２１～２５」のようにすればよいのではないか？

＜参考＞ポケベルの入力 　ポケベルの入力はこの方法を利用したものがある。

（例）

ア	１１	カ	２１	サ	３１	ワ	０１
イ	１２	キ	２２	シ	３２	ヲ	０２
ウ	１３	ク	２３	ス	３３	ン	０３
エ	１４	ケ	２４	セ	３４
オ	１５	コ	２５	ソ	３５

発展課題３
　例えば、信号のＯＮとＯＦＦを１と０と考えればよいので、情報伝達機器等に利用しやすいから、実際の情報の伝達では、２進法が多く使われている。
　それでは、０～９をどのように０と１を用いて表したらよいだろうか？

解答例３

10進法	0	1	2	3	4	5	6	7	8	9	10	11
２進法	0	1	10	11	100	101	110	111	1000	1001	1010	1011

　上記のようにして、例えば「５」は、
　　５＝１×２^２＋０×２^１＋１×２^０
のように考えて、「１０１」と変換していく。
　いま考えているのはアルファベットの大文字と空白の合計２７文字だから、
　　２７＝１×２^４＋１×２^３＋０×２^２＋１×２^１＋１×２^０
より、「２７」は２進法で「１１０１１」と表すことができるから、５桁の２進数（２進法で表された数）で考えればよいことになる。
　この場合、例えば、２進数で表された「１００」は５桁で考えることにすれば「００１００」と表記する。

　下記の変換表が作成できる。この変換表で表された２進数を「文字コード」と呼ぶ。

Ａ	00001	Ｈ	01000	Ｏ	01111	Ｖ	10110
Ｂ	00010	Ｉ	01001	Ｐ	10000	Ｗ	10111
Ｃ	00011	Ｊ	01010	Ｑ	10001	Ｘ	11000
Ｄ	00100	Ｋ	01011	Ｒ	10010	Ｙ	11001
Ｅ	00101	Ｌ	01100	Ｓ	10011	Ｚ	11010
Ｆ	00110	Ｍ	01101	Ｔ	10100	空白	11011
Ｇ	00111	Ｎ	01110	Ｕ	10101

　この変換表に従うと、

ＪＹＯＵＨＯＵ　ＮＯ　ＤＥＮＴＡＴＵ

は、次のように変換される。

010101100101111101010100001111101011101101110011111101100100001010111010100000011010010101

＜参考＞　実際の文字コード
　実際の文字コードでは、半角の文字は８桁の２進数で表されている。こうすれば、合計５１２個までのアルファベットや数字、記号はすべて２進数で表すことができる。
　様々な変換表があるが、ＪＩＳで定められた文字コードでは、例えば、「Ａ」は「01000001」、「Ｌ」は「01001100」である。

発展課題４
　文字コードを２進数で「01000001」のように表したとき、人間が扱うと（目がチラチラして）不便であるので、表記のために何かよい方法はないであろうか？

解答例４
　次のような変換を考える。

２進法	0	1	10	11	100	101	110	111	1000	1001	1010	1011	1100	1101	1110	1111
変換	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15

　上記のようにすると、ちょうど２進数の４桁ずつで２進法と変換を対応させることができる。
　例えば、２進法で「10011010001110101011」と表された数は「1001|1010|0011|1010|1011」と４桁で区切って、それぞれを上記の表にしたがって、「９|１０|３|１０|１１」のように表せばよい。
　このとき、変換された「１０～１５」は２桁の数であって紛らわしいので、これを「Ａ～Ｆ」と表すことにすると、「９|Ａ|３|Ａ|Ｂ」なので、これを「９Ａ３ＡＢ」と書く。これで、「10011010001110101011」を「９Ａ３ＡＢ」と表し直すことができる。
　この方法にしたがうと、先ほどの「Ａ」は「４１」、「Ｌ」は「４Ｃ」となる。
　この変換を１６進法といい、変換された「１～Ｆ」を１６進数という。

注　文字の「Ａ」と１６進数の「Ａ」は違うものなので注意！！

応用課題
　実際の変換コードについて調べてみよう。
　日本語を表すときには文字の種類が多いので、２バイト（２進数の１６桁）が用いられている。この変換コードには様々な種類のものがあるが、その違いについても考えてみよう。
　更に余力があれば、どのようにして、１バイトの文字と２バイトの文字をコンピュータが区別しているか、その仕組みについても調べてみよう。

発展課題５
　発展課題３では、

ＪＹＯＵＨＯＵ　ＮＯ　ＤＥＮＴＡＴＵ

は、

010101100101111101010100001111101011101101110011111101100100001010111010100000011010010101

のように変換された。

　ここでは、このデータをもっと少ない量のデータに変換する（「圧縮する」という）ことを考えてみよう。
　圧縮する方法の変換表は、受信元と発信先に用意されているものとする。

　できるだけ少ない量のデータに変換するにはどうしたらよいだろうか？
注　実際には、画像などを配信するときにできるだけ少ないデータに圧縮する方法が用いられている。

解答例５－１
　例えば、「ＡＡＡＢＢＢＣＣＣＤＤＥＥＦＦＦＦ」という文字列であれば、この場合、文字と数字の区別ができる変換表を用意しなくてはならないが、これを「Ａ３Ｂ３Ｃ３Ｄ２Ｅ２Ｆ４」というように圧縮してから２進数のデータに変換することが考えられる。
　いま取り扱っている

ＪＹＯＵＨＯＵ　ＮＯ　ＤＥＮＴＡＴＵ

では、文字の重なりがないので、この方法では、圧縮できない。

解答例５－２

Ａ	1	Ｈ	1000	Ｏ	1111	Ｖ	10110
Ｂ	10	Ｉ	1001	Ｐ	10000	Ｗ	10111
Ｃ	11	Ｊ	1010	Ｑ	10001	Ｘ	11000
Ｄ	100	Ｋ	1011	Ｒ	10010	Ｙ	11001
Ｅ	101	Ｌ	1100	Ｓ	10011	Ｚ	11010
Ｆ	110	Ｍ	1101	Ｔ	10100	空白	11011
Ｇ	111	Ｎ	1110	Ｕ	10101

　上記の表のように、「Ａ」を「00001」ではなく「1」とすれば、データを少なくできる。
ただし、どこで文字の区切りがあるのかわからなくなってしまうので、区切り記号を用いなくてはならない。どのような区切り記号を用いるかがむずかしい問題である。

解答例５－３
　ＡからＺをその文字の出現頻度で並べ直すことにする。ここでは説明を簡単にするためにＡ～Ｆで考えてみよう。
　出現頻度順が、例えば、次のようであったとする（実際はこれを調べることが大変だ）。

	Ａ	Ｂ	Ｃ	Ｄ	Ｅ	Ｆ
出現頻度	１	６	３	５	２	４

　このとき、頻度順に次のような表を作成する。

１	０						Ａ
	１	０					Ｅ
		１	０				Ｃ
			１	０			Ｆ
				１	０		Ｄ
					１	０	Ｂ

　すると、次のような変換表ができる。

Ａ	１０
Ｅ	１１０
Ｃ	１１１０
Ｆ	１１１１０
Ｄ	１１１１１０
Ｂ	１１１１１１０

　このとき、例えば、「11011101111011010」であれば、順に表から変換して、「ＥＣＦＥＡ」とすることができる。
　これは、頻度順に表して1を立てて、文字の区切りに0を置いたということになるが、元のデータに比べて圧縮されたとは言い難い。

解答例５－４
　解答例５－３の頻度順で、更に工夫して、次のような表で考えてみる。

０		０	Ａ
０		１	Ｅ
１	０	０	Ｃ
	０	１	Ｆ
	１	０	Ｄ
	１	１	Ｂ

すると、次のような変換表ができる。

Ａ	００
Ｅ	０１
Ｃ	１００
Ｆ	１０１
Ｄ	１１０
Ｂ	１１１

　このとき、例えば、「011001010100」であれば、順に表から変換して、「ＥＣＦＥＡ」とすることができる。
　解答例５－３と比べたとき、圧縮率が高いことがわかる（しかも、文字の区切りが要らない！！）。

＜参考＞
　解答例５－４の方法をハフマン法といい、実際の圧縮に用いられている。

応用課題
　　「Ａ～Ｚ」と空白が実際にどのような頻度で現れるかを調査して、例７のような表を作成し、

ＪＹＯＵＨＯＵ　ＮＯ　ＤＥＮＴＡＴＵ

を、上記の方法で圧縮変換してみよう。

時間配分　５０分

時間配分	生徒の動き	教師の動き
５分	学習内容実習の目的の把握実習の内容の理解	実習の目的の説明実習の説明０～９の数字を用いて、アルファベットを表現する。アルファベットに、数字を割り当てる。
４０分	実習内容　アルファベットと数字の変換表の作成。変換表の作成（アルファベットと空白の２７文字分）。問題の文を変換表を用いて、数字に直す。他の生徒に変換した数字と変換表から元の文に直してもらう。問題点が、なかったか確認する。　発展課題各自の進度で、発展課題に取り組む。	巡回し、補足説明。余力のある生徒には、発展課題の中から適宜選択して、考えさせる。
５分	学習内容　次回までの課題漢字について、実際のコンピュータではどのようにコード化されているか。	次回までに調べてくる課題の指示。次時の予告。

データの伝達とディジタル化、圧縮

科目の中の位置づけ

実習内容

ねらい

実習に必要な機器、材料

課題および解答例

発展課題および解答例

時間配分 ５０分

時間配分　５０分