漢字について、プレーンテキストという幻想

テキストファイルとこれまで言ってきたモノについて認識を変えないといけないことになっていることに遅くも気がついた。何という無知。

著者がJIS第一第二水準の漢字で書いてくれていれば問題がないが、もし、第3水準、森鴎外の鴎の編を口三つで書いていた場合、plain textに落とすとそれは、文字が無くなるか、unicodeのファイルになるということだそうだ。




JIS改正とMS新書体をめぐって
http://www.okazaki.sakuraweb.com/biboroku/msnewfont.html



テキストデータのゆくえ


WindowsMac OS X で、補助漢字や第三・第四水準の漢字を使う場合、Unicode のデータとして扱われます。

テキストデータでお願いします、と言われた場合には、第一・第二水準の範囲の漢字で済ませればそれでよいわけで、これまでは、そうしてきたと思います。(もし不足があれば、プリントアウトしたハードコピーに、赤字でも入れて補足していたでしょう)

しかし、Winows Vista の新フォントになると、少し状況が変わってくるように思えます。



今、Jeditで試したところ、鴎の編を口三つで書いている場合には、dosでは保存できない。それにこのhatenaも鴎の編を口三つで書いも、鴎で保存されてしまう。

plaintextで、原稿をもらうというのは非現実的で、unicode対応の文字設定であるかどうかということが重要になってくる。プレーンテキストならば、テキストが共有できるというのは、もはや幻想にすぎない。wordならwordで原稿をもらうと言うことを基本的にしておいた上で、wordの問題を把握しておくということか。