« IBM もオフショア開発にシフト | メイン | ドコモ、新型FOMA「900i」シリーズを年明けに発売 »

BOM(バイトオーダーマーク)

Unicode 関連の文字エンコード方法ではビット列の並びに 2種類存在してそれを許している。そのためその印をファイルの先頭に入れるのだが、それがバイトオーダーマーク(BOM)。

ASCII 文字しかない(はず)のに、Netscape 4.x が読み込んでくれない症状。これは間違って UTF-8 エンコードした際に BOM が入ってしまったために発生した障害だった。

通常 UTF-8 では使用しない方が良いということだけど、仕様では許されているために対応しているエディタや処理系は多いみたい。


聞いたことはあるが体験しないと分からない、そんな事件でした。

参考:
Windows 98/2000上でのUTF-8のページの作り方
IT 用語辞典 : BOM 【Byte Order Mark】

トラックバック

このエントリーのトラックバックURL:
http://5net.com/mt/mt-tb.cgi/70

コメント (1)

先月出たRFC3629にも、BOMの話が追加されています。
http://www.ietf.org/rfc/rfc3629.txt

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)

Amazon Search