EF BB BF

UTF-8Windows2000のメモ帳で編集して、javaアプリで読み込むと、先頭の1文字に「?」が表示されていた。
どうも、「EF BB BF」を符号(BOM=Byte Order Mark、バイト・オーダー・マークと言うらしい)として先頭につけるらしいが、javaは標準では対応していないみたい?


dfツールをつかってテキストレベルで比較すると同一なのだが、バイナリレベルでは不一致となる。


【参考】
http://www.atmarkit.co.jp/fxml/rensai/w3cread38/w3cread38_1.html
http://ja.wikipedia.org/wiki/UTF-8
http://search.luky.org/oo/openoffice.2003/msg04925.html