Traditional on the Ice

ARTICLE PAGE

-- --

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
08 2008

日本語が面倒になってきた

正確には「日本語の扱いが面倒になってきた。」ですかね

いま、所属研究室の発表論文、口頭発表実績などを管理するデータベースを
Perlで組んでいます。データベースといってもテキストログで管理するのでものすごく簡易なものです。

そして、先日キーワード検索を実装したのですが、
「表」とか「ー」といった文字が含まれるキーワードで検索すると
動作がアヤシイ・・・

原因は、有名な「0x5C問題」のようです。


Shift_JISで考えもなしに書くんじゃなかった・・・orz
解決策として、プログラムとログ全体をEUC-JPかUTF-8で書き直すという方法が考えられますが

EUC-JP:移行は簡単。でも若干古臭い?
UTF-8:おそらくこれからの標準。ただ、ソースコードの記法を若干変える必要あり

とどちらも一長一短な感じ。

所詮研究室のホームページなので、EUC-JPとjcode.pmの組み合わせで手を打つことになりそうだけれども、それもなんだかなぁ・・・・

- 0 Comments

Leave a comment

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。