UNIXな生活
更新:2004/7/7  
Linuxな生活  FreeBSDな生活
 Solarisな生活
 JAVAな生活
 Practical use
 掲示版
UTF-8文字コードファイルの扱いTips

  最近は、UTF-8文字エンコードしたファイルを利用することが多くなりました。GnomeなどのGUI環境を利用している場合は、UTF-8対応のエディタが標準で備わっているため問題ないですが、コンソール環境などでは、必ずしもLinuxで快適に利用できる環境が最初から揃っているとは限りません。
  そこで、UTF-8文字エンコードされているファイルを扱う環境を作成していきます。

1.UTF-8ファイルを見る
'cat'や'less'コマンドを皆さん利用されているでしょう。しかし、'cat'や'less'ではUTF8エンコードされたファイルを正しく表示できません。UTF-8ファイルを利用する場合は、これに変わるコマンドとして、'lv'コマンドを利用しましょう。
Debianでは、"apt-get install lv"で利用できるようになります。
例)
%lv [FileName]


2.文字コードの変換
文字コードを変換するには、'nkf'を利用していました。この代替も'lv'でできます。
例)
%lv -Oej file.utf8 > file.euc-jp
これで、UTF-8エンコードファイルをEUC-JPに変換します。
manで書式を確認してください。

指定できる代表的な文字コードは以下の通りです。
jiso-2022-jp
eExtended Unix Code
ejeuc-jp
u7UTF-7
u8UTF-8
i1・・・i9 iso-8859-1・・・iso-8859-9
sshift-jis


3.vi(vim)でUTF-8ファイルを利用する
vi(vim)では、6.x系以上でUTF-8ファイルを利用できます。
利用するには、~/.vimrcの以下の行を編集(追加)してください。
syntax on      >--文字の色分けを実施
set nobackup    >--バックアップファイル(file~)を作らない指定
set fileencoding=japan   >--デフォルトの保存エンコード。[japan]はeuc-jp、UTF-8の場合は[utf-8]
set fileencodings=iso-2022-jp,euc-jp,utf-8,ucs2le,ucs-2,cp932 >--読み込むことのできるエンコードを列挙。


4.emacsでUTF-8ファイルを利用する
emacsでUTF-8ファイルを利用するには、mule-ucsが必要です。
Debianなら、"apt-get install mule-ucs"で利用できるようになります。
なお、UTF-8の改行コードも他の文字コードと同じように指定できます。
utf-8-unix文字コードUTF-8、改行コードUNIX形式
utf-8-mac文字コードUTF-8、改行コードMAC形式
utf-8-win文字コードUTF-8、改行コードWindows形式

emacsの他の情報は、こちらを参考にしてください。




Producted by Tomoya Sakurai