最近は、UTF-8文字エンコードしたファイルを利用することが多くなりました。GnomeなどのGUI環境を利用している場合は、UTF-8対応のエディタが標準で備わっているため問題ないですが、コンソール環境などでは、必ずしもLinuxで快適に利用できる環境が最初から揃っているとは限りません。
そこで、UTF-8文字エンコードされているファイルを扱う環境を作成していきます。
|
| 1.UTF-8ファイルを見る |
'cat'や'less'コマンドを皆さん利用されているでしょう。しかし、'cat'や'less'ではUTF8エンコードされたファイルを正しく表示できません。UTF-8ファイルを利用する場合は、これに変わるコマンドとして、'lv'コマンドを利用しましょう。
Debianでは、"apt-get install lv"で利用できるようになります。
例)
%lv [FileName]
|
| 2.文字コードの変換 |
文字コードを変換するには、'nkf'を利用していました。この代替も'lv'でできます。
例)
%lv -Oej file.utf8 > file.euc-jp
これで、UTF-8エンコードファイルをEUC-JPに変換します。
manで書式を確認してください。
指定できる代表的な文字コードは以下の通りです。
| j | iso-2022-jp |
| e | Extended Unix Code |
| ej | euc-jp |
| u7 | UTF-7 |
| u8 | UTF-8 |
| i1・・・i9 | iso-8859-1・・・iso-8859-9 |
| s | shift-jis |
|
| 3.vi(vim)でUTF-8ファイルを利用する |
vi(vim)では、6.x系以上でUTF-8ファイルを利用できます。
利用するには、~/.vimrcの以下の行を編集(追加)してください。
syntax on >--文字の色分けを実施
set nobackup >--バックアップファイル(file~)を作らない指定
set fileencoding=japan >--デフォルトの保存エンコード。[japan]はeuc-jp、UTF-8の場合は[utf-8]
set fileencodings=iso-2022-jp,euc-jp,utf-8,ucs2le,ucs-2,cp932 >--読み込むことのできるエンコードを列挙。
|
|
| 4.emacsでUTF-8ファイルを利用する |
emacsでUTF-8ファイルを利用するには、mule-ucsが必要です。
Debianなら、"apt-get install mule-ucs"で利用できるようになります。
なお、UTF-8の改行コードも他の文字コードと同じように指定できます。
| utf-8-unix | 文字コードUTF-8、改行コードUNIX形式 |
| utf-8-mac | 文字コードUTF-8、改行コードMAC形式 |
| utf-8-win | 文字コードUTF-8、改行コードWindows形式 |
emacsの他の情報は、こちらを参考にしてください。
|