2009/03/18


vimはファイルを開く際、iconvを使用してfileencodingsの順に変換を試し、正しく変換出来た物をfileencodingとして使用する仕組みになっています。
つまり化けたファイルだと、どのfileencodingsにもマッチせずencodingで指定されたエンコーディングでファイルが開かれステータス行に「変換失敗」と表示される事になります。
しかしながらそのファイルのエンコーディングが分かっている場合もあります。vimでは++encオプションを指定する事で指定のfileencodingでファイルを開く事が出来ます。
:e ++enc=utf-8 foo.txt
この場合、vimはiconvで変換出来なかった文字を?という文字で置き換えてしまいます。
# echo あいうえお | iconv -f char -t utf-8 > utf8.txt
# echo あいうえお | iconv -f char -t cp932 > sjis.txt
# cat utf8.txt sjis.txt > bad.txt
# vim
cp932の場合は文字集合の区画が広い為、vimではutf-8が構成するバイト列をcp932の範囲内として開いてしまいます。 :e ++enc=cp932 bad.txt
縺ゅ>縺?縺医♀
あいうえお
またutf-8の場合はcp932の区画は範囲外になります。つまり :e ++enc=utf-8 bad.txt
あいうえお
??????????
この様に?に変換されてしまう事になります。ステータス行には何行目で変換が失敗したかを警告するメッセージも表示されますが、元のテキストは失われます。
こういったファイルを開くのにフィルタを使用する人もいるかもしれません。
:%!nkf -Ws
これでも良いのですが、nkfが変換出来ない文字は削られてしまいます。
実はvimの:eコマンドには++badオプションという物があり、この?の挙動を変更出来る様になっています。
                                                                *++bad*
The argument of "++bad=" specifies what happens with characters that can't be
converted and illegal bytes.  It can be one of three things:
    ++bad=X      A single-byte character that replaces each bad character.
    ++bad=keep   Keep bad characters without conversion.  Note that this may
                 result in illegal bytes in your text!
    ++bad=drop   Remove the bad characters.

The default is like "++bad=?": Replace each bad character with a question
mark.
例えば++badオプションに%を指定すると :e ++enc=utf-8 bad.txt
あいうえお
%%%%%%%%%%
となるのです。現在の所1文字の場合はその文字で置き換える様になっています。また++badオプションにkeepを指定すると、何も変換せずに開いてくれます。
:e ++enc=utf-8 ++bad=keep bad.txt
あいうえお
<82><a0><82><a2><82><a4><82><a8><82><a6>
さらにdropを指定する事で不正な文字を削除してファイルを開く事も出来ます。
あいうえお

vimでファイルが開けなくなってしまった方、一度++badオプションを試してみては如何でしょうか?
Posted at by



2009/03/13


ruby版C版なでしこ版と書いたので最後(きっと)にvim版


Posted at by



2009/03/11


解説は...いらんでしょ。
母艦は「dan the shell」。

!変数宣言が必要
ルートメニューとはメインメニュー

ファイルメニューとはメニュー
実行とは、メニュー。実行のテキストは「実行」
区切り1とは、メニュー。区切り1のテキストは「-」
閉じるとは、メニュー。閉じるのテキストは「閉じる」

「実行
区切り1
閉じる」を反復
 「ファイルメニューの追加({それ}を)」をナデシコする

「ファイルメニュー」を反復
 「ルートメニューの追加({それ}を)」をナデシコする

入力メモとはメモ。
入力メモについて
  X=0
    Y=0
    W=母艦のクライアントW
    H=母艦のクライアントHを2で割る
結果メモとはメモ。
結果メモについて
  X=0
    Y=母艦のクライアントHを2で割る
    W=母艦のクライアントW
    H=母艦のクライアントHを2で割る

母艦のサイズ変更した時は~
 入力メモについて
  X=0
    Y=0
    W=母艦のクライアントW
    H=母艦のクライアントHを2で割る
 結果メモについて
  X=0
    Y=母艦のクライアントHを2で割る
    W=母艦のクライアントW
    H=母艦のクライアントHを2で割る

閉じるのクリックした時は~
 「閉じますか?」と二択
  もし、それがはいならば、終わり

実行のクリックした時は~
  URLは「http://api.dan.co.jp/perleval.cgi?c=callback&s=」
  それは入力メモのテキスト
  それをURLエンコード
  「{改行}」を「%0A」に置換
  URLにそれを追加
  URLをHTTPデータ取得して、結果に代入
  結果を「^callback\((.*)\);$」で正規表現マッチ
  結果は抽出文字列[0]
  結果をJSONデコード
  結果はそれ
  結果メモのテキストは結果@「result」

参考文献: 404 Blog Not Found:Ajax - perlを実行するAPI
Posted at by