[Commit] 自動チェックルーチンが欲しい: 改行コード・漢字コードの不統一を検出する†
- ページ: BugTrack
- 投稿者: henoheno
- 優先順位: 重要
- 状態: 保留
- カテゴリー: サイト
- 投稿日: 2004-06-19 (土) 21:27:57
- バージョン:
メッセージ†
- 1.3も1.4も、デフォルトコンテンツ(wiki/*.txt) の コードが、EUC/LF ではなくて EUC/CRLF になっている様です(他は EUC/LF です)。SJIS/LF ならばよくある話なのですが、なぜでせう・・・
- ※PukiWiki経由でこのデフォルトコンテンツを編集すると、ちゃんと(?)EUC/LFに直る様です。ユーザーの目には触れませんが、開発者およびcvsでマージしたいユーザーによっては実害がありそうです。
- 回避策1: PukiWiki経由で修正した後、手作業で EUC/CRLF に変換してからコミット/マージする (実稼動中のサイトの場合、運営を一瞬停止して、バックアップを取ってから、こちらで対処することに)
- 回避策2: PukiWiki経由ではなく、漢字/改行コード自動判別機能のあるエディタで直接編集する (こちらは開発者向き)
- ※一つの事例を思い出しました。純粋に EUC/LF のファイルを「WinCVSごった煮版」付属のcvsクライアントでチェックアウトし(ここで改行コードがCRLFになります)、それをそのままUnix上に持ち込んで、Unix上のcvsクライアントからチェックインするとこうなります。
- ※念のため 1.3/1.4 の他のファイルをチェックしたところ、1.4ではその他に wkiki.en/*.txt および plugin/clear.inc.php, plugin/topicpath.inc.php が同じ問題に該当している様です。次に何か煩わされる事があれば、まとめて直してしまいます :)
- 全部まとめて修正/検出するためには: $ find pukiwiki_1* -type f \( -name "*.css" -or -name "*.js" -or -name "*.lng" -or -name "*.php" -or -name "*.sh" -or -name "*.txt" \) -print0 | xargs -0 qkc -eu
- これは、毎回やるのは面倒なので自動チェックルーチンのレシピにすべきです :)
- これは備忘録なのですかね?と思いますよ。というのも、チェックインできる数人の作業の話をしているわけですからね。あと、国際化を今後、考えた場合には、もはや EUC じゃなく UTF-8 なんだろうと思いますので、実害があるなら対応でしょうが、ここまで放置しているわけですから、このパワーを国際化に注ぎたいものですね。じゃないと、せっかく lng の対応に力を注いでも、意味の無い作業になってしまうと思いませんか?逆に、現状を維持し続けるのですか?とお聞きしたいです。-- upk
- こんにちは :) このBugTrackの由来は開発日記です。読み辛くてすいません。主題は「自動チェックルーチンが欲しい(作りたい)」というものです。再発を防止するためには、定期的なチェックを欠かさないのがよろしいかと思います。 -- henoheno
- 今回の文字コードの齟齬については、今だけキチッと揃えるであれば上記のレシピで一瞬で終わる話であるものの、それは対処療法でしかないので、*2
一旦皆さんに状況を説明し、反応を得てからまとめて対応すべきと考えました。 -- henoheno
- upkさんのご意見は、現状のものについては「直すべき」と言うことですよね? :) 私も同感です。いいんですよね? -- henoheno
- チェックルーチンを作るかどうか?は、今後のメンテナンスにも左右しますので、賛成です。ただ、UTF-8で統一された場合も考慮しておく必要がある。ということです。-- upk
- もしもUTF-8に移行をするならば、nkf 2.0がUTF-8に対応していますから、これをqkcの代わりに使うと良いだろうなぁと思っています。ただしnkf2.0の(UTF-8を混ぜた)漢字コード判別機能がどの程度のものかは私個人には不明ですので、ちょっと慎重にテストする必要があるでしょうけれど。 -- henoheno
- 1.4.4rc1, 1.3.8rc1のリリースを受け、まずは漢字コード・改行コードの統一を行いました。 (See 開発日記/2004-08-04) -- henoheno
- 文字コードに関してですが、CVSリポジトリ内は今後もEUC/LFで推移し、リリース作成スクリプトによってEUC版とUTF-8版をそれぞれ用意する事でユーザーニーズに答えるのが良かろうと考えています。CVSリポジトリにUTF-8を持ち込むと、開発および監査(ツール含む)のあらゆる部分に影響が出ます。またマルチランゲージの初期コンテンツを作る予定があるわけでもないため、初期コンテンツがUTF-8でなければならない理由はありません。もちろんソースが常にUTF-8である必要はありません -- henoheno
ええ道具は悪くありません XD
各自が使っているツールや、その設定によっても再発する問題ですから
Last-modified: 2010-03-08 (月) 13:19:57