カテゴリ | |
---|---|
サマリ | KAKASI、ChaSenなどを使用しない一覧表示の五十音順分類は可能? |
バージョン | 1.4.2 |
投稿者 | もりー |
状態 | 完了 |
投稿日 | 2004-03-03 (WED) 16:58:44 |
ChaSenもKAKASIも入れることが出来ない環境でPukiWikiを使用しているのですが、ChaSenやKAKASIを使用せずに一覧表示を五十音で分類することは可能でしょうか?
例えば、よく出てくる語句は予め登録しておき、その順番にソートするという感じです。
読みを登録するのが大変面倒だとは思いますけれど、ある程度でも分類できれば見やすくなるのではと思います。自動的に読みを取得できる方がやはり便利だとは思いますが…。何か方法がありましたらお教えください。
読みを入力してやれば、可能なはず・・・。
読みの入力って、ページ名にですか?(ひょっとしたら見当ハズレな質問になってます?)
入力方法を教えていただけますか?
当然、改造しないとできません。
改造しました。以下のパッチを当ててみてください。その上で、一覧表示をすると、:config/PageReading というページができますので、それを編集してください。
-[[日本語]] 日本語となっている行を
-[[日本語]] ニホンゴに書き換えると、「ニ」に分類されるようになるはずです。
ありがとうございました。最初は動かずに「?」という感じでしたが、patchの中に記載されている$pagereading_enableを1にしたらきちんと分類されました。今から読みを追加していきます。本当にありがとうございました。
もう一つついで(?)に教えてください。
例えば、「ほげ/ほげ1」「ほげ/ほげ2」「ほげ/ほげ3」というタイトルの物があったとして、「ほげ」の読みは「ホゲ」と登録します。
別に「1」は「イチ」、「2」は「ニ」というように単語ごとに登録するような、文章の読みを登録するというより、単語の音を登録するようなことは技術的には可能でしょうか?
教えていただいた方法でほぼ完全に動作するのですが、今後、ほぼ同じ読みのタイトルが増える予定ですので、(今でもかなり多いのですが)
そうなると、:config/PageReading がかなりのボリュームになるようなのです。
(今もオンラインでは編集しづらいです。)
いや、可能かどうか聞いたとしても、今の自分ではどうにも出来ないかもしれないのですが…。
なるほど、最初の一文字だけなんですね。納得しました。ありがとうございました。m(_ _)m
くどくなりそうですが、もう一つ教えてください。
「高崎(タカサキ)」「高知(コウチ)」という言葉を今回のパッチをあてない状態の一覧で出すと先頭の文字コードが同じなので近所に分類されます。
これにパッチをあて、読み方を登録してやると、「高崎」は「タ」、「高知」は「コ」の所に分類されるようになります。
それでは例えば次に「高崎ケイバ」という言葉を登録してやると、それは「タ」のところに行くわけはなく、「記号」の所に登録されます。「高知ケイリン」も同様で「コ」の所には行きません。先頭が「高崎」で始まる文字は「タ」に自動的に分類する、「高知」で始まる言葉は「コ」に自動的に分類する、そういうことは可能でしょうか?
勿論これには穴というか、かえって手間を取らせる事態もあると思います。「河野」は「カワノ」と読んだり「コウノ」と読んだりしますので「河野」を「コウノ」と登録した場合、「カワノ」と読むものは間違って分類されます。
こういった物はどちらかの読みで登録してしまうと、必ず手作業での修正が必要でしょうけれども、ある程度の文字の読み方データ(読み方辞書?*2)をPukiWiki自体に持たせることが可能なら少しは楽になりそうだなと思ったまでで…。
感謝の気持ちをpukiwiki.orgへの貢献という形で表していただけるなら、可能です(パッチを作成しますので、ドキュメントを作成していただけませんか? 現在、ChaSen/Kakasiを利用した一覧における日本語ページの分類機能の解説が無く、BugTrack等を見ないとこのような機能があることが分からないはずです。PukiWiki/インストール/1.4系列 あたりに、この機能、および今回の拡張機能の説明ドキュメントを書いていただけると、私としても、やる気がでます(最近、タダでは働かない私・・・ :D))。
ChaSen、KAKASIについて全く理解できてないんですけど、可能でしょうか?(致命的な気さえしますけれど。 :( )
…とか書きながらも手探りで書いてみました。使えそうなら使ってください。
とりあえずはdev:BugTrack/436の内容で。(拡張機能の分は含まれていません。)doc.txt
実装しました。標準のPukiWikiに、パッチpagereading2.patchを当て、ページ :config/PageReading/dict にルールを記述して下さい。ルールについては、サンプル を参照してください。JIS第一水準の漢字が50音順になっていることを利用したルールを記述してあり、ChaSen/Kakasiに比べると遥かに精度は落ちますが、そこそこ分類できます。よく作成するページ(「日記」など)を追加で登録しておけば、かなり自動化できるでしょう。
遅くなりましたが、パッチを当て、ルール記述をするとかなり楽に読みの登録ができるようになりました。ありがとうございました。かなり便利ですよね。ChaSenやKAKASIが使えない環境でも充分日本語の分類ができると思います。さて、ドキュメントですが、近いうちに拡張機能分も追加して、あげておきます。お読みいただいて、分かりづらいところなどありましたら、修正していただけますか?(PukiWiki/インストール/1.4系列 あたりになるんでしょうか? PukiWiki/1.4/ちょっと便利に あたりのような気もしますけど…。)
既に本体に取り込まれているdoc.txtの内容はdev:PukiWiki/1.4/マニュアルの下で一覧表示の五十音順分類というページに、拡張機能についてはdev:PukiWiki/1.4/ちょっと便利にの下でKAKASI、ChaSenを使わない五十音順分類 というページにそれぞれ作成するのはいかがでしょうか?
にぶんのにさん、はじめまして。アドバイス、ありがとうございます。とりあえず、一覧表示の五十音順分類に先に作成したdoc.txtをアップしました。KAKASI、ChaSenを使わない分類の方は近日中にまとめたいと思っております。
もりーさん、ドキュメント作成ありがとうございます。今回の拡張機能は、本体に取り込んでもらうよう、dev:BugTrackに提案しておきます。あって邪魔になる物ではないので、多分、次期リリースには取り込んでもらえると思います。この拡張機能のドキュメントは、にぶんのにさんのおっしゃるように、とりあえずはdev:PukiWiki/1.4/ちょっと便利にに作成してもって、本体に取り込んでもらえたら、dev:PukiWiki/1.4/マニュアル/一覧表示の五十音順分類にマージするというのが良いですかね。っていうことで良いでしょうか?>Web委員の皆様
pagereading2.patchをpukiwiki1.4.3にあててもパッチ失敗のメッセージが出ます。:config/PageReadingで読みを設定し直しても:config/PageReading/dictで設定しても五十音順に反映されませんでした。ご報告まで。
現在は本体に取り込まれていますので、パッチを当てなくても使えるはずなのですが・・・