ChaSenを使った場合ペイジの読みが正しく得られない

メッセージ

最近のChaSenはipadicに無い単語の読みを得ようとする(-F%y)と削除されてしまいます。そんなわけで読みが正しく得られず、索引ペイジの分類が正しく行われません。

--- func.php.orig       Sun Nov 16 21:17:22 2003
+++ func.php    Wed Nov 26 23:13:58 2003
@@ -314,7 +314,10 @@
                $str .= "</li>";
                
                if($pagereading_enable) {
-                       if(mb_ereg('^([A-Za-zァ-ヶ])',$readings[$page],$matches)) {
+                       if(mb_ereg('^([A-Za-z])',mb_convert_kana($page,"a"),$matches)) {
+                               $head = $matches[1];
+                       }
+                       elseif(mb_ereg('^([ァ-ヶ])',$readings[$page],$matches)) {
                               $head = $matches[1];
                       }
                       elseif (mb_ereg('^[ -~]|[^ぁ-ん亜-熙]',$page)) {

こんな感じでどうでしょう?



*1 ChaSenに比べると多少精度は落ちますが。

添付ファイル: filemecab.patch.gz 975件 [詳細] filechadic_puki.tar.gz 967件 [詳細]

トップ   編集 凍結 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2005-04-21 (木) 22:02:05
Site admin: PukiWiki Development Team

PukiWiki 1.5.4+ © 2001-2022 PukiWiki Development Team. Powered by PHP 8.2.12. HTML convert time: 0.291 sec.

SourceForge