最近のChaSenはipadicに無い単語の読みを得ようとする(-F%y)と削除されてしまいます。そんなわけで読みが正しく得られず、索引ペイジの分類が正しく行われません。
--- func.php.orig Sun Nov 16 21:17:22 2003 +++ func.php Wed Nov 26 23:13:58 2003 @@ -314,7 +314,10 @@ $str .= "</li>"; if($pagereading_enable) { - if(mb_ereg('^([A-Za-zァ-ヶ])',$readings[$page],$matches)) { + if(mb_ereg('^([A-Za-z])',mb_convert_kana($page,"a"),$matches)) { + $head = $matches[1]; + } + elseif(mb_ereg('^([ァ-ヶ])',$readings[$page],$matches)) { $head = $matches[1]; } elseif (mb_ereg('^[ -~]|[^ぁ-ん亜-熙]',$page)) {
こんな感じでどうでしょう?
大阪近鉄バファローズ オオサカキンテツ 大阪近鉄バファローズ/順位表 オオサカキンテツジュンイヒョウバファローズが出力されない
おすすめの1冊/ガールズセックス オススメノイチサツガールズセックスが出力されない
ウェブ作成 サクセイウェブが出力されない
CSS2のプロパティの値と継承関係 シーエスエスニノノネトケイショウカンケイプロパティが出力されない
ぱんだ ンダパが出力されない
ぷらぷら競馬/2004-01-31 ララケイバニゼロゼロヨンゼロイチサンイチやはり「ぱ行」がダメ
れいみぃ レイミィが出力されない
ふぇんにっくす フンニックスェが出力されない
備忘録/特殊フォルダでexplorerを開く ビボウロクトクシュデイーエックスピーエルオーアールイーアールヲヒラクフォルダが出力されない
:RenameLog background: background-attachment: Information InterWikiName RecentChanges ぷぅ ペーター読みが出力されない。しかし、background-image:やbackground-repeat:、Ikegamiはちゃんと読みが出力される。
んーん ンン音引きが出力されない
漢字 | ChaSen/Kakasiへ → 全角カタカナ |
ひらがな | 全角カタカナへ変換 |
全角カタカナ | そのまま |
全角英数字・記号 | ASCIIへ変換 |
半角カタカナ | 全角カタカナへ変換 |
ASCII | そのまま |
./.libs/libmecab.so: undefined reference to `pthread_mutex_unlock' ./.libs/libmecab.so: undefined reference to `pthread_mutex_lock' ./.libs/libmecab.so: undefined reference to `pthread_mutex_init' *** Error code 1 Stop in /hogehoge/bin/mecab-0.77/src. *** Error code 1 Stop in /hogehoge/bin/mecab-0.77. *** Error code 1 Stop in /hogehoge/bin/mecab-0.77.
elif test "X$arg" = "X-lc_r"; then case $host in *-*-openbsd* | *-*-freebsd*) # Do not include libc_r directly, use -pthread flag. continue ;; esac以前はpthreadを使えるようにするにはlibc_rをリンクするようにしてましたが、これはobsoleteになっている(で合ってる?)のにMeCabではlibc_rを使うようになっています。
ぱんだ ンダ
になるのは「ぱ」が未知語だからです。
% echo 'ぱんだ' | chasen ぱ 未知語 ん ン ん 名詞-非自立-一般 だ ダ だ 助動詞 特殊・ダ 基本形 EOS
で、ChaSenはこれを「仕様」としています。なので、これを回避するための手っ取り早い手段は「ぱ」を辞書に登録してしまうことです(コストを最低にすれば他の辞書に影響は無いハズ)。こうすることで、
% echo 'ぱんだ' | chasen -F %y パンダ
こうなることも確認済です。もし辞書のカスタマイズが許容できる環境であれば、これにより完璧に回避可能と思います。ユーザー辞書を作ってみます。
別手段としてMeCabについても調査中....
パッチを当てて、pukiwiki.ini.phpに
$pagereading_kanji2kana_converter = 'mecab'; : $pagereading_mecab_path = '/usr/local/bin/mecab';としてみてください(パッチmecab.patch.gz)。
言い出しっぺのわたしとしてはChaSenをやめてMeCabを推奨するということで決着したいのですがどうでしょうか? -- よっちい 2004-06-21 (月) 20:27:51