#author("2022-05-01T17:36:04+09:00","","") #author("2022-05-01T17:36:42+09:00","","") * デフォルトコンテンツのページが検索エンジンに引っかからないようにする [#ea96225c] - ページ: [[BugTrack2]] - 投稿者: [[umorigu]] - 優先順位: 低 - 状態: 完了 - カテゴリー: その他 - 投稿日: 2015-07-14 (火) 23:12:27 - バージョン: 1.5.0 - リリース予定バージョン: 1.5.1 ** メッセージ [#lbeb20db] 標準配布状態で Plugin Manual 等が デフォルトコンテンツとして含まれています。 これらのページが通常コンテンツとして検索エンジン等から扱われるため、PukiWiki設置サイトの数だけPlugin Manual が検索結果に含まれてしまいます。 nofollow,noindex等を使って、これらのページが検索対象にならないようにします。 対象: - BracketName - FormattingRules - Help - InterWiki - InterWikiName - InterWikiSandbox - PHP - PukiWiki - PukiWiki/1.4 - PukiWiki/1.4/* 以下すべて (PukiWiki/1.4/Manual/Plugin/A-D etc) - SandBox - WikiEngines - WikiName - WikiWikiWeb - YukiWiki 対象外: - FrontPage - MenuBar なお、公式サイト[[official:FrontPage]]のコンテンツは対象外です。(検索エンジンの検索対象になった方が都合がよいため) *** 実装 [#ld027a5a] - [[commit:6c30f54868803dfa23c9e803215c05562f8e9aa0]] $nofollow / non read のときに X-Robots-Tag: nofollow,noindex HTTPヘッダを出力する -------- - デフォルトコンテンツのうち、マニュアル類には[[nofollow プラグイン>PukiWiki/1.4/Manual/Plugin/L-N#s8c0fa4c]]が仕込まれていたような気が→[[BugTrack2/72]]。&br();なので、[[公式サイトのページ>official:PukiWiki/1.4/Manual/Plugin]]は <meta name="robots" content="NOINDEX,NOFOLLOW" /> を発行していて、凍結されていない[[開発サイトのページ>PukiWiki/1.4/Manual/Plugin]]では #nofollow: Page not freezed エラーメッセージが出ています。 -- &new{2015-07-16 (木) 21:51:18}; -- お、ほんとですね。これは気が付いていませんでした。そうするとたまに引っかかるページは、なんでしょうね。スキンに nofollow の指定があるので、スキンをカスタマイズしてると入らないこともありそうです。 -- [[umorigu]] &new{2015-07-16 (木) 22:56:35}; -- X-Robots-Tag のHTTPヘッダを出力するのが安全なのかな -- [[umorigu]] &new{2015-07-16 (木) 22:57:27}; - 注ぎ足し注ぎ足しアップデートして使い続けているからスキンやデフォルトコンテンツをアップデート対象外にして昔のままに、なんてパターンもありそうですね -- &new{2015-07-18 (土) 21:24:46}; - 検索エンジンのインデックス対象外にしたいファイルに対しては、これまでスキンファイルで HTML metaヘッダとして robots: nofollow,noindex を出力していました。これに加えて、HTTPヘッダの X-Robots-Tag: nofollow,noindex を出力するようにしました。これによりスキンをカスタマイズしていても意図通り「検索エンジンにキャッシュさせない」ことを期待できます。対象はデフォルトで含まれるマニュアルページ(#nofollow + #freese)、それから編集画面などread以外の画面です。 -- [[umorigu]] &new{2016-02-06 (土) 06:58:25}; - cmd=list もX-Robots-Tagでnoindexが出力されますが、このようなURLを示すタイプのプラグインはむしろインデックスしてもらった方が良いのではないでしょうか。 -- [[m0370]] &new{2022-04-27 (水) 08:19:07}; -- (([[BugTrack/2569]]に移動しました) -- ([[BugTrack/2569]]に移動しました) #comment