クローラー用サイトマップを生成するGoogle XML Sitemapsプラグインを使う

クローラー用サイトマップを生成するGoogle XML Sitemapsプラグインを使う

WordPressプラグインで人気の、Google XML Sitemapsプラグインを使って、クローラー用サイトマップを生成してみました。

Sitemapって必要なのか

コンテンツを検索エンジンに認識してもらうために必要なもの。
サイトマップを用意しないと、検索エンジンがページ収集をしてくれず、GoogleやYahoo!の検索結果に反映されるまでに時間がかかる可能性がある。

Sitemapってなにか

Googleなどの検索エンジンにウェブサイトの情報を素早く認識してもらうために利用されるファイル。一般的に、sitemap.xmlというファイル名で用意する。

Google XML Sitemapsを選んだ理由

WordPressプラグイン「Google XML Sitemaps」が、200万ダウンロード超え、レビューも星5つを獲得している人気のプラグインだから。
また、無料で全機能が利用できるようになっていることもメリット。

Google XML Sitemapsの設定

基本的な設定

「通知を更新」はサイトマップURLを明示化し、更新ごとに通知をした方が良いので、チェックする。
高度な設定は、デフォルト設定のままとした。

コメントを投稿させないページだったり、記事ごとに優先順位を付けないので、
「優先順位を自動的に計算しない」を選択

サイトマップに出力するページを選択する。
「最終更新時刻を含める」は推奨されているので、チェックする。

変更頻度は、こんな感じで行った。
プラグインによっては、カテゴリー別ページが正常に設定されないケースがあるようで、タグページにもカテゴリー別と同じ値をセットするとよいそう。

優先順位を指定する。
こちらも、タグページとカテゴリー別を同じ値にする

出力確認

以下のURLにアクセスすると、生成されていることを確認する。

https://[ドメイン]/sitemap.xml

Nginx サーバの場合

sitemap.xmlが正常に参照されないケースがあるようで、404にならない対策として、以下のrewriteをしなさいというワーニングが出ていたので、serverディレクティブ内のssl_certificate server.crt; の上あたりに、追記した。

   rewrite ^/sitemap(-+([a-zA-Z0-9_-]+))?\.xml$ "/index.php?xml_sitemap=params=$2" last;
   rewrite ^/sitemap(-+([a-zA-Z0-9_-]+))?\.xml\.gz$ "/index.php?xml_sitemap=params=$2;zip=true" last;
   rewrite ^/sitemap(-+([a-zA-Z0-9_-]+))?\.html$ "/index.php?xml_sitemap=params=$2;html=true" last;
   rewrite ^/sitemap(-+([a-zA-Z0-9_-]+))?\.html.gz$ "/index.php?xml_sitemap=params=$2;html=true;zip=true" last;

   ssl_certificate      server.crt;
   ssl_certificate_key  server.key;

Nginxを再起動して、記事を公開してみると、ワーニングが消えた。

Web技術カテゴリの最新記事