雑記:Google Sitemap

JW (エホバの証人)、サイト運営、技術、自己啓発、雑談など雑多な話題を密かに扱う不定期更新の雑記。

Google Sitemap

世の中にはGoogle Sitemapという、Googleにサイトを効率よく巡回してもらうようにサイトマップを登録できるサービスがあるようです。サイトマップを指定の形式で書いて自サイトに置いておき、その置いた場所をGoogleに通知するだけで良いようです。そういうサービスがあるのなら利用してみようというわけで、さっそくGoogle Sitemapを使って本サイトのサイトマップを登録することにしました。手順はそれほど難しくはないのですが、今後のために一応ここにメモしておきます。

サイトマップは手書きでも良いのですが、それだとめんどくさいのでGoogleが用意してくれているSitemap Generator (python2.3以上が必要) を使いました。また、ローカルでこのスクリプトを実行しサイトマップを作成、アップロードしてもいいのですが、cronで定期的にスクリプトを実行させる方がわざわざサイトマップをアップロードする必要がなく楽なので、サイトマップはサーバ上で作成することにしました。Sitemap Generatorの設定に詳しく設定法が載ってますが、ここでは設定用のXML (configfile.xml) を非常に簡単に

<?xml version="1.0" encoding="UTF-8"?>
<site
 base_url="http://yosh.exjw.org/"
 store_into="/path/sitemap.xml.gz"
 verbose="1"
 >
 <directory
  path="/path/"
  url="http://yosh.exjw.org"
  default_file="index.html"
 />
 <filter action="pass" type="wildcard" pattern="*.html" />
 <filter action="drop" type="wildcard" pattern="*" />
</site>
としました(一部、改変しています)。拡張子が.htmlのファイルを全てサイトマップに追加しています。その後、
$ ./sitemap_gen.py --config=configfile.xml
とサーバ上で実行し、サイトマップsitemap.xml.gzを生成しました。

あとはこのsitemap_gen.pyを定期的に実行、サイトマップファイルを更新するよう、cronの設定をすれば、今後は自動的にサイトマップが更新されGoogleに通知され続けるはずです。

$ crontab -e
ここでは更新は1週間に1回にしました。たとえば日曜の5時半に自動的に実行するにはこんな感じに設定を書けばいいと思います。
30 5 * * 0 cd /path/;./sitemap_gen.py --config=configfile.xml

さくらレンタルサーバのスタンダードプランはsshに加え、cronを含むたいていのコマンドが使えるのが便利なところです。なお、サイトマップでは、各HTMLのプライオリティ、Googleが見に来る頻度(の目安)などいろいろ設定できるようですので、もっときちんと設定したほうが良いかもしれないです。

(追記)
ここでは、cronを使ってますが、サイトマップに追加すべきHTMLファイルのほとんどがMovableTypeからのものであれば、ここにあるように、直接MovableTypeからサイトマップを生成するようにした方が効率がいいかもしれません。

2006年04月17日07:00投稿 | 技術的なこと | Comments (5) | Trackbacks (3)

この記事に対するコメント

yoshさん、お久しぶりです。
この記事に対するコメントではないのですが、どこに書いて良いのか分からなかったので、ここへ書かせて下さい。
最近、初めてのホームページ作りにハマっていて、yahooの無料スペースなので色々と制限があるのですが、何とか形だけ作ることが出来ました。制作中は、テンプレートを探すことに夢中で、実はyoshさんのサイトからソースをのぞいて、「一行カレンダー」をもらってしまいました。

本来なら、もらう前に一言相談するのがマナーだったのかもしれない、と後で気が付いて後悔しています。ごめんなさい。
今のところ「一行カレンダー」は、少しアレンジしてHP上の日記帳に使用していますが、もしご迷惑でしたら、すぐにやめますので、仰って下さい。
考えなしに、タブーなことをしてしまって本当にすみませんでした。

HPが完成したら、URL書きますね。このコメント投稿欄の、URL:保存しますか? っていうのは、どういう意味ですか? (初心者で、すみません。)

では、また遊びに来ます。

Posted by kana at 2006年04月29日 21:31

kanaさんお久しぶりです。

このブログの1行カレンダー、僕が作ったものではない(Dr.blogというサイトで配布されていたもの)ので、何とも言いがたいのですが、1行カレンダー程度なら特にたいしたものでもないと思うので、持っていってもらってもいいと思いますよ。

ちなみに、「保存しますか」というのに「はい」と答えると、次回から名前を入力しなくてもすむようになります。
またいつでも来てくださいね。

Posted by yosh at 2006年04月29日 22:43

あら、保存されてない。。なんでだろ。
どこかで設定を間違えてるのかも。

Posted by yosh at 2006年04月30日 02:21

>ちなみに、「保存しますか」というのに「はい」と答えると、次回から名前を入力しなくてもすむようになります。

多分、どこかの設定がまずかったのかなと思いますが、あまりたいした機能でもないので、消しました。。。本当は、クッキーに名前が記憶されて、次回から名前を入力しなくてもすむ、という機能だったんですが。。

Posted by yosh at 2006年04月30日 02:25

わーん。
許して頂いて ありがとうございます。
Dr.blog、検索してみますね。

HPはまだ制作中ですが、一応URL残しておきます。もう少ししたら、何とか見られる形になるかと思いますので、よかったら遊びにいらして下さい♪
本当に ありがとうございました。

Posted by kana at 2006年04月30日 09:33


コメントを投稿する




スパム防止のため以下の5文字の英数字を入力してください。
(読み難い場合は、このページを再読み込みしてください):


この記事に対するトラックバック

このブログについて

カテゴリ

最近のエントリ

関連リンク

RSS

Syndicate this site (XML)

カウンタ

  • 合計:total
  • 今日:today
  • 昨日:yesterday

Powered by

本ブログはMovable Type 3.33-jaで作成されております。

本サイトはさくらのレンタルサーバ上で運営されております。