雑記:アクセス解析関係

JW (エホバの証人)、サイト運営、技術、自己啓発、雑談など雑多な話題を密かに扱う不定期更新の雑記。

アクセス解析関係

いや、どうでもいいことなんですが、他に書くところもないのでこちらにメモっておきます。アクセス解析には、futomi's CGI Cafe 高機能アクセス解析CGI Standard版を使ってるんですが、jcode.plを使っているためUTF-8の文字が文字化けするという不具合がありました。ちょこちょこっと修正したのですが、以下はその時の記録です。単純にJcode.pmを使うように変えてるだけです。以下のように変更してなんとか出来ました。書くほどのことでもないのですが、1ヵ月も経つと忘れてそうなので備忘録として残しておきます。

やったことは

  • professional版等からJcode.pmを拾ってきて同階層に置く
  • acc.cgiを開き、上のほうでuse Jcode;と記述
  • acc.cgiの中に&jcode::convertとなっている箇所が3箇所あるので、&Jcode::convertと修正

また、アクセスログは結構膨大な量になり知らぬ間にサーバ容量を圧迫しそうなので、cronと組み合わせて月毎に圧縮、メールで通知するスクリプトを作成しました。本当は月毎に圧縮、圧縮ファイルをメールに添付して転送というところまでやれれば、後々楽なのですがメールはそこまで信用できないというのと、届いてもスパムメールと間違えて消してしまいそうということで保留ということに。。

スクリプトはこんなのです。perlの記憶が曖昧ということもあって汚いソースですが、まあ使い捨てのソースなのでいいかなと。やってることはhoge/access_log.YYYYMM00.cgiというアクセスログファイルの行数を調べた上、hogeYYYYMM.tgzというファイルに圧縮、結果をメールで通知しているだけです。cronで毎月の月初めにこのスクリプトを実行するように設定してやれば、まあ、ログファイルの増加が少しは抑えられるかなと。こんなスクリプトでも欲しいという奇特な方は自己責任の上、適当に煮るなり焼くなりしてください。日本語非対応ですが。/home/yosh/scripts/backup.plにデータがあるとしてcrontabで

0 5 1 * * /home/yosh/scripts/backup.pl
とでも設定してやればいいでしょう。この場合だと毎月1日の5時にこのスクリプトが実行されます。

(2006/12/1追記)悲しいことに、tarのところで

 "tar: Removing leading `/' from member names" 
というメッセージが出てうまくいきませんでした。そうこうしているうちに間違えて圧縮したファイルを上書きしてしまって、ログデータが全部消えてしまいました。自動化の怖いところはこういうところですよね。。不具合を解消し、圧縮したファイルを上書きしないようにプログラムを少し書き換えました。件のエラーは、tarでアーカイブに納めたいファイルを指定する場合は通常、相対パスで指定しないといけないみたいで、絶対パスで指定したために起きたエラーでした。なるほど、ひとつ痛い目にあって知識が増えました。。1月1日こそはきちんと動いて欲しいです。。

(2007/1/1追記)動いてくれてました。うれしい。。

2006年10月20日07:00投稿 | 技術的なこと | Comments (4) | Trackbacks (0)

この記事に対するコメント

yoshさん、こんにちは。わたしもfutomiさんのCGIプロ版を使ってまして、2カ月前と数日前にブログで文字化けが起りました。seesaaブログのヘルプを検索しても文字化けについては書かれていず、原因は分かりませんでしたが、CGIのバグだったんでしょうか。
 プロ版では「&jcode::convert」と、j が小文字になっていた所が2個所、大文字の所が2個所あったので、大文字に統一しました。これで文字化けとおさらばできるといいのですが(^^ゞ。
 yoshさんの所にくるといろいろ勉強できてとっても助かってます。
 ところで関係ない話ですが、このところ、メール送信フォームとブログのコメントに、ドイツのIPアドレスから迷惑な書き込みをされました。ところがログにはまったく足跡を残していないんですよね。個人サイトへのログイン履歴にもありません。これって、さくらのサーバーに不正アクセスして書き込んでいるんでしょうかね~?
 問い合わせをしてみようかと思っているんですが、どう思いますか? ログに記録されてないということは、いくらアクセス禁止にしても効果がないわけですよね?

Posted by 野バラ at 2006年10月27日 08:03

futomiさんのCGI、結構良いですよね。Professional版の方が使いやすいんですが、まあ送金するのもなあと思いつつ今はStandard版を使ってます。Professional版なら元々UTF-8に対応しているので特になにもしなくても良いと思うんですが、なんで文字化けしたんでしょうね。

>ところがログにはまったく足跡を残していないんですよね

これって↑のfutomiさんのアクセス解析CGIのログのことですか?このアクセス解析はJavaScriptを使ってるので、JavaScriptをオフにしているブラウザあるいはそもそもJavaScriptの機能がないブラウザだとログに残らないですよ。例えば検索エンジンのクローラーのログなんかもこの系統のアクセス解析では見れません。さくらのレンタルサーバ自体が提供しているアクセスログ(コントロールパネルから見れる)ではそういうログでも見れるんですが、ログを保存するように設定していればそちらには残ってるかと思いますよ。ちなみに、IPアドレスによるアクセス禁止は効果はあります。

不正アクセスするくらいだったらサイトの内容を消したり書き換えたりウイルス等を仕込んだりするか、気づかれないように裏でこっそりと何かをするかだと思うので、不正アクセスではないと思いますよ。

Posted by yosh at 2006年10月27日 11:42

お忙しいところ、レスありがとうございます。

>futomiさんのCGI、結構良いですよね。Professional版の方が使いやすいんですが、まあ送金するのもなあと思いつつ今は Standard版を使ってます。

私もどうしようか、迷ったんですけどね(^^)。
http://tech.bayashi.net/ ←こちらも結構いいかもしれないですよ。カウンターも兼ねてますし、無料ですし。「Movable Type プラグイン・アクセサリ」もたくさんあるのでお役に立つでしょうか??

>Professional版なら元々UTF-8に対応しているので特になにもしなくても良いと思うんですが、なんで文字化けしたんでしょうね。

あ、そうですか? じゃ、原因は別の所にあるんですね。それにしても突然、いくつかの文字が化けてしまうと、探し出すのが大変なんですよね。

>>ところがログにはまったく足跡を残していないんです
>これって↑のfutomiさんのアクセス解析CGIのログのことですか?

言葉が足りませんでしたが、さくらのAccess Analyzerが解析している生ログのことです。Googlebotとか、ブラウザを使わずにBBSやメールアドレスを探す回っているようなアクセスも記録されていますが、ブログのコメント欄への広告目的のコピペや、BBS、メール送信フォームへの書き込みで記録されないものがあるんですよね(BBSは適当にファイルの属性を変更したら書き込みできないようになりました)。どうやって書き込みをしているのやらと思ってしまいます。

>ちなみに、IPアドレスによるアクセス禁止は効果はあります。

ログファイルにはなくても、ブログのコントロールパネルにはIPアドレスが記録されているので、禁止IPに登録することにします。トラックバックなどはIPアドレスを次々変えてアクセスしてくるので、ワイルドカードが使えたらいいんですけれど駄目みたいですね。知識があれば可能なのかもしれませんが(^^ゞ。

Posted by 野バラ at 2006年10月28日 07:00

apacheのアクセスログに残らず書き込む方法があるのかな?あまりわからないですが。。

ワイルドカードを使うのなら.htaccessを使う手もあるかと思いますが、さくらのブログでは使えなかったかも。。

Posted by yosh at 2006年10月28日 12:24


コメントを投稿する




スパム防止のため以下の5文字の英数字を入力してください。
(読み難い場合は、このページを再読み込みしてください):


このブログについて

  • このブログは「元エホバの証人2世のメモ」および「元エホバの証人ポータル exjw.org」の管理人yoshのブログです。JW(エホバの証人)のことだけではなく、サイト運営、技術、自己啓発、雑談など雑多な話題を徒然なるままに書いております。「エホバの証人」というテーマに対して、Web技術という観点から何かできることがないかを現在模索中です。

カテゴリ

最近のエントリ

関連リンク

RSS

Syndicate this site (XML)

カウンタ

  • 合計:total
  • 今日:today
  • 昨日:yesterday

Powered by

本ブログはMovable Type 3.33-jaで作成されております。

本サイトはさくらのレンタルサーバ上で運営されております。