« デジ埋2007年11月のpv上位リスト | トップに戻る | Forza2でウィリー! 定番のCarreraセッティングから、禁断のバック・ウィリーまで » |
2007年12月01日
jsのURLにパーマリンクURLを入れて、Webサーバのログでpvを集計する 
■2007/11/30 [デジ埋2007年11月のpv上位リスト]
昨日の記事でもちょっと触れましたが、月に1度カウントしている記事別の
アクセスランキングは、Webサーバの ログから直接集計 しています。
そのため、検索ボットやスパム のアクセスもここに含まれていることになります。
上記の記事では、Webサーバのログをソースにすると、月刊のページビュー(PV)は
27万PV ありました。一方で、Google Analytics で見ると 約10万 に
なっていますので差が17万あります。ところが、User Agentで主な検索ボットなどの
アクセスを数えてみると、せいぜい 3割(8万PV)程度 しかありません。
では、もう3割は一体何だったのかと、これがずっと不思議だったのですが、
どうやら推測するに、これは検索ボット以外のスクリプトによるアクセスのようです。
1つには スパマーさんがURL収集のために 使っているスクリプトがあります。
それから、もっと善良なものとしては、Webブラウザの 先読みプラグイン なども
一度に大量のアクセスを発生させる要因になります。これらがいろいろあわさって
残りの3割を占めているのではないかという推測を、今のところはしています。
そこでもうちょっと 「人間によるアクセス」 をうまくログに残せないかなと思って、
Google Analytics と同じようにカウント用のjavascriptを1つ噛ませてみることに
しました。方法は至って簡単ですので、ここでご紹介しておきます。
昨日からこんな 1行のスクリプトタグ を各ページに挟みました。
<script language="javascript" type="text/javascript" src="/pvcount/blog/entryurl/(記事のパーマリンク)" charset="EUC-JP"></script>
一方で、そのsrcに指定された先のスクリプトはどうなっているのかといいますと、
RewriteEngine On
RewriteRule ^pvcount/blog/entryurl/(.*)$ /pvcount/blank.js
こんな感じで、mod_rewrite の設定で全部同じ 空の.jsにマッピング してあります。
Webページ上に何も表示されないのはモチロンのこと、処理も何1つ行っていません。
つまりこれは、WebサーバのログにパーマリンクURLを刻み込むためだけに
挟み込まれているスクリプトになっています。集計はWebサーバのログから
この形式の行をgrepなり何なりすれば簡単に抜き出せますので、
あとからいくらでも集計することができます。
javascriptですので、一般的なボットや先読みスクリプトなどがこのjsを
辿って読んでいく意味はありません。となると純粋に一般的なユーザが
一般的なブラウザで読んだときだけカウントされることになるという寸法です。
ただ、javascriptの実行をオフにしている方や、携帯、テキストブラウザ(w3mなど)からの
アクセスも見えなくなってしまいますので、今度は実際の数字より若干減ってしまうのですが、
少なくともボットなどを全部カウントした数字よりは有効な結果が得られるでしょう。
こうした処理をCGIでカウントすると、PVに比例したCGIプロセス起動が必要となり、
サーバ負荷にも影響が出てしまうのですが、このように ログに刻み込むだけ であれば
jsのURLにID(=ここではパーマリンクURL)を含めておいて、その先は全部空のjsに
マッピングするというのは案外といろいろな場面で応用ができそうです。
来月からのランキング集計は早速この数字を使ってみたいと思います( ・ω・)
投稿者 CK : 2007年12月01日 23:59 | ブログ
« デジ埋2007年11月のpv上位リスト | トップに戻る | Forza2でウィリー! 定番のCarreraセッティングから、禁断のバック・ウィリーまで » |
▼ はてなブックマークのコメント ▼
▼ コメント ▼
ご自由にコメントください(=゜ω゜)ノ
※管理人は多忙のためお返事はほとんどできません(スミマセン)。スパムおよび本文と無関係なコメントは削除対象になる可能性があります。
▼ トラックバック ▼
このエントリーのトラックバックURL:
このリストは、次のエントリーを参照しています: jsのURLにパーマリンクURLを入れて、Webサーバのログでpvを集計する:
トラックバック時刻: 2007年12月07日 23:53
» 【アクセスアップ】 アクセス安定していますね from 1日1Blog。eブログ作成情報局,jsのURLにパーマリンクURLを入れて
アクセスランキングが
安定した数値で推移。
[続きを読む]





