このサイトのアクセス解析を始めて一週間くらい経ったので、「パッと見」で(厳密に見てはいないし、追って「精査」なるものをすることもないw)傾向が分かって来た。いくつかおもしろいことがあったので、併せて書く。
- アクセス頻度: 予想外にアクセスが多かったが、絶対値としては田舎のバスみたいなものでw、約3分に1回程度(約500PV/日)だ。まあ、高速化とか処理効率はあまり突き詰めずに構築しているので、このくらいでいいかと思う。逆に、もし千件/分とか来たら、サーバは持つのだろうか?w
- ユニークIPアドレスは250件/日前後なので、1アクセス(人)で2ページ程度閲覧されているようだ。
- アクセス元の地域: ほぼ日本のみ(約85%)。東京、神奈川、大阪、千葉が多い感じ。海外はUSが多い(約5%)。
- 意外なのは、イランやミャンマーからもアクセスがあったこと。ボットやクローラー(自動収集ソフト)かも知れないが、なんか意外だ。
- USはAmazon AWSからが結構ある。UA(User Agent: ブラウザなどの識別記号)は普通のブラウザだが、クローラーやボットなのだろうかと思う。Amazonの商品販売の基礎情報などとして使っているのだろうか?
- アクセス元ページ(リファラー): Googleが圧倒的(日本とUS。全アクセスの約44%)、次はYahoo! Japan(同約10%)。 → 検索サイトからのアクセスがほぼ半分。Googleには逆らえない。
- おもしろい検索: 大昔のポールの麻薬逮捕の話 (近頃来日していたうえに、題が良かった?w: びっくりして来られた方、済みませんでした。)
- おもしろくない検索: とんでもないバックアップソフト、AOSBOXの話 (これについては全く書きたくない)
- なお、このサイトは長くhttpだったため、Googleから来る時に検索語がなくなってしまうため、検索語が分かるのはそれ以外の少ない検索サイトからなので、本当に多いものは分からない。十中八九、MusicBee関係だと思うが。
- 言語: 日本語(アクセス元がほぼ日本のみなので。約80%)
- ブラウザ: Chrome系(約48%)、Firefox系(約15%)、Safari、IE、Edge(それぞれ約9-8%)
- Vivaldi(1.3%)はまだまだ弱小派閥のようだ。
- OS: Windows (約80%)、iOS、Andoroid(それぞれ約10%)
- もちろん、Linuxは弱小派閥(約4%)。でも、MacOS(2.3%)よりは多い。が、ここにはAppleやMacの(いい)話が全くないせいだと思う。
- 人気コンテンツ: もちろん、MusicBee関係: アクセス上位ページの9位までを占めている(9位までの合計は全アクセスの約56%)。1位は「MusicBeeの使い方 (入門編)」。
- 意外に/なぜかアクセス数が多いページが結構ある: 「カーナビのTVを写らなくする方法」(やっぱりねえ・・・)、右膝膝蓋骨骨折の話(割ってしまう人が結構多い?)、「いろいろ遅れている」(海外からが多い。アクセスされる理由が不明)、小物干しの修理の話(壊れやすいのか?)、ルガンスキーのコンサートの話(なぜか、日本とマレーシアが同じくらい(30%前後)。近頃来たのと人気があるのか?)。
- その他
- そういえば、時々、画像ファイルapple-touch-icon*.pngがHTTP 404(ファイルなし)になっている。なんだか知らないが、Appleは独自のサイトアイコンを作れと言っているようだ。仕方がないのでちょっと作ったが、いくつものファイル名で取りに来るので、404がなくならない。
カスな高飛車な会社は本当に嫌だなあ・・・ どこまで自分(テメエ)の勝手を押し付ければ気が済むのか?! 今気付いたが、OGPで取ればいいじゃないか。
- そういえば、時々、画像ファイルapple-touch-icon*.pngがHTTP 404(ファイルなし)になっている。なんだか知らないが、Appleは独自のサイトアイコンを作れと言っているようだ。仕方がないのでちょっと作ったが、いくつものファイル名で取りに来るので、404がなくならない。
アクセスログを眺めていると、自分でも忘れていて「ん、これって何だっけ?」と思う投稿が結構あって、おもしろい。そして、自分で見返したりする。
ちなみに、仕事サイトの方はまだまだで、まさに田舎のバスそのものであるw 右肩上がりに少しずつ増えて来てはいるが、アクセス頻度はここの1/25程度だ。しかも、ほとんどは機械(クローラー)のようだ(クローラーなどはUAでフィルタリングしているのだが、アクセス元はUSが多いので、人間ではない気がする)。まあ、そうやって機械に親しんでもらえば、いつか人間も来てくれるのではないか?
なお、アクセス解析はGoogle Analyticsが有名ではあるが、個人的には使いたくない。まず、トラッキングコードをページに仕込み、大抵のサイトではその表示はないので(それでも継続してトラッキングされる)、訪問者が知ったら嫌な気分になるだろう。また、ブラウザ設定で出せる、トラッキングを拒否するヘッダー(DNT)が反映されるかも不明だから(多分しない)、グレーな感じがする※。そして、トラッキングコードを無視するブラウザ(コードはJavaScriptなので、無視するのはクローラーやボットだけかも知れない)ではカウントされないから、精度が落ちる可能性がある。極めつけは、集計結果が1日後にしか出ないから、見ていてつまらないことだw
※DNT(Do not track)ヘッダの解釈は定まっていないようですが、本サイトでは、「トラッキング」は「時間的に継続した追跡」と解釈し、DNTヘッダはそれを拒否するものと解釈しています(もし、「解析を行うな」というものであったら、"Do not analyze"のような名前になったでしょうし、ブラウザの設定にもそのように書かれるでしょう)。つまり、個々の来訪時の解析は行いますが、再訪時に再訪と分かるような、継続的に個人を識別するための仕組み(→ クッキー)は使わないことにし、その類の解析(例: 再訪率)もしていません。また、IPアドレスの最下位(1オクテット)をマスクして記録することで、GDPRに準拠しようとしています。記録する地域情報(IPアドレスより求めています)も、市区町村ではなく都道府県までにしています。
PS. 自分で解析をしておいてなんだが、サイトにアクセスすると、随分いろいろな情報が渡ってしまうものだと思う。精度は期待できないにせよ、市区町村が分かったら、何となく不安がある。モバイルだったら、高精度な位置が行く可能性がある。あとは、機器の種類・モデルやOSも。もし、特定の個人に悪意のある人がサーバを立ち上げて、その人の情報を集めまくったら、いろいろなことが特定されそうな気がする。まあ、その人がそのサーバに継続的にアクセスしなければ大丈夫だが、今は何が起こるか分からないから、怖い・・・ それへの対処は、いかなる情報もサーバに出さないようにするとか、嘘の情報を出すとか、出す情報をその都度変えるようにするとかか。面倒な世の中になったものだ。。。 そういう訳でTorなどが広まっているのだろうか。(19:27)
コメントを書く / Write a comment