鈴木です。別館

「アフィリエイト広告」等の広告が掲載してある場合があります

アクセス解析担当者が知っていないと危ない相関係数について

はてなブログの「鈴木です。」は更新を(おそらく)停止しました。

ブログはWordPressにて継続しているので、よければ是非訪れてください。

>鈴木です。~鈴木利典 公式ブログ~

なお、ちょっと黒い鈴木はnoteをご覧ください。

>鈴木です。(note)

~ここから本文です~

昨日のPVや訪問者数に正直、ビビっている鈴木です。
ご来場頂いた皆様、本当にありがとうございますm(__)m

結果数値は下記の通りです

結果数値

PV:6091
セッション数:5138
UU数:4893

先月の鈴木ですの3倍以上の数字です(^^;
どんだけ弱小ブログなんだよ・・・・・

それで、今までに、はてなブックマークが多かった記事の数字をまとめてみました。

過去5件のはてブが多いエントリー

f:id:suzukidesu23:20140405100345p:plain

こんな感じです。

これに散布図と相関係数を付け加えてみます。

散布図と相関係数1

f:id:suzukidesu23:20140405100449p:plain

ツイートとはてぶで散布図としてみました。

相関係数について

相関係数は、0.99なので相関は強いという事になります。

相関係数は、Aが○○なら、Bは○○となる傾向がある、というものを見る時に使う係数(度合い)ですが、下記のような感じになります

0.2未満:関係ない

0.2~0.4:弱い(関係ない事も無いけど・・という感じです)

0.4~0.7:中間の強さ(関係ある)

0.7以上:強い(めっちゃ関係ある)

*Wikipediaより()内は鈴木の表現

 上の散布図だと解りにくいので、解りやすい散布図に

f:id:suzukidesu23:20140405100946p:plain

グラフで右上がりが綺麗なほど、相関が強いという事になります。

つまり、はてぶやツイートをしてもらえばもらうほど、PVは増えていくという事が分かりますよね。

まあ、こんな事、誰でも知っているんですけどね(^^;
ただ、実際の現場だとこんなに綺麗な数字になる事も少ないため、実際にはもっと歪なグラフになります。

その時に、本当に相関があるのかどうか確認するために、相関係数を出します。

相関係数のエクセルでの出し方

エクセルの2013なら、物凄く簡単に出せますが、一応、エクセル関数という形では下記の図のようになります。

f:id:suzukidesu23:20140405101803p:plain

=PEARSON(A:2A6,B2:B6)

 となります。
もう少し詳しく書くと、A列にはてブの数、B列にPVとした場合、
その近くのセルに 「=PEARSON( 」と入力して、最初にA2~A6を選択してカンマを入力し、次にB2~B6を選択して、)で閉じるという事になります。

文系出身のアクセス解析担当者

相関係数は、アクセス解析では割りと行いますが文系出身の場合、知らない人が割りといるんだな~と最近知りました。
と言っても、鈴木も半年くらい前に覚えたものですが(^^;

1年くらい前にこんな本を買いました。

統計学が最強の学問である

統計学が最強の学問である

 

 これを読んでから、統計学を少しは覚えないとやばいな~と薄っすら思いました。
ちなみに、これを読んだ時はアクセス解析の担当者ではありませんでした。

しかし、専門書は本当に難しいのでまずは簡単なものから覚える事に
(文系だと本当に解らないと思います)

Excel対応 90分でわかる! 日本で一番やさしい「データ分析」超入門

Excel対応 90分でわかる! 日本で一番やさしい「データ分析」超入門

 

 きっかけ作りにはこの辺りの本が最初は読みやすいかな~と思います。

根拠のある数字だと自分では思っても統計学的には意味が無い場合というものもあります。
もちろん、統計学だけが重要という事ではありませんが、知っていて否定するのと知らずに否定するのでは、まったく意味合いが異なりますよね。

まずは、簡単なデータ分析から学んでいくのが良いのかな?と思います。

ついでに

アクセス解析担当者

ところで、アクセス解析担当者というのは、どんな仕事なの?と思うかもしれませんが、実際にはこんな担当者少ないと思います。
ウェブマーケティングと兼任しているとか、営業が独自で行っているとか、そんなところでは無いでしょうか?

アクセス解析担当者のイメージとしては、Google Analyticsでデータを出して加工してるようなイメージがあるかもしれませんが、鈴木の場合はむしろ、出したデータが本当に正しいのかを検証している事が多かったように思います。

例えば、あるアクセス解析ツールで出したデータで下記のようなものがありました。

PV:500
UU:400
セッション数:380

解る人ならすぐに解るのですが、絶対に存在しない数字です。
セッション数がUU数を下回る事は絶対にありません。
しかし、そうなってしまう事も実際にはあります。
これは、ツールの設定の問題でしたが。
下記がPVとUUとセッションの関係を表した不変の公式です。

f:id:suzukidesu23:20140405105803p:plain

 

こうならない時は何かがおかしいので確認して下さいね。

まとめ

  1. はてブ、ツイート数とPV数は多いに関係がある。
  2. それは相関係数から言える
  3. アクセス解析担当なら統計学及びデータ分析の知見を持つべき
  4. アクセス解析担当者って?(各社により大きく異なる)
  5. PV・UU・セッションの不変の公式を覚えよう

という事で、アクセス解析やデータ分析ははまると、結構面白いですよ。

 

© 2015 suzukidesu, ALL RIGHTS RESERVED.
文章並びに画像等、すべての著作物の盗用&不正利用・転載を禁止します。特にまとめサイト(NAVER・RETRIP等)での使用を固く禁止します。また、無断で使用した場合は使用料を請求いたします。詳しくはこちらのエントリーをお読み下さい。