2015年01月13日
ここ(自分)のブログに投稿した記事の数と、アクセス数を年ごとに集計し、その変遷を調べました。 ま、一種の終活のようなものです。笑 2013年の初頭に目論んだ予定(見通し)が、その後どういう結果になったか、という報告でもあります。
その時に作った、投稿記事数とアクセス数の将来見通しを再掲します。 2012年までは実績値、2013年以降は予定値です。 対して、2013年と2014年の実績がどう経過したかを見ると、 2013年以降の記事数はほぼ目論見通りですが、アクセス数は見通しと大きく異なっています。 この差異の原因は明らかで、2012年の末にサーバーが移行してアクセス数が減ったということでしょう。 毎日のアクセス数の変遷を見ても、2012年の末に大きなギャップが見られます。 日別値を藤色でプロットし、平滑化(データ30個の移動平均)した値を紺色で示してあります。 自分のとこだけを見ててもダメなので、「週間アクセスランキング」に発表されている1位から50位までのアクセス数を合計して、その変遷も見てみます。 やはり同様に、2012年の末に大きなギャップが生じています。 ただし「減った」という表現は見当違いで、それまで不自然に増えていたのが「元に戻っただけ」だろうと解釈しました。 他にも、突然にアクセス数が急上昇しているように見える時期が何ヶ所かありますから。 そこで、サーバー移行の影響を除いて評価するため、2006年から2012年までのアクセス数にある係数を掛けてみて、スムーズに繋がるような係数を探しました。 何種類か試行錯誤した後、2006年から2012年までの補正係数として、それぞれ 1.0、0.8、0.6、0.6、0.5、0.4、0.4 を採用して補正した結果を下図に示します。 これなら不自然なく連続しているように見え、この辺が真値だろうと思っています。 仮にこれらの補正係数が正しいとするならば、一時期は真値の2倍以上の大きな値に水増しされていたことになります。 ならば次の段階として、それらの係数を用いて年間のアクセス数も補正してみてはどうか、と考えを発展させた結果が下図で、 ウソのように滑らかな変化になりました。(2015年は予定値を設定し直してあります) ついでに、投稿した記事の文字数も調べてみました。 記事の文字を一々数えるのは大変なので、原稿を保存したテキストファイルのバイト数(の半分)を目安にします。 全角と半角の文字が混じっているからバイト数の半分よりは多いかも知れないけれど、画像のファイル名とかリンク先のURLなども原稿に含まれているので、両方の効果を打ち消せば大雑把に半分だと捉えて構わないと思います。 年間に打った文字数と、記事一題あたりの文字数の変遷を見ると、 これはサーバー移行の影響を受けないから補正は不要な数値だし、特に不自然な変化は見られません。 投稿記事数(=分母)を減らした分だけ、記事あたりの文字数が一時的に増えた影響は見られますが、現在は落ち着いています。 さて2015年の予定として、記事数は22題、文字数は35,000字、記事あたり文字数は1,590字 を目論んでいるのですが、どういう結果になるのでしょう。 なお、2016年の予定はありません。
2014年01月27日
昨年の元日に投稿した年頭所感?「アクセス変遷と将来予測」という記事で、このブログの2013年以降の投稿記事数の予定やアクセス数、および記事あたりアクセス数の予想を公表しましたが、その頃にオフィシャルブログのサーバーが移設されて、データの均質性が失われてしまいました。
これが昨年の年頭に目論んだ、投稿記事数の予定とアクセス数の予想で、 2012年までは実績値、2013年以降は予想値を示します。 それから1年の月日が流れた後に、2013年分の実績も加えてプロットし直してみると、 投稿記事数はほぼ予定通りに減らせたものの、アクセス数の方は全く似ても似つかない(というか、煮ても焼いても食えないほど)マズい結果になりました。 この原因はひとえに、サーバーの移設に伴ってアクセス数が減ったことに因っているものと解釈するのが妥当でしょう。 アクセス数をカウントし始めた2005年5月9日以来(足かけ8年間)のアクセス数を藤色でプロットしましたが、変動が大きいので平滑化した線(紺色)を眺めてみると、一昨年の年末に大きなギャップが生じています。(回帰曲線は3次関数) これを見せるために1年間のデータが蓄積されるまで待っていたとも・・ただし「減った」というのは見当違いで、それまで不自然に増えていたのが「元に戻っただけ」だろうと考えました。 他にも、突然にアクセス数が急上昇しているように見える時期が何ヶ所かありますから。 それらのタイミングを境にして何らかの補正を施せば、ギャップが目立たなくなってスムーズに繋がるのではないかと思えます。 そこで、2006年から2012年までのアクセス数にある係数を掛けてみて、スムーズに繋がるような係数を探しました。 何種類か試行錯誤した後、2006年から2012年までの補正係数として、それぞれ 1.0、0.8、0.6.0.5、0.4、0.4、0.4 を採用して補正した結果を示します。 これなら不自然なく連続しているように見えます。 仮にこれらの補正係数が正しいとすると、近年は真値の2倍以上の大きな値に水増しされていたことになります。 ならば次の段階として、それらの係数を用いて年間のアクセス数も補正してみてはどうか、と考えを発展させた結果が下図で、 ちょっと補正し過ぎたかも知れませんが、滑らかな変化になりました。 2014年と2015年の予想値は改めて設定し直しましたが、今年は記事の投稿間隔を7日程度に設定しており、玉置宏の如くご無沙汰する予定です。 ついでに、投稿した記事の文字数も調べてみました。 文字を一々数えるのは大変なので、原稿を保存したテキストファイルのバイト数(の半分)を目安にします。 全角と半角の文字が混じっているから半分よりは多いかも知れないけれど、画像のファイル名とかリンク先のURLなども原稿に含まれているので、両方の効果を打ち消せば大雑把に半分だと捉えて構わないと思います。 年間に打った文字数と、記事一題あたりの文字数の変遷を見ると、 これは補正の必要が無い(誤魔化せない)数値だし、特に不自然な変化は見られません。
最近困ったのが、昨年11月26日号の週間アクセスランキングで、アクセス数が正しくない上に、アクセス数と順位との関係が乱れています。 面倒だから翌週の集計作業と一緒に直すのかと思ってたら、いつま~で待っても直らない・・♪犬の~お巡りさん 困ってしまって ワン ワン ワワン・・。
2013年01月21日
昨年になって気付いたんですが、記事を投稿した当日よりも翌日の方がアクセス数が多いような印象を受けていました。 でも、そういう印象や感覚だけで物を言ってはいけないので、ホントにそうなのか調べてみました。 フツーに考えれば不自然な現象だから、これは更新のフィードを受け取ってから見に来てる時間差なんだろうと想像できます。 オフィシャルブログの移設以降、アクセス数が急に減ったからオカシイ、というだけでは論拠に乏しいし、減った原因を推定する傍証が得られるかも知れないので。
記録が残っている期間(2006/5/9~2013/1/19)について、記事を投稿した当日から7日後までの、それぞれの日のアクセス数を日別に集計してみました。 日別のアクセス数の総和を日別の投稿記事数で割って、1記事当たりのアクセス数で比較することにします。 足掛け8年間の全てのデータを集計したのが下図です。 記事を投稿したら読まれるだろうから投稿当日に最もアクセスが多く、日にちの経過と共に次第に減っていくのは当然として、3日後と6日後に再び増える傾向が見られます。 この理由は、3日間程度の間隔で記事を投稿しているからでしょう。 次に年ごとに分けて見ますが、全ての年を示すと多いので近年だけを示します。 なお2012年は、オフィシャルブログが移設する前の12/16までを集計し、2013年は資料数がまだ少なくて、移設後の2012/12/23以降の値も一緒に集計しています。 2010年の日別アクセス数変化 投稿当日が最も多く、翌日には急に減っています。 2011年の日別アクセス数変化 投稿当日が最も多いけれど、当日と翌日との差が小さくなりました。 2012年の日別アクセス数変化 翌日がさらに増えて、当日を超えてしまい・・印象は錯覚ではなかった。 全ての年について年ごとに日別変化を示したのが下図ですが、 年ごとに絶対値がかなり違うので、当日のアクセス数を100%とした比率で表しています。 込み入っているので、最近の4年間だけ抽出します。 投稿当日のアクセス数が最も多い現象はおよそ共通していますが、当日の突出具合が次第に目立たなくなって、代わりに翌日以降のアクセス数が次第に増えています。 特に翌日の伸びが著しく、2012年には遂に当日を超えてしまいました。 この変化は恐らく、記事を新規に投稿したというフィードが送られて、それを頼りにアクセスするように変わってきた、ということだろうと考えます。 2日後のアクセス数が落ち込んでいる原因は、翌日に見たら2日後には見なくていい、という結果かも知れません。 で、移設後の2013年はどうかを見ると、資料数がまだ少ないものの当日がダントツに多く、翌日以降の変化は2008年あたりの傾向と似ています。 フィードが送られなくなったから投稿された日にだけ読む、という先祖返りだと解釈すれば納得できます。 つまり移設後は、オフィシャルブログを常時見ている人だけがアクセスするようになった・・だから昔に戻っただけだと考えれば、それはそれでいいのではないかとも思っています。 無理して2012年までの(不自然な?)状態に戻す必要も無かろうと。 ついでに、曜日別のアクセス数も調べてみました。 日曜日は少なくて月曜日が最も多く、曜日が進むと徐々に減って、土曜日が最も少なくなっています。 まぁ、およそ予想した通りの結果で面白くはないですけど。
2013年01月09日
オフィシャルブログが移設されて以後、アクセス数が急に減ったようで、以前の3分の1~4分の1になっている感じです。 これが一時的な現象(減少)なのか、今後も続く現象なのか分からないんですが、ずっと続くようならば「統計切断」という扱いにせねばなりません。 そういう状況の中でも、前回の記事をアップした後はアクセス数が(比較的)多くなっています・・そんなにトイレの話が好きなのか。笑
自分のブログにアップした画像について、そのプロパティを調べてみました。 例えば、画像のプロパティが「http://www.consadole.net/account/kariki/images/215676/1357299986-0Newyear3.jpg」などと表示されます。 ここで「kariki」は、ここのブログのアカウントであり、「215676」というのがアップした画像の通し番号で、投稿画面にも表示されます。 続く「1357299986」という長ったらしい数字は何のおまじないかと思ったら、「秒数」であることが分かりました。 コンピューターでは世界の始まりとすることが多い1970年1月1日0時0分0秒(世界時)から、画像をアップした時刻までを数えた秒数に合致しています。(日本時間で2013年1月4日20時46分26秒に相当←計算したのか) そして「-」に続く最後の「0Newyear3.jpg」の部分が、パソコンや携帯に保存してあるファイル名です。 だから、最後のファイル名が無かったり、不正な名前だったりするとハネられるのではないかと・・。 43年前の1970年といえば大阪万博(not競技場)、そして翌年の1971年にはクラブハイツがオープンしたんだとさ。 リンクを張れないとか、文字の装飾機能が使えないとか、コメント文中で1行空けることが出来ないとかいう現象については、ここでは起こっていないので何とも・・これらも、携帯からの投稿時に現れる特有な制約なのかな? ただ、「追記」の文中でフォントサイズを小さく(2に)しようとしたら、プレビュー画面ではかえって大きく表示されて面食らいました。投稿後の画面では意図の通り小さく表示されたんだけど、プレビューの役目を果たしてないよなー。 コメントが許可制になったのは良いかも知れないけれど、自分で投稿したコメントでさえ自分が許可しないと表示されないというのも、何だかマヌケな気がします。 移設後のリニュアルに向けて、最終的にどんな状態になるのか、大まかな青写真のようなイメージでも示してもらうと助かるんだけどなぁ。 リニュアルオープンして蓋を開けてみたら、白い煙が出て急に老人になってしまうなんてことは・・←今さら?
2012年01月08日
この時期には例年(またか)、「週間アクセスランキング」を集計して、「年間アクセス順位○○」とか「総合アクセス順位2007~○○」という集計結果を紹介していました。 しかしこの作業は、結構な手間がかかります。 しかも昨年には短期的なサーバー障害の他、5月には2日半にも及ぶ障害が起こってデータの信頼性が落ちました。 2011年5月25日のオフィシャルブログに表示された画像
翌日にログインした時のアクセス数 さらには、集計作業の元資料となるアクセスランキングが更新されなくなったもんだから、しめたっ! これで作業をしなくて済む・・と思ったのも床の間、アクセスランキングがこっそり復活してしまいました。 一応は集計作業を続けていて結果も出ているんですけど、今年は趣向を変えて、コンサドーレオフィシャルブログ全体へのアクセス数の変遷について紹介します。 この数字は、コンサドーレオフィシャルブログへの世間からの注目度を示す目安になるとは限らないし、内輪だけでの盛り上がり度を表しているに過ぎないのかも知れません。
【作業内容】
アクセスランキングの週ごとのアクセス数を2007年の春から2011年の暮れまで調べて、その変遷を順位別の折れ線グラフに表しました。
正確に言うと最近になって調べた訳ではなく、元からあったデータセットに基くグラフを公表するだけなんですけど。
順位ごとのアクセス数のみを表示しているだけであって、どこがどのサイトなのかは関知しません。
上から1位、2位、・・10位のサイトのアクセス数、それ以下は込み合うので間引きして、10位ごとに50位まで示してあります。
全体の変化傾向を把握するには、10位か20位あたりの線の上下動を見れば良いかと。
【考察】
・前半と後半とでは、かなり様子が違います。
前半は1位のサイトのアクセス数が飛び抜けていて、どのサイトなのかは関知しないとは言いながらも、「しまふく寮通信」であることは明白です。
たまに1位と2位のアクセス数が近くなったり、サイトが入れ替わったりしたこともありました。
・2008年の暮れに「しまふく寮通信」が終了してからは、ドングリの背比べというか、群雄割拠の状態になりました。
・コンサドーレブログ全体の変化を見ても、それまで継続的に漸増していたアクセス数がガタッと落ちています。
・2009年の暮れから2010年の春にかけて、ブログ全体のアクセス数が急に増えており、当時から不思議に思っていましたが、この理由は分かりません。(ホントは分かってるんだ・笑)
同様な傾向は2010年から2011年にかけても見られますから、移籍情報などへの関心からでしょうか。
・2010年も2011年も、シーズン中は増え続けてオフになると減る、という傾向が見られます。
・どの順位も全体にストンと落ちてる週が時々あり、これらはサーバー障害が起こった時期です。
・2011シーズンは、昇格が決まる前にアクセス数が減り始めました。
オフに入って緩やかに下降した後、移籍情報に伴うらしい盛り上がりが見られ、もう大方は出揃ったから落ち付いたんだろうと解釈しています。
2011年01月07日
年別の「年間アクセス順位」に続き、週間アクセスランキングの開始(2007/3/13)から最新(2010/12/28)までを集計した「総合アクセス順位」を調べ、「アクセス数」と「ランキングポイント」などについて、上位50位までを表示します。 集計方法などについては、昨年の結果などを参考にして下さい。 最新記事番号を取得したのは、2010年12月28日の19時頃です。 集計結果に関するコメントは、特に書きません。この集計作業も今回が最後でしょう、多分。
★【アクセス数】による順位
★【ランキングポイント】による順位
★【アクセス数を記事数で割った値】(小数を四捨五入)による順位
★【ランキングポイントを記事数で割った値】(小数第3位を四捨五入)による順位
2011年01月06日
2010年の「週間アクセスランキング」を集計して、2010年の「年間アクセス順位」を調べてみました。 「アクセス数」と「ランキングポイント」について、上位50位までを表示します。 集計方法などについては、昨年の結果などを参考にして下さい。 最新記事番号を取得したのは、2010年12月28日の19時頃です。 「週間アクセスランキング」が継続してるもんだから今年も(やむなく)集計作業を行いましたが、どうせランキングの元データとして使われている数字は正しい値ではないので、この集計作業も今年で最後にしたいと思います。
★【アクセス数】による順位
★【ランキングポイント】による順位
ここで、各年の順位別のアクセス数がどんな分布になっているかを調べてみます。 順位別の集計値なので、どの点がどのサイトの数値なのかは直接は分かりません。 こちらがアクセス数の分布で、緑色が2007年、青色が2008年、茶色が2009年、赤色が2010年、4年分を合計したのが黒色です。 2007年は42週分、2008年は53週分、2009年は52週分、2010年は52週分という違いがあって絶対値での比較は出来ないため、1週あたりの数値に規格化して比較しています。 2007年と2008年には1位(しまふく寮通信)のアクセス数が飛び抜けて多いですが、2009年以降は上位まで滑らかな分布になっています。 ただ2010年は、中間部で多め(フラット)になる傾向が見られます。 こちらがランキングポイントの分布で、色分けは上記と同様です。 ランキングポイントで見ると、1位だけが特別に大きな値という訳ではなさそうで、ほぼ直線的に分布しています。 2010年の特徴としては、30位あたりを中心に例年より盛り上がっているように見えますが、この理由は分かりません。(←順位の入れ替わりが激しかった?)
2010年11月06日
以前に、「アカウントに使われる文字」という記事を書いたことがあって、その時は「サイト名」に使われる文字を調べることは諦めて、「アカウント」に使われている文字の頻度を調べました。 最近になって「サイト名」の方も少し調べてみると、作業がそう煩雑でもなかったので、その調査結果を紹介します。 調べる材料は、「最新更新順ブログリスト」で、ここの1ページから最終の30ページまでにリストアップされているサイトのうち、サポーターのジャンルのみを解析対象としてサイト名を読み取ります。 それらのサイト名を1文字ずつ分解して、どの文字が何回使われているかを集計していきます。 データは、2010年10月22日19時頃の1478サイトですが、サイト名は自由に変更することが出来るので、集計結果は時々変わる可能性があります。 途中で困ったのは、全角と半角の違いを一緒に扱うか分けるかで、なるべく全角に統一して集計しました。 他に、半角カタカナの濁音は、子音と濁点とが別々に集計される問題があります。(例えば、「ド」は「ト」と「゙」とに分かれる) でも実際に集計してみると、「ト」は「ド」の10分の1程度の頻度しか使われていないので、半角の「ト」を全角の「ト」に混ぜてしまっても大きな問題は生じません。
下記に、使用頻度の1番目から100番目までの文字を並べてみます。 1位の半角スペースはともかく、予想通り、「コ」「ン」「サ」「ド」「ー」「レ」がトップグループにまとまっています。 「日」と「記」、「赤」と「黒」、「札」と「幌」、「応」と「援」も多いのは当然ですね。 それ以外はどんな具合に文字がつながるのか、よく分かりません。 「北」は38、「海」が16、「道」が36で共に圏外となっています。 順 文字 使用頻度
・・ならば、自分が投稿した記事のタイトルに使われている文字の使用頻度も調べられるのでは?・・と思い付きましたが、多分調べるまでもなく、"U"、"-"、"1"、"リ"、"ー"、"グ"、"大"、"会"、"戦"、"試"、"合" などが多いのは明らかですから、差し当たっては集計作業を実行するモチベーションが湧きません。
2010年10月24日
先日、自分が書いたブログ記事を探そうとして、自分のトップページの検索窓に目的の語句を入れて検索しました。 すると、非公開にしてある記事まで見つかってしまい、その記事の冒頭の数行が表示されました。 例として、既に次回の記事の冒頭部分を非公開の状態でアップしてあり、ここの左下にあるボックスに「10月24日」とか「栃木SC」とか入力して検索すれば、その記事も出てきます。 ログインしていない状態なのに非公開の記事が見つかるのならば、第三者にでも同様に見つけられるに違いありません。というか、見つけられました。 そんなことがホントに起こるの? と不思議に思いながら「(この記事を読む)」というリンクをクリックしてみると、「アクセスされたページが見つかりません。」というメッセージが表示されました。 そりゃそうですよね、公開していない記事なんだから。 でも、検索した語句が含まれている記事であれば、たとえ非公開の状態であっても文章の一部が表示されてしまう、というのは問題でしょう、隠してある記事が他人からも見えるなんて。 その記事は推敲が済んだら公開する予定だったので、他人に見られても別に困りはしませんけど、フツーは「非公開なら検索しても出てこない」と暗黙に解釈してるんじゃないでしょうか。 以前に、削除したブログ記事の行方という記事などの中で、削除した記事でも見えてしまうから、「取りあえず非公開の状態にしておけば他人からは見えない」と書いておきましたが、そうは問屋が卸さないようです。 (今のところの)最善の手段としては、見られたら困る記事はまっさらにして非公開にしておく・・しかないようです。完全にまっさらにしたらエラーになっちゃうだろうけど。 ここのブログシステムって、フツーじゃ考えられない現象(仕組み)が多くて、パズル問題を無理に解かされてるみたいに疲れますね。 使用料が無料なんだから仕方無いじゃないか、ともいきません。 例えばコインロッカーを使いたい場合、荷物を入れる時に100円を入れて、荷物を取り出せば100円が戻ってくるコインロッカーがあり、差し引き無料で使用できます。 たとえ使用料が無料であっても、鍵の作り方がいい加減なせいで、他の番号の鍵でも開いてしまって貴重品を盗まれたとしたら、賠償を請求して当然です。
風は秋色(2010/10/23@清田区) もうすぐ春ですねぇ
プロフィール
作者の雁来 萌(かりき もえ)は、休日になると弁当と単語帳を持参して、札幌市東区にある「北海道コンサドーレ札幌・東雁来グラウンド」(通称:カリキ)で過ごしています。 コンサドーレの次代を担う(かも知れない)若者達が、しゃかりきにボールを追っている姿を眺めて癒されています。 性別:非公開 年令:非公開 特技:非行かい? 職業:占い師、トイレ評論家 住居:熊が出没する札幌市中央区 過去記事のリストを「記事一覧」カテゴリに載せています。 コメント欄に「今後の投稿予定」を記してあり、随時更新します。 オフィシャルブログ内であれば、このブログをリンク集に加えるのはご自由で、問い合わせも不要です。 深夜・早朝のコメント投稿はご遠慮下さい。
最新のエントリー
リンク集
コメント
検索