こんばんは、はらちたててり!
8+ in 1:iOSおよびAndroidの新しいメッセンジャーがリリースされる前に、プレスリリースを公開する場所を調査するためにいくつかの作業を行う必要がありました。 そのような場所の1つはHabrでした。
次の質問をしました。
- 投稿するのに最適な曜日は?
- 投稿するのに最適な時間(時間間隔)は?
- 投稿するのに最適な時期は何ですか?

エントリー
最初から、私はどこかで似たような記事を見たような気がしました。
見つけることができ
なかった、おそらく私は見た目が悪かったので (
ここ 、
ここ 、
ここ )、調査自体を実施し、可能であれば興味深い点を見つけることにしました。
「ベスト」とは、閲覧(読み取り)、ブックマークへの追加、または投稿へのコメントを行うユーザーの最大数を集めることを意味します。
すべては記事の解析から始まりました。 幸いなことに、Habrには、安全に歩いて情報を収集できる投稿識別子があります。
habrahabr.ru/post[id]/
急いで、グラバーはObjective-Cで書かれました。
ご覧ください:


すべてに17〜19時間かかりました。
現時点では、インデックス1から200,000までのすべてのページの重量があります(2013年9月28日、20:03):
AndrewShmigs-MacBook-Pro:TimeMachine Backup new$ du -sh HabrahabrPages/ 18G HabrahabrPages/
フィルタリング
今、あなたはすべての余分なファイルを取り除く必要があります-これらは隠された投稿があるページまたはまだ作成されていないページです。
並行して、各ページを処理し、必要なデータを「切り取り」、別のファイル(共有)に書き込むことができます。
各ブログエントリから、次の情報を受け取ります。
現在パブリックドメインにある記事の合計:115468。
この (
更新されたバージョン )リンクを使用して、次の形式でデータファイルをダウンロードできます。
195428,26 19:56,13667,264,37
コンマはセパレーターとして機能します。 パラメーターは次の順序でリストされています。
必要に応じて、すべてのファイルを配布または転送できます(ほとんどの場合、圧縮形式のトレントであり、重量は約4 GBです)。 PMに書き込みます。
次に行うことは、出版日を単一の形式にすることです:
TT:TT.DD.MM.YYYY
現在のデータでは、次の種類の発行日を満たす場合があります。
13 2006 18:23
15 05:27
簡単にするために、書式から日付を除外しました(文字通り、日付が2つあり、損失は許容できます)。
18:23
17:44
次のパーサーは2つの問題を解決します。
- 出版日を希望の形式に変換する
- 「ブックマーク」列の(ヌル)エントリを「0」に修正(ビューのある列のヌルエントリは、記事の公開時にそのような機能がなかったことを意味します)
Objective-Cで日付を目的の形式に変換するパーサー このリンクから更新された形式でファイルをダウンロードし
てください。
1,18:23.13.7.2006,(null),4,32 2,00:45.14.7.2006,(null),0,34
時間、分、日、月、年ごと
注:処理されるデータには、2006年から2013年9月28日までのレコードが含まれます。
質問:ほとんどの投稿は1日のうち何時に表示されますか?
質問:投稿の最大数は何分に公開されますか?
質問:ほとんどの投稿は何時間と何分公開されますか?Objective-Cソースコード//
// main.m
// HabrahabrParser
//
// AndrewShmigが9/27/13に作成。
// Copyright©2013 AndrewShmig。 すべての権利を留保します。
//
#import <Foundation / Foundation.h>
int main(int argc、const char * argv [])
{
NSString * path = [NSString stringWithFormat:@ "/ Volumes / TimeMachine Backup / HabrahabrDataParsedDate.txt"];
NSString * fileContent = [NSString stringWithContentsOfFile:パス
エンコード:NSUTF8StringEncoding
エラー:nil];
NSArray * lines = [fileContent componentsSeparatedByString:@ "\ n"];
int time [1440] = {0};
for(NSString * line in lines){
NSArray * components = [line componentsSeparatedByString:@ "、"];
NSString * timeStr = [components [1] componentsSeparatedByString:@ "。"] [0];
int min =(int)[[timeStr componentsSeparatedByString:@ ":"] [1] integerValue];
int hour =(int)[[timeStr componentsSeparatedByString:@ ":"] [0] integerValue];
時間[時間* 60 +分] ++;
}
FILE * file = fopen( "/ Volumes / TimeMachine Backup / RESULTS.txt"、 "a");
for(int index = 0; index <1440; index ++){
fprintf(ファイル、「%d、%d \ n」、インデックス、時間[インデックス]);
}
fclose(ファイル);
0を返します。
}
質問:投稿の最大数は月の何日ですか?
質問:投稿の最大数はどの月に公開されますか?
質問:最も多くの投稿が発行されたのはどの年ですか?
視聴回数
ここで、残念なことに、記事のビュー数を修正する機能が導入される前に63,310件の記事が書かれていたことに注目する価値があります。
質問:投稿を公開することで、最大表示回数を取得できるのは何分ですか?
平均値:
質問:ビューの最大数に達するのは何時ですか?
平均値:
質問:ビューの最大数に達するのは月の何日ですか?
平均値:

お気に入り
質問:公開された投稿は、いつオーナーのお気に入りになりますか?Objective-Cソースコード // // main.m // HabrahabrParser // // Created by AndrewShmig on 9/27/13. // Copyright (c) 2013 AndrewShmig. All rights reserved. // #import <Foundation/Foundation.h> int main(int argc, const char * argv[]) { NSString *path = [NSString stringWithFormat:@"/Volumes/TimeMachine Backup/HabrahabrDataParsedDate.txt"]; NSString *fileContent = [NSString stringWithContentsOfFile:path encoding:NSUTF8StringEncoding error:nil]; NSArray *lines = [fileContent componentsSeparatedByString:@"\n"]; int mins[60] = {0}; for(NSString *line in lines) { NSArray *parts = [line componentsSeparatedByString:@","]; NSString *favs = parts[3]; int favsCount = (int)[favs integerValue]; int min = (int)[[[parts[1] componentsSeparatedByString:@"."][0] componentsSeparatedByString:@":"][1] integerValue]; mins[min]+=favsCount; } FILE *file = fopen("/Volumes/TimeMachine Backup/RESULTS.txt", "a"); int start = 0; int end = 60; for(int index=start; index<end; index++) { fprintf(file, "%d, %d\n", index, mins[index]); } fclose(file); return 0; }

平均値:
質問:投稿の公開により、著者はお気に入りに追加されますか?
平均値:
質問:投稿の公開により、著者はお気に入りの最大数の追加を月の何日目にしますか?
平均値:
しかし、2013年のみ:
質問:投稿者がお気に入りに追加できる最大数をもたらすのはどの月の出版ですか?ハブルでは、12月は幸福と親切さのまっすぐな月です:)
コメント
質問:投稿が最も多くのコメントを著者に投稿されるのはいつですか?
質問:投稿の公開は、いつ著者がコメントの最大数をもたらすでしょうか?
平均値:
2013年のみ:
質問:投稿の公開は、その月のどの日に著者に最大数のコメントをもたらしますか?
質問:どの月に出版されると、著者に最も多くのコメントが寄せられますか?
質問:著者に最も多くのコメントが寄せられるのはどの年の出版ですか?
コメントの数がビューの数に依存する

お気に入りへの追加数のコメント数への依存
MATLABソースコード fid = fopen('/Volumes/TimeMachine Backup/RESULT.txt', 'r'); while ~feof(fid) arr = fscanf(fid,'%d,%d',2); favs = arr(1); comments = arr(2); hold on; plot(comments, favs, '*b') end fclose(fid);
LibreOfficeはこのような量のデータの処理を拒否していますが、Numbersについては黙っています。
X軸-コメントの数、およびY軸-お気に入りへの追加の数推測ゲーム
これらのグラフに何が描かれているかは誰が理解しますか?


結論として
ご清聴ありがとうございました!
私たちはiOSとAndroidで作業したことを既にお見せしたいと思いますが、残念ながら、これを行うには早すぎます...