ホッケヌ遞手の成長今䞖玀のすべおの䞖界遞手暩のデヌタを分析したす




先日、次の䞖界ホッケヌ遞手暩が終了したした。


詊合を芋ながら、アむデアが生たれたした。 䌑憩䞭にテレビカメラがロッカヌルヌムに向かっおいるプレヌダヌを瀺すずき、圌らがどれほど巚倧であるかに気付かないのは難しいです。 コヌチ、チヌムの機胜、アむスアリヌナの埓業員、ゞャヌナリストたたはファンだけを背景に、圌らは通垞非垞に印象的に芋えたす。


ここでは、䟋えば、フィンランドのホッケヌの新星、パトリック・レむン、アレクサンダヌ・バルコフ、そしお忠実なファン

そしお、私は疑問に思いたした。 ホッケヌ遞手は普通の人より䞊ですか ホッケヌ遞手の成長は、䞀般の人々ず比べお時間ずずもにどのように倉化したすか 氞続的なクロスカントリヌの違いはありたすか


デヌタ


䞖界のホッケヌ遞手暩を䞻催する組織であるIIHFは、毎幎、参加遞手のラむンナップず各遞手の身長ず䜓重に関する情報を公開しおいたす。 このデヌタのアヌカむブはこちらです。


2001幎から2016幎たでのすべおの䞖界遞手暩のデヌタを集めたした。 幎々、デヌタを提䟛するための圢匏はわずかに倉曎されおおり、デヌタをクリヌンアップするには倚少の努力が必芁です。 プロセスを正しく自動化する方法を想像するこずなく、すべおのデヌタを手動でコピヌしたした。これには3時間匷かかりたした。 結合されたデヌタセットは公開されおいたす。


Rコヌド。 仕事の準備、デヌタの読み蟌み
# load required packages require(dplyr) # data manipulation require(lubridate) # easy manipulations with dates require(ggplot2) # visualization require(ggthemes) # themes for ggplot2 require(cowplot) # nice alignment of the ggplots require(RColorBrewer) # generate color palettes require(texreg) # easy export of regression tables require(xtable) # export a data frame into an html table # download the IIHF data set; if there are some problems, you can download manually # using the stable URL (https://dx.doi.org/10.6084/m9.figshare.3394735.v2) df <- read.csv('https://ndownloader.figshare.com/files/5303173') # color palette brbg11 <- brewer.pal(11,'BrBG') 

ホッケヌ遞手は成長しおいたすか 倧たかな定期的な比范


そもそも、16の党䞖界遞手暩でのプレヌダヌの平均成長率を比范したす。



Rコヌド。 図1. 2001〜2016幎の䞖界遞手暩でのホッケヌ遞手の平均成長率の倉化。
 # mean height by championship df_per <- df %>% group_by(year) %>% summarise(height=mean(height)) gg_period_mean <- ggplot(df_per, aes(x=year,y=height))+ geom_point(size=3,color=brbg11[9])+ stat_smooth(method='lm',size=1,color=brbg11[11])+ ylab('height, cm')+ xlab('year of competition')+ scale_x_continuous(breaks=seq(2005,2015,5),labels=seq(2005,2015,5))+ theme_few(base_size = 15)+ theme(panel.grid=element_line(colour = 'grey75',size=.25)) gg_period_jitter <- ggplot(df, aes(x=year,y=height))+ geom_jitter(size=2,color=brbg11[9],alpha=.25,width = .75)+ stat_smooth(method='lm',size=1,se=F,color=brbg11[11])+ ylab('height, cm')+ xlab('year of competition')+ scale_x_continuous(breaks=seq(2005,2015,5),labels=seq(2005,2015,5))+ theme_few(base_size = 15)+ theme(panel.grid=element_line(colour = 'grey75',size=.25)) gg_period <- plot_grid(gg_period_mean,gg_period_jitter) 

前向きな傟向は明らかです。 10幎半にわたっお、ワヌルドカップでのホッケヌ遞手の平均成長は、ほが2センチメヌトル増加したした巊のパネル。 かなり倧きなバリ゚ヌションを背景にわずかに増加するように右パネル。 それはたくさんですか、それずも少しですか 質問に答えるには、母集団ず正しく比范する必芁がありたすただし、これに぀いおは蚘事の最埌で詳しく説明したす。


コホヌト分析


成長の倉化を研究するより正確な方法には、出生コホヌトの比范が含たれたす。 ここで私たちは奇劙なニュアンスに盎面しおいたす-䞀郚のホッケヌ遞手は耇数の䞖界遞手暩に参加したした。 質問同じ人の重耇した録音を削陀したすか チャンピオンシップでのホッケヌ遞手の平均的な成長に興味がある堎合䞊の写真のように、クリアするこずはおそらく意味がありたせん。 しかし、ホッケヌ遞手の成長の倉化を远跡したい堎合、私の意芋では、定期的に䞖界遞手暩に出堎した遞手により倚くのりェむトを割り圓おるのは間違っおいるでしょう。 したがっお、さらに分析するために、同じプレヌダヌの繰り返しの゚ントリからデヌタを消去したした。


Rコヌド。 コホヌト分析のためのデヌタの準備
 # remove double counts dfu_h <- df %>% select(year,name,country,position,birth,cohort,height) %>% spread(year,height) dfu_h$av.height <- apply(dfu_h[,6:21],1,mean,na.rm=T) dfu_h$times_participated <- apply(!is.na(dfu_h[,6:21]),1,sum) dfu_w <- df %>% select(year,name,country,position,birth,cohort,weight) %>% spread(year,weight) dfu_w$av.weight <- apply(dfu_w[,6:21],1,mean,na.rm=T) dfu <- left_join(dfu_h %>% select(name,country,position,birth,cohort,av.height,times_participated), dfu_w %>% select(name,country,position,birth,cohort,av.weight), by = c('name','country','position','birth','cohort')) %>% mutate(bmi = av.weight/(av.height/100)^2) 

芳枬の総数は6292から3333に枛少したした。ホッケヌ遞手が耇数の䞖界遞手暩に参加した堎合、個々のホッケヌ遞手の身長ず特に䜓重は時間ずずもに倉化する可胜性があるため、身長ず䜓重のデヌタを平均したした。 ホッケヌ遞手は、䞖界遞手暩でナショナルチヌムのプレヌの名誉を䜕回獲埗したすか 平均しお2倍匱。



Rコヌド。 図2.ワヌルドカップぞの参加数によるホッケヌ遞手の分垃のヒストグラム
 # frequencies of participation in world championships mean(dfu$times_participated) df_part <- as.data.frame(table(dfu$times_participated)) gg_times_part <- ggplot(df_part,aes(y=Freq,x=Var1))+ geom_bar(stat='identity',fill=brbg11[9])+ ylab('# of players')+ xlab('times participated (out of 16 possible)')+ theme_few(base_size = 15) 

しかし、ナニヌクなものがありたす。 少なくずも10の䞖界遞手暩に参加したプレヌダヌを芋おみたしょう。 そのようなプレヌダヌは14人いたした。


Rコヌド。 衚1.䞖界遞手暩リヌダヌ
 # the leaders of participation in world championships # save the table to html leaders <- dfu %>% filter(times_participated > 9) View(leaders) print(xtable(leaders), type="html", file="table_leaders.html") 

お名前囜䜍眮誕生コホヌト身長times_participated平均重量BMI
1オベチキン・アレキサンダヌRUSF1985-09-171985188.451198.3627.70
2ニヌルセン・ダニ゚ルデンD1980-10-311980182.271179.7324.00
3スタヌル・キムデンF1978-03-101978182.001087.8026.51
4グリヌンモヌテンデンF1981-03-191981183.001285.8325.63
5マサルスキ゚ドガヌズラットG1980-03-311980176.001279.1725.56
6アンブヌル・アンドレスすいF1983-09-141983176.801083.7026.78
7グラナク・ドミニクSVKD1983-06-111983182.001079.5024.00
8マッドセン・モヌテンデンF1987-01-161987189.821186.0023.87
9レッドリヌ・ミケリスラットF1984-07-011984180.001080.4024.81
10Cipulis MartininsラットF1980-11-291980180.701082.1025.14
11ホロス・ゞョナスたたD1987-08-271987180.181191.3628.14
12バスティアンセン・アンダヌスたたF1980-10-311980190.001193.6425.94
13モルテンに尋ねるたたF1980-05-141980185.001088.3025.80
14フォルスバヌグ・クリスチャンたたF1986-05-051986184.501087.5025.70

アレクサンダヌオベチキン、11回 しかし、ここでは、原則ずしお、すべおのホッケヌプレヌダヌが16のすべおのチャンピオンシップに参加するこずは䞍可胜であったこずに泚意する必芁がありたす。 3そしお、プレヌダヌが代衚チヌムに安定しお入ったかどうか。 最埌に、NHLが、䞖界遞手暩ぞの参加から最高のベストを安定的にそらしたす。



Rコヌド。 図3. 2001〜2016幎の䞖界ホッケヌ遞手暩ぞの代衚チヌムの参加。
 # countries times participated df_cnt_part <- df %>% select(year,country,no) %>% mutate(country=factor(paste(country))) %>% group_by(country,year) %>% summarise(value=sum(as.numeric(no))) %>% mutate(value=1) %>% ungroup() %>% mutate(country=factor(country, levels = rev(levels(country))), year=factor(year)) d_cnt_n <- df_cnt_part %>% group_by(country) %>% summarise(n=sum(value)) gg_cnt_part <- ggplot(data = df_cnt_part, aes(x=year,y=country))+ geom_point(color=brbg11[11],size=7)+ geom_text(data=d_cnt_n,aes(y=country,x=17.5,label=n,color=n),size=7,fontface=2)+ geom_text(data=d_cnt_n,aes(y=country,x=18.5,label=' '),size=7)+ scale_color_gradientn(colours = brbg11[7:11])+ xlab(NULL)+ ylab(NULL)+ theme_bw(base_size = 25)+ theme(legend.position='none', axis.text.x = element_text(angle = 90, hjust = 1,vjust=0.5)) 

ホッケヌ遞手は成長しおいたすか 回垰分析


回垰分析を䜿甚するず、プレヌダヌの成長の倉化に関する質問により正確に答えるこずができたす。 この堎合、倚項線圢回垰を䜿甚しお、出生コホヌトに応じおホッケヌ遞手の成長が予枬されたす。 回垰モデルの仕様にさたざたな远加制埡倉数を含めるず、最も興味深い係数「セテリスパリバス」の倀が埗られたす。 たずえば、説明倉数に加えお、出生コホヌト、フィヌルドでのプレむダヌの䜍眮に加えお、成長ずコホヌトの関係を取埗し、䜍眮による違いの圱響をクリアしたす。 囜の制埡倉数に远加するず、結果が埗られ、囜間の違いが解消されたす。 もちろん、制埡倉数自䜓が重芁な堎合、これも泚意する䟡倀がありたす。
回垰モデル特に線圢回垰は、倖れ倀に非垞に敏感ですたずえば、 この蚘事を参照 。 この広範なトピックに深く入るこずなく、代衚者が少なすぎるコホヌトを分析から削陀したした。


Rコヌド。 小さなコホヌトを削陀したす
 # remove small cohorts table(dfu$cohort) dfuc <- dfu %>% filter(cohort<1997,cohort>1963) 

デヌタをあたりカットしたくないので、プレむダヌが10人未満の1963幎、1997幎、1998幎のコホヌトのみを削陀したした。


だから、回垰分析の結果。 次の各モデルでは、1぀の倉数を远加したす。
埓属倉数 ホッケヌ遞手の成長。
説明倉数 1出生コホヌト。 2+フィヌルド䞊の䜍眮ディフェンダヌずの比范; 3+囜ロシアずの比范。


Rコヌド。 衚2.回垰分析の結果
 # relevel counrty variable to compare with Russia dfuc$country <- relevel(dfuc$country,ref = 'RUS') # regression models m1 <- lm(data = dfuc,av.height~cohort) m2 <- lm(data = dfuc,av.height~cohort+position) m3 <- lm(data = dfuc,av.height~cohort+position+country) # export the models to html htmlreg(list(m1,m2,m3),file = 'models_height.html',single.row = T) 

統蚈モデル
モデル1モデル2モデル3
傍受-10.1727.67-18.6427.0132.5927.00
コホヌト0.100.01 ***0.100.01 ***0.080.01 ***
positionF-2.590.20 ***-2.590.20 ***
䜍眮G-1.960.31 ***-1.930.30 ***
countryAUT-0.940.55
countryBLR-0.950.53
countryCAN1.130.46 *
countryCZE0.560.49
囜DEN-0.100.56
countryFIN0.200.50
countryFRA-2.190.69 **
countryGER-0.610.51
countryHUN-0.610.86
countryITA-3.580.61 ***
countryJPN-5.240.71 ***
囜KAZ-1.160.57 *
countryLAT-1.380.55 *
countryNOR-1.610.62 **
countryPOL0.061.12
countrySLO-1.550.58 **
countrySUI-1.800.53 ***
countrySVK1.440.50 **
countrySWE1.180.48 *
countryUKR-1.820.59 **
囜USA0.540.45
R 20.010.060.13
調敎 R 20.010.060.12
数 obs。331933193319
Rmse5.405.275.10
*** p <0.001、 ** p <0.01、 * p <0.05

モデルの解釈


モデル1 コホヌトの1幎間の増加は、ホッケヌ遞手の成長の0.1 cmの増加に察応したす。係数は統蚈的に有意ですが、モデルは埓属倉数の倉動の1のみを説明したす。 原則ずしお、これは問題ではありたせん。シミュレヌションは本質的に説明的であるため、予枬のタスクは提瀺されたせん。 ただし、䜎い決定係数は、高さのホッケヌ遞手間の違いをよりよく説明する他の倉数があるべきであるこずを瀺したす。


モデル2 ディフェンダヌはホッケヌの最高遞手です。 ゎヌルキヌパヌは2 cm䜎く、攻撃者は2.6 cm䜎く、すべおの確率は統蚈的に有意です。 説明されおいる埓属倉数の倉動は6に増加したす。 この堎合、可倉出生コホヌトの係数は倉化したせん。


モデル3 。 囜に制埡倉数を远加するこずは、2぀の理由で興味がありたす。 たず、いく぀かの違いは統蚈的に有意であり、それ自䜓が興味深いものです。 たずえば、スりェヌデン人、スロバキア人、カナダ人は、私たちのプレヌダヌよりも統蚈的に著しく高いです。 ほずんどの囜は私たちよりはるかに䜎く、日本人は5.2 cm、むタリア人は3.6 cm、フランス人は2.2 cmです図4も参照。 第二に、囜ぞの制埡倉数の導入は、倉数の出生コホヌトの係数を0.08に倧幅に削枛したす。 これは、クロスカントリヌの違いが出生コホヌトの違いの䞀郚を説明するこずを意味したす。 モデルの決定係数は13に増加したす。


Rコヌド。 図4.囜別のホッケヌ遞手の成長

 # players' height by country gg_av.h_country <- ggplot(dfuc ,aes(x=factor(cohort),y=av.height))+ geom_point(color='grey50',alpha=.25)+ stat_summary(aes(group=country),geom='line',fun.y = mean,size=.5,color='grey50')+ stat_smooth(aes(group=country,color=country),geom='line',size=1)+ #geom_hline(yintercept = mean(height),color='red',size=.5)+ facet_wrap(~country,ncol=4)+ coord_cartesian(ylim = c(170,195))+ scale_x_discrete(labels=paste(seq(1965,1995,10)),breaks=paste(seq(1965,1995,10)))+ theme_few(base_size = 15)+ theme(legend.position='none', panel.grid=element_line(colour = 'grey75',size=.25)) 

最も完党なモデルは、ホッケヌ遞手の成長が幎間0.08 cmの割合で増加するこずを瀺しおいたす。 これは、1964幎から1996幎たでの32幎間で10幎ごずに0.8 cmたたは2.56 cm増加するこずを意味したす。制埡倉数を考慮するず、ホッケヌ遞手の成長率は平均倀のより粗い分析よりも玄1.5倍䜎いこずに泚意しおください図1 10幎ごずに0.8 cm察玄1.2 cm。


成長の増加がどれほど重芁であるかを最終的に理解しようずする前に、もう1぀の興味深い点に泚意を払いたいず思いたす。 制埡倉数の導入は、回垰盎線の単䞀の募配䞻な説明倉数の単䞀の係数を䜿甚しおカテゎリ間の違いを修正するこずを意味したす。 これは垞に良いずは限らず、サブサンプルで調査された倉数間の関係の緊密さの倧きな違いを隠すこずができたす。 たずえば、プレヌダヌの成長が圹割に䟝存しおいるこずを瀺す別のシミュレヌション図5は、関係がゎヌルキヌパヌで最も顕著であり、ディフェンダヌで最も目立たないこずを瀺しおいたす。



Rコヌド。 図5.ディフェンダヌ、フォワヌド、ゎヌルキヌパヌの成長ずコホヌトの盞関
 dfuc_pos <- dfuc levels(dfuc_pos$position) <- c('Defenders','Forwards','Goalkeeprs') gg_pos <- ggplot(dfuc_pos ,aes(x=cohort,y=av.height))+ geom_jitter(aes(color=position),alpha=.5)+ stat_smooth(method = 'lm', se = T,color=brbg11[11],size=1)+ scale_x_continuous(labels=seq(1965,1995,5),breaks=seq(1965,1995,5))+ scale_color_manual(values = brbg11[c(8,4,10)])+ facet_wrap(~position,ncol=3)+ xlab('birth cohort')+ ylab('height, cm')+ theme_few(base_size = 20)+ theme(legend.position='none', panel.grid=element_line(colour = 'grey75',size=.25)) 

Rコヌド。 衚3.ディフェンダヌ、フォワヌド、ゎヌルキヌパヌのサブサンプル甚のモデル3
 # separate models for positions m3d <- lm(data = dfuc %>% filter(position=='D'),av.height~cohort+country) m3f <- lm(data = dfuc %>% filter(position=='F'),av.height~cohort+country) m3g <- lm(data = dfuc %>% filter(position=='G'),av.height~cohort+country) htmlreg(list(m3d,m3f,m3g),file = '2016/160500 Hockey players/models_height_pos.html',single.row = T, custom.model.names = c('Model 3 D','Model 3 F','Model 3 G')) 

統蚈モデル
モデル3 Dモデル3 Fモデル3 G
傍受108.4546.46 *49.3236.73-295.7674.61 ***
コホヌト0.040.020.070.02 ***0.240.04 ***
countryAUT0.140.96-2.010.75 **0.471.47
countryBLR0.300.87-1.53​​0.73 *-2.731.55
countryCAN1.550.78 *0.390.623.451.26 **
countryCZE0.870.840.300.670.631.36
囜DEN-0.600.950.100.75-0.191.62
countryFIN-0.550.89-0.040.672.401.32
countryFRA-3.341.15 **-2.060.93 *1.392.07
countryGER0.480.85-1.400.72-0.651.33
countryHUN-1.321.47-0.701.160.652.39
countryITA-2.081.08-4.780.82 ***-2.021.62
countryJPN-4.131.26 **-6.520.94 ***-2.271.98
囜KAZ-1.230.95-1.820.79 *1.791.58
countryLAT-0.730.95-1.390.75-3.421.49 *
countryNOR-3.251.07 **-1.060.85-0.101.66
countryPOL0.821.89-0.581.550.372.97
countrySLO-1.570.99-1.540.79-2.251.66
countrySUI-1.980.91 *-2.360.71 ***1.121.47
countrySVK2.940.87 ***0.810.67-0.701.50
countrySWE0.750.811.240.651.371.33
countryUKR-1.371.01-1.770.80 *-3.711.66 *
囜USA0.760.78-0.080.622.581.26 *
R 20.090.100.24
調敎 R 20.070.090.20
数 obs。10941824401
Rmse5.085.084.87
*** p <0.001、 ** p <0.01、 * p <0.05

別のモデリングでは、1964幎から1996幎の出生時のコホヌトでは、2001幎から2016幎の䞖界遞手暩に参加するホッケヌ遞手の平均成長率が、防埡偎では小数あたり0.4 cm、攻撃偎では0.7 cm、ゎヌルキヌパヌ。 30幎以䞊にわたり、ゎヌルキヌパヌの平均成長率は7 cm増加したした


これらの倉化を人口平均ず比范する時が来たした。


人口ずの比范


回垰分析の結果は、重芁なクロスカントリヌの違いを蚘録しおいたす。 したがっお、特定の囜のホッケヌ遞手ず同じ囜の男性人口ずを囜ごずに比范するのは理にかなっおいたす。


ホッケヌ遞手の成長を平均的な男性人口ず比范するために、 関連する科孊蚘事  PDF のデヌタを䜿甚したした。 蚘事からデヌタをコピヌし玠晎らしいタブラプログラムを䜿甚 、パブリックドメむンに投皿したした 。


Rコヌド。 Hatton、TJ、Bray、BE2010デヌタのダりンロヌドず分析の準備
 # download the data from Hatton, TJ, & Bray, BE (2010). # Long run trends in the heights of European men, 19th–20th centuries. # Economics & Human Biology, 8(3), 405–413. # http://doi.org/10.1016/j.ehb.2010.03.001 # stable URL, copied data (https://dx.doi.org/10.6084/m9.figshare.3394795.v1) df_hb <- read.csv('https://ndownloader.figshare.com/files/5303878') df_hb <- df_hb %>% gather('country','h_pop',2:16) %>% mutate(period=paste(period)) %>% separate(period,c('t1','t2'),sep = '/')%>% transmute(cohort=(as.numeric(t1)+as.numeric(t2))/2,country,h_pop) # calculate hockey players' cohort height averages for each country df_hoc <- dfu %>% group_by(country,cohort) %>% summarise(h_hp=mean(av.height)) %>% ungroup() 

残念ながら、人口増加ダむナミクスに関するデヌタは、私のホッケヌデヌタセットの8か囜オヌストリア、デンマヌク、フィンランド、フランス、ドむツ、むタリア、ノルりェヌ、スりェヌデンずしか亀差しおいたせん。


Rコヌド。 重耇デヌタ
 # countries in both data sets both_cnt <- levels(factor(df_hb$country))[which(levels(factor(df_hb$country)) %in% levels(df_hoc$country))] both_cnt 


Rコヌド。 図6.男性人口ずホッケヌ遞手の成長ダむナミクスの比范。 泚緑は男性の人口です。 茶色-ホッケヌ遞手。
 gg_hoc_vs_pop <- ggplot()+ geom_path(data = df_hb %>% filter(country %in% both_cnt), aes(x=cohort,y=h_pop), color=brbg11[9],size=1)+ geom_point(data = df_hb %>% filter(country %in% both_cnt), aes(x=cohort,y=h_pop), color=brbg11[9],size=2)+ geom_point(data = df_hb %>% filter(country %in% both_cnt), aes(x=cohort,y=h_pop), color='white',size=1.5)+ geom_point(data = df_hoc %>% filter(country %in% both_cnt), aes(x=cohort,y=h_hp), color=brbg11[3],size=2,pch=18)+ stat_smooth(data = df_hoc %>% filter(country %in% both_cnt), aes(x=cohort,y=h_hp), method='lm',se=F,color=brbg11[1],size=1)+ facet_wrap(~country,ncol=2)+ ylab('height, cm')+ xlab('birth cohort')+ theme_few(base_size = 15)+ theme(panel.grid=element_line(colour = 'grey75',size=.25)) 

分析したすべおの囜で、ホッケヌ遞手は暙準的な統蚈の男性よりも2〜5 cm高いですが、これは驚くこずではありたせん-スポヌツにはかなりの遞択がありたす。
別のこずは泚目に倀したす。 先進囜では、20䞖玀初頭に男性の人口増加が特に急速に増加したした。 1960幎代頃のコホヌトでは、男性の成長はプラトヌに近づき、急速に増加しなくなりたした。 䜕らかの理由でデンマヌクを陀くすべおの囜のホッケヌ遞手の平均的な成長傟向は、男性人口党䜓の長幎の傟向を継続しおいるようです。
20䞖玀前半に生たれたペヌロッパ人のコホヌトでは、平均的な成長の成長率は、囜に応じお10幎あたり1.18〜1.74 cmの範囲でした図7。 1960幎代以来、この指暙は10幎間で0.15〜0.80のレベルたで䜎䞋しおいたす。



Rコヌド。 図7.男性人口の平均成長ダむナミクス
 # growth in population df_hb_w <- df_hb %>% spread(cohort,h_pop) names(df_hb_w)[2:26] <- paste('y',names(df_hb_w)[2:26]) diffs <- df_hb_w[,3:26]-df_hb_w[,2:25] df_hb_gr<- df_hb_w %>% transmute(country, gr_1961_1980 = unname(apply(diffs[,22:24],1,mean,na.rm=T))*2, gr_1901_1960 = unname(apply(diffs[,9:21],1,mean,na.rm=T))*2, gr_1856_1900 = unname(apply(diffs[,1:8],1,mean,na.rm=T))*2) %>% gather('period','average_growth',2:4) %>% filter(country %in% both_cnt) %>% mutate(country=factor(country,levels = rev(levels(factor(country)))), period=factor(period,labels = c('1856-1900','1901-1960','1961-1980'))) gg_hb_growth <- ggplot(df_hb_gr, aes(x=average_growth,y=country))+ geom_point(aes(color=period),size=3)+ scale_color_manual(values = brbg11[c(8,3,10)])+ scale_x_continuous(limits=c(0,2))+ facet_wrap(~period)+ theme_few()+ xlab("average growth in men's height over 10 years, cm")+ ylab(NULL)+ theme_few(base_size = 20)+ theme(legend.position='none', panel.grid=element_line(colour = 'grey75',size=.25)) 

人口の停滞傟向を背景に、ホッケヌ遞手の成長の増加は非垞に印象的です。 そしお、ゎヌルキヌパヌ間の加速は䞀般に前䟋のないものです。
遞択を忘れないでください。 人口ずホッケヌ遞手の傟向の違いは、遞択の増加を瀺しおいる可胜性がありたす。ホッケヌを成功させるには、さらに倧きな成長が必芁です。


スポヌツ遞択


このトピックに関する科孊文献を芋るず、 驚くべき結果に出䌚いたした。 プロスポヌツでは、幎の前半に生たれた人が圧倒的に倚いこずがわかりたす。 これは、スポヌツ郚門が原則ずしお出生コホヌトの子䟛のチヌムを圢成するずいう事実によっお説明されたす。 したがっお、幎の初めに生たれた人は垞に圌らの埌ろにもう少し倚くの時間を費やしおいたす。 デヌタセットでこの結果を確認するのは簡単です。



Rコヌド。 図8.出生月別のホッケヌ遞手の分垃
 # check if there are more players born in earlier months df_month <- df %>% mutate(month=month(birth)) %>% mutate(month=factor(month,levels = rev(levels(factor(month))))) gg_month <- ggplot(df_month,aes(x=factor(month)))+ geom_bar(stat='count',fill=brbg11[8])+ scale_x_discrete(breaks=1:12,labels=month.name)+ xlab('month of birth')+ coord_flip()+ theme_few(base_size = 20)+ theme(legend.position='none', panel.grid=element_line(colour = 'grey75',size=.25)) 

確かに、分垃はかなり早い時期に偏っおいたす。 数十幎ごずにデヌタを分解するず、肉県で芋るず、時間ずずもに効果が匷たるこずがわかりたす図9。 間接的に、これはホッケヌの遞択が厳しくなっおいるこずを瀺しおいたす。



Rコヌド。 図9.出生月別のホッケヌ遞手の分垃、出生別10幎ごず
 # facet by decades df_month_dec <- df_month %>% mutate(dec=factor(substr(paste(cohort),3,3),labels = paste('born in',c('1960s','1970s','1980s','1990s')))) gg_month_dec <- ggplot(df_month_dec,aes(x=factor(month)))+ geom_bar(stat='count',fill=brbg11[8])+ scale_x_discrete(breaks=1:12,labels=month.abb)+ xlab('month of birth')+ facet_wrap(~dec,ncol=2,scales = 'free')+ theme_few(base_size = 20)+ theme(legend.position='none', panel.grid=element_line(colour = 'grey75',size=.25)) 

未来のために


物理デヌタがホッケヌ遞手のゲヌム統蚈に圱響するかどうかを確認するのは興味深いでしょう。 非垞にたずもな科孊雑誌に掲茉された面癜い蚘事に出くわしたした。著者は、ホッケヌ遞手の顔の割合ずゲヌムあたりのペナルティ時間の平均数ずの盞関関係を発芋したした。


指定された蚘事のグラフ

再珟性


私の蚘事の結果を再珟した完党なRスクリプトはこちらです。
䜿甚枈みバヌゞョンR-3.2.4
2016-03-14珟圚のすべおのパッケヌゞ。 パッケヌゞの非互換性の堎合、察応する日付でチェックポむントパッケヌゞを䜿甚するず、このコヌドが再珟されるこずが保蚌されたす。



Source: https://habr.com/ru/post/J301340/


All Articles