
рдпрджрд┐ рдЖрдк рдПрдХ рдЖрдИрдЯреА рд╡рд┐рд╢реЗрд╖рдЬреНрдЮ рд╣реИрдВ, рддреЛ
рдЖрдк рдмрд╕ рдЗрд╕реЗ рдирд╣реАрдВ рд▓реЗ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ 2 рдЬрдирд╡рд░реА рдХреЛ рдХрд╛рдо рдкрд░ рдЬрд╛ рд╕рдХрддреЗ рд╣реИрдВ : рдордиреЛрд╡рд┐рдЬреНрдЮрд╛рди рдХреА рд▓рдбрд╝рд╛рдИ рдХреЗ рддреАрд╕рд░реЗ рд╕реАрдЬрди рдХреА рд╕рдореАрдХреНрд╖рд╛ рдХрд░реЗрдВ рдпрд╛ рдПрдирдЯреАрд╡реА рдкрд░ рдЧреЙрд░реНрдбрди рдХрд╛рд░реНрдпрдХреНрд░рдо рд░рд┐рдХреЙрд░реНрдб рдХрд░реЗрдВ (
рдорд╛рдирд╕рд┐рдХ рд╕реНрд╡рд╛рдж
рдХреНрд╖рдорддрд╛рдУрдВ рдХрд╛ рдорд╛рдорд▓рд╛)ред
рдпрд╣ рдЕрд╕рдВрднрд╡ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рдЕрдиреНрдп рдХрд░реНрдордЪрд╛рд░рд┐рдпреЛрдВ рдХреЛ рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рдЖрдкрдХреЗ рд▓рд┐рдП рдЙрдкрд╣рд╛рд░ рд╣реЛрдВрдЧреЗ: рд╕рдЪрд┐рд╡ рдХреЙрдлреА рд╕реЗ рдмрд╛рд╣рд░ рдЪрд▓рд╛ рдЧрдпрд╛ рд╣реИ, рд╕рд╛рдВрд╕рдж рд╕рдордп рд╕реАрдорд╛ рд╕реЗ рдмрд╛рд╣рд░ рдЪрд▓рд╛ рдЧрдпрд╛ рд╣реИ, рдФрд░ рдбреЗрдЯрд╛рдмреЗрд╕ рд╡реНрдпрд╡рд╕реНрдерд╛рдкрдХ рдХреЗ рдкрд╛рд╕
рднреВрд▓рдиреЗ рдХреА
рдмреАрдорд╛рд░реА рд╣реИ ред
рдпрд╣ рдкрддрд╛ рдЪрд▓рд╛ рдХрд┐ Hadoop рдЯреАрдо рдХреЗ рдЗрдВрдЬреАрдирд┐рдпрд░ рднреА рдирдП рд╕рд╛рд▓ рдХреЗ рдЖрд╢реНрдЪрд░реНрдп рдХреЗ рд╕рд╛рде рдПрдХ-рджреВрд╕рд░реЗ рдХреЛ рд▓рд╛рдбрд╝ рдкреНрдпрд╛рд░ рдХрд░рддреЗ рд╣реИрдВред
2008
2 рдЬрдирд╡рд░реА рдиреАрдЪреЗ рд╡рд░реНрдгрд┐рдд рдШрдЯрдирд╛рдУрдВ рдореЗрдВ рднрд╛рдЧ рд▓реЗрдиреЗ рд╡рд╛рд▓реЗ рд╡реНрдпрдХреНрддрд┐рдпреЛрдВ рдХреА рднрд╛рд╡рдирд╛рддреНрдордХ рдФрд░ рдордиреЛрд╡реИрдЬреНрдЮрд╛рдирд┐рдХ рд╕реНрдерд┐рддрд┐ рдХрд╛ рд╡рд┐рд╕реНрддреГрдд рд╡рд┐рд╡рд░рдг рдпрд╛рдж рдХрд░рддреЗ рд╣реБрдП, рдореИрдВ рддреБрд░рдВрдд рдЗрд╕ рддрдереНрдп рдХреА рдУрд░
рдореБрдбрд╝реВрдВрдЧрд╛ :
MAPREDUCE-279 рдореИрдк-рд░рд┐рдбреНрдпреВрд╕ 2.0 рдХрд╛рд░реНрдп рд╡рд┐рддрд░рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред рд╕рдВрдЦреНрдпрд╛ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЪреБрдЯрдХреБрд▓реЗ рдЫреЛрдбрд╝рдиреЗ рдХреЗ рдмрд╛рдж, рдореИрдВ рдЗрд╕ рддрдереНрдп рдкрд░ рдЖрдкрдХрд╛ рдзреНрдпрд╛рди рдЖрдХрд░реНрд╖рд┐рдд рдХрд░реВрдБрдЧрд╛ рдХрд┐ рд╣рдбреЛрдк рдХрд╛ рдкрд╣рд▓рд╛ рд╕реНрдерд┐рд░ рд╕рдВрд╕реНрдХрд░рдг 4 рд╕рд╛рд▓ рд╕реЗ рдереЛрдбрд╝рд╛ рдХрдо рд╣реИред
рдЗрд╕ рд╕рдордп рдХреЗ рджреМрд░рд╛рди, Hadoop рдкрд░рд┐рдпреЛрдЬрдирд╛ 2005 рдореЗрдВ рд╢реБрд░реВ рдХреА рдЧрдИ рдПрдХ рдЫреЛрдЯреА рдЕрднрд┐рдирд╡ рд╕реНрдиреЛрдмреЙрд▓ рд╕реЗ рд╡рд┐рдХрд╕рд┐рдд рд╣реЛрдЧреА, рдЬреЛ 2012 рдореЗрдВ IT рдкрд░ рдПрдХ рдмрдбрд╝реЗ рд╕реНрдиреЛрдмреЙрд▓
рдХреЙрдо рдХреЗ рд░реВрдк рдореЗрдВ рд╡рд┐рдХрд╕рд┐рдд рд╣реЛрдЧреАред
рдиреАрдЪреЗ рд╣рдо рдпрд╣ рдЬрд╛рдирдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░реЗрдВрдЧреЗ рдХрд┐ Hadoop рдкреНрд▓реЗрдЯрдлреЙрд░реНрдо рдХреЗ рд╡рд┐рдХрд╛рд╕ рдореЗрдВ рдЬрдирд╡рд░реА рдХрд╛рд░реНрдп MAPREDUCE-279 рдиреЗ рдЦреЗрд▓рд╛ (рдФрд░, рдореБрдЭреЗ рдпрдХреАрди рд╣реИ, 2013 рдореЗрдВ рдЦреЗрд▓реЗрдВрдЧреЗ)ред
2011
рдлрд░рд╡рд░реА 2011 рдореЗрдВ, рдпрд╛рд╣реВ рдХреЗ рдЗрдВрдЬреАрдирд┐рдпрд░реЛрдВ рдиреЗ "рдЕрдкрд╛рдЪреЗ рд╣реИрдбреЙрдк рдореИрдкрд░реЗрдбреЗрд╕ рдХреА рдЕрдЧрд▓реА рдкреАрдврд╝реА" [2] рд▓реЗрдЦ рдХреЗ рд╕рд╛рде рджреБрдирд┐рдпрд╛ рдХреЛ рдЦреБрд╢ рдХрд┐рдпрд╛ред рдЕрдХреНрдЯреВрдмрд░ 2011 рдореЗрдВ, Apache Software Foundation рдиреЗ рдЕрдкрдиреЗ Apiki Hadoop NextGen MapReduce (YARN) [1] рд╢реАрд░реНрд╖рдХ рд╕реЗ рд╡рд┐рдХрд┐ рдХрд╛рд░реНрдп рдореЗрдВ рдкреНрд░рдХрд╛рд╢рд┐рдд рдХрд┐рдпрд╛ред 27 рджрд┐рд╕рдВрдмрд░ рдХреЛ, рджреБрдирд┐рдпрд╛ рдиреЗ Apache Software Foundation рд╡реЗрдмрд╕рд╛рдЗрдЯ рдкрд░ рдПрдХ рд╢рд┐рд▓рд╛рд▓реЗрдЦ рджреЗрдЦрд╛:
... рд░рд┐рд▓реАрдЬрд╝ 1.0.0 рдЙрдкрд▓рдмреНрдзред рдЫрд╣ рд╕рд╛рд▓ рдХреЗ рдЧрд░реНрдн рдХреЗ рдмрд╛рдж, Hadoop 1.0.0 рддрдХ рдкрд╣реБрдБрдЪ рдЬрд╛рддрд╛ рд╣реИ!
рдФрд░ рд▓рд┐рдВрдХ Hadoop v1.0 рдХрд╛ рд╕реНрдерд┐рд░ рд╕рдВрд╕реНрдХрд░рдг рд╣реИред
2012
рдордИ рдХреЗ рдЕрдВрдд рдореЗрдВ Hadoop 2.0.0-рдЕрд▓реНрдлрд╛ рдбрд╛рдЙрдирд▓реЛрдб рдХреЗ рд▓рд┐рдП рдЙрдкрд▓рдмреНрдз рд╣реЛ рдЧрдпрд╛ред рдордИ рдореЗрдВ, Hadoop: The Definitive Guide, Third Edition (рдЯреЙрдо рд╡реНрд╣рд╛рдЗрдЯ рджреНрд╡рд╛рд░рд╛) рдкреБрд╕реНрддрдХ рдкреНрд░рдХрд╛рд╢рд┐рдд рдХреА рдЧрдИ рдереА, рдЬрд╣рд╛рдВ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд░рд╛рд╢рд┐ YARN рдХреЛ рдЖрд╡рдВрдЯрд┐рдд рдХреА рдЧрдИ рд╣реИред рдЬреВрди рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ, рдЯреЙрдо рд╡реНрд╣рд╛рдЗрдЯ рдиреЗ рд╢рд┐рдХрд╛рдЧреЛ рд╣рдбреЙрдк рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рд╕рдореВрд╣ рдореЗрдВ MapReduce 2.0 (
рд╡реАрдбрд┐рдпреЛ ) рдХреА рдПрдХ рдкреНрд░рд╕реНрддреБрддрд┐ рджреАред рдЙрд╕реА рдорд╣реАрдиреЗ рдореЗрдВ, рдХреНрд▓рд╛рдЙрдбрд░рд╛ рдиреЗ рдЕрдкрдиреЗ CDH4 рдЙрддреНрдкрд╛рдж рдореЗрдВ Hadoop 2.0.0 рдЕрд▓реНрдлрд╛ рдХреЗ рд▓рд┐рдП рд╕рдорд░реНрдерди рдХреА рдШреЛрд╖рдгрд╛ рдХреАред рдереЛрдбрд╝реА рджреЗрд░ рдмрд╛рдж, рд╣реЙрд░реНрдЯрдирд╡рд░реНрдХреНрд╕ рдиреЗ рднреА рдЕрдкрдиреЗ рд╡рд┐рддрд░рдг рдореЗрдВ рд╣рдбреЛрдк 2.0 рдХреЗ рд▓рд┐рдП рд╕рдорд░реНрдерди рдХреА рдШреЛрд╖рдгрд╛ рдХреАред
17 рд╕рд┐рддрдВрдмрд░ рдХреЛ, Apache Software Foundation рдиреЗ рдШреЛрд╖рдгрд╛ рдХреА рдХрд┐ YARN рдФрд░ MapReduce v2 Hadoop 0.23.3 рдореЗрдВ рдЙрдкрд▓рдмреНрдз рд╣реИрдВред
рдиреАрдЪреЗ рд╣рдо рдХреНрд▓рд╛рд╕рд┐рдХ Hadoop MapReduce рдФрд░ рдирдП рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдореЗрдВ рд╡рд┐рддрд░рд┐рдд рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдХреЗ рджреГрд╖реНрдЯрд┐рдХреЛрдг рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░реЗрдВрдЧреЗ, рддрдХрдиреАрдХреЛрдВ рдФрд░ рдШрдЯрдХреЛрдВ рдХрд╛ рд╡рд░реНрдгрди рдХрд░реЗрдВрдЧреЗ рдЬреЛ рдирдП рдореЙрдбрд▓ рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛рдУрдВ рдХреЛ рд▓рд╛рдЧреВ рдХрд░рддреЗ рд╣реИрдВ, рдФрд░ рд╢рд╛рд╕реНрддреНрд░реАрдп рдФрд░ 2.0 рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдХреА рддреБрд▓рдирд╛ рднреА рдХрд░рддреЗ рд╣реИрдВред1. Hadoop MapReduce Classic
Hadoop рдмрдбрд╝реЗ рдкреИрдорд╛рдиреЗ рдкрд░ рд╕рдорд╛рдирд╛рдВрддрд░ рдкреНрд░рд╕рдВрд╕реНрдХрд░рдг (MPP) рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рд╡рд┐рддрд░рд┐рдд рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреЗ рдирд┐рд░реНрдорд╛рдг рдХреЗ рд▓рд┐рдП рдПрдХ рд▓реЛрдХрдкреНрд░рд┐рдп рд╕реЙрдлреНрдЯрд╡реЗрдпрд░ рдврд╛рдВрдЪрд╛ рд╣реИред
Hadoop рдореЗрдВ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдШрдЯрдХ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:
- HDFS - рд╡рд┐рддрд░рд┐рдд рдлрд╝рд╛рдЗрд▓ рд╕рд┐рд╕реНрдЯрдо;
- Hadoop MapReduce - рдореИрдк рдХреЗ рдврд╛рдВрдЪреЗ / рдХрдо рдкреНрд░рддрд┐рдорд╛рди рдХреЗ рднреАрддрд░ рдмрдбрд╝реА рдорд╛рддреНрд░рд╛ рдореЗрдВ рдбреЗрдЯрд╛ рдХреЗ рд▓рд┐рдП рд╡рд┐рддрд░рд┐рдд рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдкреНрд░рджрд░реНрд╢рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рд╕реЙрдлреНрдЯрд╡реЗрдпрд░ рдореЙрдбрд▓ (рдврд╛рдВрдЪрд╛)ред
Hadoop MapReduce рд╡рд╛рд╕реНрддреБрдХрд▓рд╛ рдФрд░
HDFS рд╕рдВрд░рдЪрдирд╛ рдореЗрдВ рдПрдореНрдмреЗрдбреЗрдб рдЕрд╡рдзрд╛рд░рдгрд╛рдУрдВ рдиреЗ рдШрдЯрдХреЛрдВ рдХреЗ рд╕реНрд╡рдпрдВ рдореЗрдВ рдХрдИ рдЕрдбрд╝рдЪрдиреЗрдВ рдкреИрджрд╛ рдХреА рд╣реИрдВ, рдЬрд┐рд╕рдореЗрдВ рд╡рд┐рдлрд▓рддрд╛ рдХреЗ рдПрдХрд▓ рдмрд┐рдВрджреБ рднреА рд╢рд╛рдорд┐рд▓ рд╣реИрдВред рдЬрд┐рд╕рдиреЗ рдЕрдВрдд рдореЗрдВ рд╣рдбреЛрдк рдкреНрд▓реЗрдЯрдлреЙрд░реНрдо рдХреА рд╕реАрдорд╛рдУрдВ рдХреЛ рд╕рдордЧреНрд░ рд░реВрдк рд╕реЗ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд┐рдпрд╛ред
рдЙрддреНрддрд░рд╛рд░реНрджреНрдз рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:
- Hadoop рдХреНрд▓рд╕реНрдЯрд░ рд╕реНрдХреЗрд▓реЗрдмрд┐рд▓рд┐рдЯреА рд╕реАрдорд╛ : ~ 4K рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдиреЛрдбреНрд╕; ~ 40K рд╕рдорд╛рдирд╛рдВрддрд░ рдиреМрдХрд░рд┐рдпрд╛рдВ;
- рд╡рд┐рддрд░рд┐рдд рдПрд▓реНрдЧреЛрд░рд┐рдереНрдо рдХреЛ рд▓рд╛рдЧреВ рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рд╡рд┐рддрд░рд┐рдд рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдврд╛рдВрдЪреЗ рдФрд░ рдХреНрд▓рд╛рдЗрдВрдЯ рдкреБрд╕реНрддрдХрд╛рд▓рдпреЛрдВ рдХреА рдордЬрдмреВрдд рдХрдиреЗрдХреНрдЯрд┐рд╡рд┐рдЯреА ред рдкрд░рд┐рдгрд╛рдорд╕реНрд╡рд░реВрдк:
- рд╡рд┐рддрд░рд┐рдд рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдкреНрд░рджрд░реНрд╢рди рдХреЗ рд▓рд┐рдП рдПрдХ рд╡реИрдХрд▓реНрдкрд┐рдХ рд╕реЙрдлреНрдЯрд╡реЗрдпрд░ рдореЙрдбрд▓ рдХреЗ рд▓рд┐рдП рд╕рдорд░реНрдерди рдХрд╛ рдЕрднрд╛рд╡: Hadoop v1.0 рдореЗрдВ, рдХреЗрд╡рд▓ рдирдХреНрд╢рд╛ / рдХрдо рдЧрдгрдирд╛ рдореЙрдбрд▓ рдХрд╛ рд╕рдорд░реНрдерди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
- рд╡рд┐рдлрд▓рддрд╛ рдХреЗ рдПрдХрд▓ рдмрд┐рдВрджреБрдУрдВ рдХреА рдЙрдкрд╕реНрдерд┐рддрд┐ рдФрд░, рдкрд░рд┐рдгрд╛рдорд╕реНрд╡рд░реВрдк, рдЙрдЪреНрдЪ рд╡рд┐рд╢реНрд╡рд╕рдиреАрдпрддрд╛ рдЖрд╡рд╢реНрдпрдХрддрд╛рдУрдВ рдХреЗ рд╕рд╛рде рд╡рд╛рддрд╛рд╡рд░рдг рдореЗрдВ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдореЗрдВ рдЕрд╕рдорд░реНрдерддрд╛;
- рд╡рд░реНрдЬрди рдХрдореНрдкреИрдЯрд┐рдмрд┐рд▓рд┐рдЯреА рдкреНрд░реЙрдмреНрд▓рдореНрд╕ : рд╣реИрдбреЛрдк рдкреНрд▓реЗрдЯрдлреЙрд░реНрдо рдХреЛ рдЕрдкрдбреЗрдЯ рдХрд░рддреЗ рд╕рдордп (рдирдпрд╛ рд╡рд░реНрдЬрди рдпрд╛ рд╕рд░реНрд╡рд┐рд╕ рдкреИрдХ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рддреЗ рд╕рдордп) рдХреНрд▓рд╕реНрдЯрд░ рдХреЗ рд╕рднреА рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдиреЛрдбреНрд╕ рдХреЗ рдПрдХ рдмрд╛рд░ рдХреЗ рдЕрдкрдбреЗрдЯ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛;
- рдЕрджреНрдпрддрди / рд╕реНрдЯреНрд░реАрдорд┐рдВрдЧ рдбреЗрдЯрд╛ рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдорд░реНрдерди рдХрд╛ рдЕрднрд╛рд╡ред
рдирдИ Hadoop рд╡рд╛рд╕реНрддреБрдХрд▓рд╛ рдиреЗ рдЙрдкрд░реЛрдХреНрдд рдХрдИ рд╕реАрдорд╛рдУрдВ рдХреЛ рд╣рдЯрд╛рдиреЗ рдХрд╛ рд▓рдХреНрд╖реНрдп рд░рдЦрд╛ рд╣реИред
Hadoop 2.0 рдХреА рд╡рд╛рд╕реНрддреБрдХрд▓рд╛ рдФрд░ рдЗрд╕реЗ рджреВрд░ рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреА рдЧрдИ рд╕реАрдорд╛рдУрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ, рдФрд░ рд╣рдо рдиреАрдЪреЗ рдмрд╛рдд рдХрд░реЗрдВрдЧреЗред
2. Hadoop MapReduce Next
рдкреНрд░рдореБрдЦ рдкрд░рд┐рд╡рд░реНрддрдиреЛрдВ рдиреЗ Hadoop MapReduce рдХреЗ рд╡рд┐рддрд░рд┐рдд рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдШрдЯрдХ рдХреЛ рдкреНрд░рднрд╛рд╡рд┐рдд рдХрд┐рдпрд╛ рд╣реИред
рдХреНрд▓рд╛рд╕рд┐рдХ Hadoop MapReduce рдПрдХ рдПрдХрд▓
JobTracker рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдФрд░
TaskTracker рдкреНрд░рдХреНрд░рд┐рдпрд╛рдУрдВ рдХреА рдПрдХ рдордирдорд╛рдиреА рд╕рдВрдЦреНрдпрд╛ рдереАред
рдирдП Hadoop MapReduce рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдореЗрдВ, JobTracker рдХреЗ рд╕рдВрд╕рд╛рдзрди рдкреНрд░рдмрдВрдзрди рдФрд░ рдиреМрдХрд░реА рдирд┐рд░реНрдзрд╛рд░рдг / рд╕рдордиреНрд╡рдп рдХрд╛рд░реНрдпреЛрдВ рдХреЛ 2 рдЕрд▓рдЧ-рдЕрд▓рдЧ рдШрдЯрдХреЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ:
- рд╕рдВрд╕рд╛рдзрди рдкреНрд░рдмрдВрдзрдХ рд╕рдВрд╕рд╛рдзрди рдкреНрд░рдмрдВрдзрдХ
- ApplicationMaster рдпреЛрдЬрдирд╛рдХрд╛рд░ рдФрд░ рд╕рдордиреНрд╡рдпрдХред
рдЖрдЗрдП рдкреНрд░рддреНрдпреЗрдХ рдШрдЯрдХ рдкрд░ рдЕрдзрд┐рдХ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рд╡рд┐рдЪрд╛рд░ рдХрд░реЗрдВред
рд╕рдВрд╕рд╛рдзрдирдкреНрд░рдмрдВрдзрдХ
рд░рд┐рд╕реЛрд░реНрд╕ рдореИрдирдЬрд░ (рдЖрд░рдПрдо) рдПрдХ рд╡реИрд╢реНрд╡рд┐рдХ рд╕рдВрд╕рд╛рдзрди рдкреНрд░рдмрдВрдзрдХ рд╣реИ рдЬрд┐рд╕рдХрд╛ рдХрд╛рд░реНрдп рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рджреНрд╡рд╛рд░рд╛ рдЕрдиреБрд░реЛрдзрд┐рдд рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреЛ рд╡рд┐рддрд░рд┐рдд рдХрд░рдирд╛ рдФрд░ рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдиреЛрдбреНрд╕ рдХреА рдирд┐рдЧрд░рд╛рдиреА рдХрд░рдирд╛ рд╣реИ, рдЬрд┐рд╕ рдкрд░ рдпреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рдЪрд▓ рд░рд╣реЗ рд╣реИрдВред
рд╕рдВрд╕рд╛рдзрди рдкреНрд░рдмрдВрдзрдХ, рдмрджрд▓реЗ рдореЗрдВ, рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдШрдЯрдХ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:
- рд╢реЗрдбреНрдпреВрд▓рд░ рдЙрди рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреЛ рдЖрд╡рдВрдЯрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЬрд┐рдореНрдореЗрджрд╛рд░ рд╢реЗрдбреНрдпреВрд▓рд░ рд╣реИ рдЬрд┐рд╕реЗ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИред
рд╢реЗрдбреНрдпреВрд▓рд░ "рдХреНрд▓реАрди" рд╢реЗрдбреНрдпреВрд▓рд░ рд╣реИ: рдпрд╣ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреА рд╕реНрдерд┐рддрд┐ рдХреА рдирд┐рдЧрд░рд╛рдиреА рдпрд╛ рдирд┐рдЧрд░рд╛рдиреА рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИред
- ApplicationManager (AsM) ApplicationMaster рдЙрджрд╛рд╣рд░рдгреЛрдВ рдХреЛ рд▓реЙрдиреНрдЪ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЬрд┐рдореНрдореЗрджрд╛рд░ рдШрдЯрдХ рд╣реИ, рд╕рд╛рде рд╣реА рдиреЛрдбреНрд╕ (рдХрдВрдЯреЗрдирд░реЛрдВ) рдХреА рдирд┐рдЧрд░рд╛рдиреА рдХрд░рдирд╛, рдЬрд┐рд╕ рдкрд░ рдирд┐рд╖реНрдкрд╛рджрди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдФрд░ "рдореГрдд" рдиреЛрдбреНрд╕ рдХреЛ рдкреБрдирд░рд╛рд░рдВрдн рдХрд░рддрд╛ рд╣реИред
рдпрд╣ рдзреНрдпрд╛рди рджреЗрдиреЗ рдпреЛрдЧреНрдп рд╣реИ рдХрд┐ рд╕рдВрд╕рд╛рдзрди рдкреНрд░рдмрдВрдзрдХ рдореЗрдВ рдЕрдиреБрд╕реВрдЪрдХ рдПрдХ рдкреНрд▓рдЧ рдХрд░рдиреЗ рдпреЛрдЧреНрдп рдШрдЯрдХ рд╣реИред рдХреБрд▓ 3 рдкреНрд░рдХрд╛рд░ рдХреЗ рд╕рдордпрдмрджреНрдзрдХ рд╣реИрдВ: рдПрдлрдЖрдИрдПрдлрдУ рдЕрдиреБрд╕реВрдЪрдХ (рдбрд┐рдлрд╝реЙрд▓реНрдЯ), рдХреНрд╖рдорддрд╛ рдЕрдиреБрд╕реВрдЪрдХ рдФрд░ рдирд┐рд╖реНрдкрдХреНрд╖ рдЕрдиреБрд╕реВрдЪрдХред Hadoop 0.23 рд╕рдВрд╕реНрдХрд░рдг рдореЗрдВ, рдкрд╣рд▓реЗ 2 рдкреНрд░рдХрд╛рд░ рдХреЗ рдЕрдиреБрд╕реВрдЪрд┐рдпреЛрдВ рдХрд╛ рд╕рдорд░реНрдерди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рддреАрд╕рд░рд╛ - рдирд╣реАрдВред
рдХрдВрдЯреЗрдирд░ рдХреА рдЕрдореВрд░реНрдд рдЕрд╡рдзрд╛рд░рдгрд╛ рдХреЗ рд▓рд┐рдП рдЖрд░рдПрдо рд╕реЗ рд╕рдВрд╕рд╛рдзрди рдХрд╛ рдЕрдиреБрд░реЛрдз рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдЬрд┐рд╕ рдкрд░ рдмрд╛рдж рдореЗрдВ рдЪрд░реНрдЪрд╛ рдХреА рдЬрд╛рдПрдЧреА рдФрд░ рдЬрд┐рд╕рдХреЗ рд▓рд┐рдП рдЖрдк рдЖрд╡рд╢реНрдпрдХ рдкреНрд░реЛрд╕реЗрд╕рд░ рд╕рдордп, рд░реИрдо рдХреА рдорд╛рддреНрд░рд╛, рдЖрд╡рд╢реНрдпрдХ рдиреЗрдЯрд╡рд░реНрдХ рдмреИрдВрдбрд╡рд┐рдбреНрде рдЬреИрд╕реЗ рдкреИрд░рд╛рдореАрдЯрд░ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рджрд┐рд╕рдВрдмрд░ 2012 рддрдХ, рдХреЗрд╡рд▓ "рд░реИрдо рдХреНрд╖рдорддрд╛" рдкреИрд░рд╛рдореАрдЯрд░ рд╕рдорд░реНрдерд┐рдд рд╣реИред
рдкрд░рд┐рдЪрдп рдЖрд░рдПрдо рдХреНрд▓рд╕реНрдЯрд░ рдиреЛрдбреНрд╕ рдХреЛ рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреЗ рд░реВрдк рдореЗрдВ рд╡реНрдпрд╡рд╣рд╛рд░ рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддрд╛ рд╣реИ, рдЬреЛ рдЧреБрдгрд╛рддреНрдордХ рд░реВрдк рд╕реЗ рдХреНрд▓рд╕реНрдЯрд░ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреЗ рдЙрдкрдпреЛрдЧ рдХреЛ рдмрдврд╝рд╛рддрд╛ рд╣реИред
ApplicationMaster
ApplicationMaster (AM) рдПрдХ рд╡рд┐рддрд░рд┐рдд рдЕрдиреБрдкреНрд░рдпреЛрдЧ рдХреЗ рдирд┐рд╖реНрдкрд╛рджрди рдХреА рд╕реНрдерд┐рддрд┐ рдХреЗ рдЬреАрд╡рди рдЪрдХреНрд░ рдХреА рдпреЛрдЬрдирд╛, рд╕рдордиреНрд╡рдп рдФрд░ рдирд┐рдЧрд░рд╛рдиреА рдХреЗ рд▓рд┐рдП рдЬрд┐рдореНрдореЗрджрд╛рд░ рдШрдЯрдХ рд╣реИред рдкреНрд░рддреНрдпреЗрдХ рдПрдкреНрд▓рд┐рдХреЗрд╢рди рдХреЗ рдкрд╛рд╕ ApplicationMaster рдХрд╛ рдЕрдкрдирд╛ рдЙрджрд╛рд╣рд░рдг рд╣реИред
рдЗрд╕ рд╕реНрддрд░ рдкрд░, рдпрд╣ рдпрд╛рд░реНрди рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░рдиреЗ рдпреЛрдЧреНрдп рд╣реИред
YARN (рдлрд┐рд░ рднреА рдПрдХ рдЕрдиреНрдп рд╕рдВрд╕рд╛рдзрди рд╡рд╛рд░реНрддрд╛рдХрд╛рд░) рд╡рд┐рддрд░рд┐рдд рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреЛ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рд╕реЙрдлреНрдЯрд╡реЗрдпрд░ рдврд╛рдВрдЪрд╛ рд╣реИ (рдЬреЛ рдХрд┐ рдПрдкреНрд▓реАрдХреЗрд╢рдирдорд╛рд╕реНрдЯрд░ рд╣реИ)ред YARN рд╡рд┐рддрд░рд┐рдд рдкреНрд░рдХрд╛рд░ рдХреЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреЛ рд╡рд┐рдХрд╕рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрд╡рд╢реНрдпрдХ рдШрдЯрдХ рдФрд░ API рдкреНрд░рджрд╛рди рдХрд░рддрд╛ рд╣реИред рдврд╛рдВрдЪрд╛ рдЦреБрдж рд╣реА рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреЗ рдЖрд╡рдВрдЯрди рдХреЗ рд▓рд┐рдП рдЬрд┐рдореНрдореЗрджрд╛рд░реА рд▓реЗрддрд╛ рд╣реИ, рдЬреЛ рдЪрд▓ рд░рд╣реЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рд╕реЗ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреЗ рдЕрдиреБрд░реЛрдз рдХреЗ рдЬрд╡рд╛рдм рдореЗрдВ рд╣реЛрддрд╛ рд╣реИ рдФрд░ рдЖрд╡реЗрджрди рдирд┐рд╖реНрдкрд╛рджрди рдХреА рд╕реНрдерд┐рддрд┐ рдХреА рдирд┐рдЧрд░рд╛рдиреА рдХреЗ рд▓рд┐рдП рдЬрд┐рдореНрдореЗрджрд╛рд░реА рд╣реИред
рдХреНрд▓рд╛рд╕рд┐рдХ Hadoop MapReduce рдореЗрдВ рд▓рд╛рдЧреВ рдореЙрдбрд▓ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ YARN рдореЙрдбрд▓ рдЕрдзрд┐рдХ рд╕рд╛рдорд╛рдиреНрдп рд╣реИред
YARN рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж, Hadoop рдХреНрд▓рд╕реНрдЯрд░ рдкрд░ рди рдХреЗрд╡рд▓ рдорд╛рдирдЪрд┐рддреНрд░ рдЪрд▓рд╛рдирд╛ / рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреЛ рдХрдо рдХрд░рдирд╛ рд╕рдВрднрд╡ рд╣реИ, рдмрд▓реНрдХрд┐ рдЙрдкрдпреЛрдЧ рдХрд┐рдП рдЧрдП рдПрдкреНрд▓рд┐рдХреЗрд╢рди рднреА рд╡рд┐рддрд░рд┐рдд рдХрд┐рдП рдЧрдП рд╣реИрдВ: рдУрдкрди MPI, рд╕реНрдкрд╛рд░реНрдХ, Apache HAMA, Apache Giraph, рдЖрджрд┐ред рдЕрдиреНрдп рд╡рд┐рддрд░рд┐рдд рдПрд▓реНрдЧреЛрд░рд┐рджрдо рдХреЛ рд▓рд╛рдЧреВ рдХрд░рдирд╛ рд╕рдВрднрд╡ рд╣реИ (рдпрд╣рд╛рдВ рдпрд╣ рдУрдУрдкреА рдХреА рддрд╛рдХрдд рд╣реИ!)ред рд╡рд┐рд╕реНрддреГрдд
рдирд┐рд░реНрджреЗрд╢ рдЕрдкрд╛рдЪреЗ рд╡рд┐рдХреА рдореЗрдВ рд╡рд░реНрдгрд┐рдд
рд╣реИрдВ ред
MapReduce 2.0 (рдпрд╛ MR2, рдпрд╛ MRv2), рдмрджрд▓реЗ рдореЗрдВ, рдирдХреНрд╢реЗ рдХреЗ рдврд╛рдВрдЪреЗ рдХреЗ рднреАрддрд░ рд╡рд┐рддрд░рд┐рдд рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдкреНрд░рджрд░реНрд╢рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рд░реВрдкрд░реЗрдЦрд╛ рд╣реИ / рдкреНрд░реЛрдЧреНрд░рд╛рдорд┐рдВрдЧ рдореЙрдбрд▓ рдХреЛ рдХрдо рдХрд░реЗрдВ, YARN рд╕реНрддрд░ рд╕реЗ рдКрдкрд░ "рдЭреВрда"ред
рд╕рдВрд╕рд╛рдзрди рдкреНрд░рдмрдВрдзрди рдФрд░ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рдЬреАрд╡рди рдЪрдХреНрд░ рдпреЛрдЬрдирд╛ / рд╕рдВрд╕рд╛рдзрди рдкреНрд░рдмрдВрдзрдХ рдФрд░ ApplicationMaster рдШрдЯрдХреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдордиреНрд╡рдп рдХреЗ рд▓рд┐рдП рдЬрд┐рдореНрдореЗрджрд╛рд░рд┐рдпреЛрдВ рдХреЗ рдкреГрдердХреНрдХрд░рдг рдиреЗ Hadoop рдордВрдЪ рдХреЛ рдЕрдзрд┐рдХ рд╡рд┐рддрд░рд┐рдд рдХрд┐рдпрд╛ рд╣реИред рдЗрд╕рдХреЗ рдкрд░рд┐рдгрд╛рдорд╕реНрд╡рд░реВрдк, рдкреНрд▓реЗрдЯрдлрд╝реЙрд░реНрдо рдХреА рдорд╛рдкрдиреАрдпрддрд╛ рдкрд░ рд╕рдХрд╛рд░рд╛рддреНрдордХ рдкреНрд░рднрд╛рд╡ рдкрдбрд╝рд╛ред
NodeManager
NodeManager (NM) - рдХрдореНрдкреНрдпреВрдЯ рдиреЛрдб рдкрд░ рдЪрд▓рдиреЗ рд╡рд╛рд▓рд╛ рдПрдЬреЗрдВрдЯ, рдЬрд┐рд╕рдХреЗ рдХрд░реНрддрд╡реНрдпреЛрдВ рдореЗрдВ рд╢рд╛рдорд┐рд▓ рд╣реИрдВ:
- рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рд╕рдВрд╕рд╛рдзрдиреЛрдВ (рд╕реАрдкреАрдпреВ, рд░реИрдо, рдиреЗрдЯрд╡рд░реНрдХ, рдЖрджрд┐) рдХрд╛ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд┐рдпрд╛ рдЯреНрд░реИрдХрд┐рдВрдЧ;
- рд░рд┐рд╕реЛрд░реНрд╕рдореИрди / рд╢реЗрдбреНрдпреВрд▓рд░ рд░рд┐рд╕реЛрд░реНрд╕ рдореИрдиреЗрдЬрд░ рдХреЗ рд╢реЗрдбреНрдпреВрд▓ рдореЗрдВ рдкреНрд░рдпреБрдХреНрдд рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдкрд░ рд░рд┐рдкреЛрд░реНрдЯ рднреЗрдЬрдирд╛ред
рд╕рд╣рднрд╛рдЧрд┐рддрд╛ рдкреНрд░реЛрдЯреЛрдХреЙрд▓
Hadoop рдкреНрд▓реЗрдЯрдлрд╝реЙрд░реНрдо рдХреЗ рд╡рд┐рднрд┐рдиреНрди рдШрдЯрдХреЛрдВ рдкрд░ рдирд┐рдпрдВрддреНрд░рдг рдЖрджреЗрд╢ рдФрд░ рд╕реНрдерд┐рддрд┐ рд╣рд╕реНрддрд╛рдВрддрд░рдг рдирд┐рдореНрди рдкреНрд░реЛрдЯреЛрдХреЙрд▓ рд╕реЗ рдЧреБрдЬрд░рддрд╛ рд╣реИ:
- ClientRMProtocol - рдЕрдиреБрдкреНрд░рдпреЛрдЧ рд▓реЙрдиреНрдЪ рдХрд░рдиреЗ, рд╕реНрдерд┐рддрд┐ рдХреА рдЬрд╛рдБрдЪ рдХрд░рдиреЗ рдФрд░ рдЕрдиреБрдкреНрд░рдпреЛрдЧреЛрдВ рдХреЛ рдмрдВрдж рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП ResourceManager рдХреЗ рд╕рд╛рде рдХреНрд▓рд╛рдЗрдВрдЯ рдЗрдВрдЯрд░реИрдХреНрд╢рди рдХреЗ рд▓рд┐рдП рдПрдХ рдкреНрд░реЛрдЯреЛрдХреЙрд▓ред

- AMRMProtocol - рдПрдПрдо рдХреА рд╕рджрд╕реНрдпрддрд╛ / рд╕рджрд╕реНрдпрддрд╛ рд╕рдорд╛рдкреНрдд рдХрд░рдиреЗ, рдЕрдиреБрд░реЛрдз рднреЗрдЬрдиреЗ рдФрд░ RM рд╕реЗ рд╕рдВрд╕рд╛рдзрди рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП ResourceManager рдХреЗ рд╕рд╛рде ApplicationMaster рдЙрджрд╛рд╣рд░рдгреЛрдВ рдХреА рдмрд╛рддрдЪреАрдд рдХреЗ рд▓рд┐рдП рдкреНрд░реЛрдЯреЛрдХреЙрд▓ред

- рдХрдВрдЯреЗрдирд░ рдореИрдирдЬрд░ - тАЛтАЛрдПрдирдПрдо рджреНрд╡рд╛рд░рд╛ рдкреНрд░рдмрдВрдзрд┐рдд рдХрдВрдЯреЗрдирд░реЛрдВ рдХреА рд╕реНрдерд┐рддрд┐ рд╢реБрд░реВ рдХрд░рдиреЗ / рд░реЛрдХрдиреЗ рдФрд░ рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдиреЛрдбрдореИрдиреЗрдЬрд░ рдХреЗ рд╕рд╛рде рдПрдкреНрд▓реАрдХреЗрд╢рдирдорд╛рд╕реНрдЯрд░ рдЗрдВрдЯрд░реИрдХреНрд╢рди рдкреНрд░реЛрдЯреЛрдХреЙрд▓ред

3. Hadoop MapReduceред рдХреЗ рд░реВ-рдмрд░реВ
"Hadoop MapReduce Classic" рдХреЗ рднрд╛рдЧ 1 рдиреЗ Hadoop рдордВрдЪ рдХрд╛ рдкрд░рд┐рдЪрдп рджрд┐рдпрд╛ рдФрд░ рдордВрдЪ рдХреА рдореБрдЦреНрдп рд╕реАрдорд╛рдУрдВ рдХрд╛ рд╡рд░реНрдгрди рдХрд┐рдпрд╛ред Hadoop MapReduce Next рдХреЗ рднрд╛рдЧ 2 рдиреЗ Hadoop MapReduce рд╡рд┐рддрд░рд┐рдд рдХрдореНрдкреНрдпреВрдЯрд┐рдВрдЧ рдлреНрд░реЗрдорд╡рд░реНрдХ рдХреЗ рдирдП рд╕рдВрд╕реНрдХрд░рдг рдореЗрдВ рд╢реБрд░реВ рдХреА рдЧрдИ рдЕрд╡рдзрд╛рд░рдгрд╛рдУрдВ рдФрд░ рдШрдЯрдХреЛрдВ рдХрд╛ рд╡рд░реНрдгрди рдХрд┐рдпрд╛ред
рд╣рдо рдЪрд░реНрдЪрд╛ рдХрд░реЗрдВрдЧреЗ рдХрд┐ рдЗрди рдЕрд╡рдзрд╛рд░рдгрд╛рдУрдВ рдХреЛ рд▓рд╛рдЧреВ рдХрд░рдиреЗ рд╡рд╛рд▓реЗ YARN, MR2 рдЕрд╡рдзрд╛рд░рдгрд╛рдУрдВ рдФрд░ рдШрдЯрдХреЛрдВ рдиреЗ Hadoop рдкреНрд▓реЗрдЯрдлрд╝реЙрд░реНрдо рдкрд░ рд╡рд┐рддрд░рд┐рдд рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдХреА рд╡рд╛рд╕реНрддреБрдХрд▓рд╛ рдХреЛ рдХреИрд╕реЗ рдмрджрд▓ рджрд┐рдпрд╛ рд╣реИ, рдФрд░ рдЗрди рдкрд░рд┐рд╡рд░реНрддрдиреЛрдВ рдиреЗ рдореМрдЬреВрджрд╛ рдкреНрд▓реЗрдЯрдлрд╝реЙрд░реНрдо рд╕реАрдорд╛рдУрдВ рдХреЗ рдЖрд╕рдкрд╛рд╕ рдкрд╣реБрдВрдЪрдиреЗ рдореЗрдВ рдХреИрд╕реЗ (рдпрд╛ рдирд╣реАрдВ) рдорджрдж рдХреА рд╣реИред
- рд╢рдмреНрджрд╛рд╡рд▓реА рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ
рдЗрд╕рдХреЗ рдмрд╛рдж рд╕реЗ рд╣рдо рдмрдЪрдиреЗ рдХреЗ рд▓рд┐рдП Hadoop MapReduce рдХреЗ рдХреНрд▓рд╛рд╕рд┐рдХ рдФрд░ "2.0" рд╕рдВрд╕реНрдХрд░рдгреЛрдВ рдХреА рддреБрд▓рдирд╛ рдХрд░рдиреЗ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдмрд╛рдд рдХрд░реЗрдВрдЧреЗ:
- рдЪрд░реНрдЪрд╛ рдХреА рдЬрд╛ рд░рд╣реА рд╕рдВрд╕реНрдХрд░рдг рдХреЗ рд╕рд╛рде рдЬреБрдбрд╝реЗ рдЕрд╕реНрдкрд╖реНрдЯрддрд╛, рдФрд░ / рдпрд╛
- рд╡рд┐рдЪрд╛рд░рд╛рдзреАрди рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЕрдВрддрд╣реАрди рд╢реЛрдзрди,
рдореИрдВ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд
рд╕рд╢рд░реНрдд рд╢рдмреНрджрд╛рд╡рд▓реА рдХрд╛ рдкрд╛рд▓рди рдХрд░рдирд╛ рдЬрд╛рд░реА рд░рдЦреВрдВрдЧрд╛:
- Hadoop MapReduce 1.0 - "рдХреНрд▓рд╛рд╕рд┐рдХ" рдореИрджрд╛рди (рдЬрдм рддрдХ рдХрд┐ рдЕрдиреНрдпрдерд╛ рдирд┐рд░реНрджрд┐рд╖реНрдЯ рди рд╣реЛ) Hadoop MapReduce;
- Hadoop MapReduce 2.0 YARN рдФрд░ MapReduce v2.0 рд╣реИред
-
рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░
Hadoop MapReduce 1.0 рдореЗрдВ, рдПрдХ рдХреНрд▓рд╕реНрдЯрд░ рдореЗрдВ рдПрдХ JobTracker рдиреЛрдб рд╣реЛрддрд╛ рд╣реИ рдЬреЛ рдХрдИ рдЯрд╛рд╕реНрдХрдЯреНрд░реИрдХ рдиреЛрдбреНрд╕ рдореЗрдВ рдХрд╛рд░реНрдп рд╡рд┐рддрд░рд┐рдд рдХрд░рддрд╛ рд╣реИ рдЬреЛ рд╕реАрдзреЗ рдХрд╛рд░реНрдп рдХрд░рддрд╛ рд╣реИред
рдирдП Hadoop MapReduce рд╡рд╛рд╕реНрддреБрдХрд▓рд╛ рдореЗрдВ, рд╕рдВрд╕рд╛рдзрди рдкреНрд░рдмрдВрдзрди рдЬрд┐рдореНрдореЗрджрд╛рд░рд┐рдпреЛрдВ рдФрд░ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рдЬреАрд╡рди рдЪрдХреНрд░ рдХреЗ рдирд┐рд░реНрдзрд╛рд░рдг / рд╕рдордиреНрд╡рдп рдХреНрд░рдорд╢рдГ ResourceManager (рдкреНрд░рддрд┐-рдХреНрд▓рд╕реНрдЯрд░) рдФрд░ ApplicationMaster (рдкреНрд░рддрд┐-рдЕрдиреБрдкреНрд░рдпреЛрдЧ) рдХреЗ рдмреАрдЪ рд╕рд╛рдЭрд╛ рдХрд┐рдП рдЬрд╛рддреЗ рд╣реИрдВред
рдкреНрд░рддреНрдпреЗрдХ рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдиреЛрдб рдХреЛ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреА рдкреВрд░реНрд╡ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдорд╛рддреНрд░рд╛ рд╡рд╛рд▓реЗ
рдХрдВрдЯреЗрдирд░ рдХрдВрдЯреЗрдирд░реЛрдВ рдХреА рдПрдХ рдордирдорд╛рдиреА рд╕рдВрдЦреНрдпрд╛ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ: рд╕реАрдкреАрдпреВ, рд░реИрдо, рдЖрджрд┐ред рдХрдВрдЯреЗрдирд░ рдореЙрдирд┐рдЯрд░рд┐рдВрдЧ NodeManager (рдкреНрд░рддрд┐-рдиреЛрдб) рджреНрд╡рд╛рд░рд╛ рдХреА рдЬрд╛рддреА рд╣реИред
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХреНрд▓рд╛рд╕рд┐рдХ рд╡рд╛рд╕реНрддреБрдХрд▓рд╛ рдореЗрдВ Hadoop MapReduce рдХреЗ рд╡реНрдпрдХреНрддрд┐рдЧрдд рдШрдЯрдХреЛрдВ рдХреА рдмрд╛рддрдЪреАрдд рдХрд╛ рдПрдХ рдЪрд┐рддреНрд░рдг рд╣реИ
рдФрд░ YARN рдЬреИрд╕реА рд╡рд╛рд╕реНрддреБрдХрд▓рд╛ (рдШрдЯрдХреЛрдВ рдХреЗ рдмреАрдЪ рд╕рдВрдЪрд╛рд░ рдХреЗ рдирдП рдкреНрд░рдХрд╛рд░ рдмреЛрд▓реНрдб рдореЗрдВ рд╣рд╛рдЗрд▓рд╛рдЗрдЯ рдХрд┐рдП рдЧрдП рд╣реИрдВ)ред
рдЗрд╕рдХреЗ рдмрд╛рдж, рд╣рдо рджреЗрдЦреЗрдВрдЧреЗ рдХрд┐ рдирдпрд╛ Hadoop MapReduce рдЖрд░реНрдХрд┐рдЯреЗрдХреНрдЪрд░ рдкреНрд▓реЗрдЯрдлрд╝реЙрд░реНрдо рдХреЗ рдРрд╕реЗ рдкрд╣рд▓реБрдУрдВ рдХреЛ рдЙрдкрд▓рдмреНрдзрддрд╛, рдорд╛рдкрдиреАрдпрддрд╛ рдФрд░ рд╕рдВрд╕рд╛рдзрди рдЙрдкрдпреЛрдЧ рдХреЗ рд░реВрдк рдореЗрдВ рдХреИрд╕реЗ рдкреНрд░рднрд╛рд╡рд┐рдд рдХрд░рддрд╛ рд╣реИред
рдЙрдкрд▓рдмреНрдзрддрд╛
Hadoop MapReduce 1.0 рдореЗрдВ, JobTracker рдХреЛ рд╡рд┐рд╢реЗрд╖ рд▓реЙрдЧ рд╕реЗ рдкрдврд╝рдиреЗ рдХреЗ рд╕рд╛рде JobTracker рдХреЗ рдкреБрдирд░рд╛рд░рдВрдн рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИ, рдЬреЛ рдЕрдВрддрддрдГ рдХреНрд▓рд╕реНрдЯрд░ рдбрд╛рдЙрдирдЯрд╛рдЗрдо рдХреА рдУрд░ рдЬрд╛рддрд╛ рд╣реИред
рдирдП рд╕рдВрд╕реНрдХрд░рдг рдореЗрдВ, рдЕрднрд┐рдЧрдореНрдпрддрд╛ рд╕рдорд╛рдзрд╛рди, рд╣рд╛рд▓рд╛рдВрдХрд┐ рд╡реЗ рдЧреБрдгрд╛рддреНрдордХ рд░реВрдк рд╕реЗ рдирдП рд╕реНрддрд░ рддрдХ рдирд╣реАрдВ рдмрдврд╝реЗ рд╣реИрдВ, рдлрд┐рд░ рднреА рдЪреАрдЬреЗрдВ рдмрджрддрд░ рдирд╣реАрдВ рд╣реИрдВред Hadoop MapReduce 2.0 рдЙрдЪреНрдЪ рдЙрдкрд▓рдмреНрдзрддрд╛ рд╕рдорд╕реНрдпрд╛ рдХреЛ рдирд┐рдореНрди рддрд░реАрдХреЗ рд╕реЗ рд╣рд▓ рдХрд░рддрд╛ рд╣реИ: рд╕рдВрд╕рд╛рдзрди рдкреНрд░рдмрдВрдзрдХ рдФрд░ ApplicationMaster рдШрдЯрдХреЛрдВ рдХреА рд╕реНрдерд┐рддрд┐ рдХреЛ рд╕рд╣реЗрдЬрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдФрд░ рдЕрдВрддрд┐рдо рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рд╕рд╣реЗрдЬреЗ рдЧрдП рд░рд╛рдЬреНрдп рдХреА рд▓реЛрдбрд┐рдВрдЧ рдХреЗ рд╕рд╛рде рд╡рд┐рдлрд▓рддрд╛ рдХреЗ рдорд╛рдорд▓реЗ рдореЗрдВ рд╕реВрдЪреАрдмрджреНрдз рдШрдЯрдХреЛрдВ рдХреЛ рд╕реНрд╡рдЪрд╛рд▓рд┐рдд рд░реВрдк рд╕реЗ рдкреБрдирд░рд╛рд░рдВрдн рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдкреНрд░рдгрд╛рд▓реА рдкреНрд░рджрд╛рди рдХреА рдЬрд╛рддреА рд╣реИред
рд░рд┐рд╕реЛрд░реНрд╕ рдореИрдирдЬрд░ рдХреЗ рд▓рд┐рдП, рдЕрдкрд╛рдЪреЗ рдЬрд╝реВрдХрд┐рдкрд░ рд░рд╛рдЬреНрдп рджреГрдврд╝рддрд╛ рдХреЛ рд╕рдВрднрд╛рд▓рддрд╛ рд╣реИред рдФрд░ рдЬрдм рд╕рдВрд╕рд╛рдзрди рдкреНрд░рдмрдВрдзрдХ рд╡рд┐рдлрд▓ рд╣реЛ рдЬрд╛рддрд╛ рд╣реИ, рддреЛ рдЙрд╕ рд╕реНрдерд┐рддрд┐ рдХреЗ рд╕рд╛рде рдПрдХ рдирдпрд╛ RM рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдмрдирд╛рдИ рдЬрд╛рддреА рд╣реИ рдЬреЛ рд╡рд┐рдлрд▓рддрд╛ рд╕реЗ рдкрд╣рд▓реЗ рдереАред рдЗрд╕ рдкреНрд░рдХрд╛рд░, рдЖрд░рдПрдо рд╡рд┐рдлрд▓рддрд╛ рдХреЗ рдкрд░рд┐рдгрд╛рдо рдпрд╣ рд╣реИрдВ рдХрд┐ рд╕рднреА рдирд┐рдпреЛрдЬрд┐рдд рдФрд░ рдЪрд▓рдиреЗ рд╡рд╛рд▓реЗ рдЕрдиреБрдкреНрд░рдпреЛрдЧ рдлрд┐рд░ рд╕реЗ рд╢реБрд░реВ рд╣реЛ рдЬрд╛рдПрдВрдЧреЗред
ApplicationMaster рдЕрдкрдиреЗ рд╕реНрд╡рдпрдВ рдХреЗ рдЪреЗрдХрдкреЙрдЗрдВрдЯ рдЗрдВрдЬрди рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИред рдЗрд╕ рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдореЗрдВ, AM рдЕрдкрдиреЗ рд░рд╛рдЬреНрдп рдХреЛ HDFS рдореЗрдВ рдмрдЪрд╛рддрд╛ рд╣реИред рдпрджрд┐ AM рдЕрдиреБрдкрд▓рдмреНрдз рд╣реИ, рддреЛ RM рд╕реНрдиреИрдкрд╢реЙрдЯ рд╕реЗ рд╕реНрдерд┐рддрд┐ рдХреЗ рд╕рд╛рде рдЗрд╕реЗ рдкреБрдирд░рд╛рд░рдВрдн рдХрд░рддрд╛ рд╣реИред
scalability
Hadoop MapReduce 1.0 рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рдбреЗрд╡рд▓рдкрд░реНрд╕ рдиреЗ рджреЛрд╣рд░рд╛рдпрд╛ рд╣реИ рдХрд┐ Hadoop рдХреНрд▓рд╕реНрдЯрд░ рдХреА рд╕реНрдХреЗрд▓реЗрдмрд┐рд▓рд┐рдЯреА рд╕реАрдорд╛ 4K рдорд╢реАрдиреЛрдВ рдХреЗ рдХреНрд╖реЗрддреНрд░ рдореЗрдВ рд╣реИред рдЗрд╕ рд╕реАрдорд╛ рдХрд╛ рдореБрдЦреНрдп рдХрд╛рд░рдг рдпрд╣ рд╣реИ рдХрд┐ рдЬреЙрдмрдЯреНрд░реИрдХ рдиреЛрдб рдЕрдкрдиреЗ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХрд╛ рдХрд╛рдлреА рд╣рд┐рд╕реНрд╕рд╛ рдЖрд╡реЗрджрди рдЬреАрд╡рди рдЪрдХреНрд░ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рдХрд╛рд░реНрдпреЛрдВ рдкрд░ рдЦрд░реНрдЪ рдХрд░рддрд╛ рд╣реИред рдЙрддреНрддрд░рд╛рд░реНрджреНрдз рдХреЛ рдПрдХ рд╡рд┐рд╢реЗрд╖ рдЖрд╡реЗрджрди рдХреЗ рд▓рд┐рдП рд╡рд┐рд╢рд┐рд╖реНрдЯ рдХрд╛рд░реНрдпреЛрдВ рдХреЗ рд▓рд┐рдП рдЬрд┐рдореНрдореЗрджрд╛рд░ рдард╣рд░рд╛рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ, рдФрд░ рдПрдХ рдкреВрд░реЗ рдХреЗ рд░реВрдк рдореЗрдВ рдХреНрд▓рд╕реНрдЯрд░ рдХреЗ рд▓рд┐рдП рдирд╣реАрдВред
рд░рд┐рд╕реЛрд░реНрд╕ рдореИрдирдЬрд░ рдФрд░ рдПрдкреНрд▓реАрдХреЗрд╢рдирдорд╛рд╕реНрдЯрд░ рдХреЗ рдмреАрдЪ рд╡рд┐рднрд┐рдиреНрди рд╕реНрддрд░реЛрдВ рдкрд░ рдХрд╛рд░реНрдпреЛрдВ рдХреЗ рд▓рд┐рдП рдЬрд┐рдореНрдореЗрджрд╛рд░реА рдХрд╛ рдмрдВрдЯрд╡рд╛рд░рд╛ рд╕рдВрднрд╡рдд: рд╣рдбреЛрдк рдореИрдкрдбреНрд░рд╛рдЗрдб 2.0 рдХрд╛ рдореБрдЦреНрдп рдкрддрд╛ рд╣реИред
рдпрд╣ рдпреЛрдЬрдирд╛ рдмрдирд╛рдИ рдЧрдИ рд╣реИ рдХрд┐ Hadoop MapReduce 2.0 10K + рдХрдВрдкреНрдпреВрдЯ рдиреЛрдбреНрд╕ рдХреЗ рдХреНрд▓рд╕реНрдЯрд░ рдкрд░ рдЪрд▓ рд╕рдХрддреА рд╣реИ, рдЬреЛ Hadoop MapReduce рдХреЗ рдХреНрд▓рд╛рд╕рд┐рдХ рд╕рдВрд╕реНрдХрд░рдг рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдПрдХ рдорд╣рддреНрд╡рдкреВрд░реНрдг рдкреНрд░рдЧрддрд┐ рд╣реИред
рд╕рдВрд╕рд╛рдзрди рдХрд╛ рдЙрдкрдпреЛрдЧ
рдХреНрд▓рд╕реНрдЯрд░ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреЗ рдорд╛рдирдЪрд┐рддреНрд░ рдореЗрдВ рд╡рд┐рднрд╛рдЬрди рдФрд░ рдХрдо-рд╕реНрд▓реЙрдЯ рдХреЗ рдХрд╛рд░рдг рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХрд╛ рдХрдо рдЙрдкрдпреЛрдЧ рдЕрдХреНрд╕рд░ рдХреНрд▓рд╛рд╕рд┐рдХ рд╣рдбреЛрдк рдореИрдкрд░рд╛рдЗрдб рдХреА рдЖрд▓реЛрдЪрдирд╛ рдХрд╛ рд╡рд┐рд╖рдп рднреА рд╣реИред MapReduce 1.0 рдореЗрдВ рд╕реНрд▓реЙрдЯ рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛ рдХреЛ рд╕рд╛рд░реНрд╡рднреМрдорд┐рдХ
рдХрдВрдЯреЗрдирд░реЛрдВ рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛ рд╕реЗ рдмрджрд▓ рджрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ - рд╡рд┐рдирд┐рдореЗрдп рдкреГрдердХ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХрд╛ рдПрдХ рд╕реЗрдЯред
Hadoop MapReduce 2.0 рдореЗрдВ "
рдХрдВрдЯреЗрдирд░ " рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛ рдХреА рд╢реБрд░реВрдЖрдд, рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ, Hadoop рдкреНрд▓реЗрдЯрдлреЙрд░реНрдо -
рдорд▓реНрдЯреА -
рдЯреЗрдиреЗрдВрд╕реА рдореЗрдВ рдПрдХ рдФрд░ рд╕рдВрдкрддреНрддрд┐ рдЬреЛрдбрд╝ рджреАред рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдХреЗ рд░реВрдк рдореЗрдВ рдХреНрд▓рд╕реНрдЯрд░ рдиреЛрдбреНрд╕ рдХреЗ рджреГрд╖реНрдЯрд┐рдХреЛрдг рд╕реЗ рд╕рдВрд╕рд╛рдзрди рдЙрдкрдпреЛрдЧ рдкрд░ рд╕реНрд▓реЙрдЯ рдХреЗ рдирдХрд╛рд░рд╛рддреНрдордХ рдкреНрд░рднрд╛рд╡ рд╕реЗ рдЫреБрдЯрдХрд╛рд░рд╛ рдкрд╛рдиреЗ рдореЗрдВ рдорджрдж рдорд┐рд▓реЗрдЧреАред
рд╕рдВрдпреБрдХреНрддрддрд╛
Hadoop MapReduce 1.0 рдХреА рд╡рд╛рд╕реНрддреБ рд╕рдВрдмрдВрдзреА рд╕рдорд╕реНрдпрд╛рдУрдВ рдореЗрдВ рд╕реЗ рдПрдХ рджреЛ рдХреА рдордЬрдмреВрдд рдХрдиреЗрдХреНрдЯрд┐рд╡рд┐рдЯреА рдереА, рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ, рдЕрдиреНрдпреЛрдиреНрдпрд╛рд╢реНрд░рд┐рдд рд╕рд┐рд╕реНрдЯрдо рдирд╣реАрдВ: рдПрдХ рд╡рд┐рддрд░рд┐рдд рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдлреНрд░реЗрдорд╡рд░реНрдХ рдФрд░ рдХреНрд▓рд╛рдЗрдВрдЯ рд▓рд╛рдЗрдмреНрд░реЗрд░реА рдЬреЛ рдПрдХ рд╡рд┐рддрд░рд┐рдд рдПрд▓реНрдЧреЛрд░рд┐рджрдо рдХреЛ рд▓рд╛рдЧреВ рдХрд░рддреЗ рд╣реИрдВред
рдЗрд╕ рдХрдиреЗрдХреНрд╢рди рдиреЗ Hadoop рдХреНрд▓рд╕реНрдЯрд░ рдкрд░ MPI рдпрд╛ рдЕрдиреНрдп, рд╡реИрдХрд▓реНрдкрд┐рдХ рдореИрдк / рдХрдо, рд╡рд┐рддрд░рд┐рдд рдПрд▓реНрдЧреЛрд░рд┐рджрдо рдХреЛ рдЪрд▓рд╛рдирд╛ рдЕрд╕рдВрднрд╡ рдмрдирд╛ рджрд┐рдпрд╛ рд╣реИред
рдирдИ рд╡рд╛рд╕реНрддреБрдХрд▓рд╛ рдореЗрдВ, рд╡рд┐рддрд░рд┐рдд рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдлреНрд░реЗрдорд╡рд░реНрдХ YARN рдФрд░ рдореИрдк рдХреЗ рдврд╛рдВрдЪреЗ рдХреЗ рднреАрддрд░ рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдврд╛рдВрдЪреЗ / YARN рдкрд░ рдЖрдзрд╛рд░рд┐рдд рдкреНрд░реЛрдЧреНрд░рд╛рдорд┐рдВрдЧ рдореЙрдбрд▓ рдХреЛ рдХрдо рдХрд░реЗрдВ - MR2 рдкрд░ рдкреНрд░рдХрд╛рд╢ рдбрд╛рд▓рд╛ рдЧрдпрд╛ред
MR2, ApplicationMaster рджреНрд╡рд╛рд░рд╛ рдкреНрд░рджрд╛рди рдХрд┐рдпрд╛ рдЧрдпрд╛ рдПрдкреНрд▓рд┐рдХреЗрд╢рди-рд╡рд┐рд╢рд┐рд╖реНрдЯ рдврд╛рдВрдЪрд╛ рд╣реИ, рдЬрдмрдХрд┐ YARN рд░рд┐рд╕реЛрд░реНрд╕ рдореИрдирдЬрд░ рдФрд░ NodeManager рдХреЗ рдШрдЯрдХреЛрдВ рджреНрд╡рд╛рд░рд╛ "рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡" рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ рдФрд░ рд╡рд┐рддрд░рд┐рдд рдПрд▓реНрдЧреЛрд░рд┐рджрдо рдХреА рдмрд╛рд░реАрдХрд┐рдпреЛрдВ рд╕реЗ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рд╕реНрд╡рддрдВрддреНрд░ рд╣реИред
рдСрдл рд╕реНрдХреНрд░реАрди
2 рдкрд╣рд▓реБрдУрдВ рдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдирд╣реАрдВ рдХрд░рдиреЗ рдкрд░ рдкреВрд░реА рддрд╕реНрд╡реАрд░ рдирд╣реАрдВ рд╣реЛрдЧреА:
1. рд▓реЗрдЦ рдХреЗрд╡рд▓ рд╡рд┐рддрд░рд┐рдд рдХрдВрдкреНрдпреВрдЯрд┐рдВрдЧ рдврд╛рдВрдЪреЗ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд┐рдпрд╛ред
рд▓реЗрдЦ рдХреЗ рджрд╛рдпрд░реЗ рдХреЗ рдмрд╛рд╣рд░, рдбреЗрдЯрд╛ рд╡реЗрдпрд░рд╣рд╛рдЙрд╕ рдХреЛ рдкреНрд░рднрд╛рд╡рд┐рдд рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рдкрд░рд┐рд╡рд░реНрддрди рд╣реБрдП рд╣реИрдВред рдЗрдирдореЗрдВ рд╕реЗ рд╕рдмрд╕реЗ рдЙрд▓реНрд▓реЗрдЦрдиреАрдп рдПрдЪрдбреАрдПрдлрдПрд╕ рдирд╛рдо рдиреЛрдб рдХреА рдЙрдЪреНрдЪ рдЙрдкрд▓рдмреНрдзрддрд╛ рдФрд░ рдПрдЪрдбреАрдПрдлрдПрд╕ рдирд╛рдо рдиреЛрдбреНрд╕ рдХрд╛ рдорд╣рд╛рд╕рдВрдШ рд╣реИред
2. рдЙрдкрд░реЛрдХреНрдд рдХреЗрд╡рд▓ Hadoop v2.0 (рд▓реЗрдЦрди рдХреЗ рд╕рдордп рдПрдХ рдЕрд▓реНрдлрд╛ рд╕рдВрд╕реНрдХрд░рдг рдЙрдкрд▓рдмреНрдз рд╣реИ) рдореЗрдВ рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛ред рддреЛ YARN рдФрд░ MR2 рдкрд╣рд▓реЗ рд╕реЗ рд╣реА Hadoop v0.23 рдореЗрдВ рдЙрдкрд▓рдмреНрдз рд╣реИрдВ, рд▓реЗрдХрд┐рди рдЙрдЪреНрдЪ рдЙрдкрд▓рдмреНрдзрддрд╛ NameNode рдХреЗ рд╕рдорд░реНрдерди рдХреЗ рдмрд┐рдирд╛ред
рдЕрд▓рдЧ рд╕реЗ, рдореИрдВ рдпрд╣ рдиреЛрдЯ рдХрд░рддрд╛ рд╣реВрдВ рдХрд┐ рдЬреВрди рд╢рд┐рдХрд╛рдЧреЛ рдПрдЪрдпреВрдЬреА 2012 рд╕рдореНрдореЗрд▓рди рдореЗрдВ, рдЬрд┐рд╕рдХрд╛ рдореИрдВрдиреЗ рдкрд░рд┐рдЪрдп рдореЗрдВ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдерд╛, рдЯреЙрдо рд╡реНрд╣рд╛рдЗрдЯ рдиреЗ рдХрд╣рд╛ рдХрд┐ рдЕрднреА рднреА рд╣рдбреЛрдк 2.0 рдЕрд▓реНрдлрд╛ рдореЗрдВ рдкреНрд░рджрд░реНрд╢рди, рд╕реБрд░рдХреНрд╖рд╛ рдФрд░ рд░рд┐рд╕реЛрд░реНрд╕рдореИрдирдореИрди рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рдХрд╛рд░реНрдп рд╣реИрдВред
рдирд┐рд╖реНрдХрд░реНрд╖
2010 рдореЗрдВ рд╣рдбреЛрдк рдкрд░рд┐рдпреЛрдЬрдирд╛ рдХреЛ
рд╡рд┐рдЪрд╛рд░реЛрдВ рд╕реЗ рд╕реБрдЦрдж рд░реВрдк рд╕реЗ рдЖрд╢реНрдЪрд░реНрдпрдЪрдХрд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛, 2011 рдореЗрдВ -
рд╡рд┐рддрд░рдг рдХреА
рдЧрддрд┐ рд╕реЗ , 2012 рдореЗрдВ рдпрд╣
рдмрджрд▓рд╛рд╡реЛрдВ рдХреЗ
рдкреИрдорд╛рдиреЗ рд╕реЗ рдЯрдХрд░рд╛рдпрд╛ред
Hadoop рдкреНрд▓реЗрдЯрдлрд╝реЙрд░реНрдо рдореЗрдВ YARN рдФрд░ MR2 рдХреЛ рдмрджрд▓ рджреЗрдиреЗ рд╡рд╛рд▓реЗ "рдкрд╛рд░рдВрдкрд░рд┐рдХ" рд╕рд╛рд░рд╛рдВрд╢ рдкрд░ рдореИрдВ рдЖрдкрдХрд╛ рд╕рдордп рдмрд░реНрдмрд╛рдж рдирд╣реАрдВ рдХрд░реВрдБрдЧрд╛ред рдпрд╣ рдПрдХ рд╢рдХ рдХреЗ рдмрд┐рдирд╛ рдордВрдЪ рдореЗрдВ рдПрдХ рдЧреБрдгрд╛рддреНрдордХ рдЫрд▓рд╛рдВрдЧ рд╣реИред
Hadoop рдЕрдм рдмрд┐рдЧ рдбреЗрдЯрд╛ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рдХрд╛рд░реНрдпреЛрдВ рдореЗрдВ рдПрдХ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рдЙрджреНрдпреЛрдЧ рдорд╛рдирдХ рдХреА рддрд░рд╣ рджрд┐рдЦрддрд╛ рд╣реИред рд╕рдВрд╕реНрдХрд░рдг 2.0 рдХреА рдЖрдЧрд╛рдореА рд░рд┐рд▓реАрдЬ рдбреЗрд╡рд▓рдкрд░реНрд╕ рдХреЛ рдПрдХ рдЦреБрд▓рд╛, рджреЛрд╖-рд╕рд╣рд┐рд╖реНрдгреБ, рд╢рд╛рдирджрд╛рд░ рд╕реНрдХреЗрд▓реЗрдмрд▓, рдПрдХреНрд╕реНрдЯреЗрдВрд╕рд┐рдмрд▓ рдорд╛рд╕-рд╕рдорд╛рдВрддрд░ рдкреНрд░реЛрд╕реЗрд╕рд┐рдВрдЧ рдЯреВрд▓ рджреЗрдЧреА рдЬреЛ рдХреЗрд╡рд▓ рдореИрдк рдкрд░ "рд▓реВрдкреЗрдб" рдирд╣реАрдВ рд╣реИ / рдкреНрд░реЛрдЧреНрд░рд╛рдорд┐рдВрдЧ рдореЙрдбрд▓ рдХреЛ рдХрдо рдХрд░рддрд╛ рд╣реИред
рдпрд╣ рдЕрд╡рд┐рд╢реНрд╡рд╕рдиреАрдп рд▓рдЧрддрд╛ рд╣реИред рдпрд╣ рдФрд░ рднреА рдЕрд╡рд┐рд╢реНрд╡рд╕рдиреАрдп рд╣реИ рдХрд┐ рдпрд╣ рдмрд╣реБрдд рдирд┐рдХрдЯ рд╡рд╛рд╕реНрддрд╡рд┐рдХрддрд╛ рд╣реИред
рдЗрд╕ рд╡рд╛рд╕реНрддрд╡рд┐рдХрддрд╛ рдХреЗ рд▓рд┐рдП рддреИрдпрд╛рд░ рд╣реЛрдиреЗ рдХреЗ рд▓рд┐рдП рдХреЗрд╡рд▓ рдПрдХ рдЪреЗрддрд╛рд╡рдиреА рд╣реИ -
рд╕реВрддреНрд░реЛрдВ рдХреА рд╕реВрдЪреА
[рез]
рдЕрдкрд╛рдЪреЗ рд╣рдбреЛрдк рдиреЗрдХреНрд╕реНрдЯрдЬреЗрди рдореИрдкрд░реЗрдб (YARN) ред рдЕрдкрд╛рдЪреЗ рд╕реЙрдлреНрдЯрд╡реЗрдпрд░ рдлрд╛рдЙрдВрдбреЗрд╢рди, 2011ред
[реи] рдЕрд░реБрдг рд╕реА рдореВрд░реНрддрд┐ред
Apache Hadoop MapReduce рдХреА рдЕрдЧрд▓реА рдкреАрдврд╝реА ред рдпрд╛рд╣реВ, 2011ред
[рей] рдЕрд╣рдордж рд░рджрд╡рд╛рдиред
Hadoop 0.23 рдореЗрдВ MapReduce 2.0 ред рдХреНрд▓рд╛рдЙрдбрд░рд╛, 2012ред
[рек] рдЯреЙрдо рд╡реНрд╣рд╛рдЗрдЯред Hadoop: рдж рдирд┐рд╢реНрдЪрд┐рдд рдЧрд╛рдЗрдб, рддреАрд╕рд░рд╛ рд╕рдВрд╕реНрдХрд░рдгред рдУ рд░реЗрд▓реА рдореАрдбрд┐рдпрд╛ / рдпрд╛рд╣реВ рдкреНрд░реЗрд╕, 2012ред
[рел]
рдЕрдкрд╛рдЪреЗ рд╣рдбреЛрдк рдореБрдЦреНрдп 2.0.2-рдЕрд▓реНрдлрд╛ рдПрдкреАрдЖрдИ ред рдЕрдкрд╛рдЪреЗ рд╕реЙрдлреНрдЯрд╡реЗрдпрд░ рдлрд╛рдЙрдВрдбреЗрд╢рди, 2012ред
рдкреЛрд╕реНрдЯрд╕реНрдХреНрд░рд┐рдкреНрдЯ рдФрд░ рд▓реЗрдЦрдХ рдХреЗ рдЕрдиреНрдп рдЕрдиреБрднрд╡
* Cloudera рдЖрдкрдХреЛ CDH4 рд╡рд┐рддрд░рдг (YARN рд╕рдорд░реНрдерди рдХреЗ рд╕рд╛рде) рдХреЛ рд╕реНрдерд╛рдиреАрдп рдорд╢реАрди рдкрд░ рдЫрджреНрдо рд╡рд┐рддрд░рд┐рдд рдореЛрдб рдореЗрдВ рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдбрд╛рдЙрдирд▓реЛрдб рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддрд╛ рд╣реИред
рд╡рд┐рддрд░рдг рдФрд░ рдирд┐рд░реНрджреЗрд╢ ред