HDInsight рдореЗрдВ рдХрдордЬреЛрд░ рд╕рдВрд░рдЪрд┐рдд рдбреЗрдЯрд╛ рдХреЛ рд╕рдВрд╕рд╛рдзрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП MapReduce

рдЗрд╕ рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рд╣рдо Microsoft рдХреЗ рдХреНрд▓рд╛рдЙрдб-рдЖрдзрд╛рд░рд┐рдд Hadoop рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдореЗрдВ рдПрдХ рд╡рд┐рд╢рд┐рд╖реНрдЯ MapReduce рдХрд╛рд░реНрдп рдмрдирд╛рдиреЗ рдФрд░ рдирд┐рд╖реНрдкрд╛рджрд┐рдд рдХрд░рдиреЗ рдкрд░ рдзреНрдпрд╛рди рджреЗрдВрдЧреЗ, рдЬрд┐рд╕реЗ HDInsight рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред
рдкрд┐рдЫрд▓реЗ рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рд╣рдордиреЗ 3-рдиреЛрдб рд╣рдбреЛрдк рдХреНрд▓рд╕реНрдЯрд░ рдмрдирд╛рдпрд╛ рдФрд░ рдереЛрдбрд╝рд╛ рд╕рдВрд░рдЪрд┐рдд рдкреНрд░рд╛рд░реВрдк рдХрд╛ рд╕рд╛рд░ рд▓реЙрдЧ рд▓реЛрдб рдХрд┐рдпрд╛, рдЬрд┐рд╕реЗ рдЕрдм рд╕рдВрд╕рд╛рдзрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рдирд╛ рд╣реИред рдкрддреНрд░рд┐рдХрд╛ рдЖрдо рддреМрд░ рдкрд░ рдПрдХ рдмрдбрд╝реА (рд╣рдорд╛рд░реЗ рд╡рд┐рд╢рд┐рд╖реНрдЯ рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рдЫреЛрдЯреА рд╣реИ, рд▓реЗрдХрд┐рди рдпрд╣ рд╡рд┐рдЪрд╛рд░ рдХреЗ рдореМрд▓рд┐рдХ рдкреНрд░рджрд░реНрд╢рди рдХреЛ рдкреНрд░рднрд╛рд╡рд┐рдд рдирд╣реАрдВ рдХрд░рддреА рд╣реИ) рдкрд╛рда рдлрд╝рд╛рдЗрд▓ рдЬрд┐рд╕рдореЗрдВ рд╕рдВрдХреЗрдд TRACE, DEBUG, INFO, WARN, ERROR, FATAL рдХреЗ рд╕рд╛рде рд▓рд╛рдЗрдиреЗрдВ рд╣реИрдВред рд╣рдорд╛рд░рд╛ рдкреНрд░рд╛рдердорд┐рдХ рдХрд╛рд░реНрдп рдкреНрд░рддреНрдпреЗрдХ рд╡рд┐рд╢реЗрд╖рддрд╛ рдХреЗ рд╕рд╛рде рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХреА рдЧрдгрдирд╛ рдХрд░рдирд╛ рд╣реЛрдЧрд╛, рдЕрд░реНрдерд╛рдд WARN рдХреА рд╕реНрдерд┐рддрд┐ рдХрд┐рддрдиреА рдмрд╛рд░ рд╣реБрдИ, рдХрд┐рддрдиреЗ ERROR рдЗрддреНрдпрд╛рджрд┐ рд╣реБрдП?

SQL рдХреЗ рд╕рдВрджрд░реНрдн рдореЗрдВ, рдЖрдкрдХреЛ COUT () ... GROUP BY рдХреЛ рд╡рд┐рд╢реЗрд╖рддрд╛ рдлрд╝реАрд▓реНрдб рджреНрд╡рд╛рд░рд╛ рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред рдпрд╣ рд╕реНрдкрд╖реНрдЯ рд╣реИ рдХрд┐ рдЬреИрд╕реЗ рдХреЛрдИ рдлрд╝реАрд▓реНрдб рдирд╣реАрдВ рд╣реИ, рдЪреВрдВрдХрд┐ рдлрд╝рд╛рдЗрд▓ рдПрдХ рдкреНрд▓реЗрдЯ рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди рд╕рдорд╕реНрдпрд╛ рдХреЗ рдПрдХ рдкрд╛рда рд╡рд┐рд╡рд░рдг рдХреЗ рд╕рд╛рде рд▓рд╛рдЗрдиреЛрдВ рдХрд╛ рдПрдХ рд╕реЗрдЯ рд╣реИ, рдЬрд┐рд╕рдореЗрдВ рд▓рдХреНрд╖рдг рдХреЗ рдирд╛рдо рдХреЗ рд╕рд╛рде рдПрдХ рд╡рд┐рдХрд▓реНрдк рд╣реИред рдЖрдкрдХреЛ рд╕рднреА рд▓рд╛рдЗрдиреЛрдВ рдкрд░ рдЬрд╛рдиреЗ рдХреА рдЬрд░реВрд░рдд рд╣реИ, рд╡рд┐рд╢реЗрд╖рддрд╛ рдХрд╛ рдПрдХ рд╡рд┐рдХрд▓реНрдк рдЪреБрдиреЗрдВ рдФрд░ рдЬреЛрдбрд╝реЗрдВред рд╕реАрдзреЗ рд╢рдмреНрджреЛрдВ рдореЗрдВ рдХрд╣реЗрдВ, рд╕реЗ

2012-02-03 18:35:34 SampleClass6 [INFO] everything normal for id 577725851 2012-02-03 18:35:34 SampleClass4 [FATAL] system problem at id 1991281254 2012-02-03 18:35:34 SampleClass3 [DEBUG] detail for id 1304807656 2012-02-03 18:35:34 SampleClass3 [WARN] missing id 423340895 2012-02-03 18:35:34 SampleClass5 [TRACE] verbose detail for id 2082654978 2012-02-03 18:35:34 SampleClass0 [ERROR] incorrect id 1886438513 ... 
рд▓рд┐рдкрд┐ рез

рдЖрдкрдХреЛ рдХреБрдЫ рдкрд╛рдиреЗ рдХреА рдЬрд░реВрд░рдд рд╣реИ

 [TRACE] 10 [DEBUG] 20 [INFO] 30 [WARN] 555 [ERROR] 777 [FATAL] 1 
рд▓рд┐рдкрд┐ реи

MapReduce рдореЙрдбрд▓ рдХреЗ рдкреАрдЫреЗ рдХрд╛ рд╡рд┐рдЪрд╛рд░ рдмрд╣реБрдд рд╕рд░рд▓ рд╣реИред рдПрдХ рд╡рд┐рддрд░рд┐рдд рдкреНрд░рдгрд╛рд▓реА рдХреА рдЙрдкрд╕реНрдерд┐рддрд┐ рдореЗрдВ, рдЬреЛ рдПрдХ Hadoop рдХреНрд▓рд╕реНрдЯрд░ рд╣реИ, рд╕рд╛рдорд╛рдиреНрдп рдХрд╛рд░реНрдп рдХреЛ рд╕рдорд╛рдирд╛рдВрддрд░ рдЙрдк-рдХрд╛рд░реНрдпреЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд (рдореИрдк) рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдЬреИрд╕рд╛ рдХрд┐ рдкрд┐рдЫрд▓реЗ рдЙрджрд╛рд╣рд░рдг рдореЗрдВ рдмрддрд╛рдпрд╛ рдЧрдпрд╛ рд╣реИ, Hadoop рдлрд╝рд╛рдЗрд▓ рд╕рд┐рд╕реНрдЯрдо рдХреЛ рд╕рд╣реЗрдЬрддреЗ рд╕рдордп рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдХреЛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдХреЗ рд▓рд┐рдП рдиреЛрдбреНрд╕ рджреНрд╡рд╛рд░рд╛ рдкрд╛рд░рджрд░реНрд╢реА рд░реВрдк рд╕реЗ рдЯреБрдХрдбрд╝реЛрдВ рдореЗрдВ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рд╕реИрджреНрдзрд╛рдВрддрд┐рдХ рд░реВрдк рд╕реЗ, рдЗрди рдиреЛрдбреНрд╕ рдХреЛ рднреМрдЧреЛрд▓рд┐рдХ рд░реВрдк рд╕реЗ рд╡рд┐рддрд░рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ, рдЕрд░реНрдерд╛рддред рд╡рд┐рднрд┐рдиреНрди рднреМрдЧреЛрд▓рд┐рдХ рд╕реНрдерд╛рдиреЛрдВ рдореЗрдВ рд╣реЛред рдбреЗрдЯрд╛ рдХреЗрдВрджреНрд░реЛрдВ (рдпрд╛ рдмрд╕ рдЕрд▓рдЧ рдиреЛрдбреНрд╕ рдХреЗ рдмреАрдЪ) рдХреЗ рдмреАрдЪ рдбреЗрдЯрд╛ рд╕реНрдерд╛рдирд╛рдВрддрд░рд┐рдд рдХрд░рдиреЗ рд╕реЗ рдЬреБрдбрд╝реА рд▓рд╛рдЧрддреЛрдВ рдХреЛ рдХрдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, Hadoop рдбреЗрдЯрд╛ рдХреА рдХреНрд╖реЗрддреНрд░реАрдп рдирд┐рдХрдЯрддрд╛ рдХреЛ рдзреНрдпрд╛рди рдореЗрдВ рд░рдЦрддрд╛ рд╣реИ - рдкреНрд░рддреНрдпреЗрдХ рдЙрдк-рдХрд╛рд░реНрдп рдЕрдкрдиреЗ рд╕реНрд╡рдпрдВ рдХреЗ рдбреЗрдЯрд╛ рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рддрд╛ рд╣реИред рд╣рдорд╛рд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдХреНрд▓рд╕реНрдЯрд░ рдореЗрдВ рдХреЗрд╡рд▓ 3 рдиреЛрдб рд╣реИрдВ, рд▓рдХреНрдЬрд░реА рдирд╣реАрдВред рдЕрд╕рд╛рдЗрдирдореЗрдВрдЯ рдХреЛ рдЙрди рдиреЛрдбреНрд╕ рдкрд░ рдирд┐рд╖реНрдкрд╛рджрд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛ рдЬрд╣рд╛рдВ рдбреЗрдЯрд╛ рдЯреБрдХрдбрд╝реЗ рдЭреВрда рдмреЛрд▓рддреЗ рд╣реИрдВред рдЙрдкрдХреБрдВрдЬреА рдХреЗ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреЛ рдлрд┐рд░ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдХреЗ рд▓рд┐рдП рд▓реМрдЯрд╛рдП рдЧрдП рдПрдХрд▓ рдкрд░рд┐рдгрд╛рдо рдореЗрдВ рдХрдЯреМрддреА рдХрд╛рд░реНрдпреЛрдВ рджреНрд╡рд╛рд░рд╛ рдПрдХрддреНрд░ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рджреВрд╕рд░реЗ рд╢рдмреНрджреЛрдВ рдореЗрдВ, рдкреНрд░рддреНрдпреЗрдХ рдиреЛрдб рдЕрдкрдирд╛ рдирд┐рдЬреА рдЙрдк-рдкрд░рд┐рдгрд╛рдо рджреЗрдЧрд╛, рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдкрд╣рд▓рд╛ -
 [TRACE] 1 [DEBUG] 2 [INFO] 3 ... 
рд▓рд┐рдкрд┐ рей

рджреВрд╕рд░рд╛ -
 [TRACE] 9 [DEBUG] 5 [INFO] 7 ... 
рд▓рд┐рдкрд┐ рек

рдЬрд┐рдирдореЗрдВ рд╕реЗ рдЕрдВрдд рдореЗрдВ рд╕рдордЧреНрд░ рдкрд░рд┐рдгрд╛рдо рд╕рдВрдХрд▓рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛ред рд╕реНрдХреНрд░рд┐рдкреНрдЯ 2. рдпрд╣ рд╕рдорд╛рдирд╛рдВрддрд░ рдкреНрд░рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдПрдХ рд╕рд╛рдорд╛рдиреНрдп рд╡рд┐рдЪрд╛рд░ рд╣реИ, рдЬрд┐рд╕реЗ рдкрд╛рд░рдВрдкрд░рд┐рдХ рд░рд┐рд▓реЗрд╢рдирд▓ рдбреЗрдЯрд╛рдмреЗрд╕ рд╕рд░реНрд╡рд░ (рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдУрд░реЗрдХрд▓ рдЖрд░рдПрд╕реА, рдорд╛рдЗрдХреНрд░реЛрд╕реЙрдлреНрдЯ рдПрд╕рдХреНрдпреВрдПрд▓ рд╕рд░реНрд╡рд░ рд╕рдорд╛рдирд╛рдВрддрд░ рдбреЗрдЯрд╛рд╡реЗрдпрд░, рдЖрджрд┐) рдФрд░ рдХреНрд▓рд╛рдЙрдб рд░рд┐рд▓реЗрд╢рдирд▓ рд╕реЗрд╡рд╛рдУрдВ рдореЗрдВ рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред рдбреЗрдЯрд╛ рдкреНрд░реЛрд╕реЗрд╕рд┐рдВрдЧ (рдЙрджрд╛ред, Windows Azure SQL рдбреЗрдЯрд╛рдмреЗрд╕ рдореЗрдВ рдПрдХ рдлрд╝реЗрдбрд░реЗрдЯреЗрдб рдбреЗрдЯрд╛рдмреЗрд╕, рдЬрд┐рд╕реЗ рдкрд╣рд▓реЗ SQL Azure рдореЗрдВ рд╢рд╛рд░реНрдХрд┐рдВрдЧ рдХреЗ рд░реВрдк рдореЗрдВ рдЬрд╛рдирд╛ рдЬрд╛рддрд╛ рд╣реИ)ред рд▓реЗрдХрд┐рди рдЗрд╕ рдорд╛рдорд▓реЗ рдореЗрдВ, рд╣рдо рдПрдХ рд░рд┐рд▓реЗрд╢рдирд▓ рдХреЗ рд╕рд╛рде рдХрд╛рдо рдирд╣реАрдВ рдХрд░ рд░рд╣реЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди рдПрдХ рдЦрд░рд╛рдм рд╕рдВрд░рдЪрд┐рдд рдЗрдирдкреБрдЯ рдбреЗрдЯрд╛ рдкреНрд░рд╛рд░реВрдк рд╣реИ, рдЗрд╕рд▓рд┐рдП, SQL рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХреЗ рдмрдЬрд╛рдп, рд╣рдореЗрдВ рдРрд╕реЗ рдХрд╛рд░реНрдпреЛрдВ рдХреЛ рд▓рд┐рдЦрдирд╛ рд╣реЛрдЧрд╛ рдЬреЛ рдорд╛рдирдЪрд┐рддреНрд░ / рднреВрдорд┐рдХрд╛ рдХреЛ рдХрдо рдХрд░рддреЗ рд╣реИрдВред MapReduce рдХрд╛ рд╡рд┐рдЪрд╛рд░ рд╡рд┐рднрд┐рдиреНрди рднрд╛рд╖рд╛рдУрдВ рдореЗрдВ рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдореБрдлреНрдд рдЦреБрд▓рд╛ рд╕реНрд░реЛрдд рдЕрдкрд╛рдЪреЗ рд╣рдбреЛрдк рдкрд░рд┐рдпреЛрдЬрдирд╛ рдЗрди рдЙрджреНрджреЗрд╢реНрдпреЛрдВ рдХреЗ рд▓рд┐рдП рдЬрд╛рд╡рд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддреА рд╣реИред рдЪреВрдВрдХрд┐ Microsoft HDInsight рдЕрдкрд╛рдЪреЗ Hadoop рдХреЗ рд╕рд╛рде рд╕рдВрдЧрдд рд╣реИ, рдЗрд╕рд▓рд┐рдП рд╣рдо рдЬрд╛рд╡рд╛ рднрд╛рд╖рд╛ рдФрд░ org.apache.hadoop.mapreduce рдкреИрдХреЗрдЬ рдХрд╛ рднреА рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВрдЧреЗред

рдкреНрд░рд╛рд░рдВрдн рдореЗрдВ, рдореИрдк рдХреНрд▓рд╛рд╕, рдЬрд┐рд╕реЗ рдореИрдкрд░ рд╕реЗ рд▓рд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ, рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред рдореИрдкрд░ рд╡рд░реНрдЧ рдХреБрдВрдЬреА / рдорд╛рди рдЬреЛрдбрд╝реЗ рдХреЗ рдПрдХ рдкреНрд░рд╛рд░рдВрднрд┐рдХ рд╕реЗрдЯ рдХреЛ рдПрдХ рдордзреНрдпрд╡рд░реНрддреА рдореЗрдВ рдкрд░рд┐рд╡рд░реНрддрд┐рдд рдХрд░рддрд╛ рд╣реИред рд╣рдорд╛рд░реЗ рдорд╛рдорд▓реЗ рдореЗрдВ, рдЗрдирдкреБрдЯ рдорд╛рди рдкрд╛рда рд▓реЙрдЧ рдлрд╝рд╛рдЗрд▓ рдХреА рд░реЗрдЦрд╛рдПрдВ рд╣реИрдВ - рдорд╛рдирдЪрд┐рддреНрд░ рд╡рд┐рдзрд┐ рдХреЗ рдкрд╛рда рдкреНрд░рдХрд╛рд░ рдХрд╛ рдорд╛рди рдкреИрд░рд╛рдореАрдЯрд░ред рд╡рд┐рдзрд┐ рдХреЗ рдЕрдВрджрд░, рдкреНрд░рддреНрдпреЗрдХ рдорд╛рди рдореЗрдВ, рд╣рдо рд╡рд░реНрдЧ рдХреЛрд╖реНрдардХ рдХреА рддрд▓рд╛рд╢ рдХрд░рддреЗ рд╣реИрдВ, рдмреАрдЪ рдореЗрдВ рдЬреЛ рд╣реИ рдЙрд╕реЗ рдмрд╛рд╣рд░ рдирд┐рдХрд╛рд▓реЗрдВ, рд╕рдВрдХреЗрддреЛрдВ рдХреЗ рдирд┐рд░рдВрддрд░ рд╕реЗрдЯ рдХреЗ рд╕рд╛рде рддреБрд▓рдирд╛ рдХрд░реЗрдВ, рдЬрд┐рд╕реЗ рд╣рдо рд╢реБрд░реБрдЖрдд рдореЗрдВ рдкреИрдЯрд░реНрди рдЪрд░ рдореЗрдВ рдбрд╛рд▓рддреЗ рд╣реИрдВ рдФрд░, рдЕрдЧрд░ рдпрд╣ рдореЗрд▓ рдЦрд╛рддрд╛ рд╣реИ (рдпрджрд┐ (matcher.matches ())), рддреЛ рд╣рдо рдЖрдЙрдЯрдкреБрдЯ рдХреА-рдЬреЛрдбрд╝реА рдмрдирд╛рддреЗ рд╣реИрдВред рдореВрд▓реНрдпред рдХреБрдВрдЬреА рд╕рд╛рдЗрди TRACE / DEBUG / ... (рдкрд╛рда рдЪрд░ logLevel) рдХрд╛ рд╡рд┐рдХрд▓реНрдк рд╣реИ, рдФрд░ рдорд╛рди 1ред рдорд╛рди IntWritable рдкреНрд░рдХрд╛рд░ рдХреЗ рд╕рдВрдЪрд╛рдпрдХ рдЪрд░ рдореЗрдВ рдирд┐рд╣рд┐рдд рд╣реИ, рдЬрд┐рд╕реЗ рд╣рдордиреЗ рдПрдХ рдореЗрдВ рдХрдВрд╕реНрдЯреНрд░рдХреНрдЯрд░ рдореЗрдВ рдЖрд░рдВрднреАрдХреГрдд рдХрд┐рдпрд╛ рд╣реИред IntWriteable рдПрдХ Java int рдкреНрд░рдХрд╛рд░ рдХреЗ рдЖрд╕рдкрд╛рд╕ рдПрдХ рдЖрд╡рд░рдг рд╣реИ, рдЬреЛ Writable рдЗрдВрдЯрд░рдлрд╝реЗрд╕ рд▓рд╛рдЧреВ рдХрд░рддрд╛ рд╣реИред Hadoop рдЕрдкрдиреЗ рдХреНрд░рдорд╛рдВрдХрди рдкреНрд░рд╛рд░реВрдк рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рддрд╛ рд╣реИред рд╣рдо рдкреНрд░рддреНрдпреЗрдХ рд╡рд┐рд╢реЗрд╖рддрд╛ рдХреА рдШрдЯрдирд╛рдУрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХреА рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЗрди рд▓реЛрдЧреЛрдВ рдХреЛ рдХрдЯреМрддреА рд╕рдорд╛рд░реЛрд╣ рдореЗрдВ рдЬреЛрдбрд╝ рджреЗрдВрдЧреЗред рдордзреНрдпрд╡рд░реНрддреА (рдЖрдЙрдЯрдкреБрдЯ) рдорд╛рди рдХреЛ рдкреНрд░рддреНрдпреЗрдХ рдЖрдЙрдЯрдкреБрдЯ рдХреБрдВрдЬреА рдХреЗ рд▓рд┐рдП Hadoop рд╡рд╛рддрд╛рд╡рд░рдг рджреНрд╡рд╛рд░рд╛ рд╕рдореВрд╣реАрдХреГрдд рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдореИрдкрд┐рдВрдЧ рд╕реНрдЯреЗрдЬ рдкрд░, рдЖрдк рдбреЗрдЯрд╛ рдХреЛ рдХрдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП setCombinerClass рдХреЗ рд╕рд╛рде рдкреВрд░реНрд╡-рдПрдХрддреНрд░ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред Reducer рдХреЛ рдкреНрд░реЗрд╖рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ред рдЗрд╕ рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рдЗрд╕ рд╕реБрд╡рд┐рдзрд╛ рдХрд╛ рдЙрдкрдпреЛрдЧ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред рд░рд┐рдкреЛрд░реНрдЯрд░ рд╡рд░реНрдЧ (рдорд╛рдирдЪрд┐рддреНрд░ рд╡рд┐рдзрд┐ рдХрд╛ рдЕрдВрддрд┐рдо рдкреИрд░рд╛рдореАрдЯрд░) рдХрд╛ рдЙрджреНрджреЗрд╢реНрдп рдирд┐рд╖реНрдкрд╛рджрди рдХреА рд╕реНрдерд┐рддрд┐ рдФрд░ рдкреНрд░рдЧрддрд┐, рдЕрджреНрдпрддрди рдХрд╛рдЙрдВрдЯрд░реЛрдВ рдЖрджрд┐ рдХреЛ рдкреНрд░рджрд░реНрд╢рд┐рдд рдХрд░рдирд╛ рд╣реИред рд╣рдорд╛рд░реЗ рд╕рд░рд▓ рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рдЗрд╕рдХрд╛ рдЙрдкрдпреЛрдЧ рднреА рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред
Reducer рд╕реЗ рдирд┐рдХрд╛рд▓реА рдЧрдИ Reduce class, рдЙрд▓рдЯрд╛ рд╕рдорд╕реНрдпрд╛ рд╣рд▓ рдХрд░рддреА рд╣реИред рдпрд╣ рдореИрдкрд┐рдВрдЧ рдХреЗ рдордзреНрдпрд╡рд░реНрддреА рдкрд░рд┐рдгрд╛рдо рдПрдХрддреНрд░ рдХрд░рддрд╛ рд╣реИ рдФрд░ рдЙрдиреНрд╣реЗрдВ рдПрдХрддреНрд░ рдХрд░рддрд╛ рд╣реИ, рдЗрд╕ рдорд╛рдорд▓реЗ рдореЗрдВ рдХреБрдЦреНрдпрд╛рдд COUNT () рдорд╛рдиреЛрдВ рдХрд╛ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддрд╛ рд╣реИ, рдХреНрдпреЛрдВрдХрд┐ рдореИрдкрд┐рдВрдЧ рдХреЗ рджреМрд░рд╛рди рдЪрд╛рдмрд┐рдпреЛрдВ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдЧреНрд░реБрдк рдмрд╛рдп (рдЫрдБрдЯрд╛рдИ рд╕рд╣рд┐рдд) рдХрд┐рдпрд╛ рдЧрдпрд╛ред рдХрдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЗрдирдкреБрдЯ рдкреНрд░рдХрд╛рд░ (рдкрд╛рда, рдЖрдВрддрд░рд┐рдХ) рдорд╛рдирдЪрд┐рддреНрд░ рд╕реЗ рдЖрдЙрдЯрдкреБрдЯ рдкреНрд░рдХрд╛рд░реЛрдВ рд╕реЗ рдореЗрд▓ рдЦрд╛рдирд╛ рдЪрд╛рд╣рд┐рдПред рд░рд┐рдбреНрдпреВрд╕ рдЪрд░рдг рдореЗрдВ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреЗ рд╡рд┐рд▓рдп рдХреЗ рджреМрд░рд╛рди, рд╣рдбреЛрдкреЙрдк рдкрд░реНрдпрд╛рд╡рд░рдг рдПрдХ рджреНрд╡рд┐рддреАрдпрдХ рдкреНрд░рдХрд╛рд░ рдХрд╛ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддрд╛ рд╣реИ, рдХреНрдпреЛрдВрдХрд┐ рд╡рд┐рднрд┐рдиреНрди рдореИрдкрд░ рд╕реЗ рдкреНрд░рд╛рдкреНрдд рдкрд░рд┐рдгрд╛рдореЛрдВ рдореЗрдВ рдПрдХ рд╣реА рдХреБрдВрдЬреА рд╣реЛ рд╕рдХрддреА рд╣реИред рдЗрд╕ рдкреНрд░рдХрд╛рд░, рдХрдЯреМрддреА рд╡рд┐рдзрд┐ рдХреЗ рд▓рд┐рдП рдЗрдирдкреБрдЯ рдХреБрдВрдЬреА рддрд╛рд░ рдХрд╛ рдПрдХ рд╕реЗрдЯ рд╣реИ - рдЗрд╕рдХреЗ рдЕрдиреБрд░реВрдк рдореВрд▓реНрдпреЛрдВ рдХрд╛ рдПрдХ рд╕рдВрдЧреНрд░рд╣ред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рд▓рд╛рдЗрдиреЛрдВ рдореЗрдВ рд╕реЗ рдПрдХ TRACE (рдХреБрдВрдЬреА) рдФрд░ рдХрдИ рдЗрдХрд╛рдЗрдпреЛрдВ рдХрд╛ рдПрдХ рд╕рдВрдЧреНрд░рд╣ рд╣реЛрдЧрд╛ рдХреНрдпреЛрдВрдХрд┐ рдЗрд╕ рд╡рд┐рд╢реЗрд╖рддрд╛ рдХреЗ рд╣реЛрдиреЗ рдХреА рд╕рдВрдЦреНрдпрд╛ рдореИрдкрд░ рдХреЗ рдПрдХ рдпрд╛ рджреВрд╕рд░реЗ рдЙрджрд╛рд╣рд░рдг рджреНрд╡рд╛рд░рд╛ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХреА рдЧрдИ рдереАред рдпрд╣ рд╣рдорд╛рд░реЗ рд▓рд┐рдП рд╕рдВрдЧреНрд░рд╣ рдкрд░ рдЬрд╛рдиреЗ рдФрд░ рдЪрд░ рдЧрдгрдирд╛ рдореЗрдВ рдпреЛрдЧ рд░рдЦрдиреЗ рдХреЗ рд▓рд┐рдП рд░рд╣рддрд╛ рд╣реИред OutputCollector рдореЗрдВ рд╣рдо рдкрд╛рд░рдВрдкрд░рд┐рдХ рдХреА-рд╡реИрд▓реНрдпреВ рдкреЗрдпрд░ рд▓рд┐рдЦрддреЗ рд╣реИрдВ, рдпрд╣рд╛рдБ рдХреЗрд╡рд▓ рд╡реИрд▓реНрдпреВ рдХреБрдВрдЬреА рджреНрд╡рд╛рд░рд╛ рдПрдХрддреНрд░реАрдХрд░рдг рдХрд╛ рдкрд░рд┐рдгрд╛рдо рд╣реЛрдЧрд╛ред
рдореБрдЦреНрдп () рд╡рд┐рдзрд┐ рдХрд╛ рдЙрдкрдпреЛрдЧ рдмрдирд╛рдП рдЧрдП рдорд╛рдирдЪрд┐рддреНрд░ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдПрдХ Hadoop рдиреМрдХрд░реА рдмрдирд╛рдиреЗ рдФрд░ рдХрдХреНрд╖рд╛рдУрдВ рдХреЛ рдХрдо рдХрд░рдиреЗ рдФрд░ рдЗрд╕реЗ рдирд┐рд╖реНрдкрд╛рджрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред JobConf рдСрдмреНрдЬреЗрдХреНрдЯ рдПрдХ рдХрд╛рд░реНрдп рд╡рд┐рдирд┐рд░реНрджреЗрд╢ рдмрдирд╛рддрд╛ рд╣реИред рдХреЛрдб рдПрдХ JAR рдлрд╝рд╛рдЗрд▓ рдХреЛ рд▓рд┐рдЦрд╛ рдЬрд╛рддрд╛ рд╣реИ рдЬрд┐рд╕реЗ Hadoop рдХреНрд▓рд╕реНрдЯрд░ рдореЗрдВ рд╡рд┐рддрд░рд┐рдд рдХрд░реЗрдЧрд╛ред рдлрд╝рд╛рдЗрд▓ рдирд╛рдо рдХреЛ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░рдиреЗ рдХреЗ рдмрдЬрд╛рдп, рдЖрдк рдПрдиреНрдХреЛрдбрд┐рдВрдЧ рдХреНрд▓рд╛рд╕ рдХреЛ рдПрдЧреНрдЬреАрдХреНрдпреВрдЯреЗрдмрд▓ рдХреЛрдб (MapReduceTest) рд╕реЗ рдЬреЙрдмрдХреЛрдирдл рдХрдВрд╕реНрдЯреНрд░рдХреНрдЯрд░ рдХреЛ рдкрд╛рд╕ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рдЬрд┐рд╕рдХреЗ рджреНрд╡рд╛рд░рд╛ Hadoop рдХреЛ рд╕рдВрдмрдВрдзрд┐рдд JAR рдлрд╛рдЗрд▓ рдорд┐рд▓ рдЬрд╛рдПрдЧреАред SetOutputKeyClass () рдФрд░ setOutputValueClass () рддрд░реАрдХреЗ рдореИрдк рдФрд░ рд░рд┐рдбреНрдпреВрд╕ рдлрд╝рдВрдХреНрд╢рди рдХреЗ рд▓рд┐рдП рдЖрдЙрдЯрдкреБрдЯ рдкреНрд░рдХрд╛рд░ рд╕реЗрдЯ рдХрд░рддреЗ рд╣реИрдВред рдПрдХ рдирд┐рдпрдо рдХреЗ рд░реВрдк рдореЗрдВ, рд╡реЗ рд╕рдВрдпреЛрдЧ рдХрд░рддреЗ рд╣реИрдВ, рдЕрд░реНрдерд╛рддреНред рдирдХреНрд╢рд╛ Reduce рдХреЗ рд╕рдорд╛рди рд╣реА рдЙрддреНрдкрд╛рджрди рдХрд░рддрд╛ рд╣реИред рдпрджрд┐ рд╡реЗ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╣реИрдВ, рддреЛ MapMap рдлрд╝рдВрдХреНрд╢рди рдХрд╛ рдЖрдЙрдЯрдкреБрдЯ рдкреНрд░рдХрд╛рд░ setMapOutputKeyClass () рдФрд░ setMapOutputValueClass () рд╡рд┐рдзрд┐рдпреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдХреМрди рд╕рд╛ рдХреНрд▓рд╛рд╕ рдореИрдк рдХрд░реЗрдЧрд╛, рдФрд░ рдХреМрди рд╕рд╛ рдХрдо рдХрд░реЗрдВ, рдЬреИрд╕рд╛ рдХрд┐ рдЖрдк рдЕрдиреБрдорд╛рди рд▓рдЧрд╛ рд╕рдХрддреЗ рд╣реИрдВ, setMapperClass () рдФрд░ setReducerClass () рд╡рд┐рдзрд┐рдпреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд╕реЗрдЯ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред рдпрд╣ рдЗрдирдкреБрдЯ / рдЖрдЙрдЯрдкреБрдЯ рдкреНрд░рд╛рд░реВрдк рдХреЛ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд░рд╣рддрд╛ рд╣реИред рдпрд╣ setInputFormat () рдФрд░ setOutputFormat () рд╡рд┐рдзрд┐рдпреЛрдВ рджреНрд╡рд╛рд░рд╛ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдЗрд╕ рдорд╛рдорд▓реЗ рдореЗрдВ, рдпрд╣ рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрд╛, рдХреНрдпреЛрдВрдХрд┐ рдкрд╛рда рдкреНрд░рд╛рд░реВрдк рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд░реВрдк рд╕реЗ рд╕реНрд╡реАрдХрд╛рд░ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдЕрдВрдд рдореЗрдВ, рдЖрдкрдХреЛ рд╕реНрдЯреИрдЯрд┐рдХ рд╡рд┐рдзрд┐рдпреЛрдВ FileInputFormat.setInputPaths () рдФрд░ FileOutputFormat.setOutputPath () рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд╕реНрд░реЛрдд рдбреЗрдЯрд╛ рдФрд░ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреЗ рд╕рд╛рде рдлрд╝рд╛рдЗрд▓реЛрдВ рдХреЛ рдкрде рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред рд╣рдо рдХрдорд╛рдВрдб рд▓рд╛рдЗрди рддрд░реНрдХреЛрдВ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдлрд╝рд╛рдЗрд▓ рдирд╛рдо рдкрд╛рд░рд┐рдд рдХрд░реЗрдВрдЧреЗред рдЬреИрд╕рд╛ рдХрд┐ рд╡рд┐рдзрд┐ рдХрд╛ рдирд╛рдо рджрд┐рдЦрд╛рддрд╛ рд╣реИ, рдХрдИ рдЗрдирдкреБрдЯ рдлрд╛рдЗрд▓реЗрдВ рд╣реЛ рд╕рдХрддреА рд╣реИрдВред рд╢рд╛рдпрдж рдПрдХ рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛, рдлрд┐рд░ рдЗрд╕рдореЗрдВ рдирд┐рд╣рд┐рдд рд╕рднреА рдлрд╛рдЗрд▓реЗрдВ рд▓реА рдЬрд╛рдПрдВрдЧреАред рдЖрдк рдПрдХ рдлрд╝рд╛рдЗрд▓ рдирд╛рдо рдЯреЗрдореНрдкрд▓реЗрдЯ рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдПрдХ рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдЙрд╕ рд╕реНрдерд╛рди рдХреЗ рд░реВрдк рдореЗрдВ рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХреА рдЬрд╛рддреА рд╣реИ рдЬрд╣рд╛рдБ рдкрд░рд┐рдгрд╛рдо рдлрд╝рд╛рдЗрд▓реЛрдВ рдХреЛ рдЬреЛрдбрд╝рд╛ рдЬрд╛рдПрдЧрд╛ред рдпрд╣ рдореМрдЬреВрдж рдирд╣реАрдВ рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП, рдЕрдиреНрдпрдерд╛ рдирд┐рд╖реНрдкрд╛рджрди рдХреЗ рджреМрд░рд╛рди рдПрдХ рддреНрд░реБрдЯрд┐ рд╣реЛрдЧреАред рдПрдХ рдкреНрд░рдХрд╛рд░ рдХрд╛ рд╕реБрд░рдХреНрд╖рд╛ рдЙрдкрд╛рдп рддрд╛рдХрд┐ рдПрдХ рдХрд╛рд░реНрдп рджреВрд╕рд░реЗ рдХреЗ рдкрд░рд┐рдгрд╛рдо рдХреЛ рди рднрдЯрдХрд╛рдПред рдЖрдк рд╣реИрдбреВрдк fs -rmr рдХрдорд╛рдВрдб рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдПрдХ рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдХреЛ рд╣рдЯрд╛ рд╕рдХрддреЗ рд╣реИрдВред
рдЗрд╕реЗ рдПрдХ рд╕рд╛рде рд░рдЦрдиреЗ рдкрд░, рд╣рдореЗрдВ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдХреЛрдб рдорд┐рд▓рддреЗ рд╣реИрдВ:

 //   import java.io.IOException; import java.util.Iterator; import java.util.regex.Matcher; import java.util.regex.Pattern; //,   Hadoop import org.apache.hadoop.fs.Path; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapred.FileInputFormat; import org.apache.hadoop.mapred.FileOutputFormat; import org.apache.hadoop.mapred.JobClient; import org.apache.hadoop.mapred.JobConf; import org.apache.hadoop.mapred.MapReduceBase; import org.apache.hadoop.mapred.Mapper; import org.apache.hadoop.mapred.OutputCollector; import org.apache.hadoop.mapred.Reducer; import org.apache.hadoop.mapred.Reporter; import org.apache.hadoop.mapred.TextInputFormat; import org.apache.hadoop.mapred.TextOutputFormat; public class MapReduceTest { /* *  */ public static class Map extends MapReduceBase implements Mapper<LongWritable, Text, Text, IntWritable> { private static final Pattern pattern = Pattern.compile("(TRACE)|(DEBUG)|(INFO)|(WARN)|(ERROR)|(FATAL)"); //   private static final IntWritable accumulator = new IntWritable(1); //   - ,    private Text logLevel = new Text(); public void map(LongWritable key, Text value, OutputCollector<Text, IntWritable> collector, Reporter reporter) throws IOException { //    '['  ']' final String[] tokens = value.toString().split("[ \\[\\]]"); if(tokens != null) { //  logLevel for(final String token : tokens) { final Matcher matcher = pattern.matcher(token); if(matcher.matches()) //  { logLevel.set(token); collector.collect(logLevel, accumulator); //  - } } } } } /* *  */ public static class Reduce extends MapReduceBase implements Reducer<Text, IntWritable, Text, IntWritable> { public void reduce(Text key, Iterator<IntWritable> values, OutputCollector<Text, IntWritable> collector, Reporter reporter) throws IOException { int count = 0; //  count    while(values.hasNext()) { count += values.next().get(); } System.out.println(key + "\t" + count); collector.collect(key, new IntWritable(count)); } } /* *   */ public static void main(String[] args) throws Exception { //       ,  Map/Reduce final JobConf conf = new JobConf(MapReduceTest.class); conf.setOutputKeyClass(Text.class); conf.setOutputValueClass(IntWritable.class); conf.setMapperClass(Map.class); conf.setReducerClass(Reduce.class); conf.setInputFormat(TextInputFormat.class); conf.setOutputFormat(TextOutputFormat.class); //-       FileInputFormat.setInputPaths(conf, new Path(args[0])); FileOutputFormat.setOutputPath(conf, new Path(args[1])); //  JobClient.runJob(conf); } } 

рд╕реНрдХреНрд░рд┐рдкреНрдЯ 5

рджреВрд░рд╕реНрде рдбреЗрд╕реНрдХрдЯреЙрдк рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ Hadoup рдХреНрд▓рд╕реНрдЯрд░ рдкрд░ рдЪрд▓рддреЗ рд╣реИрдВ, рдЬреИрд╕рд╛ рдХрд┐ рдкрд┐рдЫрд▓реЗ рд▓реЗрдЦ рдореЗрдВ рджрд┐рдЦрд╛рдпрд╛ рдЧрдпрд╛ рд╣реИ, рдФрд░ рдЗрд╕ рдХреЛрдб рдХреЛ MapReduceTest.java рдлрд╝рд╛рдЗрд▓ рдореЗрдВ рд╕рд╣реЗрдЬреЗрдВ, рдЙрд╕реА d: \ Temp рдореЗрдВ рдХрд╣реЗрдВред HDInsight рдХреЗ Java рд╕рдкреЛрд░реНрдЯ рд▓рд╛рдЗрдмреНрд░реЗрд░реА C: \ apps \ java \ bin рдореЗрдВ рд╕реНрдерд┐рдд рд╣реИрдВред рдЗрд╕ рдмрд╛рд░реЗ рдореЗрдВ Hadoop рдХреЛ рдЬрд╛рдирдХрд╛рд░реА рдирд╣реАрдВ рд╣реИред рдпрд╣ Hadoop рдХрдорд╛рдВрдб рдкреНрд░реЙрдореНрдкреНрдЯ рд╡рд┐рдВрдбреЛ рдореЗрдВ рдЬрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдордЭ рдореЗрдВ рдЖрддрд╛ рд╣реИ (
 D:\Windows\system32\cmd.exe /k pushd "c:\apps\dist\hadoop-1.1.0-SNAPSHOT" && "c:\apps\dist\hadoop-1.1.0-SNAPSHOT\bin\hadoop.cmd" 
, рд╕реБрд╡рд┐рдзрд╛ рдХреЗ рд▓рд┐рдП, HDInsight рдбреЗрд╕реНрдХрдЯреЙрдк рдкрд░ рдПрдХ рд╢реЙрд░реНрдЯрдХрдЯ рд╣реИ) рдФрд░ рдЗрд╕ рдкрде рдХреЛ% рдкрде% рдкрд░рд┐рд╡реЗрд╢ рдЪрд░ рдкрд░ рд▓рд┐рдЦреЗрдВ:

 set PATH=%PATH%;C:\apps\java\bin 
рд▓рд┐рдкрд┐ рем

D: \ Temp рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдкрд░ рдЬрд╛рдПрдВ рдФрд░ Java рдлрд╝рд╛рдЗрд▓ рдХреЛ рдмрд╛рдпрдЯреЗрдХреЛрдб рдХреНрд▓рд╛рд╕ рдлрд╝рд╛рдЗрд▓реЛрдВ рдореЗрдВ рд╕рдВрдХрд▓рд┐рдд рдХрд░реЗрдВред рдЬрдм рд╕реЗ рдореИрдВрдиреЗ рдпреВрдирд┐рдХреЛрдб рдПрдиреНрдХреЛрдбрд┐рдВрдЧ рдореЗрдВ MapReduceTest.java рдХреЛ рд╕рд╣реЗрдЬрд╛ рд╣реИ, рддрдм -encoding рд╕реНрд╡рд┐рдЪ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рдереАред

 javac -encoding UNICODE -classpath C:\apps\dist\hadoop-1.1.0-SNAPSHOT\hadoop-core-*.jar d:\Temp\MapReduceTest.java 
рд▓рд┐рдкрд┐ 7

D: \ Temp рдореЗрдВ, MapReduceTest.class рдлрд╝рд╛рдЗрд▓ рдФрд░ MapReduceTest $ Map.class рдФрд░ MapReduceTest $ Reduce.class рд╡рд░реНрдЧреЛрдВ рдХреЗ рдЕрдиреБрд░реВрдк рдлрд╝рд╛рдЗрд▓реЗрдВ рдмрдирд╛рдИ рдЬрд╛рддреА рд╣реИрдВред рд╡рд┐рдзрд╛рдирд╕рднрд╛ рдХрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░реЗрдВ:

 jar -cvf MapReduceTest.jar *.class 
рд▓рд┐рдкрд┐ 8


рдЪрд┐рддреНрд░ 1

рд╡рд░реНрддрдорд╛рди рдкрде d: \ Temp рдкрд░, Java рд╕рдВрдЧреНрд░рд╣ MapReduceTest.jar рдХрд╛ рдЧрдарди рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред

 hadoop jar MapReduceTest.jar MapReduceTest Sample1/input/Sample.log Sample1/output 
рд▓рд┐рдкрд┐ реп


Fig.2

рдпрд╣рд╛рдБ рдирдореВрдирд╛ 1 / рдЗрдирдкреБрдЯ / рд╕реЗрдореНрдкрд▓реЙрдЧ рд▓реЙрдЧ рдлрд╝рд╛рдЗрд▓ рд╣реИ рдЬрд┐рд╕реЗ рд╕реНрдерд╛рдиреАрдп d: \ Temp рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рд╕реЗ HDFS / рдирдореВрдирд╛ 1 / рдЗрдирдкреБрдЯ рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдореЗрдВ рдбрд╛рдЙрдирд▓реЛрдб рдХрд┐рдпрд╛ рдЬрд╛рдирд╛ рд╣реИ - рдкрд┐рдЫрд▓реЗ рд▓реЗрдЦ рдХреЗ рдЪрд┐рддреНрд░ 5 рджреЗрдЦреЗрдВред рдкрд┐рдЫрд▓реА рдмрд╛рд░, рдореИрдВ рдЗрд╕ рддрдереНрдп рдкрд░ рдзреНрдпрд╛рди рдХреЗрдВрджреНрд░рд┐рдд рдХрд░рдирд╛ рднреВрд▓ рдЧрдпрд╛ рдерд╛ рдХрд┐ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░рдиреЗ рд╕реЗ рдкрд╣рд▓реЗ рдПрдЪрдбреАрдПрдлрдПрд╕ рдЗрдирдкреБрдЯ рдбрд╛рдпрд░реЗрдХреНрдЯрд░реА (рд╣рдбреВрдк fs -mkdir Sample1 / input /) рдХреЛ рд╕реНрдкрд╖реНрдЯ рд░реВрдк рд╕реЗ рдмрдирд╛рдирд╛ рдЖрд╡рд╢реНрдпрдХ рд╣реИ рдФрд░ рдЙрд╕рдХреЗ рдмрд╛рдж рд╣реА рдлрд╛рдЗрд▓ (рд╣рдбреВрдк fs -put d) \ Temp \ Sample.log рдбрд╛рд▓реЗрдВ рдирдореВрдирд╛ 1 / рдЗрдирдкреБрдЯ /)ред рдпрджрд┐ рдЖрдк рдХрд┐рд╕реА рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдХреЛ рдмрдирд╛рдП рдмрд┐рдирд╛ рдХрд┐рд╕реА рдлрд╝рд╛рдЗрд▓ рдХреЛ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рдЗрд╕реЗ рдмрдирд╛рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рд▓реЗрдХрд┐рди рдлрд╝рд╛рдЗрд▓ рдЗрд╕рдореЗрдВ рд▓реЛрдб рдирд╣реАрдВ рд╣реЛрддреА рд╣реИ, рдЬреИрд╕рд╛ рдХрд┐ рдЖрдк рд╣рдбрдк fs -ls Sample1 / input / рджреЗрдЦ рд╕рдХрддреЗ рд╣реИрдВред
рдЗрд╕ рдмреАрдЪ, рдХрд╛рд░реНрдп рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдкреВрд░рд╛ рд╣реБрдЖред рдЖрдЙрдЯрдкреБрдЯ рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ HDFS рдирдореВрдирд╛ 1 / рдЖрдЙрдЯрдкреБрдЯ рдореЗрдВ, рдПрдХ рдлрд╝рд╛рдЗрд▓ рдХреЛ рдкрд░рд┐рдгрд╛рдо рдореЗрдВ рд▓реЙрдЧ рдореЗрдВ рдкреНрд░рддреНрдпреЗрдХ рд╡рд┐рд╢реЗрд╖рддрд╛ рдХреА рдШрдЯрдирд╛рдУрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╡рд╛рд▓реЗ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреЗ рд╕рд╛рде рдЙрддреНрдкрдиреНрди рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛:

 hadoop fs -cat Sample1/output/part-00000 
рд▓рд┐рдкрд┐ резреж


3 рдЪрд┐рддреНрд░

Source: https://habr.com/ru/post/In173147/


All Articles