
рдпрд╣ рд▓реЗрдЦ рдкреНрд░рдпреЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП рдПрдХ рдЫреЛрдЯрд╛ рд╕рд╛ Hadoop рдХреНрд▓рд╕реНрдЯрд░ рдмрдирд╛рдиреЗ рдХреЗ рдЪрд░рдгреЛрдВ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдЖрдкрдХреЛ рд▓реЗ рдЬрд╛рдПрдЧрд╛ред
рдЗрд╕ рддрдереНрдп рдХреЗ рдмрд╛рд╡рдЬреВрдж рдХрд┐ Hadoop рдХреА рд╕реНрдерд╛рдкрдирд╛ / рддреИрдирд╛рддреА рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╡рд┐рджреЗрд╢реА рд╕рдВрд╕рд╛рдзрдиреЛрдВ рдкрд░ рдЗрдВрдЯрд░рдиреЗрдЯ рдкрд░ рдмрд╣реБрдд рд╕рд╛рд░реА рд╕рд╛рдордЧреНрд░реА рд╣реИ, рдЙрдирдореЗрдВ рд╕реЗ рдЬреНрдпрд╛рджрд╛рддрд░ рдпрд╛ рддреЛ рдкрд╣рд▓реЗ рдХреЗ рд╕рдВрд╕реНрдХрд░рдгреЛрдВ (0.XX рдФрд░ 1.XX) рдХреЛ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХрд╛ рд╡рд░реНрдгрди рдХрд░рддреЗ рд╣реИрдВ, рдпрд╛ рдХреЗрд╡рд▓ рдПрдХрд▓ рдореЛрдб / рдЫрджреНрдо рд╡рд┐рддрд░рд┐рдд рдореЛрдб рдореЗрдВ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХрд╛ рд╡рд░реНрдгрди рдХрд░рддреЗ рд╣реИрдВред рдХреЗрд╡рд▓ рдЖрдВрд╢рд┐рдХ рд░реВрдк рд╕реЗ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рд╡рд┐рддрд░рд┐рдд рдореЛрдбред рд░реВрд╕реА рдореЗрдВ, рд╡реНрдпрд╛рд╡рд╣рд╛рд░рд┐рдХ рд░реВрдк рд╕реЗ рдХреЛрдИ рднреА рд╕рд╛рдордЧреНрд░реА рдирд╣реАрдВ рд╣реИред
рдЬрдм рдореБрдЭреЗ рд╕реНрд╡рдпрдВ рд╣рдбреЙрдк рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рдереА, рддреЛ рдпрд╣ рдкрд╣рд▓реА рдмрд╛рд░ рдирд╣реАрдВ рдерд╛ рдЬрдм рдореИрдВ рд╕рдм рдХреБрдЫ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рдерд╛ред рд╕рд╛рдордЧреНрд░реА рдЕрдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рдереА, рдЕрдХреНрд╕рд░ рдпрд╣ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ рдХрд┐ рдкрджрд╛рд╡рдирдд рдорд╛рдкрджрдВрдбреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВ, рдЗрд╕рд▓рд┐рдП рдЙрдирдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдЕрд╡рд╛рдВрдЫрдиреАрдп рд╣реИред рдФрд░ рдпрд╣рд╛рдВ рддрдХ тАЛтАЛрдХрд┐ рдЬрдм рд╕рдм рдХреБрдЫ рд╕реЗрдЯ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рддрдм рднреА рдЙрд╕рдиреЗ рдХрдИ рд╕рд╡рд╛рд▓ рдкреВрдЫреЗ рдереЗ, рдЬрд┐рд╕рдХреЗ рдЬрд╡рд╛рдм рдХреА рддрд▓рд╛рд╢ рдереАред рдЕрдиреНрдп рд▓реЛрдЧреЛрдВ рдХреЗ рднреА рдРрд╕реЗ рд╣реА
рд╕рд╡рд╛рд▓ рдереЗ ред
рдЬреЛ рдХреЛрдИ рднреА рджрд┐рд▓рдЪрд╕реНрдкреА рд╣реИ, рдмрд┐рд▓реНрд▓реА рдХреЗ рд▓рд┐рдП рд╕реНрд╡рд╛рдЧрдд рд╣реИред
рдкреНрд░реАрд╕реЗрдЯ
рд╣рдорд╛рд░реЗ рдХреНрд▓рд╕реНрдЯрд░ рдХреЗ рд▓рд┐рдП рдСрдкрд░реЗрдЯрд┐рдВрдЧ рд╕рд┐рд╕реНрдЯрдо рдХреЗ рд░реВрдк рдореЗрдВ, рдореИрдВ
рдЙрдмрдВрдЯреВ рд╕рд░реНрд╡рд░ 12.04.3 рдПрд▓рдЯреАрдПрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХрд╛ рд╕реБрдЭрд╛рд╡ рджреЗрддрд╛ рд╣реВрдВ, рд▓реЗрдХрд┐рди рдиреНрдпреВрдирддрдо рдмрджрд▓рд╛рд╡реЛрдВ рдХреЗ рд╕рд╛рде, рдЖрдк рд╕рднреА рдЪрд░рдгреЛрдВ рдХреЛ рджреВрд╕рд░реЗ рдУрдПрд╕ рдкрд░ рднреА рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред
рд╕рднреА рдиреЛрдбреНрд╕ VirtualBox рдкрд░ рдЪрд▓реЗрдВрдЧреЗред рд╡рд░реНрдЪреБрдЕрд▓ рдорд╢реАрди рдХреЗ рд▓рд┐рдП рд╕рд┐рд╕реНрдЯрдо рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдореИрдВ рдЫреЛрдЯрд╛ рд╕реЗрдЯ рдХрд░рддрд╛ рд╣реВрдВред рдХреЗрд╡рд▓ 8 рдЬреАрдмреА рд╣рд╛рд░реНрдб рдбреНрд░рд╛рдЗрд╡ рд╕реНрдкреЗрд╕, рдПрдХ рдХреЛрд░ рдФрд░ 512 рдПрдордмреА рдореЗрдореЛрд░реАред рд╡рд░реНрдЪреБрдЕрд▓ рдорд╢реАрди рджреЛ рдиреЗрдЯрд╡рд░реНрдХ рдПрдбреЗрдкреНрдЯрд░ рд╕реЗ рднреА рд╕реБрд╕рдЬреНрдЬрд┐рдд рд╣реИ: рдПрдХ NAT рдФрд░ рджреВрд╕рд░рд╛ рдЖрдВрддрд░рд┐рдХ рдиреЗрдЯрд╡рд░реНрдХ рдХреЗ рд▓рд┐рдПред
рдСрдкрд░реЗрдЯрд┐рдВрдЧ рд╕рд┐рд╕реНрдЯрдо рдбрд╛рдЙрдирд▓реЛрдб рдФрд░ рдЗрдВрд╕реНрдЯреЙрд▓ рд╣реЛрдиреЗ рдХреЗ рдмрд╛рдж, рдЖрдкрдХреЛ ssh рдФрд░ rsync рдХреЛ рдЕрдкрдЧреНрд░реЗрдб рдФрд░ рдЗрдВрд╕реНрдЯреЙрд▓ рдХрд░рдирд╛ рд╣реЛрдЧрд╛:
sudo apt-get update && sudo apt-get upgrade sudo apt-get install ssh sudo apt-get install rsync
рдЬрд╛рд╡рд╛
рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП Hadoop рдХреЗ рд▓рд┐рдП рдЖрдк 6 рдпрд╛ рд╕рдВрд╕реНрдХрд░рдг 7 рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред
рдпрд╣ рд▓реЗрдЦ OpenJDK рд╕рдВрд╕реНрдХрд░рдг 7 рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░реЗрдЧрд╛:
$ sudo apt-get install openjdk-7-jdk
рдпрджреНрдпрдкрд┐ рдЖрдк Oracle рд╕реЗ рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред
рдФрд░ рдХреИрд╕реЗ?рд╣рдо рд╕рднреА OpenJDK рдирд┐рд░реНрднрд░рддрд╛рдУрдВ рд╕реЗ OS рдХреЛ рд╕рд╛рдл рдХрд░рддреЗ рд╣реИрдВред
рдЕрдЬрдЧрд░-рд╕реЙрдлрд╝реНрдЯрд╡реЗрдпрд░-рдЧреБрдг рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ рдЬреЛ рдирдП PPA рдХреЛ рдЬреЛрдбрд╝рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрдЧрд╛:
sudo apt-get install python-software-properties
рд▓реЙрдиреНрдЪрдкреИрдб.net/~webupd8team/+archive/java рдХреЗ рд╕рд╛рде рдПрдХ рдкреАрдкреАрдП рдЬреЛрдбрд╝реЗрдВ
sudo add-apt-repository ppa:webupd8team/java sudo apt-get update sudo apt-get install oracle-java7-installer
рдФрд░ рдкрдврд╝реЗрдВ:
UBUNTU VIA PPA REPOSITORY рдореЗрдВ INSTALL ORACLE JAVA 7 Hadoop рдЪрд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдЕрд▓рдЧ рдЦрд╛рддрд╛ рдмрдирд╛рдПрдБ
рд╣рдо Hadoop рдХреЛ рд▓реЙрдиреНрдЪ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рд╕рдорд░реНрдкрд┐рдд рдЦрд╛рддреЗ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░реЗрдВрдЧреЗред рдпрд╣ рдЖрд╡рд╢реНрдпрдХ рдирд╣реАрдВ рд╣реИ, рд▓реЗрдХрд┐рди рдЕрдиреБрд╢рдВрд╕рд┐рдд рд╣реИред рд╣рдо рднрд╡рд┐рд╖реНрдп рдореЗрдВ рдЕрдкрдиреЗ рд▓рд┐рдП рдЬреАрд╡рди рдХреЛ рдЖрд╕рд╛рди рдмрдирд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдирдП рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ sudo рдЕрдзрд┐рдХрд╛рд░реЛрдВ рдХреЛ рднреА рдкреНрд░рджрд╛рди рдХрд░реЗрдВрдЧреЗред
sudo addgroup hadoop sudo adduser --ingroup hadoop hduser sudo usermod -aG sudo hduser
рдПрдХ рдирдпрд╛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдмрдирд╛рддреЗ рд╕рдордп, рдЖрдкрдХреЛ рдЙрд╕рдХреЗ рд▓рд┐рдП рдПрдХ рдкрд╛рд╕рд╡рд░реНрдб рджрд░реНрдЬ рдХрд░рдирд╛ рд╣реЛрдЧрд╛ред
/ рдЖрджрд┐ / рдореЗрдЬрдмрд╛рди
рд╣рдореЗрдВ рдЖрд╕рд╛рдиреА рд╕реЗ рдПрдХ-рджреВрд╕рд░реЗ рддрдХ рдкрд╣реБрдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рд╕рднреА рдиреЛрдбреНрд╕ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред рдПрдХ рдмрдбрд╝реЗ рдХреНрд▓рд╕реНрдЯрд░ рдореЗрдВ, dns рд╕рд░реНрд╡рд░ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдЙрдЪрд┐рдд рд╣реИ, рд▓реЗрдХрд┐рди рдореЗрдЬрдмрд╛рдиреЛрдВ рдХреА рдлрд╛рдЗрд▓ рд╣рдорд╛рд░реЗ рдЫреЛрдЯреЗ рд╡рд┐рдиреНрдпрд╛рд╕ рдХреЗ рд▓рд┐рдП рдЙрдкрдпреБрдХреНрдд рд╣реИред рдЗрд╕рдореЗрдВ рд╣рдо рдиреЗрдЯрд╡рд░реНрдХ рдкрд░ рдЙрд╕рдХреЗ рдирд╛рдо рдХреЗ рдиреЛрдб рдХреЗ рдЖрдИрдкреА-рдкрддреЗ рдХреЗ рдкрддреНрд░рд╛рдЪрд╛рд░ рдХрд╛ рд╡рд░реНрдгрди рдХрд░реЗрдВрдЧреЗред рдПрдХ рдиреЛрдб рдХреЗ рд▓рд┐рдП, рдЖрдкрдХреА рдлрд╝рд╛рдЗрд▓ рдХреЛ рдХреБрдЫ рдЗрд╕ рддрд░рд╣ рджрд┐рдЦрдирд╛ рдЪрд╛рд╣рд┐рдП:
127.0.0.1 localhost
SSH
рд╣рдбреВрдк рдХреНрд▓рд╕реНрдЯрд░ рдХреЗ рдиреЛрдбреНрд╕ рдХреЛ рдкреНрд░рдмрдВрдзрд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, ssh рдПрдХреНрд╕реЗрд╕ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред рдмрдирд╛рдП рдЧрдП рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ HDuser рдХреЗ рд▓рд┐рдП, рдорд╛рд╕реНрдЯрд░ рддрдХ рдкрд╣реБрдВрдЪ рдкреНрд░рджрд╛рди рдХрд░реЗрдВред
рд╕рдмрд╕реЗ рдкрд╣рд▓реЗ рдЖрдкрдХреЛ рдПрдХ рдирдИ ssh рдХреБрдВрдЬреА рдЬреЗрдирд░реЗрдЯ рдХрд░рдиреА рд╣реЛрдЧреА:
ssh-keygen -t rsa -P ""
рдореБрдЦреНрдп рдирд┐рд░реНрдорд╛рдг рдХреЗ рджреМрд░рд╛рди, рдПрдХ рдкрд╛рд╕рд╡рд░реНрдб рдХрд╛ рдЕрдиреБрд░реЛрдз рдХрд┐рдпрд╛ рдЬрд╛рдПрдЧрд╛ред рдЕрдм рдЖрдк рдЗрд╕рдореЗрдВ рдкреНрд░рд╡реЗрд╢ рдирд╣реАрдВ рдХрд░ рд╕рдХрддреЗред
рдЕрдЧрд▓рд╛ рдЪрд░рдг рдЕрдзрд┐рдХреГрдд рд╕реВрдЪреА рдореЗрдВ рдмрдирд╛рдИ рдЧрдИ рдХреБрдВрдЬреА рдХреЛ рдЬреЛрдбрд╝рдирд╛ рд╣реИ:
cat $HOME/.ssh/id_rsa.pub >> $HOME/.ssh/authorized_keys
рд╣рдо рдЦреБрдж рд╕реЗ рдЬреБрдбрд╝рдХрд░ рдкреНрд░рджрд░реНрд╢рди рдХреА рдЬрд╛рдБрдЪ рдХрд░рддреЗ рд╣реИрдВ:
ssh master
IPv6 рдХреЛ рдЕрдХреНрд╖рдо рдХрд░рдирд╛
рдпрджрд┐ рдЖрдк IPv6 рдХреЛ рдЕрдХреНрд╖рдо рдирд╣реАрдВ рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рдЖрдкрдХреЛ рдмрд╣реБрдд рд╕рд╛рд░реА рд╕рдорд╕реНрдпрд╛рдПрдВ рд╣реЛ рд╕рдХрддреА рд╣реИрдВред
Ubuntu 12.04 / 12.10 / 13.04 рдореЗрдВ IPv6 рдХреЛ рдЕрдХреНрд╖рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдЖрдкрдХреЛ sysctl.conf рдлрд╝рд╛рдЗрд▓ рдХреЛ рд╕рдВрдкрд╛рджрд┐рдд рдХрд░рдирд╛ рд╣реЛрдЧрд╛:
sudo vim /etc/sysctl.conf
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдкреИрд░рд╛рдореАрдЯрд░ рдЬреЛрдбрд╝реЗрдВ:
рд╣рдо рдСрдкрд░реЗрдЯрд┐рдВрдЧ рд╕рд┐рд╕реНрдЯрдо рдХреЛ рд╕рд╣реЗрдЬрддреЗ рд╣реИрдВ рдФрд░ рд░рд┐рдмреВрдЯ рдХрд░рддреЗ рд╣реИрдВред
рд▓реЗрдХрд┐рди рдореБрдЭреЗ IPv6 рдЪрд╛рд╣рд┐рдП!рдХреЗрд╡рд▓ рд╣рдбреВрдк рдореЗрдВ ipv6 рдХреЛ рдирд┐рд╖реНрдХреНрд░рд┐рдп рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдЖрдк рдлрд╝рд╛рдЗрд▓ рдЖрджрд┐ рдореЗрдВ рдЬреЛрдбрд╝ рд╕рдХрддреЗ рд╣реИрдВ / hadoop / hadoop-env.sh:
export HADOOP_OPTS=-Djava.net.preferIPv4Stack=true
Apache Hadoop рд╕реНрдерд╛рдкрд┐рдд рдХрд░реЗрдВ
рдЖрд╡рд╢реНрдпрдХ рдлрд╛рдЗрд▓реЗрдВ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░реЗрдВред
рдлреНрд░реЗрдорд╡рд░реНрдХ рдХреЗ рд╡рд░реНрддрдорд╛рди рд╕рдВрд╕реНрдХрд░рдг рдпрд╣рд╛рдВ рд╕реНрдерд┐рдд рд╣реИрдВ:
www.apache.org/dyn/closer.cgi/hadoop/commonрджрд┐рд╕рдВрдмрд░ 2013 рдХреЗ рд╕рдордп, рд╕реНрдерд┐рд░ рд╕рдВрд╕реНрдХрд░рдг 2.2.0 рд╣реИред
рд░реВрдЯ рдирд┐рд░реНрджреЗрд╢рд┐рдХрд╛ рдореЗрдВ рдбрд╛рдЙрдирд▓реЛрдб рдлрд╝реЛрд▓реНрдбрд░ рдмрдирд╛рдПрдБ рдФрд░ рдирд╡реАрдирддрдо рд╕рдВрд╕реНрдХрд░рдг рдбрд╛рдЙрдирд▓реЛрдб рдХрд░реЗрдВ:
sudo mkdir /downloads cd downloads/ sudo wget http://apache-mirror.rbc.ru/pub/apache/hadoop/common/stable/hadoop-2.2.0.tar.gz
/ Usr / рд╕реНрдерд╛рдиреАрдп / рдореЗрдВ рдкреИрдХреЗрдЬ рдХреА рд╕рд╛рдордЧреНрд░реА рдХреЛ рдЕрдирдкреИрдХ рдХрд░реЗрдВ, рдлрд╝реЛрд▓реНрдбрд░ рдХрд╛ рдирд╛рдо рдмрджрд▓реЗрдВ рдФрд░ рдПрдЪрдбреАрдпреВрд╕рд░ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдирд┐рд░реНрдорд╛рддрд╛ рдЕрдзрд┐рдХрд╛рд░ рджреЗрдВ:
sudo mv /downloads/hadoop-2.2.0.tar.gz /usr/local/ cd /usr/local/ sudo tar xzf hadoop-2.2.0.tar.gz sudo mv hadoop-2.2.0 hadoop chown -R hduser:hadoop hadoop
$ рдШрд░ / .bashrc рдЕрджреНрдпрддрди
рд╕реБрд╡рд┐рдзрд╛ рдХреЗ рд▓рд┐рдП, .bashrc рдореЗрдВ рдЪрд░ рдХреА рд╕реВрдЪреА рдЬреЛрдбрд╝реЗрдВ:
рдЗрд╕ рдХрджрдо рдкрд░, рдкреНрд░рд╛рд░рдВрднрд┐рдХ рддреИрдпрд╛рд░реА рдкреВрд░реА рд╣реЛ рдЧрдИ рд╣реИред
рдЕрдкрд╛рдЪреЗ Hadoop рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░реЗрдВ
рдмрд╛рдж рдХреЗ рд╕рднреА рдХрд╛рд░реНрдп рдлрд╝реЛрд▓реНрдбрд░ / usr / рд╕реНрдерд╛рдиреАрдп / рд╣рдбреВрдк рд╕реЗ рдХрд┐рдП рдЬрд╛рдПрдВрдЧреЗред
рдЖрджрд┐ рдХреЛ рдЦреЛрд▓реЗрдВ / hadoop / hadoop-env.sh рдФрд░ JAVA_HOME рд╕реЗрдЯ рдХрд░реЗрдВред
vim /usr/local/hadoop/etc/hadoop/hadoop-env.sh
рд╣рдо рд╡рд░реНрдгрди рдХрд░реЗрдВрдЧреЗ рдХрд┐ рдлрд╝рд╛рдЗрд▓ рдореЗрдВ рдХреНрд▓рд╕реНрдЯрд░ рдореЗрдВ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдХреНрдпрд╛ рдиреЛрдбреНрд╕ рд╣реЛрдВрдЧреЗ / рд╣рдбреВрдк / рджрд╛рд╕
master
рдпрд╣ рдлрд╝рд╛рдЗрд▓ рдХреЗрд╡рд▓ рдореБрдЦреНрдп рдиреЛрдб рдкрд░ рд╕реНрдерд┐рдд рд╣реЛ рд╕рдХрддреА рд╣реИред рдпрд╣рд╛рдВ рд╕рднреА рдирдП рдиреЛрдбреНрд╕ рдХрд╛ рд╡рд░реНрдгрди рдХрд┐рдпрд╛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдПред
рдореБрдЦреНрдп рдкреНрд░рдгрд╛рд▓реА рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдЖрджрд┐ / рд╣рдбреВрдк / рдХреЛрд░-рд╕рд╛рдЗрдЯ.рдПрдХреНрд╕рдПрдордПрд▓ рдореЗрдВ рд╕реНрдерд┐рдд рд╣реИрдВ:
<configuration> <property> <name>fs.defaultFS</name> <value>hdfs://master:9000</value> </property> </configuration>
рдПрдЪрдбреАрдПрдл рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдЖрджрд┐ / рд╣рдбреВрдк / рдПрдЪрдбреАрдПрдлрдПрд╕-рд╕рд╛рдЗрдЯ.рдПрдХреНрд╕рдПрдордПрд▓ рдореЗрдВ рд╣реИрдВ:
<configuration> <property> <name>dfs.replication</name> <value>1</value> </property> <property> <name>dfs.namenode.name.dir</name> <value>file:/usr/local/hadoop/tmp/hdfs/namenode</value> </property> <property> <name>dfs.datanode.data.dir</name> <value>file:/usr/local/hadoop/tmp/hdfs/datanode</value> </property> </configuration>
рдпрд╣рд╛рдВ, dfs.replication рдкреИрд░рд╛рдореАрдЯрд░ рдлрд╝рд╛рдЗрд▓ рд╕рд┐рд╕реНрдЯрдо рдкрд░ рд╕рдВрдЧреНрд░рд╣реАрдд рдХрд┐рдП рдЬрд╛рдиреЗ рд╡рд╛рд▓реЗ рдкреНрд░рддрд┐рдХреГрддрд┐рдпреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХрд░рддрд╛ рд╣реИред рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд░реВрдк рд╕реЗ, рдЗрд╕рдХрд╛ рдореВрд▓реНрдп рд╣реИ
3. рдпрд╣ рдХреНрд▓рд╕реНрдЯрд░ рдореЗрдВ рдиреЛрдбреНрд╕ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╕реЗ рдЕрдзрд┐рдХ рдирд╣реАрдВ рд╣реЛ рд╕рдХрддрд╛ рд╣реИред
Dfs.namenode.name.dir рдФрд░ dfs.datanode.data.dir рдкреИрд░рд╛рдореАрдЯрд░ рдЙрди рд░рд╛рд╕реНрддреЛрдВ рдХреЛ рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░рддреЗ рд╣реИрдВ рдЬрд╣рд╛рдБ рдбреЗрдЯрд╛ рдФрд░ рдЬрд╛рдирдХрд╛рд░реА HDFS рдореЗрдВ рднреМрддрд┐рдХ рд░реВрдк рд╕реЗ рд╕реНрдерд┐рдд рд╣реЛрдВрдЧреЗред рдЖрдкрдХреЛ рдкрд╣рд▓реЗ рд╕реЗ tmp рдлрд╝реЛрд▓реНрдбрд░ рдмрдирд╛рдирд╛ рд╣реЛрдЧрд╛ред
рд╣рдорд╛рд░реЗ рдХреНрд▓рд╕реНрдЯрд░ рдХреЛ рдмрддрд╛рдПрдВ рдХрд┐ рд╣рдо YARN рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВред рдРрд╕рд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдЖрджрд┐ рдмрджрд▓реЗрдВ / hadoop / mapred-site.xml:
<configuration> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> </configuration>
рд╕рднреА рдпрд╛рд░ рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдЖрджрд┐ / рд╣рдбреВрдк / рдпрд╛рд░реНрди- site.xml рдореЗрдВ рд╡рд░реНрдгрд┐рдд рд╣реИрдВ:
<configuration> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> <property> <name>yarn.resourcemanager.scheduler.address</name> <value>master:8030</value> </property> <property> <name>yarn.resourcemanager.address</name> <value>master:8032</value> </property> <property> <name>yarn.resourcemanager.webapp.address</name> <value>master:8088</value> </property> <property> <name>yarn.resourcemanager.resource-tracker.address</name> <value>master:8031</value> </property> <property> <name>yarn.resourcemanager.admin.address</name> <value>master:8033</value> </property> </configuration>
рд░рд┐рд╕реЛрд░реНрд╕рдореИрдиреЗрдЬрд░ рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдХреА рдЬрд░реВрд░рдд рд╣реИ рддрд╛рдХрд┐ рдХреНрд▓рд╕реНрдЯрд░ рдХреЗ рд╕рднреА рдиреЛрдбреНрд╕ рдХрдВрдЯреНрд░реЛрд▓ рдкреИрдирд▓ рдореЗрдВ рджреЗрдЦреЗ рдЬрд╛ рд╕рдХреЗрдВред
рдкреНрд░рд╛рд░реВрдк HDFS:
bin/hdfs namenode тАУformat
рд╣рдбреВрдк рд╕реЗрд╡рд╛ рдЪрд▓рд╛рдПрдВ:
sbin/start-dfs.sh sbin/start-yarn.sh
* Hadoop рдХреЗ рдкрд┐рдЫрд▓реЗ рд╕рдВрд╕реНрдХрд░рдг рдореЗрдВ sbin / start-all.sh рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рд▓реЗрдХрд┐рди рдЗрд╕реЗ рд╕рдВрд╕реНрдХрд░рдг 2 рд╕реЗ рд╣рдЯрд╛ рджрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред * *ред
рдЖрдкрдХреЛ рдпрд╣ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ рдХрд┐ рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдЬрд╛рд╡рд╛ рдкреНрд░рдХреНрд░рд┐рдпрд╛рдПрдВ рдЪрд▓ рд░рд╣реА рд╣реИрдВ:
hduser@master:/usr/local/hadoop$ jps 4868 SecondaryNameNode 5243 NodeManager 5035 ResourceManager 4409 NameNode 4622 DataNode 5517 Jps
рдЖрдк рдорд╛рдирдХ рдЙрджрд╛рд╣рд░рдгреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдХреНрд▓рд╕реНрдЯрд░ рдСрдкрд░реЗрд╢рди рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ:
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar
рдЕрдм рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдПрдХ рддреИрдпрд╛рд░ рдЫрд╡рд┐ рд╣реИ рдЬреЛ рдХреНрд▓рд╕реНрдЯрд░ рдмрдирд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрдзрд╛рд░ рдХреЗ рд░реВрдк рдореЗрдВ рдХрд╛рдо рдХрд░реЗрдЧреАред
рдЗрд╕рдХреЗ рдмрд╛рдж, рдЖрдк рд╣рдорд╛рд░реА рдЫрд╡рд┐ рдХреА рдЖрд╡рд╢реНрдпрдХ рд╕рдВрдЦреНрдпрд╛ рдмрдирд╛ рд╕рдХрддреЗ рд╣реИрдВред
рдкреНрд░рддрд┐рдпреЛрдВ рдкрд░, рдЖрдкрдХреЛ рдиреЗрдЯрд╡рд░реНрдХ рдХреЛ рдХреЙрдиреНрдлрд╝рд┐рдЧрд░ рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред рдиреЗрдЯрд╡рд░реНрдХ рдЗрдВрдЯрд░рдлреЗрд╕ рдХреЗ рд▓рд┐рдП рдирдП рдореИрдХ рдкрддреЗ рдЙрддреНрдкрдиреНрди рдХрд░рдирд╛ рдФрд░ рдЙрдиреНрд╣реЗрдВ рдЖрд╡рд╢реНрдпрдХ рдЖрдИрдкреА рдкрддреЗ рдЬрд╛рд░реА рдХрд░рдирд╛ рдЖрд╡рд╢реНрдпрдХ рд╣реИред рдореЗрд░реЗ рдЙрджрд╛рд╣рд░рдг рдореЗрдВ, рдореИрдВ 192.168.0.X рдЬреИрд╕реЗ рдкрддреЛрдВ рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рддрд╛ рд╣реВрдВред
рдХреНрд▓рд╕реНрдЯрд░ рдХреЗ рд╕рднреА рдиреЛрдбреНрд╕ рдкрд░ / etc / рдореЗрдЬрдмрд╛рди рдлрд╝рд╛рдЗрд▓ рдХреЛ рдареАрдХ рдХрд░реЗрдВ рддрд╛рдХрд┐ рдЙрд╕рдореЗрдВ рд╕рднреА рдореИрдЪ рд▓рд┐рдЦреЗ рдЬрд╛рдПрдВред
рд╕реБрд╡рд┐рдзрд╛ рдХреЗ рд▓рд┐рдП, рдирдП рдиреЛрдбреНрд╕ рдХреЗ рдирд╛рдо рдмрджрд▓рдХрд░ slave1 рдФрд░ slave2 рдХрд░реЗрдВред
рдХреИрд╕реЗ?рджреЛ рдлрд╛рдЗрд▓реЗрдВ рдмрджрд▓рдиреА рдЪрд╛рд╣рд┐рдП: / etc / hostname рдФрд░ / etc / рдореЗрдЬрдмрд╛рдиред
рдиреЛрдбреНрд╕ рдкрд░ рдирдИ SSH рдХреБрдВрдЬрд┐рдпрд╛рдБ рдмрдирд╛рдПрдБ рдФрд░ рдЙрди рд╕рднреА рдХреЛ рдорд╛рд╕реНрдЯрд░ рдиреЛрдб рдкрд░ рдЕрдзрд┐рдХреГрдд рдХреА рд╕реВрдЪреА рдореЗрдВ рдЬреЛрдбрд╝реЗрдВред
рдХреНрд▓рд╕реНрдЯрд░ рдХреЗ рдкреНрд░рддреНрдпреЗрдХ рдиреЛрдб рдкрд░, dfs.replication рдкреИрд░рд╛рдореАрдЯрд░ рдХреЗ рдорд╛рдиреЛрдВ рдХреЛ рдЖрджрд┐ / hadoop / hdfs-site.xml рдореЗрдВ рдмрджрд▓реЗрдВред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдорд╛рди рдХреЛ рд╣рд░ рдЬрдЧрд╣ 3 рдкрд░ рд╕реЗрдЯ рдХрд░реЗрдВред
etc / hadoop / hdfs-site.xml <configuration> <property> <name>dfs.replication</name> <value>3</value> </property> </configuration>
рдорд╛рд╕реНрдЯрд░ рдиреЛрдб рдкрд░ рдЖрджрд┐ / рд╣рдбреВрдк / рджрд╛рд╕ рдлрд╝рд╛рдЗрд▓ рдореЗрдВ рдирдП рдиреЛрдб рдЬреЛрдбрд╝реЗрдВ:
master slave1 slave2
рдЬрдм рд╕рднреА рд╕реЗрдЯрд┐рдВрдЧреНрд╕ рдкрдВрдЬреАрдХреГрдд рд╣реИрдВ, рддреЛ рдореБрдЦреНрдп рдиреЛрдб рдкрд░ рдЖрдк рд╣рдорд╛рд░реЗ рдХреНрд▓рд╕реНрдЯрд░ рдХреЛ рд╢реБрд░реВ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред
bin/hdfs namenode тАУformat sbin/start-dfs.sh sbin/start-yarn.sh
рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рдкреНрд░рдХреНрд░рд┐рдпрд╛ рджрд╛рд╕ рдиреЛрдбреНрд╕ рдкрд░ рд╢реБрд░реВ рд╣реЛрдиреА рдЪрд╛рд╣рд┐рдП:
hduser@slave1:/usr/local/hadoop$ jps 1748 Jps 1664 NodeManager 1448 DataNode
рдЕрдм рд╣рдорд╛рд░рд╛ рдЕрдкрдирд╛ рдорд┐рдиреА-рдХреНрд▓рд╕реНрдЯрд░ рд╣реИред
рд╡рд░реНрдб рдХрд╛рдЙрдВрдЯ рдЯрд╛рд╕реНрдХ рдХреЛ рд░рди рдХрд░рддреЗ рд╣реИрдВред
рдРрд╕рд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рд╣рдореЗрдВ рдХрдИ рдкрд╛рда рдлрд╝рд╛рдЗрд▓реЛрдВ рдХреЛ рдПрдЪрдбреАрдПрдлрдПрд╕ рдкрд░ рдЕрдкрд▓реЛрдб рдХрд░рдирд╛ рд╣реЛрдЧрд╛ред
рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдореИрдВрдиреЗ
рдлреНрд░реА рдИ- рдмреБрдХреНрд╕ рд╕рд╛рдЗрдЯ
- рдкреНрд░реЛрдЬреЗрдХреНрдЯ рдЧреБрдЯреЗрдирдмрд░реНрдЧ рд╕реЗ txt рдкреНрд░рд╛рд░реВрдк рдореЗрдВ рдкреБрд╕реНрддрдХреЗрдВ рд▓реАрдВред
рдлрд╝рд╛рдЗрд▓реЛрдВ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░реЗрдВ cd /home/hduser mkdir books cd books wget http://www.gutenberg.org/cache/epub/20417/pg20417.txt wget http://www.gutenberg.org/cache/epub/5000/pg5000.txt wget http://www.gutenberg.org/cache/epub/4300/pg4300.txt wget http://www.gutenberg.org/cache/epub/972/pg972.txt wget http://www.gutenberg.org/cache/epub/132/pg132.txt wget http://www.gutenberg.org/cache/epub/1661/pg1661.txt wget http://www.gutenberg.org/cache/epub/19699/pg19699.txt
рд╣рдорд╛рд░реА рдлрд╝рд╛рдЗрд▓реЛрдВ рдХреЛ HDFS рдореЗрдВ рд╕реНрдерд╛рдирд╛рдВрддрд░рд┐рдд рдХрд░реЗрдВ:
cd /usr/local/hadoop bin/hdfs dfs -mkdir /in bin/hdfs dfs -copyFromLocal /home/hduser/books/* /in bin/hdfs dfs -ls /in
рд▓реЙрдиреНрдЪ рд╢рдмреНрдж рдЧрдгрдирд╛:
bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /in /out
рдЖрдк рдХрдВрд╕реЛрд▓ рдкрд░ рдпрд╛
рдорд╛рд╕реНрдЯрд░ рдореЗрдВ рд░рд┐рд╕реЛрд░реНрд╕рдореИрди рдХреЗ рд╡реЗрдм рдЗрдВрдЯрд░рдлреЗрд╕ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдХрд╛рд░реНрдп рдХреА рдирд┐рдЧрд░рд╛рдиреА рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ: 8088 / рдХреНрд▓рд╕реНрдЯрд░ / рдПрдкреНрд╕ /
рдкреВрд░рд╛ рд╣реЛрдиреЗ рдкрд░, рдкрд░рд┐рдгрд╛рдо рдПрдЪрдбреАрдПрдлрдПрд╕ рдореЗрдВ / рдЖрдЙрдЯ рдлрд╝реЛрд▓реНрдбрд░ рдореЗрдВ рд╕реНрдерд┐рдд рд╣реЛрдЧрд╛ред
рд╕реНрдерд╛рдиреАрдп рдлрд╝рд╛рдЗрд▓ рд╕рд┐рд╕реНрдЯрдо рдореЗрдВ рдЗрд╕реЗ рдбрд╛рдЙрдирд▓реЛрдб рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдирд┐рд╖реНрдкрд╛рджрд┐рдд рдХрд░реЗрдВ:
bin/hdfs dfs -copyToLocal /out /home/hduser/
рдпрджрд┐ рдЖрдкрдХреЗ рдХреЛрдИ рдкреНрд░рд╢реНрди рд╣реИрдВ, рддреЛ рдЙрдиреНрд╣реЗрдВ рдЯрд┐рдкреНрдкрдгрд┐рдпреЛрдВ рдореЗрдВ рдкреВрдЫреЗрдВред