рдирдорд╕реНрдХрд╛рд░ред
рдореИрдВ рдорд╣рдЯ рдЗрди рдПрдХреНрд╢рди рдХрд┐рддрд╛рдм рдкрдврд╝ рд░рд╣рд╛ рд╣реВрдВред "рдореИрдВ рдкреБрд╕реНрддрдХ рдореЗрдВ рджреЗрдЦрддрд╛ рд╣реВрдБ - рдореИрдВ рдПрдХ рдЕрдВрдЬреАрд░ рджреЗрдЦрддрд╛ рд╣реВрдБ" рдХрд╛ рдкреНрд░рднрд╛рд╡ рдкрдбрд╝рд╛ред рдЗрд╕реЗ рдЦрддреНрдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдореИрдВрдиреЗ рдиреЛрдЯ рд▓реЗрдиреЗ рдХрд╛ рдлреИрд╕рд▓рд╛ рдХрд┐рдпрд╛редApache Mahout рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдПрд▓реНрдЧреЛрд░рд┐рджрдо рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдкреБрд╕реНрддрдХрд╛рд▓рдп рд╣реИ, рдЬрд┐рд╕рдХрд╛ рдЙрдкрдпреЛрдЧ Hadoop рдпрд╛ рдЕрдкрдиреЗ рджрдо рдкрд░ рдРрдб-рдСрди рдХреЗ рд░реВрдк рдореЗрдВ рдХрд┐рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдкреБрд╕реНрддрдХрд╛рд▓рдп
рд╕рд╣рдпреЛрдЧреА рдлрд╝рд┐рд▓реНрдЯрд░рд┐рдВрдЧ ,
рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ рдФрд░
рд╡рд░реНрдЧреАрдХрд░рдг рд╡рд┐рдзрд┐рдпреЛрдВ рдХреЛ рд▓рд╛рдЧреВ рдХрд░рддрд╛ рд╣реИред
рд╣рдо рд╕рд╣рдпреЛрдЧреА рдлрд╝рд┐рд▓реНрдЯрд░рд┐рдВрдЧ рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдПрдХ рд╕рд┐рдлрд╛рд░рд┐рд╢ рдкреНрд░рдгрд╛рд▓реА рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░ рд░рд╣реЗ рд╣реИрдВред рдпрд╣ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛-рдЖрдзрд╛рд░рд┐рдд (рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛-рдЖрдзрд╛рд░рд┐рдд) рдпрд╛ рд╕рдВрдкрддреНрддрд┐-рдЙрдиреНрдореБрдЦ (рдЖрдЗрдЯрдо-рдЖрдзрд╛рд░рд┐рдд) рд╣реЛ рд╕рдХрддрд╛ рд╣реИред
рд╕рд╣рдпреЛрдЧрд╛рддреНрдордХ рдлрд╝рд┐рд▓реНрдЯрд░рд┐рдВрдЧ рдкреВрд░реНрд╡рд╛рдиреБрдорд╛рди рд╡рд┐рдзрд┐рдпреЛрдВ рдореЗрдВ рд╕реЗ рдПрдХ рд╣реИ рдЬреЛ рдХрд┐рд╕реА рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рд╕рдореВрд╣ рдХреА рдЬреНрдЮрд╛рдд рдкреНрд░рд╛рдердорд┐рдХрддрд╛рдУрдВ (рдЕрдиреБрдорд╛рдиреЛрдВ) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рд╕реА рдЕрдиреНрдп рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдХреА рдЕрдЬреНрдЮрд╛рдд рдкреНрд░рд╛рдердорд┐рдХрддрд╛рдУрдВ рдХрд╛ рдЕрдиреБрдорд╛рди рд▓рдЧрд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд░рддрд╛ рд╣реИред рдЙрдирдХреА рдореБрдЦреНрдп рдзрд╛рд░рдгрд╛ рдпрд╣ рд╣реИ: рдЬрд┐рдиреНрд╣реЛрдВрдиреЗ рдЕрддреАрдд рдореЗрдВ рд╕рдорд╛рди рд╡рд┐рд╖рдпреЛрдВ рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдХрд┐рдпрд╛ рд╣реИ рд╡реЗ рднрд╡рд┐рд╖реНрдп рдореЗрдВ рдЕрдиреНрдп рд╡рд┐рд╖рдпреЛрдВ рдХреЗ рд╕рдорд╛рди рдореВрд▓реНрдпрд╛рдВрдХрди рджреЗрддреЗ рд╣реИрдВред (рд╡рд┐рдХрд┐рдкреАрдбрд┐рдпрд╛ рд╕реЗ)
рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛-рдЙрдиреНрдореБрдЦ рдЕрдиреБрд╢рдВрд╕рд╛ рдкреНрд░рдгрд╛рд▓рд┐рдпреЛрдВ рдХреА рдореВрд▓ рдЕрд╡рдзрд╛рд░рдгрд╛рдУрдВ рдореЗрдВ рд╕реЗ рдПрдХ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рд╕рдорд╛рдирддрд╛ рдХрд╛ рдирд┐рд░реНрдзрд╛рд░рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдореАрдЯреНрд░рд┐рдХ рд╣реИред рдорд╛рди рд▓реАрдЬрд┐рдП рдХрд┐ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рд╡рд┐рднрд┐рдиреНрди рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рджреНрд╡рд╛рд░рд╛ рдлрд┐рд▓реНрдореЛрдВ рдХреЗ рд╡рд┐рдЪрд╛рд░реЛрдВ рдФрд░ рд░реЗрдЯрд┐рдВрдЧ рдкрд░ рдбреЗрдЯрд╛ рд╣реИред рд╣рдо рджреЛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреА рддреБрд▓рдирд╛ рдХрд░реЗрдВрдЧреЗ:
X рдФрд░
Yред рдЙрдиреНрд╣реЛрдВрдиреЗ рдлрд┐рд▓реНрдореЛрдВ рдореЗрдВ
рдПрдХреНрд╕ (рдПрдХреНрд╕ 1 , рдПрдХреНрд╕ 2 , ..., рдПрдХреНрд╕ рдПрди ) рдФрд░
рд╡рд╛рдИ (рд╡рд╛рдИ 1 , рд╡рд╛рдИ 2 , ..., рд╡рд╛рдИ рдПрдо ) рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдХрд┐рдпрд╛, рдЬрд╣рд╛рдВ
рдПрди ,
рдПрдо рдХреНрд░рдорд╢рдГ рдкрд╣рд▓реЗ рдФрд░ рджреВрд╕рд░реЗ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рджреНрд╡рд╛рд░рд╛ рджреА рдЧрдИ рд░реЗрдЯрд┐рдВрдЧ рдХреА рд╕рдВрдЦреНрдпрд╛ рд╣реИрдВред
рдПрди - рджреЛрдиреЛрдВ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рджреНрд╡рд╛рд░рд╛ рдПрдХ рд╣реА рдлрд┐рд▓реНрдореЛрдВ рдХреЗ рд▓рд┐рдП рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХреА рдЧрдИ рд░реЗрдЯрд┐рдВрдЧ рдХреА рд╕рдВрдЦреНрдпрд╛ (рдкрд╣рд▓реА рдФрд░ рджреВрд╕рд░реА рджреНрд╡рд╛рд░рд╛ рджреЗрдЦреА рдЧрдИ рдлрд┐рд▓реНрдореЛрдВ рдХреЗ рд╕реЗрдЯ рдХрд╛ рдкреНрд░рддрд┐рдЪреНрдЫреЗрджрди)ред рд╣рдо рдорд╛рдирддреЗ рд╣реИрдВ рдХрд┐
(x i , y i ) рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рджреНрд╡рд╛рд░рд╛ рдПрдХ рдлрд┐рд▓реНрдо рдХреЗ рд▓рд┐рдП рд░рдЦреА рдЧрдИ рд░реЗрдЯрд┐рдВрдЧ рдХреА рдПрдХ рдЬреЛрдбрд╝реА рд╣реИред
Mahout рдХрдИ рдПрд▓реНрдЧреЛрд░рд┐рджрдо рдкрд░ рдЖрдзрд╛рд░рд┐рдд рдореИрдЯреНрд░рд┐рдХреНрд╕ рдХреЛ рд▓рд╛рдЧреВ рдХрд░рддрд╛ рд╣реИред рдореИрдВ рд╕реНрд╡рдпрдВ рдПрд▓реНрдЧреЛрд░рд┐рджрдо рдХрд╛ рд╡рд░реНрдгрди рдХрд░рддрд╛ рд╣реВрдВ, рди рдХрд┐ рдорд╣рдЯ рдореЗрдВ рдЙрдирдХреЗ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдХрд╛ред
рдкреАрдпрд░рд╕рди рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ (4.3.1)
рдХреЛрд╖реНрдардХреЛрдВ рдореЗрдВ рдореИрдВ
рдУрд╡реЗрди, рдЕрдирд┐рд▓, рдбрд┐рдВрдЧрд┐рдВрдЧ, рдлреНрд░реАрдбрдореИрди рдХреА рдкреБрд╕реНрддрдХ
"рдПрдХреНрд╢рди рдореЗрдВ рдорд╣рд╛рд╡рдд" рдХреЛ рдЪрд┐рд╣реНрдирд┐рдд рдХрд░реВрдВрдЧрд╛ред
рдорд╣рд╛рд╡рдд рдореЗрдВ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди -
рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдзрд╛рд╕рди ред
рдкрд┐рдпрд░реНрд╕рди рдХрд╛ рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ рд╕рдВрдЦреНрдпрд╛
K (-1 тЙд K ,
1) рд╣реИ , рдЬреЛ рдЬреЛрдбрд╝реЗ рдореЗрдВ рдЬрд╛рдиреЗ рд╡рд╛рд▓реА рд╕рдВрдЦреНрдпрд╛рдУрдВ рдХреЗ рджреЛ рд╕реЗрдЯреЛрдВ рдХреА рдкреНрд░рд╡реГрддреНрддрд┐ рджрд░реНрд╢рд╛рддрд╛ рд╣реИред рдпрд╛рдиреА рдкрд╣рд▓реЗ рдФрд░ рджреВрд╕рд░реЗ рд╕реЗрдЯ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХреЗ рдмреАрдЪ рд▓рдЧрднрдЧ рдПрдХ рд░реИрдЦрд┐рдХ рд╕рдВрдмрдВрдз рдмрдирд╛рддреЗ рд╣реИрдВред
x i = by i (рд╕рднреА
i B рдХреЗ рд▓рд┐рдП рдпрд╣ рд▓рдЧрднрдЧ рд╕рдорд╛рди рд╣реЛрдЧрд╛)ред рдпрджрд┐ рдирд┐рд░реНрднрд░рддрд╛ рд░реИрдЦрд┐рдХ рд╣реИ, рддреЛ рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ 1 рд╣реИ, рдпрджрд┐ рд╡реНрдпреБрддреНрдХреНрд░рдо -1 рд╣реИ, рдЕрдЧрд░ рдХреЛрдИ рдирд┐рд░реНрднрд░рддрд╛ рдирд╣реАрдВ рд╣реИ, рддреЛ 0ред
рдЗрд╕рдХреА рдЧрдгрдирд╛ рд╕реВрддреНрд░ рджреНрд╡рд╛рд░рд╛ рдХреА рдЬрд╛рддреА рд╣реИ:

рд╕рд╣реА рд╡реЗрдХреНрдЯрд░ рдкреНрд░рд╡рд┐рд╖реНрдЯрд┐ред

- рдЕрдВрдХрдЧрдгрд┐рдд рдорд╛рдзреНрдпред рдЗрд╕ рддрд░рд╣ рд╣рдо рдбреЗрдЯрд╛ рдХреЛ рдХреЗрдВрджреНрд░ рдореЗрдВ рд░рдЦрддреЗ рд╣реИрдВред рдореИрдиреНрдпреБрдЕрд▓ рд░реВрдк рд╕реЗ рдЧрдгрдирд╛ рдХрд░рддреЗ рд╕рдордп, рдЗрд╕реЗ рдзреНрдпрд╛рди рдореЗрдВ рд░рдЦрд╛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдП, рд▓реЗрдХрд┐рди рдорд╣рд╛рд╡рдд рдореЗрдВ рд╕рд╣рд╕рдВрдмрдВрдз рдХрд╛ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдЗрд╕ рдмрд╛рдд рдХрд╛ рдзреНрдпрд╛рди рд░рдЦрддрд╛ рд╣реИред
рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдз рдореАрдЯреНрд░рд┐рдХ рд╕рдорд╕реНрдпрд╛рдПрдВ (4.3.2)
рдпрд╣ рдорд╛рдирдирд╛ тАЛтАЛрддрд░реНрдХрд╕рдВрдЧрдд рд╣реИ рдХрд┐ рджреЛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдЬрд┐рдиреНрд╣реЛрдВрдиреЗ 200 рд╕рдорд╛рди рдлрд┐рд▓реНрдореЗрдВ рджреЗрдЦреАрдВ, рд╡реЗ рджреЛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд░реЗрдЯрд┐рдВрдЧ рдбрд╛рд▓рддреЗ рд╣реИрдВ, рдЬреЛ рддреАрди рд╕рдорд╛рди рдлрд┐рд▓реНрдореЛрдВ рдХреЛ рджреЗрдЦрддреЗ рд╣реИрдВ рдФрд░ рдЙрдиреНрд╣реЗрдВ рдПрдХ рд╣реА рд░реЗрдЯрд┐рдВрдЧ рджреЗрддреЗ рд╣реИрдВред рд▓реЗрдХрд┐рди рд╕реВрддреНрд░ рд╕реЗ рд╣рдореЗрдВ рд╡рд┐рдкрд░реАрдд рдкрд░рд┐рдгрд╛рдо рдорд┐рд▓рддрд╛ рд╣реИред
рджреВрд╕рд░рд╛ рджреЛрд╖ рдЙрди рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреЗ рд▓рд┐рдП рд╕рд╣рд╕рдВрдмрдВрдз рдХреА рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреА рдЕрд╕рдВрднрд╡рддрд╛ рд╣реИ рдЬрд┐рдирдХреА рдХреЗрд╡рд▓ рдПрдХ рд░реЗрдЯрд┐рдВрдЧ рд╣реИ (рдЪреВрдВрдХрд┐ рднрд╛рдЬрдХ рд╢реВрдиреНрдп рд╣реЛрдЧрд╛)ред
рдЧреБрдгрд╛рдВрдХ рдХреЛ рдЙрди рдорд╛рдорд▓реЛрдВ рдХреЗ рд▓рд┐рдП рднреА рдкрд░рд┐рднрд╛рд╖рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ рдЬрдм рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдореЗрдВ рд╕реЗ рдПрдХ рдиреЗ рд╕рднреА рдлрд┐рд▓реНрдореЛрдВ рдХреЛ рдПрдХ рд╣реА рд░реЗрдЯрд┐рдВрдЧ рджреА рдереАред рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдиреЗ 3 рдлрд┐рд▓реНрдореЗрдВ рджреЗрдЦреАрдВ рдФрд░ рдЙрдиреНрд╣реЗрдВ 5 рдХреА рд░реЗрдЯрд┐рдВрдЧ рджреАред рдлрд┐рд░ рд╕реЗ, рднрд╛рдЬрдХ рд╢реВрдиреНрдп рд╣реИред
рд╕рд╣рд╕рдВрдмрдВрдз рд╡рдЬрди (4.3.3)
рдкрд╣рд▓реА рдЦрд╛рдореА рдХреЛ рдЦрддреНрдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рд╕рд╣рд╕рдВрдмрдВрдз рд╡рдЬрди рдХреА рдЕрд╡рдзрд╛рд░рдгрд╛ рдХреЛ рдкреЗрд╢ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред рдпрджрд┐ рдЧрдгрдирд╛ рдХреЗ рд▓рд┐рдП рдХрдИ рдорд╛рдкрджрдВрдбреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рддреЛ рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╕рд╣рд╕рдВрдмрдВрдз 1 рд╕реЗ рдЧреБрдгрд╛ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдФрд░ рдирдХрд╛рд░рд╛рддреНрдордХ -1 рд╕реЗред рдЗрд╕ рдкреНрд░рдХрд╛рд░ рдпрджрд┐ рдмрдбрд╝реА рд╕рдВрдЦреНрдпрд╛ рдореЗрдВ рд╕рдорд╛рди рдлрд┐рд▓реНрдореЗрдВ рджреЗрдЦреА рдЧрдИрдВ рд▓реЗрдХрд┐рди рд╡рд┐рдкрд░реАрдд рд░реЗрдЯрд┐рдВрдЧ рдирд┐рд░реНрдзрд╛рд░рд┐рдд рдХреА рдЧрдИ, рддреЛ рд╕рд╣рд╕рдВрдмрдВрдз рд╕рдХрд╛рд░рд╛рддреНрдордХ рд╣реЛрдЧрд╛ред
рдпрджрд┐ рдЧреБрдгрд╛рдВрдХ рдХреА рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХреБрдЫ рдорд╛рдкрджрдВрдбреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛, рддреЛ рдЖрдк 1 рд╕реЗ рднреА рдХрдо рд╕рдВрдЦреНрдпрд╛ рд╕реЗ рдЧреБрдгрд╛ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рдЬрд┐рд╕рд╕реЗ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреА рд╕рдорд╛рдирддрд╛ рдХрдо рд╣реЛ рд╕рдХрддреА рд╣реИред
рдпреВрдХреНрд▓рд┐рдбрд┐рдпрди рдореАрдЯреНрд░рд┐рдХ (4.3.4)
рдорд╣рд╛рд╡рдд рдореЗрдВ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди -
рдпреВрдХреНрд▓рд┐рдбрд┐рдпрдирдбрд┐рд╕реНрдЯреЗрдВрд╕рд╕рд┐рдорд┐рд▓рд░рд┐рдЯреА ред
рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреЗ рдмреАрдЪ рдХреА рджреВрд░реА рдХрд╛ рдкрддрд╛ рд▓рдЧрд╛рдирд╛ рд╣реИред рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рд╕рдордиреНрд╡рд┐рдд рдЕрдиреБрдорд╛рдиреЛрдВ рдХреЗ рд╕рд╛рде рдПрдХ рдмрд╣реБрдЖрдпрд╛рдореА рд╕реНрдерд╛рди рдореЗрдВ рдмрд┐рдВрджреБрдУрдВ рдХреЗ рд░реВрдк рдореЗрдВ рдХрд╛рд░реНрдп рдХрд░рддреЗ рд╣реИрдВред рдлрд┐рд▓реНрдо рдХреЗ рд▓рд┐рдП рдХреЗрд╡рд▓ рджреЛрдиреЛрдВ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рджреНрд╡рд╛рд░рд╛ рджреА рдЧрдИ рд░реЗрдЯрд┐рдВрдЧ рдХреЛ рдзреНрдпрд╛рди рдореЗрдВ рд░рдЦрд╛ рдЧрдпрд╛ рд╣реИред

рджреВрд░реА рдЬрд┐рддрдиреА рдХрдо рд╣реЛрдЧреА, рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХрд╛ рд╕реНрд╡рд╛рдж рдЙрддрдирд╛ рд╣реА рдЕрдзрд┐рдХ рд╣реЛрдЧрд╛ред рдЗрд╕рд▓рд┐рдП, Mahout рдиреЗ
K = 1 / (1 + d) рдореЗрдВ рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдореАрдЯреНрд░рд┐рдХред рдкрд┐рдЫрд▓реЗ рдореАрдЯреНрд░рд┐рдХ рдХреЗ рд╡рд┐рдкрд░реАрдд, рдпрд╣ 0 рд╕реЗ 1 рддрдХ рдХрд╛ рдорд╛рди рд▓реЗрддрд╛ рд╣реИред рдмрдбрд╝рд╛ рдЧреБрдгрд╛рдВрдХ, рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреЗ рд╕реНрд╡рд╛рдж рдХреЗ рд╕рдорд╛рдиред
рдЗрд╕ рдореАрдЯреНрд░рд┐рдХ рдХрд╛ рдиреБрдХрд╕рд╛рди рдпрд╣ рд╣реИ рдХрд┐ рдЬреЛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдПрдХ рд╣реА рдореВрд╡реА рдХреЛ рд░реЗрдЯ рдХрд░рддреЗ рд╣реИрдВ (рдХреЛрдИ рдЕрдиреНрдп рд╕рд╛рдорд╛рдиреНрдп рдлрд┐рд▓реНрдореЗрдВ рдирд╣реАрдВ рд╣реИрдВ) рдЙрди рд▓реЛрдЧреЛрдВ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдЕрдзрд┐рдХ рд╕рдорд╛рди рд╣реЛрдВрдЧреА, рдЬрд┐рдиреНрд╣реЛрдВрдиреЗ рд▓рдЧрднрдЧ рдПрдХ рд╣реА рддрд░рд╣ рдХреА рд╕реМ рдлрд┐рд▓реНрдореЛрдВ рдХреЛ рд░реЗрдЯ рдХрд┐рдпрд╛ рд╣реИред
рдХреЛрд╕рд╛рдЗрди рдлреИрдХреНрдЯрд░ (4.3.5)
Mahout рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди -
PearsonCorrelationSimilarity рдХрд╛ рдЙрдкрдпреЛрдЧ
рдХрд░рдХреЗ ред
рдпрд╣ рдмрд┐рдВрджреБ
O (0,0, ...) рдФрд░ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдмрд┐рдВрджреБ
X (x 1 , x 2 , ...) ,
Y (y 1 , y 2 , ...) рджреНрд╡рд╛рд░рд╛ рдмрдирд╛рдИ рдЧрдИ рджреЛ рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХреЗ рдмреАрдЪ рдХреЗ рдХреЛрдг рдХрд╛ рдХреЛрд╕рд╛рдЗрди рд╣реИред
-1 тЙд рдХреЙрд╕ рдП ред
1 ред рдпрджрд┐ рдХреЛрдг
A = 0 (cos A = 1) рд╣реИ , рддреЛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рд╕рдорд╛рди рд╣реИрдВред рдпрджрд┐ рдХреЛрдг
A = 180 (cos A = -1) рд╣реИ , рддреЛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреЗ рд╕реНрд╡рд╛рдж рд╡рд┐рдкрд░реАрдд рд╣реИрдВред рдпрджрд┐ рдХреЛрдг 90 рдбрд┐рдЧреНрд░реА рдХреЗ рдХрд░реАрдм рд╣реИ, рддреЛ рдЗрди рджреЛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреА рд╡рд░реАрдпрддрд╛рдУрдВ рдХреЗ рдмреАрдЪ рдХреЛрдИ рд╕рдВрдмрдВрдз рдирд╣реАрдВ рд╣реИред
рдХреЙрд╢рди рдЧреБрдгрд╛рдВрдХ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЕрдзрд┐рдХ рдЬрд╛рдиреЗрдВредрдЗрд╕ рдореАрдЯреНрд░рд┐рдХ рдХреЗ рд▓рд┐рдП рдорд╣рд╛рдЙрдд рдореЗрдВ рдХреЛрдИ рд╡рд┐рд╢реЗрд╖ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдирд╣реАрдВ рд╣реИ; рдЗрд╕рдХреА рдЧрдгрдирд╛ рдХреЗ рд▓рд┐рдП рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдз рдореАрдЯреНрд░рд┐рдХ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдореИрдиреБрдЕрд▓ рдЧрдгрдирд╛ рдиреАрдЪреЗ рджрд┐рдП рдЧрдП рд╕реВрддреНрд░ рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдХреА рдЬрд╛ рд╕рдХрддреА рд╣реИред рджрд╛рдИрдВ рдУрд░ рд╡реЗрдХреНрдЯрд░ рд╕рдВрдХреЗрддрди рдкрд┐рдпрд░реНрд╕рди рдХреЗ рд╕рд╣рд╕рдВрдмрдВрдз рд╕реЗ рдЕрд▓рдЧ рд╣реИ рдХреЗрд╡рд▓ рд╣рдо рдирд┐рд░реНрджреЗрд╢рд╛рдВрдХ рдХреЛ рдХреЗрдВрджреНрд░ рдореЗрдВ рдирд╣реАрдВ рд░рдЦрддреЗ рд╣реИрдВред

рд╕реНрдкреАрдпрд░рдореИрди рдХрд╛ рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ (4.3.6)
рдорд╣рд╛рд╡рдд рдореЗрдВ рдХреНрд░рд┐рдпрд╛рдиреНрд╡рдпрди -
рд╕реНрдкреАрдпрд░рдореИрди рд╕рд╣рд╕рдВрдмрдВрдзрд╕реНрдорд░рдг ред
рд╕реНрдкреАрдпрд░рдореИрди рдХреЗ рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ рдХреЛ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдЪрд░ рдХреЗ рдмреАрдЪ рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ рдХреЗ рд░реВрдк рдореЗрдВ рдкрд░рд┐рднрд╛рд╖рд┐рдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред рд╕рдмрд╕реЗ рдХрдо рдкрд╕рдВрджреАрджрд╛ рдлрд┐рд▓реНрдо рдХреЛ рд░реЗрдЯ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ 1, рдЕрдЧрд▓реЗ 2, рдЖрджрд┐ред рд╕рднреА рдЕрдиреБрдорд╛рдиреЛрдВ рдХреЛ рд╕реНрдерд╛рдкрд┐рдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж, рдкрд┐рдпрд░реНрд╕рди рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ рдХреА рдЧрдгрдирд╛ рдХреА рдЬрд╛рддреА рд╣реИред
рдЗрд╕ рдореАрдЯреНрд░рд┐рдХ рдХрд╛ рдиреБрдХрд╕рд╛рди рдзреАрдорд╛ рдХрд╛рдо рд╣реИред рдЖрдЦрд┐рд░рдХрд╛рд░, рд╕рд╣рд╕рдВрдмрдВрдз рдЧреБрдгрд╛рдВрдХ рдХреА рдЧрдгрдирд╛ рдХрд░рдиреЗ рд╕реЗ рдкрд╣рд▓реЗ, рдЖрдкрдХреЛ рдПрдХ рд░реИрдВрдХрд┐рдВрдЧ рдЖрдпреЛрдЬрд┐рдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред рдЗрд╕рдХреЗ рдЕрд▓рд╛рд╡рд╛, рдореАрдЯреНрд░рд┐рдХ рдореЗрдВ рдкрд┐рдпрд░реНрд╕рди рдореАрдЯреНрд░рд┐рдХ рдореЗрдВ рджреЛрд╖ рд╣реИрдВред
рддрдирд┐рдореЛрдЯреЛ рдЕрдиреБрдкрд╛рдд (4.3.7)
рдорд╣рддреЛ рдореЗрдВ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди -
рддрдиреАрдореЛрддреЛ рдХрд╛рд░реНрдпрдХреБрд╢рд▓рддрд╛ ред
рдЯреИрдирд┐рдореЛрдЯреЛ рдЧреБрдгрд╛рдВрдХ рдкрд╣рд▓реЗ рдФрд░ рджреВрд╕рд░реЗ рджреЛрдиреЛрдВ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ (рдЪреМрд░рд╛рд╣реЗ) рджреНрд╡рд╛рд░рд╛ рднрд░реЗ рдЧрдП рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛рдУрдВ рдХреА рд╕рдВрдЦреНрдпрд╛ рдХрд╛ рдЕрдиреБрдкрд╛рдд рд╣реИ рдЬреЛ рдкрд╣рд▓реЗ рдФрд░ рджреВрд╕рд░реЗ (рдПрд╕реЛрд╕рд┐рдПрд╢рди) рдХреЗ рд╕рднреА рдЧреБрдгреЛрдВ рдХреА рд╕рдВрдЦреНрдпрд╛:
рдХреЗ = рдЖрдИ / рдпреВред рдпрд╣ рдореАрдЯреНрд░рд┐рдХ рдЙрди рдорд╛рдорд▓реЛрдВ рдореЗрдВ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреА рд╕рд┐рдлрд╛рд░рд┐рд╢ рдХреА рдЬрд╛рддреА рд╣реИ рдЬрд╣рд╛рдВ рд╡рд░реАрдпрддрд╛ рдорд╛рди рдмреВрд▓рд┐рдпрди рд╣реИрдВред
рд▓реЙрдЧ рд╕рдВрднрд╛рд╡рдирд╛ (4.3.8)
рдорд╣реМрдЯ рдореЗрдВ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди -
рд▓реЙрдЬрд┐рдХреЗрд▓рд┐рд╣реБрдбрд╕рд┐рдорд┐рд▓рд░рд┐рдЯреА ред
рдкрд┐рдЫрд▓реЗ рдЧрдгрдирд╛ рдХреЗ рд╡рд┐рдкрд░реАрдд, рдореАрдЯреНрд░рд┐рдХ рдЧрдгрдирд╛ рдПрд▓реНрдЧреЛрд░рд┐рдереНрдо рдкреВрд░реА рддрд░рд╣ рд╕реЗ рд╕рд╣рдЬ рдирд╣реАрдВ рд╣реИред
рдкрд╣рд▓реЗ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдХреЛ
n рдлрд┐рд▓реНрдореЗрдВ рджреЗрдЦрдиреЗ рджреЗрдВ,
рдореА рджреВрд╕рд░рд╛,
p - рджреЛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рдХреБрд▓ (рдПрд╕реЛрд╕рд┐рдПрд╢рди) рджреЗрдЦрддреЗ рд╣реИрдВред

* - рдлрд┐рд▓реНрдо рдХреЛ рдЙрдкрдпреЛрдЧрдХрд░реНрддрд╛ рджреНрд╡рд╛рд░рд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ (рдпрд╛ рдирд╣реАрдВ рджреЗрдЦрд╛ рдЧрдпрд╛)ред 1 рдХреЗ рдмрд░рд╛рдмрд░ рдЕрдЧрд░ рдлрд┐рд▓реНрдо рд░реЗрдЯ рдХреА рдЬрд╛рддреА рд╣реИ, рддреЛ 0 рдХреЗ рдмрд░рд╛рдмрд░ред



LLR = 2 (H (k) - H (rowSums (k)) - H (colSums (k))) рд▓реЙрдЧ рд╕рдВрднрд╛рд╡рдирд╛ рдЧреБрдгрд╛рдВрдХ рд╣реИред
рдЗрд╕ рдПрд▓реНрдЧреЛрд░рд┐рдереНрдо рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЕрдзрд┐рдХ:
рд╕реВрддреНрд░ ,
рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди ред
рдореБрдЭреЗ рдЦреБрд╢реА рд╣реЛрдЧреА рдЕрдЧрд░ рдХреЛрдИ рдХрд╛рдо рдЖрдПрдЧрд╛ред рд╣рдо рдкреАрдПрдо рдореЗрдВ рддреНрд░реБрдЯрд┐рдпреЛрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд▓рд┐рдЦрддреЗ рд╣реИрдВ, рдФрд░ рдЯрд┐рдкреНрдкрдгрд┐рдпреЛрдВ рдореЗрдВ рдЯреНрд░реЛрд▓ рдХрд░рддреЗ рд╣реИрдВред