рд╢реБрдн рджреЛрдкрд╣рд░, рдкреНрд░рд┐рдп Khabrovitesред рдЗрд╕ рдкреЛрд╕реНрдЯ рдореЗрдВ, рд╣рдо
рдПрд╕рд╕реА рдЪреЗрди рдФрд░
рдЬреЙрди рд╢реНрд▓рд┐рдХ рдХреЗ рдмреАрдЪ рдПрдХ рд╕рдВрдпреБрдХреНрдд рдкрд░рд┐рдпреЛрдЬрдирд╛ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдмрд╛рдд рдХрд░реЗрдВрдЧреЗ, рдЬрд┐рд╕реЗ
рдкреАрдПрдЪрдкреА рд╕рд┐рдВрдкрд▓ рдПрдЪрдЯреАрдПрдордПрд▓ рдбреЛрдо рдкрд╛рд░реНрд╕рд░ (
рд╕реЛрд░реНрд╕рдлреЛрд░реНрдо рдХреЗ рд▓рд┐рдВрдХ) рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред
рдкрд░рд┐рдпреЛрдЬрдирд╛ рдХрд╛ рд╡рд┐рдЪрд╛рд░ рдПрдХ рдЙрдкрдХрд░рдг рдмрдирд╛рдирд╛ рд╣реИ рдЬреЛ рдЖрдкрдХреЛ рдЪрдпрдирдХрд░реНрддрд╛рдУрдВ рдХреА рддрд░рд╣ jQuery рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ html рдХреЛрдб рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддрд╛ рд╣реИред
рдЬреЛрд╕ рд╕реЛрд▓реЛрд░рдЬрд╝рд╛рдиреЛ рдХрд╛ рдореВрд▓ рд╡рд┐рдЪрд╛рд░ рдФрд░ php рдЪреМрдереЗ рд╕рдВрд╕реНрдХрд░рдг рдХреЗ рд▓рд┐рдП рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рдЧрдпрд╛ред рдпрд╣ рдкреНрд░реЛрдЬреЗрдХреНрдЯ php5 + рдкрд░ рдЖрдзрд╛рд░рд┐рдд рдПрдХ рдЕрдзрд┐рдХ рдЙрдиреНрдирдд рд╕рдВрд╕реНрдХрд░рдг рд╣реИред
рд╕рдореАрдХреНрд╖рд╛
рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рдореИрдиреБрдЕрд▓ рд╕реЗ рд╕рдВрдХреНрд╖рд┐рдкреНрдд рдЕрдВрд╢ рдкреЗрд╢ рдХрд░реЗрдЧреА, рд╕рд╛рде рд╣реА рдЯреНрд╡рд┐рдЯрд░ рдХреЗ рд▓рд┐рдП рдкрд╛рд░реНрд╕рд░ рдХрд╛ рдПрдХ рдЙрджрд╛рд╣рд░рдг рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рднреА рд╣реЛрдЧрд╛ред рдирд┐рд╖реНрдкрдХреНрд╖рддрд╛ рдореЗрдВ, рдпрд╣ рдзреНрдпрд╛рди рджрд┐рдпрд╛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдП рдХрд┐ рдПрдХ рд╕рдорд╛рди рдкреЛрд╕реНрдЯ
рдкрд╣рд▓реЗ рд╕реЗ
рд╣реА рд╣реИрдмреНрд░реИрдмреНрд░ рдкрд░
рдореМрдЬреВрдж рд╣реИ, рд▓реЗрдХрд┐рди рдореЗрд░реА рд░рд╛рдп рдореЗрдВ, рдмрд╣реБрдд рдХрдо рдЬрд╛рдирдХрд╛рд░реА рд╢рд╛рдорд┐рд▓ рд╣реИред рдЬреЛ рдЗрд╕ рд╡рд┐рд╖рдп рдореЗрдВ рд░реБрдЪрд┐ рд░рдЦрддреЗ рд╣реИрдВ, рдмрд┐рд▓реНрд▓реА рдХрд╛ рд╕реНрд╡рд╛рдЧрдд рдХрд░рддреЗ рд╣реИрдВред
HTML рдкреЗрдЬ рдХреЛрдб рдкреНрд░рд╛рдкреНрдд рдХрд░рдирд╛
$html = file_get_html('http://habrahabr.ru/');
рдХреЙрдорд░реЗрдб
рдлреЗрдбрдХрдВрдк рдиреЗ file_get_contents рдФрд░ 404 рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛рдУрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдПрдХ
рдЙрдкрдпреЛрдЧреА рдЯрд┐рдкреНрдкрдгреА рдХреА ред рдкреГрд╖реНрда 404 рдХреЗ рдЕрдиреБрд░реЛрдз рдкрд░ рдореВрд▓ рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХреБрдЫ рднреА рд╡рд╛рдкрд╕ рдирд╣реАрдВ рдХрд░рддреА рд╣реИред рдЗрд╕реЗ рдареАрдХ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдореИрдВрдиреЗ get_headers рдкрд░ рдПрдХ рдЪреЗрдХ рдЬреЛрдбрд╝рд╛ред рд╕рдВрд╢реЛрдзрд┐рдд рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХреЛ
рдпрд╣рд╛рдВ рд▓реЗ рдЬрд╛рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛
рд╣реИ ред
рдХрд┐рд╕реА рдЖрдЗрдЯрдо рдХреЗ рд▓рд┐рдП рдЯреИрдЧ рдирд╛рдо рд╕реЗ рдЦреЛрдЬреЗрдВ
foreach($html->find('img') as $element) {
HTML рддрддреНрд╡реЛрдВ рдХрд╛ рд╕рдВрд╢реЛрдзрди
$html = str_get_html('<div id="hello">Hello</div><div id="world">World</div>'); // html (file_get_html() - ) $html->find('div', 1)->class = 'bar'; // div 1 "bar" $html->find('div[id=hello]', 0)->innertext = 'foo'; // div id="hello" foo echo $html; // <div id="hello">foo</div><div id="world" class="bar">World</div>
рдХрд┐рд╕реА рддрддреНрд╡ (рдЯреЗрдХреНрд╕реНрдЯрдЯреЗрдХреНрд╕реНрдЯ) рдХреА рдкрд╛рдареНрдп рд╕рд╛рдордЧреНрд░реА рдкреНрд░рд╛рдкреНрдд рдХрд░рдирд╛
echo file_get_html('http://habrahabr.ru/')->plaintext;
рд▓реЗрдЦ рдХрд╛ рдЙрджреНрджреЗрд╢реНрдп рдЗрд╕ рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдкрд░ рд╡реНрдпрд╛рдкрдХ рдкреНрд░рд▓реЗрдЦрди рдкреНрд░рджрд╛рди рдХрд░рдирд╛ рдирд╣реАрдВ рд╣реИ,
рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рдореИрдиреБрдЕрд▓ рдореЗрдВ рдЖрдк рдкрд╛ рд╕рдХрддреЗ рд╣реИрдВ рд╕рднреА рд╕реБрд╡рд┐рдзрд╛рдУрдВ рдХрд╛ рдПрдХ рд╡рд┐рд╕реНрддреГрдд рд╡рд┐рд╡рд░рдг, рдпрджрд┐ рд╕рдореБрджрд╛рдп рдХреА рдЗрдЪреНрдЫрд╛ рд╣реИ, рддреЛ рдореИрдВ рдЦрд╝реБрд╢реА рд╕реЗ рдкреВрд░реЗ рдореИрдиреБрдЕрд▓ рдХреЛ рд░реВрд╕реА рдореЗрдВ рдЕрдиреБрд╡рд╛рдж рдХрд░реВрдВрдЧрд╛, рдЕрдм рдореИрдВ рд▓реЗрдЦ рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ рд╡рд╛рджрд╛ рдХрд┐рдП рдЧрдП рдЯреНрд╡рд┐рдЯрд░ рдХреЗ рд▓рд┐рдП рдЙрджрд╛рд╣рд░рдг рдкрд╛рд░реНрд╕рд░ рджреВрдВрдЧрд╛ред
рдЙрджрд╛рд╣рд░рдг рдЯреНрд╡рд┐рдЯрд░ рд╕реЗ рд╕рдВрджреЗрд╢реЛрдВ рдХреЗ рдкрд╛рд░реНрд╕рд░
require_once 'simple_html_dom.php';
рд╕рдВрджреЗрд╢ рдЖрдЙрдЯрдкреБрдЯ
for ($j = 0; $j < $maxpost; $j++) { echo '<div class="twitter_message">'; echo '<p class="twitter_text">' . $articles[$j]['text'] . '</p>'; echo '<p class="twitter_time">' . $articles[$j]['time'] . '</p>'; echo '</div>'; }
рдЖрдкрдХрд╛ рдзреНрдпрд╛рди рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред рдореБрдЭреЗ рдЙрдореНрдореАрдж рд╣реИ рдХрд┐ рдпрд╣ рдзрд╛рд░рдгрд╛ рдХреЗ рд▓рд┐рдП рдмрд╣реБрдд рдХрдард┐рди рдФрд░ рдЖрд╕рд╛рди рдХрд╛рдо рдирд╣реАрдВ рдХрд░реЗрдЧрд╛ред
рдЗрд╕реА рддрд░рд╣ рдХреЗ рдкреБрд╕реНрддрдХрд╛рд▓рдп
htmlSQL - рдзрдиреНрдпрд╡рд╛рдж
рдЪреЗрд╕рдиреЛрд╡рд┐рдЪZend_Dom_Query - рдзрдиреНрдпрд╡рд╛рдж
рдорд╣рд┐рдорд╛phpQuery - рдзрдиреНрдпрд╡рд╛рдж
рд░реИрд╡рд▓QueryPath - рдзрдиреНрдпрд╡рд╛рдж
ZonD80рдбреЛрдо рдХреНрд░реЙрд▓рд░ (рд╕рд┐рдореНрдлрдиреА) - рдзрдиреНрдпрд╡рд╛рдж
рдЪрдпрдирдХрд░реНрддрд╛рд╕реАрдбреАрдо - рд▓реЗрдЦрдХ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж
рдХреБрдЦреНрдпрд╛рдд XPath -
KAndy рдпрд╛рдж рджрд┐рд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж
рдкреБрдирд╢реНрдЪ
рдЧреНрд░реВрд╡ рд╣рдмреНрд░реЛрдЬрд╝рд┐рдЯреЗрд▓ рдиреЗ рд╕рдВрдХреЗрдд рджрд┐рдпрд╛ рдХрд┐
рд╕рдорд╛рди рд╕рд╛рдордЧреНрд░реА рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рдереАрдкреА рдкреА рдПрд╕
рдЕрдкрдиреЗ рдЦрд╛рд▓реА рд╕рдордп рдореЗрдВ рдореИрдВ рд╕рднреА рдкреБрд╕реНрддрдХрд╛рд▓рдпреЛрдВ рдХреЛ рдЗрдХрдЯреНрдард╛ рдХрд░рдиреЗ рдФрд░ рдЙрдкрдпреЛрдЧ рдХреЗ рдкреНрд░рджрд░реНрд╢рди рдФрд░ рд╕реБрдЦрджрддрд╛ рдкрд░ рд╕рд╛рд░рд╛рдВрд╢ рдбреЗрдЯрд╛ рд╕рдВрдХрд▓рд┐рдд рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реВрдВрдЧрд╛ред