PHP HTML рдбреЛрдо рдкрд╛рд░реНрд╕рд░ рдЪрдпрдирдХрд░реНрддрд╛рдУрдВ рдХреА рддрд░рд╣ jQuery рдХреЗ рд╕рд╛рде

рд╢реБрдн рджреЛрдкрд╣рд░, рдкреНрд░рд┐рдп Khabrovitesред рдЗрд╕ рдкреЛрд╕реНрдЯ рдореЗрдВ, рд╣рдо рдПрд╕рд╕реА рдЪреЗрди рдФрд░ рдЬреЙрди рд╢реНрд▓рд┐рдХ рдХреЗ рдмреАрдЪ рдПрдХ рд╕рдВрдпреБрдХреНрдд рдкрд░рд┐рдпреЛрдЬрдирд╛ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдмрд╛рдд рдХрд░реЗрдВрдЧреЗ, рдЬрд┐рд╕реЗ рдкреАрдПрдЪрдкреА рд╕рд┐рдВрдкрд▓ рдПрдЪрдЯреАрдПрдордПрд▓ рдбреЛрдо рдкрд╛рд░реНрд╕рд░ ( рд╕реЛрд░реНрд╕рдлреЛрд░реНрдо рдХреЗ рд▓рд┐рдВрдХ) рдХрд╣рд╛ рдЬрд╛рддрд╛ рд╣реИред

рдкрд░рд┐рдпреЛрдЬрдирд╛ рдХрд╛ рд╡рд┐рдЪрд╛рд░ рдПрдХ рдЙрдкрдХрд░рдг рдмрдирд╛рдирд╛ рд╣реИ рдЬреЛ рдЖрдкрдХреЛ рдЪрдпрдирдХрд░реНрддрд╛рдУрдВ рдХреА рддрд░рд╣ jQuery рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ html рдХреЛрдб рдХреЗ рд╕рд╛рде рдХрд╛рдо рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддрд╛ рд╣реИред рдЬреЛрд╕ рд╕реЛрд▓реЛрд░рдЬрд╝рд╛рдиреЛ рдХрд╛ рдореВрд▓ рд╡рд┐рдЪрд╛рд░ рдФрд░ php рдЪреМрдереЗ рд╕рдВрд╕реНрдХрд░рдг рдХреЗ рд▓рд┐рдП рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рдЧрдпрд╛ред рдпрд╣ рдкреНрд░реЛрдЬреЗрдХреНрдЯ php5 + рдкрд░ рдЖрдзрд╛рд░рд┐рдд рдПрдХ рдЕрдзрд┐рдХ рдЙрдиреНрдирдд рд╕рдВрд╕реНрдХрд░рдг рд╣реИред

рд╕рдореАрдХреНрд╖рд╛ рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рдореИрдиреБрдЕрд▓ рд╕реЗ рд╕рдВрдХреНрд╖рд┐рдкреНрдд рдЕрдВрд╢ рдкреЗрд╢ рдХрд░реЗрдЧреА, рд╕рд╛рде рд╣реА рдЯреНрд╡рд┐рдЯрд░ рдХреЗ рд▓рд┐рдП рдкрд╛рд░реНрд╕рд░ рдХрд╛ рдПрдХ рдЙрджрд╛рд╣рд░рдг рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рднреА рд╣реЛрдЧрд╛ред рдирд┐рд╖реНрдкрдХреНрд╖рддрд╛ рдореЗрдВ, рдпрд╣ рдзреНрдпрд╛рди рджрд┐рдпрд╛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдП рдХрд┐ рдПрдХ рд╕рдорд╛рди рдкреЛрд╕реНрдЯ рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рд╣реИрдмреНрд░реИрдмреНрд░ рдкрд░ рдореМрдЬреВрдж рд╣реИ, рд▓реЗрдХрд┐рди рдореЗрд░реА рд░рд╛рдп рдореЗрдВ, рдмрд╣реБрдд рдХрдо рдЬрд╛рдирдХрд╛рд░реА рд╢рд╛рдорд┐рд▓ рд╣реИред рдЬреЛ рдЗрд╕ рд╡рд┐рд╖рдп рдореЗрдВ рд░реБрдЪрд┐ рд░рдЦрддреЗ рд╣реИрдВ, рдмрд┐рд▓реНрд▓реА рдХрд╛ рд╕реНрд╡рд╛рдЧрдд рдХрд░рддреЗ рд╣реИрдВред

HTML рдкреЗрдЬ рдХреЛрдб рдкреНрд░рд╛рдкреНрдд рдХрд░рдирд╛

$html = file_get_html('http://habrahabr.ru/'); //   https:// 

рдХреЙрдорд░реЗрдб рдлреЗрдбрдХрдВрдк рдиреЗ file_get_contents рдФрд░ 404 рдкреНрд░рддрд┐рдХреНрд░рд┐рдпрд╛рдУрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдПрдХ рдЙрдкрдпреЛрдЧреА рдЯрд┐рдкреНрдкрдгреА рдХреА ред рдкреГрд╖реНрда 404 рдХреЗ рдЕрдиреБрд░реЛрдз рдкрд░ рдореВрд▓ рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХреБрдЫ рднреА рд╡рд╛рдкрд╕ рдирд╣реАрдВ рдХрд░рддреА рд╣реИред рдЗрд╕реЗ рдареАрдХ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдореИрдВрдиреЗ get_headers рдкрд░ рдПрдХ рдЪреЗрдХ рдЬреЛрдбрд╝рд╛ред рд╕рдВрд╢реЛрдзрд┐рдд рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдХреЛ рдпрд╣рд╛рдВ рд▓реЗ рдЬрд╛рдпрд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИ ред
рдХрд┐рд╕реА рдЖрдЗрдЯрдо рдХреЗ рд▓рд┐рдП рдЯреИрдЧ рдирд╛рдо рд╕реЗ рдЦреЛрдЬреЗрдВ

 foreach($html->find('img') as $element) { //   img   echo $element->src . '<br>'; //       src } 

HTML рддрддреНрд╡реЛрдВ рдХрд╛ рд╕рдВрд╢реЛрдзрди

 $html = str_get_html('<div id="hello">Hello</div><div id="world">World</div>'); //  html    (file_get_html() -  ) $html->find('div', 1)->class = 'bar'; //   div    1  "bar" $html->find('div[id=hello]', 0)->innertext = 'foo'; //    div  id="hello"  foo echo $html; //  <div id="hello">foo</div><div id="world" class="bar">World</div> 

рдХрд┐рд╕реА рддрддреНрд╡ (рдЯреЗрдХреНрд╕реНрдЯрдЯреЗрдХреНрд╕реНрдЯ) рдХреА рдкрд╛рдареНрдп рд╕рд╛рдордЧреНрд░реА рдкреНрд░рд╛рдкреНрдд рдХрд░рдирд╛

 echo file_get_html('http://habrahabr.ru/')->plaintext; 


рд▓реЗрдЦ рдХрд╛ рдЙрджреНрджреЗрд╢реНрдп рдЗрд╕ рд╕реНрдХреНрд░рд┐рдкреНрдЯ рдкрд░ рд╡реНрдпрд╛рдкрдХ рдкреНрд░рд▓реЗрдЦрди рдкреНрд░рджрд╛рди рдХрд░рдирд╛ рдирд╣реАрдВ рд╣реИ, рдЖрдзрд┐рдХрд╛рд░рд┐рдХ рдореИрдиреБрдЕрд▓ рдореЗрдВ рдЖрдк рдкрд╛ рд╕рдХрддреЗ рд╣реИрдВ рд╕рднреА рд╕реБрд╡рд┐рдзрд╛рдУрдВ рдХрд╛ рдПрдХ рд╡рд┐рд╕реНрддреГрдд рд╡рд┐рд╡рд░рдг, рдпрджрд┐ рд╕рдореБрджрд╛рдп рдХреА рдЗрдЪреНрдЫрд╛ рд╣реИ, рддреЛ рдореИрдВ рдЦрд╝реБрд╢реА рд╕реЗ рдкреВрд░реЗ рдореИрдиреБрдЕрд▓ рдХреЛ рд░реВрд╕реА рдореЗрдВ рдЕрдиреБрд╡рд╛рдж рдХрд░реВрдВрдЧрд╛, рдЕрдм рдореИрдВ рд▓реЗрдЦ рдХреА рд╢реБрд░реБрдЖрдд рдореЗрдВ рд╡рд╛рджрд╛ рдХрд┐рдП рдЧрдП рдЯреНрд╡рд┐рдЯрд░ рдХреЗ рд▓рд┐рдП рдЙрджрд╛рд╣рд░рдг рдкрд╛рд░реНрд╕рд░ рджреВрдВрдЧрд╛ред

рдЙрджрд╛рд╣рд░рдг рдЯреНрд╡рд┐рдЯрд░ рд╕реЗ рд╕рдВрджреЗрд╢реЛрдВ рдХреЗ рдкрд╛рд░реНрд╕рд░

 require_once 'simple_html_dom.php'; //    $username = 'habrahabr'; //   twitter $maxpost = '5'; // -  $html = file_get_html('https://twitter.com/' . $username); $i = '0'; foreach ($html->find('li.expanding-stream-item') as $article) { //  li  $item['text'] = $article->find('p.js-tweet-text', 0)->innertext; //     html  $item['time'] = $article->find('small.time', 0)->innertext; //    html  $articles[] = $item; //    $i++; if ($i == $maxpost) break; //   } 


рд╕рдВрджреЗрд╢ рдЖрдЙрдЯрдкреБрдЯ

  for ($j = 0; $j < $maxpost; $j++) { echo '<div class="twitter_message">'; echo '<p class="twitter_text">' . $articles[$j]['text'] . '</p>'; echo '<p class="twitter_time">' . $articles[$j]['time'] . '</p>'; echo '</div>'; } 


рдЖрдкрдХрд╛ рдзреНрдпрд╛рди рджреЗрдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред рдореБрдЭреЗ рдЙрдореНрдореАрдж рд╣реИ рдХрд┐ рдпрд╣ рдзрд╛рд░рдгрд╛ рдХреЗ рд▓рд┐рдП рдмрд╣реБрдд рдХрдард┐рди рдФрд░ рдЖрд╕рд╛рди рдХрд╛рдо рдирд╣реАрдВ рдХрд░реЗрдЧрд╛ред

рдЗрд╕реА рддрд░рд╣ рдХреЗ рдкреБрд╕реНрддрдХрд╛рд▓рдп

htmlSQL - рдзрдиреНрдпрд╡рд╛рдж рдЪреЗрд╕рдиреЛрд╡рд┐рдЪ
Zend_Dom_Query - рдзрдиреНрдпрд╡рд╛рдж рдорд╣рд┐рдорд╛
phpQuery - рдзрдиреНрдпрд╡рд╛рдж рд░реИрд╡рд▓
QueryPath - рдзрдиреНрдпрд╡рд╛рдж ZonD80
рдбреЛрдо рдХреНрд░реЙрд▓рд░ (рд╕рд┐рдореНрдлрдиреА) - рдзрдиреНрдпрд╡рд╛рдж рдЪрдпрдирдХрд░реНрддрд╛
рд╕реАрдбреАрдо - рд▓реЗрдЦрдХ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж
рдХреБрдЦреНрдпрд╛рдд XPath - KAndy рдпрд╛рдж рджрд┐рд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж

рдкреБрдирд╢реНрдЪ
рдЧреНрд░реВрд╡ рд╣рдмреНрд░реЛрдЬрд╝рд┐рдЯреЗрд▓ рдиреЗ рд╕рдВрдХреЗрдд рджрд┐рдпрд╛ рдХрд┐ рд╕рдорд╛рди рд╕рд╛рдордЧреНрд░реА рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рдереА
рдкреА рдкреА рдПрд╕
рдЕрдкрдиреЗ рдЦрд╛рд▓реА рд╕рдордп рдореЗрдВ рдореИрдВ рд╕рднреА рдкреБрд╕реНрддрдХрд╛рд▓рдпреЛрдВ рдХреЛ рдЗрдХрдЯреНрдард╛ рдХрд░рдиреЗ рдФрд░ рдЙрдкрдпреЛрдЧ рдХреЗ рдкреНрд░рджрд░реНрд╢рди рдФрд░ рд╕реБрдЦрджрддрд╛ рдкрд░ рд╕рд╛рд░рд╛рдВрд╢ рдбреЗрдЯрд╛ рд╕рдВрдХрд▓рд┐рдд рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реВрдВрдЧрд╛ред

Source: https://habr.com/ru/post/In176635/


All Articles