<?xml version="1.0" encoding="UTF-8" ?>
<rss version="2.0">
<channel>
<title><![CDATA[向东博客 专注WEB应用 构架之美 --- 构架之美，在于尽态极妍 | 应用之美，在于药到病除]]></title> 
<link>http://jackxiang.com/index.php</link> 
<description><![CDATA[赢在IT，Playin' with IT,Focus on Killer Application,Marketing Meets Technology.]]></description> 
<language>zh-cn</language> 
<copyright><![CDATA[向东博客 专注WEB应用 构架之美 --- 构架之美，在于尽态极妍 | 应用之美，在于药到病除]]></copyright>
<item>
<link>http://jackxiang.com/post//</link>
<title><![CDATA[超好的HTML解析工具PHP Simple HTML DOM Parser 中文]]></title> 
<author>jack &lt;xdy108@126.com&gt;</author>
<category><![CDATA[Php/Js/Shell/Go]]></category>
<pubDate>Tue, 26 Feb 2013 03:06:56 +0000</pubDate> 
<guid>http://jackxiang.com/post//</guid> 
<description>
<![CDATA[ 
	超好的HTML解析工具PHP Simple HTML DOM Parser 中文手册<br/>&nbsp;&nbsp;采用PHP5+开发的一个简单的PHP HTML DOM分析，支持invalid HTML并提供非常简单的方式来操作HTML元素。在HMTL页面上查找标签所使用的语法与jQuery（一个轻量级，实用的javascript框架）相似。从页面中抽取内容只需要一行代码。<br/>手册地址：http://www.kg-led.com/phpgrid/simplehtml/<br/>====================================================<br/>請參考 http://simplehtmldom.sourceforge.net/<br/>php Simple HTML DOM Parser 強力解析html 工具<br/><br/>include(&#039;../simple_html_dom.php&#039;);<br/>// Create DOM from URL or file<br/>$dom = file_get_dom(&#039;http://www.torrentz.com/movies&#039;);<br/>// Find all<br/>foreach($dom-&gt;find(&#039;img&#039;) as $element)<br/>echo $element-&gt;src . &quot;&#92;n&quot;;<br/>foreach($dom-&gt;find(&#039;a&#039;) as $element)<br/>echo $element-&gt;href . &quot; &quot;.$element-&gt;innertext.&quot;&#92;n&quot;; //網址及結連名稱<br/>運用curl主站目前已可抓文抓圖<br/>//curl 範列<br/>$ch = curl_init (&quot;http://static.php.net/www.php.net/images/php.gif&quot;);<br/>curl_setopt($ch, CURLOPT_HEADER, 0);<br/>curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);<br/>curl_setopt($ch, CURLOPT_BINARYTRANSFER,1);<br/>$rawdata=curl_exec ($ch);<br/>curl_close ($ch);<br/>$fp = fopen(&quot;php.gif&quot;,&#039;w&#039;);<br/>fwrite($fp, $rawdata);<br/>fclose($fp);<br/>===========================================================<br/>me578022 簡單分析HTML - PHP Simple HTML DOM Parser<br/><br/>網址： http://sourceforge.net/projects/simplehtmldom/<br/>因為使用PHP內建的DOM物件分析HTML實在太痛苦了,<br/>我自己寫了一個放到Sourceforge上, 希望大家能提供一些開發的建議.<br/>特色:<br/>1. 只支援PHP5以上<br/>2. 可以分析不嚴謹(invalid)的HTML.<br/>3. 支援簡單的CSS Selector.<br/>4. 簡單的DOM操作<br/>5. 會維持HTML中的原始格式.<br/>範例:<br/>&lt;?<br/>// 示範如何讀取HTML元素<br/>include(&#039;html_dom_parser.php&#039;);<br/>// 產生DOM物件<br/>$dom = file_get_dom(&#039;http://www.google.com/&#039;);<br/>// 找出所有網頁連結<br/>$result = $dom-&gt;find(&#039;a&#039;);<br/>foreach($result as $v) &#123;echo $v-&gt;href . &#039;&lt;br&gt;&#039;;&#125;<br/>// 找出所有網頁圖片<br/>$result = $dom-&gt;find(&#039;img&#039;);<br/>foreach($result as $v) &#123;echo $v-&gt;src . &#039;&lt;br&gt;&#039;;&#125;<br/>// 找出所有網頁中所有id=gbar的div標籤<br/>$result = $dom-&gt;find(&#039;div#gbar&#039;);<br/>foreach($result as $v) &#123;echo $v-&gt;innertext . &#039;&lt;br&gt;&#039;;&#125;<br/>// 找出所有網頁中所有calss=gb1的span 標籤<br/>$result = $dom-&gt;find(&#039;span.gb1&#039;);<br/>foreach($result as $v) &#123;echo $v-&gt;outertext . &#039;&lt;br&gt;&#039;;&#125;<br/>// 找出所有網頁中所有align=center的&#039;td標籤<br/>$result = $dom-&gt;find(&#039;td[align=center]&#039;);<br/>foreach($result as $v) &#123;echo $v-&gt;outertext . &#039;&lt;br&gt;&#039;;&#125;<br/>?&gt;<br/>&lt;?<br/>// 示範如何修改HTML元素<br/>include(&#039;html_dom_parser.php&#039;);<br/>// 產生DOM物件<br/>$dom = file_get_dom(&#039;http://www.google.com/&#039;);<br/>// 移除網頁中所有圖片<br/>$ret = $dom-&gt;find(&#039;img&#039;);<br/>foreach($ret as $v) &#123;$v-&gt;outertext = &#039;&#039;;&#125;<br/>// 修改網頁中所有input標籤<br/>$ret = $dom-&gt;find(&#039;input&#039;);<br/>foreach($ret as $v) &#123;$v-&gt;outertext = &#039;[INPUT]&#039;;&#125;<br/>// 顯示修改後的網頁<br/>echo $dom-&gt;save();<br/>?&gt;<br/>来自：http://blog.sina.com.cn/s/blog_5fd841bf0100dqk2.html
]]>
</description>
</item><item>
<link>http://jackxiang.com/post//#blogcomment</link>
<title><![CDATA[[评论] 超好的HTML解析工具PHP Simple HTML DOM Parser 中文]]></title> 
<author> &lt;user@domain.com&gt;</author>
<category><![CDATA[评论]]></category>
<pubDate>Thu, 01 Jan 1970 00:00:00 +0000</pubDate> 
<guid>http://jackxiang.com/post//#blogcomment</guid> 
<description>
<![CDATA[ 
	
]]>
</description>
</item>
</channel>
</rss>