源地址:https://sourceforge.net/projects/simplehtmldom/
网盘下载:http://share.menglei.net/f/16922972-484284080-a3ac7a(访问密码:806459)
版本1.9.1
采用PHP5+开发的一个简单的PHP HTML DOM分析,支持invalid HTML并提供非常简单的方式来操作HTML元素。在HMTL页面上查找标签所使用的语法与 jQuery(一个轻量级,实用的javascript框架)相似。从页面中抽取内容只需要一行代码。
使用
require('simple_html_dom.php');
function get_weixin_content($url){
$dom = file_get_html($url);
if(!$dom){
return false;
}
$title = $dom->find("h2[id=activity-name]", 0)->outertext;
$data['title'] = $title;
$content = $dom->find("div[id=js_content]", 0)->outertext;
$content = str_replace("data-src", "src", $content);
$content = str_replace("style=\"visibility: hidden;\">", ">", $content);
$data['content'] = saveimages($content);
return $data;
}
其中saveimages为远程图片本地化函数
使用以上代码可以实现微信公众号文章采集.