PHP版HTML解析工具PHP Simple HTML DOM Parser

源地址:https://sourceforge.net/projects/simplehtmldom/

网盘下载:http://share.menglei.net/f/16922972-484284080-a3ac7a(访问密码:806459)

版本1.9.1

采用PHP5+开发的一个简单的PHP HTML DOM分析,支持invalid HTML并提供非常简单的方式来操作HTML元素。在HMTL页面上查找标签所使用的语法与 jQuery(一个轻量级,实用的javascript框架)相似。从页面中抽取内容只需要一行代码。

使用

require('simple_html_dom.php');

function get_weixin_content($url){
  $dom = file_get_html($url);
  if(!$dom){
      return false;
  }
  $title = $dom->find("h2[id=activity-name]", 0)->outertext;
  $data['title'] = $title;
  $content = $dom->find("div[id=js_content]", 0)->outertext;
  $content = str_replace("data-src", "src", $content);
  $content = str_replace("style=\"visibility: hidden;\">", ">", $content);
  $data['content'] = saveimages($content);
  return $data;
}

其中saveimages为远程图片本地化函数

使用以上代码可以实现微信公众号文章采集.