使用magpierss解析Rss,Rss采集,支持解析属性
那天在中国站长站看到一个可以根据输入的关键词自动采集YouTubo相关视频的整站程序,下载下来仔细研究了一下,原来他是用的magpierss解析Rss的功能,把Youtubo的视频搜索结果采集到网站上显示,整个站点只需要第一次设置一下站点目录和关键词就可以完全不用管了,随时更新,完全就是YouTubo的视频内容
可是毕竟YouTubo是个国外站点,速度上不说,主要是内容大部分都是英文的,不适应国内的情况,而且不知道怎么回事,他的站点功能上还有点欠缺,分页的时候容易出错
于是我就根据这个修改了一个可以采集国内视频站点的工具
具体的工具就不发布了,主要说碰到的问题和解决方法
先说magpierss的使用:
下载magpierss-0.72.zip,里面有个index.php文件做了基本演示,其实就是引用magpierss然后循环得到值即可
$url='http://ai-2.cn/feed/'; require('rss_fetch.inc'); $rss = fetch_rss($url)
foreach ($rss->items as $item) { $title=$item['title']; }
有些rss中的元素是带属性的,比如
<enclosure url="http://www.leipzig48.com/compositions/ghost/tistime.mp3" length="2663591" type="audio/mpeg"></enclosure>这里引用schillerlabs.net的解决方法,修改rss_parse.inc文件 然后这样获取
echo $arrItem[’enclosure’][0][’url’]; echo $arrItem[’enclosure’][0][’length’]; echo $arrItem[’enclosure’][0][’type’];
本站的下载包里已经包含了此更改
You can follow any responses to this entry through the RSS 2.0 feed.
You can leave a response, or trackback from your own site.
2 Responses
2009/02/28
关于magpierss解析rss页面显示乱码的问题,因为magpierss默认的编码是ISO-8859-1,而我们用的一般是UTF-8的编码,所以,本站的下载包中已经更改默认编码为UTF-8
如果要该回,请修改rss_fetch.inc文件的358行,将UTF-8改为ISO-8859-1



好多视频站就没有提供RSS