2008年1月5日星期六

使用Xenu制作XML格式Sitemap文件

前阵写了一篇“SEO工具使用感想”,文中提到用Xenu可以方便的生成强大的XML格式Sitemap文件,很多SEO在QQ或MSN中问我如何生成,今天樂思蜀给大家分享一下。

Xenu本身是网站链接检查工具,其速度比很多软件都要快;而且包含的文件列表很全。Xenu检查完毕后,会生成一个详细的报告,我们利用这个报告,适当的查找替换一下,就是一个Sitemap文件了。

第一步 使用Xenu检查网站链接

使用方法相信大家都比较熟悉,只有简单的选项。如果没有Xenu的点这里下载:Xenu 1.2d 下载

第二步 截取生成报告的需要内容

查看源文件,找到“List of valid URLs you can submit to a search engine”这一部分,将<pre>到</pre>之间的内容复制到文本编辑器,删除<pre>和之前的内容,及尾部无用的代码,保存为html文件,备用。

第三步 XML文件格式

0.84标准的XML格式Sitemap文件标准格式:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">


<url>
 <loc>http://www.example.com/abc.html</loc>
</url>


</urlset>

蓝色部分为文件的头和尾,红色部分为网址的列表语法,绿色部分为URL地址。

第四步 分析刚才保存的html文件

刚才保存的html文件中,每一个URL的格式都是这样的:

 <a href=http://www.lesishu.com/ TARGET="Xenu">http://www.lesishu.com/</a>

我们来看一下与XML格式的对应关系:

<url>
<loc>
http://www.example.com/1.html</loc>
</url>


如上所示,只要将HTML文件中的红色部分替换为XML的红色部分蓝色部分替换为XML的蓝色部分,即是XML格式了。但HTML格式中加粗部分,为变化内容。

第五步 批量替换

我们可以借助专业的文本替换工具(下载:批量文本替换工具),或使用专业编辑器(如Editplus等)的正则替换,将上面所述进行批量替换。

第六步 加上XML的头和尾

将替换后的HTML文件,头部加上XML的头:
<?xml version="1.0" encoding="UTF-8"?>
<urlset xmlns="http://www.google.com/schemas/sitemap/0.84">

尾部加上XML的尾:
</urlset>

第六步 保存

另存为XML文件即可。

这样是不是很方便呢?检查完网站链接后,顺便就生成了完整的XML地图文件。还可以生成urllist.txt、urlist.html文件(某些搜索引擎可能会用到),一举多得。

3 条评论:

肖虎亭 说...

王大哥,向你学习了~

dance 说...

多谢!正好在找Xenu

华晨 说...

写的真好,不过少了一点。就是必须保存为utf-8的格式。