完美解决百度不收录织梦标签页问题
yipin.cn堪称史上最完美的DEDE文章系统改造典范,是本人平生最得意之作之一,用织梦程序做网站的的人想解决和完善的,还有遇到的难题,在这里基本都解决了。就是说你想要的,绞尽脑汁想办法,猪八戒上悬赏的,论坛上到处裸体跪求的的难题,在yipin.cn都有解决。这其中有些是网上找到的,找不到的都是自己试验出来。不过代码改的东西太多时间久了也记不清楚,要遇到升级就没招了,今天开始都在这里做个记录。
很早注意到百度从来不收录站里的TAG标签页,除了TAG列表一页都不收,首先想到是静态化,给TAG做了伪静态,但过了两天百度还是没收录,在网上查了一下发现其他程序的网站各种文件名都有收录,只有用织梦的一页不收,并且迄今无人解决。
猜测机器人是从文件名里的中文代码判别DEDE的标签,改了代码后文件名变为123.html,但还是不收录。
我从来没象那些做SEO的人,把搜索引擎看的和神一样,整天揣摩机器人喜欢什么,我是不是惹机器人不高兴啦之类的问题。机器人不可能识别123.html这样命名的文章是否伪静态,只能通过它抓取到的东西判断,首先可以从源码里识别文章系统,然后和静态列表区别的只有tags这个文件夹名了,我猜想它可能是通过DEDE_的字符和TAGS这些特征判断的,于是又修改了指向的”tags”这个文件夹名。
晚上修改好的代码,半夜临睡前查询,大功告成,标签页已经被百度收录了十几页,这些页面可是几年没有收录的。
tag.lib.php里修改
$row['link'] = $cfg_cmsurl.”/You name/”.urlencode($row['id']).”.html”;
原来的($row[‘keyword’]),表示关键词,生出的别名是很长的中文代码,改为”ID”就是数字
httpd.ini 添加:
RewriteRule ^(.*)/You name/ $1/You name/tags\.php
RewriteRule ^(.*)/You name/(.*).html $1/You name/tags\.php\?$2