建站经验 experience
当前位置:首页 > 网站建设专题 > 建站经验
经验分享:根据关键词自动聚合数据的科讯CMS插件开发
发布日期:2011-01-17 阅读次数:1421 字体大小:

  分享科讯文章、图片、动漫、视频、问答根据关键词自动聚合数据的CMS插件制作经验分享。

  爱聚合很多站长朋友都是比较熟悉,火车头很多站长朋友也很熟悉,当然是用科讯的CMS的朋友更加熟悉科讯的采集系统了。对于科讯的后台来说,我们不可否认非常强大,但是欠缺一个功能--问答的采集(这个功能之针对启用问答系统的用户来说有用)。建站前期,我们往往会采集一些数据,然后我们再去手工增加数据,伪原创数据。很多站长因为前期看不到站有流量所以没有时间的时候就放弃了每天更新的工作,所以百度爬虫或者其他的搜索引擎爬虫来了也吃不到新的数据,于是很多朋友都在思考我们能不能去执行自动采集或者自动聚合。

  很多朋友都说我们不管通过任何形式都要对内容执行一个伪原创或者原创才会对网站的权重或者关键词的排名才会有帮助,没有错,这个问题我开始也在思考,到底是对标题进行关键词或者字眼的程序自动更改才能达到预期的效果, 还是通过其他形式改变达到效果。后来我通过e.baidu.com以及zhishu.baidu.com(index.baidu.com)查询总结的结果是:其实百度指数就是对人们在网络中寻找自己想要的信息的一个搜索习惯的总结,当然也是用户体验的一个大概总结和归纳。那么我们在标题前面加上一个与内容息息相关的指数是不是算是对标题的伪原创呢?对网站内容到底有没有什么帮助呢?答案是肯定的。

  于是启发了我开发基于科讯CMS文章、图片、动漫、视频、问答根据关键词自动聚合插件的兴趣,也算是一个尝试吧,每天下班回家就开发这个插件,足足辛苦了一个礼拜,网站终于可以上线测试了,网站从开始上线到今天流量在明显的上升(见统计图),于是我写这么一篇文章和科讯的网友一起来分享了。

  

按此在新窗口浏览图片

 

  统计图(2011-01-16 9:23的截图)

  闲话不说,下面介绍一下这个聚合插件的思路:

  l 全站只需要针对每个栏目以及对应的问题添加一个指数关键词

  l 指数词会在事件(人工访问,搜索引擎爬虫的访问)触发下自动执行数据(文章、图片、动漫、视频、问答)聚合,数据的聚合过程属于分布式进行,所以不会拖延网站的速度。

  l 当这个指数词聚合完毕之后,程序就会自动根据指数词聚合相关热度的指数关键词,然后程序再次根据指数词去执行数据的聚合或者根据前面的指数此执行指数词的数据更新。这个过程都是随机的抽取关键词执行任务。

  l 数据源基本来自博客和门户以及专业社区中的信息,数据来源目前合计是近120多个网站,不仅仅是一个简单的单数据源的数据抽取。唯独动漫现在因为时间关系(没有来得及做,不过接口已经预留了,后期效果好再开发)只去聚合优酷的视频信息。

  l 标题全部加一个热度指数词在前面进行标题的伪原创。大家可以详细见www.52-game.com的内容页。

  l 在所有的内容页下面为网站创建一个热度指数作为列表的回路(其实也是大家所说的网站权重传递)。

  l 内容中增加指数词作为内部链接之用,也是为将来做关键词的排名做准备。

  l 图片全部执行伪造,通过伪静态将远程的图片地址以本地图片地址模式进行显示。

  科讯后台修改的管理页面主要有:KS.Class.asp, KS.Article.asp, KS.Picture.asp, KS.Movie.asp, KS.Asklist.asp, KS.Special.asp

  科讯前台主要修改的页面文件有:/Item/list.asp, /Item/show.asp, /Ask/q.asp

  新增加的文件:Auto.asp

  新增加的文件夹:ZLJ.Cls

  后台修改后的展示效果

  栏目管理页面如图1

  

按此在新窗口浏览图片

 

  图1

  专题页面修改如图2

  

按此在新窗口浏览图片

 

  图2

  执行效果见前台

  案例网站:我爱游戏网

  文章来源:http://www.1366.me/news/cjxw_16_38_2.html

  作者 春天的希望-秋天的硕果 的个人空间 本文仅代表作者观点,与站长网立场无关.