您的位置: 旅游网 > 社会

老Y文章管理系统采集自动伪原创详解海口商家

发布时间:2020-02-15 00:31:58

老Y文章管理系统采集自动伪原创详解

A5任务 SEO诊断选学淘宝客 站长团购 云主机

做垃圾站的站长们,最希望的事就是站可以自动收集、自动完成伪原创、然后自动收钱,这实在是天底下最幸福的事,呵呵。自动收集和自动收钱就不讨论了,我今天介绍一下如何利用老Y文章管理系统采集时自动完成伪原创的方法。

老Y文章管理系统使用简单、方便,虽然功能不如DEDE之类的强大到几近变态的程度(固然,老Y文章管理系统是asp语言写的,似乎也没有可比性),但是该有的都有,且相当简单,所以也受到了不少站长们的欢迎。老Y文章管理系统采集时自动完成伪原创的具体方法还很少有人探讨,在老Y的论坛上,乃至有人在卖这个方法,小小的鄙视一下。

关于收集,我就不多说了,相信大家都可以搞定,我要介绍的是老Y文章管理系统如何在收集的同时自动完成伪原创工作的具体方法,大体的思路就是利用老Y文章管理系统自带的过滤功能实现近义词的自动替换,从而达到伪原创的目的。比如我想将被收集文章中的所有 赚博客 字样替换为 赚日记 。详细步骤如下:

第一步,进入后台。找到 采集管理 - 过滤管理 ,添加一个新的过滤项目。

我可以建立一个名为 赚博客 的项目,具体设置请看图:

过滤名称 :填入 赚博客 便可,也可以随便写,但是为了方便查看,建议与被替换的词语一致。

所属项目 :请根据自己的站进行选择一个站栏目(必须选择一个栏目,否则过滤项目没法保存)。

过滤对象 :可选项有 标题过滤 和 正文过滤 ,一般选 正文过滤 便可,如果你连标题都想伪原创一下,可以选择 标题过滤 。

过滤类型 :可选项有 简单替换 和 高级过滤 ,一般选 简单替换 ,如果选择了 高级过滤 ,需要指定 开始标记 和 结束标记 ,这样可对收集来的内容进行代码级的替换。

使用状态 :可选项有 启用 和 禁用 ,不用解释。

使用范围 :可选项有 公有 和 私有 。选择 私有 ,该过滤仅对当前站栏目有效;选择 公有 ,对所有栏目都有效,不管采集任何栏目的任何内容,该过滤均有效。一般选 私有 即可。

内容 :填入 赚博客 ,将要被替换的词语。

替换 :填入 赚日记 ,这样只要被采集的文章中含有 赚博客 字样,就会被自动替换为 赚日记 。

第二步,重复第一步的工作,直到添加完所有的近义词。

有友要问了:我有30000多条近义词,难道要一条一条手动添加?那要到添加什么时候!?不能批量添加吗?

这个问题问得好!手动添加的确几乎是个不可能完成的任务,除非你有超常的毅力,可以手工把这30000多条近义词添加进去。遗憾的是,老Y文章管理系统并没有提供批量导入的功能。但是,作为真正的、资深的、有思想的懒人,我们要有懒人的觉悟。

要知道,我们刚才输入的内容,是存储在数据库中的,而老Y文章管理系统是用asp+Access写的,mdb数据库可以很方便的!于是乎,我可以通过直接修改数据库的方法来批量导入伪原创替换规则!

改进的第二步:修改数据库,批量导入规则。

经过查找,我发现这个数据库位于 你的管理目录\cai\Database 下。用Access打开这个数据库,找到 Filters 表,你会发现我们刚才添加的替换规则就在这儿存着呢,根据你的需要,批量添加吧!接下来的工作涉及到Access的操作了,我就不罗嗦了,大家自己可以搞定。

解释一下 Filters 表中的几个字段的含义:

FilterID:自动生成,无需输入。

ItemID:栏目ID,就是我们手动输入时 所属项目 的内容,不过这里是个数字ID,注意跟栏目的收集ID做好对应,如果不知道ID,可以重复第一步,测试一下。

FilterName:即 过滤名称 。

FilterObjece:即 过滤对象 ,填1为 标题过滤 ,填2则是 正文过滤 。

FilterType:即 过滤类型 ,填1为 简单替换 ,填2为 高级过滤 。

FilterContent:即 内容 。

FisString:即 开始标记 ,仅在设置了 高级过滤 时有效,如果设置了 简单过滤 请留空。

FioString:即 结束标记 ,仅在设置了 高级过滤 时有效,如果设置了 简单过滤 请留空。

FilterRep:即 替换 。

Flag:即 使用状态 ,TRUE为 启用 ,FALSE为 禁用 。

PublicTf:即 使用范围 。TRUE为 公有 ,FALSE为 私有 。

最后说一点利用过滤功能实现伪原创的使用感受:

老Y文章管理系统的这个功能可以实现采集时自动伪原创,但是功能还不够强大。比如我站上有 栏目1 、 栏目2 、 栏目三 共三个栏目。我希望 栏目1 对标题和正文都进行伪原创, 栏目2 只对正文进行伪原创, 栏目3 只对标题进行伪原创。

因而,我只能做如下设置(假定我有30000的近义词规则):

为 栏目1 的标题伪原创创建30000条替换规则;

为 栏目一 的正文伪原创创建30000条替换规则;

为 栏目二 的正文伪原创创建30000条替换规则;

为 栏目3 的标题伪原创创建30000条替换规则。

这样就造成了极大的数据库浪费,如果我的站有几十个栏目,每一个栏目的要求都不一样,这个数据库的尺寸将会十分恐怖。

所以建议老Y文章管理系统下一版本将这个功能做一下改进:

首先添加批量导入功能,毕竟修改数据库有一定的危险性。

其次,过滤规则不再依附于某个站栏目,而是将过滤规则独立出来,而在建立新的采集项目的时候,加入一条是否使用过滤规则的判断。

相信,这样修改之后可以极大地节约数据库存储空间,同时逻辑结构也显得更加清晰。

本文为 我的赚日记-原创赚博客 原创,请尊重我的劳动成果,转载请注明出处!另外,我使用老Y文章管理系统时间并不是很久,如果文中有毛病或不当的地方,欢迎大家指正!

益母颗粒什么时候喝
有治疗术后ED的药吗
出现阳痿后应该怎么治
希爱力和必利劲怎么选
猜你会喜欢的
猜你会喜欢的