长尾关键词的批量自动获取思路及实现

clsrich 站外优化 2019-09-03 15:02:33 289 0

以百度为例，思路如下：

1、搜索主关键词，分析相关搜索链接，存入网址库，标记为未抓取。

2、读取数据库中标记为未抓取的网址，抓取后分析相关搜索，存入网址库，标记为未抓取。

3、重复2直到指定深度（一般热门关键词6层左右深度差不多全部读取，一般关键词4层即可，理论上可以无限层，但需要抓取的数据量呈级数增长，相关性也越来越差，没必要）。

4、人工处理长尾词，这里需要人工去除一些无关的关键词，保留合适的（当前搜素引擎的语义处理能力还很弱）。

至此，基本完成了对长尾关键词的处理，可以获得一个比较全的长尾关键词列表了。由于个人还需要研究不同层次关键词之间的关系，所以存储了搜索结果的网页，定义了父子关系，也没有过滤不同层之间相同的关键词，这些对找长尾词用处不大。

自动获取文件指定目标关键词的php实现见附件：spider_keywords

这是我自用程序，提供一个实现方式，打算用的话还需要根据自己使用环境修改，要求懂php，SQL。关键部分如相关关键词分析提取已经做的比较稳定，请放心使用。其中：

mykeyword.dat为存放关键词的文件，每行一个主关键词。

$depth为抓取深度，默认5层，对于一般关键词够深。

程序挖掘数据后存放在我的PostgreSQL数据库，数据库默认UTF-8编码，可以根据自己的实际需要修改。数据表结构如下：

– Table: mykeywords

– DROP TABLE mykeywords;

CREATE TABLE mykeywords

(id serial NOT NULL,

father text,

"content" text,

sons text,

depth text,

keyname text,

remark text,

is_spidered boolean,

CONSTRAINT mykeywords_pkey PRIMARY KEY (id)

)

WITH (OIDS=FALSE);

ALTER TABLE mykeywords OWNER TO postgres;

AADF3RSEGDTHIU

版权声明

本文仅代表作者观点，不代表本站立场。
发布的有些文章部分内容来源于互联网。如有侵权，请联系我们，我们会尽快删除。

本文链接：https://www.shseotuiguang.com/post/378.html

发表评论

评论列表（0人评论 , 289人围观）

☹还没有评论，来说两句吧...

选关键词

URL优化

代码优化

网页结构

经验之谈

内链外链

优化误区

英文优化

搜索算法

百度AD

谷歌AD

黑帽灰帽

百度PC端

百度手机端

搜狗PC端

搜狗手机端

360搜索

神马搜索

好书推荐

好站推荐

视频学习

优化工具

谷歌优化

生意经

长尾关键词的批量自动获取思路及实现

版权声明

相关文章

发表评论

网站分类

最近发表

标签列表

统计代码 | 蜀ICP备18039239号

Powered By 城南二哥