最后更新时间: 2024年3月25日
有时候我们想给我们的网站批量添加一些和长尾关键词相关内容,今天来演示如何通过火车头实现 Bing.com 上指定关键词搜索列表内容的抓取。
首先准备采集关键词,如下,这里我找了大概三百个关键词做个 demo

这里我们处理下链接,这次我们以 bing.com 搜索引擎展示列表为例子(也可以使用其它源),如下抓取它的标题和描述部分(这一部分当作内容使用,当然采集来的数据也可以进行清洗,加工,总之这是我们的原始数据)

构造采集 url 如下, 即关键词的空格替换成’+’,然后前边加上 ‘https://www.bing.com/search?=’

然后打开火车头(谷歌搜索火车头采集器,免费注册个账号即可使用)导入关键词文本文件,如下图

然后保存退出,点击开始采集即可,如下为采集过程

300个词大概10分钟左右就采集完成了,如下

这里配置把抓取的数据内容存储为sqlite3数据库格式

最后我们使用 sqlitespy 打开我们采集的数据库,看一下里边的内容

可以看到如上图的标题,内容部分,这样我们就完成了对应长尾关键词原始数据积累了,并且这些内容跟我们的长尾关键词高度相关。这里演示了英文,当然像阿语,西班牙语,俄语等小语种方法都是一样的。
需要脚本的可以关注公众号 ⬇️⬇️ 或添加 微信 ⬇️⬇️ 领取。