SEO工具四:数据库转换脚本 – 把原始数据转换为 Peace 可解析 db

最后更新时间: 2024年3月25日

上一次我们介绍了 Peace 这个简洁的CMS系统, Peace 是通过解析一个 sqlite3 数据库工作的,跟wordpress 原理一样,我们通过火车头等脚本工具抓取的内容是原始数据,需要加工处理一下才可以被 Peace 识别,这里使用转换脚本 transfter.php 来做这个工作, 大概如下图所示

transfer-part-code
transfer 脚本部分代码截图

从代码中可以看出 transfer.php 这个脚本主要是用来把我们采集的类似

<h3>this is title</h3>
<p>This is description</p>

转换为我们想要的样式布局,即进行标签替换,添加留言板脚本,添加链接等工作,同时我们对原始的内容还进行一些过滤,比如过滤掉中文词,过滤掉一些特殊字符如 ‘[‘, ‘&’, “;”等,同时过滤掉 ‘https’, ‘www’之类的网址,一些标点符号 ”’, ‘&amp’ 之类的,经过这么一处理,我们的原始数据库就转换为可以被 Peace 识别的数据库了。

现在我们再来说说开头的 $fromTime 和 $toTime(代码截图中没显示出来), 这是指定网站文章发布的时间,跟 wordpress 的定时发布是一个道理,比如你指定 2024.03.21 00:00:00 开始发布,到2024.03.22 23:59:59秒结束,则 Peace 会计算大概多久放出来一篇文章,转换过程如下图(这里我们文章比较少只是方便演示用,实际过程一般是上万篇数据进行转换)

transfer-succeed
转换成功截图

提示我们转换完成后,可以看到在我们指定的位置生成了数据库 db(sqlite3数据库格式),如下图

transfered-db
transfered-db

这时候我们打开 love.php (上一节已经讲过love.php 的作用),修改配置文件,把生成的 db 引入即可,这时我们打开我们的网站的站点地图, 我本地电脑是 http://127.0.0.4/sitemap.xml,如下图

peace-cms-sitemap
peace-cms-sitemap

随便打开一个链接,如下图

peace-cms-page-screenshot1
peace-cms-page-screenshot1

可以看到留言板加载出来了,同时采集的数据也以列表的形势展现出来, 同时左边还会随机一张产品图片出来,下方还有一个Get Quote 的按钮,这个按钮链接到网站的联系我们页面,联系我们页面一般是放了联系电话,邮箱和留言板的,列表中每个 item 都是这样,增加了用户点击率,这已经比较像一个正常网站的列表页了。

peace-cms-page-screenshot2
peace-cms-page-screenshot2

上图这里同样可以看到,上一篇,下一篇的文章也显示出来了,点击相应链接就可以连接到上一篇,下一篇,方便搜索引擎抓取网站内容。

点击查看网页源代码,可以看到如下图所示,每个网页的 title 就是我们设置的长尾关键词,通过对脚本进行处理还可以动态截取源内容作为网站的 description 和 keywords,这里没作过多展示。

peace-cms-page-source-code
peace-cms-page-source-code

通过 transfer.php 处理,我们把火车头等工具采集来的数据转换为适应我们自己网站模板数据库,这时 Peace 通过解析数据库中每行的数据为我们动态生成了一个对应网站页面,同时还帮我们生成了站点地图,并且根据我们自定义的开始和结束时间帮我们定时发布文章,可以说 Peace 的功能相当完善了,当然这只是一种实现思路,可以发挥的空间还非常大。

想要了解更多 Peace 相关内容的可以关注公众号 ⬇️⬇️ 或添加 微信 ⬇️⬇️ 领取。

5/5 - (2票)

发表评论