上回时间太赶,对采集内容处理写的很浅,在实际操作过程中仍有很多奇淫巧技,需要创意与技术的结合。此文全程装逼。 回顾 上回说道处理采集内容的两个先后步骤: 对原始内容的处理 对处理后内容进行组织 第一块,对原始内容的处理,上篇主要针对html源码信息的处理,但没说对文本信息该如何处理。 下面分享下本渣渣曾经使用的一些,对采集内容文本的处理方式… 对原始采集内容文本信息的处理 对元数据的处理,这边忽略,因为元数据主要是添加逻辑上的映射。比如我一个企业黄页的网站,去抓了“XXX公司的规模、商标、年营业额、法人信息”等元数…

2016年10月22日 0条评论 709点热度 0人点赞 WPTalk 阅读全文

号外 这么久才开通留言功能,好丢人,这篇是本渣渣图新鲜试试留言功能用的,没有干货 采集内容对SEO是否有效? 有人说采集内容对搜索引擎友好性不高,不容易获得排名,这个是肯定且必然的。 对大多站点,上采集内容必定不如UGC、精心编辑过的内容来的效果好。但是,现在搜索引擎能获取到的原创内容量已经不如之前多了,毕竟内容生产平台已经转移了,早就不集中在网站上了。另外几个搜索引擎之间还相互抓,何况小站点呢。 所以采集内容依旧是有效的,只不过对采集内容后加工的成本越来越高了。 采集内容的后加工 担心采集内容效果差,或者容易被K…

2016年10月22日 0条评论 783点热度 0人点赞 WPTalk 阅读全文

其实SEO很多工作就是不断的在倒腾内容,将内容各种倒腾来倒腾去,通过拆分聚合在拆分再聚合,来捕获搜索词。 老生常谈的空短页面、重复页面、原创页面….都是间接影响流量的点,直接影响流量的是内容的维度、属性、数量 维度决定能捕获哪些流量;属性决定内容的组织方式;数量决定能够捕获流量的最大值; 其实就是数据库,维度是数据表、属性是字段、数量就是记录。做内容,就是不断的充实优化数据库。三个点都照顾到了,所谓网页内容质量也自然而然的就上去了。一个数据库设计混乱、毫无信息架构的网站,是没办法展开SEO的。 倒腾网站内容的几个动…

2016年10月22日 0条评论 657点热度 0人点赞 WPTalk 阅读全文