方法博客上分享通过百度商情数据接口挖掘关键词的 Shell 。同时,也提供一个 Python 脚本源码。 在运行脚本之前,请确定你是否按照了 MySQLdb 库,安装方法可以去百度一下。 代码如下: #!/usr/local/bin/python #coding:utf8 # 2015-6-26 DaoXin import pycurl, json, MySQLdb import StringIO import urllib, urllib2 from random import choice import sys…

2017年8月2日 0条评论 1783点热度 0人点赞 WPTalk 阅读全文

如果自己的网站需要被百度收录,可以在搜索结果中找到,就需要将网站的链接提交给百度。依靠百度的爬虫可能无法检索到网站所有的内容,因此可以主动将链接提交给百度。 在百度的站长平台上介绍了链接提交方法,目前有这四种: 主动推送:最快的提交方式,推荐将站点当天新产出链接立即通过此方式推送给百度,以保证新链接可以及时被百度收录。 自动推送:最为便捷的提交方式,将自动推送的JS代码部署在站点的每一个页面源代码中,部署代码的页面在每次被浏览时,链接会被自动推送给百度。可以与主动推送配合使用。 sitemap:将网站链接放到sit…

2017年8月1日 1条评论 1001点热度 1人点赞 WPTalk 阅读全文

之前有初始安装了 Windows 10 子系统 Linux ,但是感觉体验并不好。随着 Windows 10 的升级,现在的子系统 Bash on Ubuntu on Windows 感觉是越来越好用了。当然,这只是针对一般的 Linux 菜鸟,仅用来做一些测试,还是很好的。就如个人而言,安装 Windows 版本的是 Python ,在使用过程中,常常因为编码问题,无法正常显示调试错误。于是把心一横的安装子系统。但是,也需要注意的是,安装子系统的空间点用,肯定要比单独安装 Python for Windows 的…

2017年7月30日 0条评论 2042点热度 0人点赞 WPTalk 阅读全文

最近,使用 Windows 10 开启了子系统 Ubuntu 。由于没有怎么用过这个系统,很大多命令不大会。所以,收集一下相关的命令。目前使用 Windows 10 子系统 Ubuntu 安装 Python ,感觉挺好用的。不过,占用空间不小。但是想到 Windows 下安装 Python 经常受编码问题的影响,还是咬咬牙的安装了这个子系统。 命令 最佳卸载命令 apt-get remove packagename --purge && apt-get autoremove --purge && apt-get c…

2017年7月27日 0条评论 1610点热度 1人点赞 WPTalk 阅读全文

今天看到@Brooks大神分享了一个百度推广后台关键词批量挖掘并导出的Python程序,分享出来给大家。 下面给大家简单介绍一下怎么用。 首先你需要将工具下载到你电脑上(点击下载百度凤巢推广关键词批量挖掘导出工具),解压开来,应该能看到如下图的文件: 顺序给大家介绍一下各文件的作用: resultkeys.txt是关键词导出的结果 failed.txt是查询失败的关键词 cookies.txt是存放你自己登录账号后的 cookies的,后面会讲怎么获取 checkwords.txt是你需要拓展的关键词词根,或者叫母…

2017年3月22日 1条评论 5391点热度 7人点赞 WPTalk 阅读全文

最近在 Windows 10 中安装了 Cygwin ,体验了一番,有点儿折腾,原本想不要再装 Python Windows 版本,但是,在使用 Cygwin 中的 Python 时,在获取模块时,容易出错,比如 pip 的使用不是那么的方便友好。同时,安装的 Cygwin 中自带了两个 Python 版本,个人最后决定还是要在 Windows 10 系统中安装 Python 3.6 版本。那么如何让 Cygwin 支持安装在 Windows 10 系统中的 Python 3.6 版本呢?找到了一些方法,记录分享一…

2017年3月20日 0条评论 3584点热度 1人点赞 WPTalk 阅读全文

Python 通过 xmlrpc 发布文章到 WordPress 的教程有很多,有详细也有简洁。但是,找到的教程或是通过方法博客提供的脚本也没有解决个人想要的。经过一番谷歌以及摸索折腾,终于搞定了支持定义标签别名和文章别名的发布脚本,做一个记录分享。 首先,提供一篇参考教程:Python 使用 xmlrpc 自动发布文章到 WordPress 以及相关的模块说明:Python-WordPress-xmlrpc 说明文档 其次,需要安装相关 Python 模块 easy_install python-wordpres…

2017年3月12日 0条评论 2490点热度 0人点赞 WPTalk 阅读全文

本文来自知乎专栏-Python中文社区-Python网络爬虫实战项目代码大全(长期更新,欢迎补充) [1]WechatSogou - 微信公众号爬虫。基于搜狗微信搜索的微信公众号爬虫接口,可以扩展成基于搜狗搜索的爬虫,返回结果是列表,每一项均是公众号具体信息字典。项目代码地址:GitHub托管 | GitHub [2]DouBanSpider - 豆瓣读书爬虫。可以爬下豆瓣读书标签下的所有图书,按评分排名依次存储,存储到Excel中,可方便大家筛选搜罗,比如筛选评价人数>1000的高分书籍;可依据不同的主题存储到E…

2017年2月21日 0条评论 33016点热度 0人点赞 WPTalk 阅读全文

项目地址:https://github.com/k1995/BaiduyunSpider 运行环境 开始之前你需要安装 PHP 5.3.7 + MySQL Python 2.7 ~ xunsearch 搜索引擎 获取源码 ssh 方式: git clone git@github.com:k1995/BaiduyunSpider.git https 方式: git clone https://github.com/k1995/BaiduyunSpider 或手动下载 https://github.com/k1995/…

2017年2月21日 0条评论 1810点热度 1人点赞 WPTalk 阅读全文

因为TalkingCoder的服务都是部署在阿里云ECS上的,而之前一直用SMTP来发邮件遇到种种问题,正好最近阿里云在推邮件推送服务,就尝试把它迁移过去。阿里云的推送速度、数量和监控会更好一点。 邮件推送服务其实就是一个简单的API调用,但在和Celery集成过程中,却遇到几个很头疼的小问题。下面一一说明我遇到的一些坑。 签名算法 阿里云有提供SDK,但是签名算法目前只有JAVA、PHP、C#支持,其他需要自己写。在查了一些资料后, 基于python2.6/7 的Aliyun(阿里云) API的简单使用,最终实现…

2016年11月24日 0条评论 1120点热度 0人点赞 WPTalk 阅读全文
12