博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
SAE 部署 bilibili 爬虫
阅读量:7083 次
发布时间:2019-06-28

本文共 931 字,大约阅读时间需要 3 分钟。

layout: post

title: sae部署bilibili爬虫
categories: python
tags: spider sae

前端效果

pic1

sae准备工作

从本地上传的爬虫到sae一直被提示没有requests模块,在requirements.txt里声明了也不行。起初我以为是这个第三方包被屏蔽了,直到看到才直到原因:requirements.txt 只在容器云app里面才会生效,同理 runtime.txt 也是。因此需要在共享服务器上面使用第三方包的话,只能自己上传。我通过 ubantu python 2.7.6 使用pip install -t vendor requests安装上 requests 包,再将这个文件夹上传到 sae 根目录就可以使用了。因为涉及到我自己账号的 cookie,这里我使用的是码云私有仓库保存我的代码,不再贴出。

bilibili-Getcoin

B站只要登录一下就可以获得当日的一硬币,在爬虫界这算是非常简单的了。我之前尝试用国外的某ae来爬B站,得到503错误(403?),国外访问B站是要梯子的。

code:

# -*- coding: utf-8 -*-"""requests学习实战"""import requestsurl = 'https://account.bilibili.com/site/getCoin'headers = {}cookies = {}with requests.Session() as s:r = s.get(url,headers=headers,cookies=cookies)print r.status_codebjson = r.json()#print bjson.keys()print bjson[u'data'] print 'over!'

以上。

2018/9/3 更新

cookies 需要每月更新。本月更新后无法获取硬币了,对比之前的cookies,发现本次更新后多出一个_jct键。现在删除后等待观察明天的结果。

结果仍然是不能获取。

转载于:https://www.cnblogs.com/aubucuo/p/spider6.html

你可能感兴趣的文章
通过DevOps考古学了解生产环境
查看>>
nginx lua指令执行顺序
查看>>
新书问答:Agile Management
查看>>
精益企业中架构师的角色
查看>>
angular-cli创建angular2项目并添加ng2-bootstrap
查看>>
leetcode讲解之开篇--刷题技巧
查看>>
Ruby 2.5.0概览
查看>>
改变从内部开始:开发者与管理者的协作
查看>>
mac使用minikube安装kubernetes
查看>>
Chrome开发者工具中关于“Deferred long-running timer task(s) ”的警告
查看>>
聊聊跨域
查看>>
Windows 下使用 MinGW 编译安装 (G)vim 添加 Lua 等编程语言支持
查看>>
Objective-C基本数据类型
查看>>
利用localStorage本地储存js文件
查看>>
[聊一聊系列]聊一聊百度移动端首页前端速度那些事儿
查看>>
shell script编程小结——附带实例
查看>>
在 Laravel 项目中使用 Glup 之 Laravel-Elixir
查看>>
Nginx、CGI、FastCGI、PHP-CGI、PHP-FPM处理流程
查看>>
Tornado 4.3文档翻译: web框架-RequestHandler和Application 类
查看>>
python之itertools的排列组合相关
查看>>