首页>>科技 >>内容

python获取年,python获取历届春晚数据

发布时间:2023-11-30 12:48:04编辑:温柔的背包来源:

python获取年,python获取历届春晚数据

很多朋友对python获取年,python获取历届春晚数据不是很了解,每日小编刚好整理了这方面的知识,今天就来带大家一探究竟。

不知道大家都看今年的春晚了吗?小编说没看过,已经很多年没有完整看过春晚了。看春晚的热情只发生在我小时候。如今,距离1983年第一届春晚已经过去39年了,看了这么多春晚,哪一年、哪些节目、哪些人仍然给你留下了深刻的印象?接下来,通过Python进行数据分析。

在网上查了很久,发现并没有关于春晚的完整数据。这里我们使用Python来捕获这种类型的表数据。方法很简单,只需几行代码即可完成。简单的示例代码如下:

#! -*- encoding:utf-8 -*- import requests import random # 访问的目标页面targetUrl='http://httpbin.org/ip' # 访问的目标HTTPS页面# targetUrl='https://httpbin.org/ip' #代理服务器(官方产品网站www.16yun.cn) proxyHost='t.16yun.cn' proxyPort='31111' # 代理验证信息proxyUser='用户名' proxyPass='密码' proxyMeta='http://%(user)s: % (pass)s@%(host)s:%(port)s' % { 'host' : proxyHost, 'port' : proxyPort, 'user' : proxyUser, 'pass' : proxyPass, } # 设置http 和https access HTTP proxy proxies={ 'http' : proxyMeta, 'https' : proxyMeta, } # 设置IP切换头tunnel=random.randint(1,10000) headers={'Proxy-Tunnel': str(tunnel)} resp=requests.get(targetUrl, proxies=proxies, headers=headers) 打印resp.status_code 打印resp.text

捕获的数据比较杂乱,需要用Python进行清理和处理后再进行分析。这些都不是重点。关键是,在获取数据的过程中,目标网站有屏蔽IP地址等屏蔽和反爬策略,所以在访问过程中我添加了代码部分,主要是如何使用动态转发模式代理示例。如果您在学习爬虫时有关于代理的疑问,可以在这里查看https://www.16yun.cn/。获得数据后,我们就可以直接进入分析环节。由此我们可以看出谁执导春晚次数最多?谁主持春晚次数最多?比如谁参加春晚次数最多等数据。

如果觉得有用,请点个赞

评论严梦凡

以上知识分享希望能够帮助到大家!