Web API是网站的一部分,用于与使用非常具体的URL请求特定信息的程序互交。这种请求称为API调用,请求的数据将以易于处理的格式返回(JSON/CSV)。
1. Git和GitHub GitHub(https://github.com/) Git是一个分布式版本控制系统,让程序员团队能够协作开发项目。 GitHub上的项目都存储在仓库中,包含与项目相关联的一切:代码、项目参与者的信息,问题或者bug报告等。
2. 使用API调用请求数据
https://api.github.com/search/repositories?q=language:python&sort=stars
分析:
第一部分:https://api.github.com 将请求发送到GitHub网站中响应API调用的部分第二部分:search/repositories 让API搜索GitHub上的所有仓库第三部分:问号(?)后指出我们要传递的实参 q表示查询,q=language:python,只想获取主要语言为Python的仓库信息; sort表示排序,指定将项目按其获得的星级进行排序。3. 安装requests
requests包让Python程序能够轻松地向网站发送请求信息,以及检查返回的响应。安装命令:pip install --user requests
4. 处理API响应 下面编写一个程序,执行API调用并处理结果,找出GitHub上星级最高的Python项目。
import requests # 执行API调用并存储响应信息 url = "https://api.github.com/search/repositories?q=language:python&sort=stars" r = requests.get(url) print("Status code:",r.status_code) # 将API响应存储在一个变量中 response_dict = r.json() # 处理结果 print(response_dict.keys()) 运行结果: Status code: 200 dict_keys(['total_count', 'incomplete_results', 'items'])5. 处理字典响应
将API调用返回的信息存储到字典中后,就可以处理这个字典中的数据了。
import requests # 执行API调用并存储响应信息 url = "https://api.github.com/search/repositories?q=language:python&sort=stars" r = requests.get(url) print("Status code:",r.status_code) # 将API响应存储在一个变量中 response_dict = r.json() print("Total repositories: ",response_dict['total_count']) # 搜索有关仓库的信息 response_dict = response_dict['items'] print("Repositories returned:",len(response_dict)) # 处理结果 repo_dict = response_dict[0] # print(repo_dict) print("\nKeys:",len(response_dict)) for key in sorted(repo_dict.keys()): print(key)6. 概述最受欢迎的仓库
7. 监视API的速率限制
https://api.github.com/rate_limit
{ --snip-- "search": { "limit": 10, "remaining": 10, "reset": 1570366257 }, --snip-- }limit:极限是每分钟10个请求 remaining:还可以执行10个请求 reset:配额将重置的Unix时间或新纪元时间
创建交互式条形图:条形的高度表示项目获得了多少颗星。
1. 改进Pygal图表
2. 添加自定义工具提示
3. 根据数据绘图
4. 在图表中添加可单击的链接
