功能:爬取查询后的肯德基餐厅的地址信息
地址:http://www.kfc.com.cn/kfccda/storelist/index.aspx
亮点是post请求的参数有两组:查询字符串参数,表单数据。
对于post请求,由于url中隐藏了许多参数,所以引入了表单数据,查询字符串参数用于拼接url,表单数据用于查询内容。理论上查询字符串参数用params传递,表单数据用data传递。但是实践证明都放入params或data中传也没问题。
完整代码
import requests
#请求url:http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword
url='http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?'
name=input('输入要查询的城市:')
#查询字符串参数
params={'op': 'keyword' #查询字符串参数
}
#表单数据
data={'cname': '','pid': '','keyword': name, 'pageIndex': '1','pageSize': '10',}header={'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/91.0.4472.101 Safari/537.36 Edg/91.0.864.48'
}
r=requests.post(url=url,params=params,data=data,headers=header) #用params也是一样的
text=r.text
with open('./text.text','w',encoding='utf-8') as f:f.write(text)
print("爬取成功!")