Python爬取酷我音乐(收费也可),这就是爬虫的魅力!
作者:互联网
详细
进入酷我音乐的网站到搜索界面
输入歌名进去打开开发者工具会发现这个包
它里面包含了这一页的音乐数据,我们需要的是这个参数
然后开始写代码吧,先找到所需的音乐数据
import requests import json import os def music_download(): kw = input("请输入音乐名称:") # 请求头 headers = {xian "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Safari/537.36 Edg/84.0.522.63", "Cookie":"_ga=GA1.2.1083049585.1590317697; _gid=GA1.2.2053211683.1598526974; _gat=1; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1597491567,1598094297,1598096480,1598526974; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1598526974; kw_token=HYZQI4KPK3P", "Referer": "http://www.kuwo.cn/search/list?key=%E5%91%A8%E6%9D%B0%E4%BC%A6", "csrf": "HYZQI4KPK3P", } # 参数列表 params = { "key": kw, # 页数 "pn": "1", # 音乐数 "rn": "10", "httpsStatus": "1", "reqId": "cc337fa0-e856-11ea-8e2d-ab61b365fb50", } # 创建列表,后面下载需要 music_list = [] url = "http://www.kuwo.cn/api/www/search/searchMusicBykeyWord?" res = requests.get(url = url,headers = headers,params = params) res.encoding = "utf-8" text = res.text # 转成json数据 json_list = json.loads(text) # 发现data中list是存主要数据的地方 datapack = json_list["data"]["list"] 123456789101112131415161718192021222324252627282930313233
接下来是重要的地方
先随便试听一首音乐,找到他的json数据
我们发现这个json数据里含有.mp3的链接,这就是音乐文件
复制他的url,进去看是一个接口
他的url有规律,之前我们提取的rid参数就起了作用,把它复制到链接里,这里看代码吧
# 遍历拿到所需要的数据,音乐名称,歌手,id... for i in datapack: # 音乐名 music_name = i["name"] # 歌手 music_singer = i["artist"] # 待会需要的id先拿到 rid = i["rid"] # 随便试听拿到一个音乐的接口,这是的rid就用得上了 api_music = "http://www.kuwo.cn/url?format=mp3&rid={}&response=url&type=convert_url3" \ "&br=128kmp3&from=web&t=1598528574799&httpsStatus=1" \ "&reqId=72259df1-e85a-11ea-a367-b5a64c5660e5".format(rid) api_res = requests.get(url = api_music) # 打印发现真实的url确实在里面 # print(api_res.text) music_url = json.loads(api_res.text)["url"] # 大功告成,试试效果 print(music_name) print(music_singer) print(music_url) 1234567891011121314151617181920
顺便写了个方便下载的功能
# 在此之前先创建列表 music_list = [] 12
函数体内建一个字典方便保存歌名与音乐数据 # 把数据存到字典方便下载时查找 music_dict = {} music_dict["name"] = music_name music_dict["url"] = music_url music_dict["singer"] = music_singer music_list.append(music_dict) # 看看真实数据数量 print(len(music_list)) 123456789
遍历之前的列表数据进行判断,利用索引找到指定的url
# 下载 xiazai = input("输入要下载的音乐名称:") # 下载位置 root = 'E://下载的music//' # 每个字典里有name和url for i in range(len(music_list)): try: if xiazai == music_list[i]["name"]: # 创建文件夹 if not os.path.exists(root): os.mkdir(root) # 拿到字典中对应的音乐url数据 music_content = requests.get(url = music_list[i]["url"]).content with open(root + "{}.mp3".format(music_list[i]['name']),"wb") as f: f.write(music_content) print("下载成功") except: print("下载失败") 123456789101112131415161718
然后就可以愉快的下载付费音乐啦
完整代码
import requests import json import os def music_download(): kw = input("请输入音乐名称:") # 请求头 headers = { "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Safari/537.36 Edg/84.0.522.63", "Cookie":"_ga=GA1.2.1083049585.1590317697; _gid=GA1.2.2053211683.1598526974; _gat=1; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1597491567,1598094297,1598096480,1598526974; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1598526974; kw_token=HYZQI4KPK3P", "Referer": "http://www.kuwo.cn/search/list?key=%E5%91%A8%E6%9D%B0%E4%BC%A6", "csrf": "HYZQI4KPK3P", } # 参数列表 params = { "key": kw, # 页数 "pn": "1", # 音乐数 "rn": "10", "httpsStatus": "1", "reqId": "cc337fa0-e856-11ea-8e2d-ab61b365fb50", } # 创建列表,后面下载需要 music_list = [] url = "http://www.kuwo.cn/api/www/search/searchMusicBykeyWord?" res = requests.get(url = url,headers = headers,params = params) res.encoding = "utf-8" text = res.text # 转成json数据 json_list = json.loads(text) # 发现data中list是存主要数据的地方 datapack = json_list["data"]["list"] # 遍历拿到所需要的数据,音乐名称,歌手,id... for i in datapack: # 音乐名 music_name = i["name"] # 歌手 music_singer = i["artist"] # 待会需要的id先拿到 rid = i["rid"] # 随便试听拿到一个音乐的接口,这是的rid就用得上了 api_music = "http://www.kuwo.cn/url?format=mp3&rid={}&response=url&type=convert_url3" \ "&br=128kmp3&from=web&t=1598528574799&httpsStatus=1" \ "&reqId=72259df1-e85a-11ea-a367-b5a64c5660e5".format(rid) api_res = requests.get(url = api_music) # 打印发现真实的url确实在里面 # print(api_res.text) music_url = json.loads(api_res.text)["url"] # 大功告成,试试效果 print(music_name) print(music_singer) print(music_url) # 把数据存到字典方便下载时查找 music_dict = {} music_dict["name"] = music_name music_dict["url"] = music_url music_dict["singer"] = music_singer music_list.append(music_dict) # 看看真实数据数量 print(len(music_list)) # 下载 xiazai = input("输入音乐名称:") # 下载位置 root = 'E://下载的music//' for i in range(len(music_list)): try: if xiazai == music_list[i]["name"]: # 创建文件夹 if not os.path.exists(root): os.mkdir(root) # 拿到字典中对应的音乐url数据 music_content = requests.get(url = music_list[i]["url"]).content with open(root + "{}({}).mp3".format(music_list[i]['name'],music_list[i]['singer']),"wb") as f: f.write(music_content) print("下载成功") except: print("下载失败") if __name__ == "__main__": music_download() 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081
运行结果
完整项目代码获取私信小编01
标签:name,Python,list,爬虫,url,json,music,取酷,print 来源: https://www.cnblogs.com/A3535/p/13589363.html