首页 > 编程语言> > Python爬取酷我音乐(收费也可)，这就是爬虫的魅力！

Python爬取酷我音乐(收费也可)，这就是爬虫的魅力！

2020-08-31 14:33:07 作者：互联网

详细

进入酷我音乐的网站到搜索界面

输入歌名进去打开开发者工具会发现这个包

它里面包含了这一页的音乐数据，我们需要的是这个参数

然后开始写代码吧，先找到所需的音乐数据

import requests
import json
import os

def music_download():
    kw = input("请输入音乐名称：")
    # 请求头
    headers = {xian
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Safari/537.36 Edg/84.0.522.63",
        "Cookie":"_ga=GA1.2.1083049585.1590317697; _gid=GA1.2.2053211683.1598526974; _gat=1; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1597491567,1598094297,1598096480,1598526974; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1598526974; kw_token=HYZQI4KPK3P",
        "Referer": "http://www.kuwo.cn/search/list?key=%E5%91%A8%E6%9D%B0%E4%BC%A6",
        "csrf": "HYZQI4KPK3P",
    }
    # 参数列表
    params = {
        "key": kw,
        # 页数
        "pn": "1",
        # 音乐数
        "rn": "10",
        "httpsStatus": "1",
        "reqId": "cc337fa0-e856-11ea-8e2d-ab61b365fb50",
    }
    # 创建列表,后面下载需要
    music_list = []
    url = "http://www.kuwo.cn/api/www/search/searchMusicBykeyWord?"
    res = requests.get(url = url,headers = headers,params = params)
    res.encoding = "utf-8"
    text = res.text
    # 转成json数据
    json_list = json.loads(text)
    # 发现data中list是存主要数据的地方
    datapack = json_list["data"]["list"]
123456789101112131415161718192021222324252627282930313233

接下来是重要的地方

先随便试听一首音乐，找到他的json数据

我们发现这个json数据里含有.mp3的链接，这就是音乐文件

复制他的url，进去看是一个接口

他的url有规律，之前我们提取的rid参数就起了作用，把它复制到链接里，这里看代码吧

# 遍历拿到所需要的数据，音乐名称，歌手，id...
for i in datapack:
    # 音乐名
    music_name = i["name"]
    # 歌手
    music_singer = i["artist"]
    # 待会需要的id先拿到
    rid = i["rid"]
    # 随便试听拿到一个音乐的接口,这是的rid就用得上了
    api_music = "http://www.kuwo.cn/url?format=mp3&rid={}&response=url&type=convert_url3" \
                "&br=128kmp3&from=web&t=1598528574799&httpsStatus=1" \
                "&reqId=72259df1-e85a-11ea-a367-b5a64c5660e5".format(rid)
    api_res = requests.get(url = api_music)
    # 打印发现真实的url确实在里面
    # print(api_res.text)
    music_url = json.loads(api_res.text)["url"]
    # 大功告成，试试效果
    print(music_name)
    print(music_singer)
    print(music_url)
1234567891011121314151617181920

顺便写了个方便下载的功能

 # 在此之前先创建列表
 music_list = []
12

函数体内建一个字典方便保存歌名与音乐数据
# 把数据存到字典方便下载时查找
music_dict = {}
music_dict["name"] = music_name
music_dict["url"] = music_url
music_dict["singer"] = music_singer
music_list.append(music_dict)
# 看看真实数据数量
print(len(music_list))
123456789

遍历之前的列表数据进行判断，利用索引找到指定的url

# 下载
xiazai = input("输入要下载的音乐名称:")
# 下载位置
root = 'E://下载的music//'
# 每个字典里有name和url
for i in range(len(music_list)):
    try:
        if xiazai == music_list[i]["name"]:
            # 创建文件夹
            if not os.path.exists(root):
                os.mkdir(root)
            # 拿到字典中对应的音乐url数据
            music_content = requests.get(url = music_list[i]["url"]).content
            with open(root + "{}.mp3".format(music_list[i]['name']),"wb") as f:
                f.write(music_content)
                print("下载成功")
    except:
        print("下载失败")
123456789101112131415161718

然后就可以愉快的下载付费音乐啦

完整代码

import requests
import json
import os

def music_download():
    kw = input("请输入音乐名称：")
    # 请求头
    headers = {
        "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.135 Safari/537.36 Edg/84.0.522.63",
        "Cookie":"_ga=GA1.2.1083049585.1590317697; _gid=GA1.2.2053211683.1598526974; _gat=1; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1597491567,1598094297,1598096480,1598526974; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1598526974; kw_token=HYZQI4KPK3P",
        "Referer": "http://www.kuwo.cn/search/list?key=%E5%91%A8%E6%9D%B0%E4%BC%A6",
        "csrf": "HYZQI4KPK3P",
    }
    # 参数列表
    params = {
        "key": kw,
        # 页数
        "pn": "1",
        # 音乐数
        "rn": "10",
        "httpsStatus": "1",
        "reqId": "cc337fa0-e856-11ea-8e2d-ab61b365fb50",
    }
    # 创建列表,后面下载需要
    music_list = []
    url = "http://www.kuwo.cn/api/www/search/searchMusicBykeyWord?"
    res = requests.get(url = url,headers = headers,params = params)
    res.encoding = "utf-8"
    text = res.text
    # 转成json数据
    json_list = json.loads(text)
    # 发现data中list是存主要数据的地方
    datapack = json_list["data"]["list"]
    # 遍历拿到所需要的数据，音乐名称，歌手，id...
    for i in datapack:
        # 音乐名
        music_name = i["name"]
        # 歌手
        music_singer = i["artist"]
        # 待会需要的id先拿到
        rid = i["rid"]
        # 随便试听拿到一个音乐的接口,这是的rid就用得上了
        api_music = "http://www.kuwo.cn/url?format=mp3&rid={}&response=url&type=convert_url3" \
                    "&br=128kmp3&from=web&t=1598528574799&httpsStatus=1" \
                    "&reqId=72259df1-e85a-11ea-a367-b5a64c5660e5".format(rid)
        api_res = requests.get(url = api_music)
        # 打印发现真实的url确实在里面
        # print(api_res.text)
        music_url = json.loads(api_res.text)["url"]
        # 大功告成，试试效果
        print(music_name)
        print(music_singer)
        print(music_url)
        # 把数据存到字典方便下载时查找
        music_dict = {}
        music_dict["name"] = music_name
        music_dict["url"] = music_url
        music_dict["singer"] = music_singer
        music_list.append(music_dict)
    # 看看真实数据数量
    print(len(music_list))
    # 下载
    xiazai = input("输入音乐名称:")
    # 下载位置
    root = 'E://下载的music//'
    for i in range(len(music_list)):
        try:
            if xiazai == music_list[i]["name"]:
                # 创建文件夹
                if not os.path.exists(root):
                    os.mkdir(root)
                # 拿到字典中对应的音乐url数据
                music_content = requests.get(url = music_list[i]["url"]).content
                with open(root + "{}({}).mp3".format(music_list[i]['name'],music_list[i]['singer']),"wb") as f:
                    f.write(music_content)
                    print("下载成功")
        except:
            print("下载失败")
if __name__ == "__main__":
    music_download()

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081

运行结果

完整项目代码获取私信小编01

标签：name,Python,list,爬虫,url,json,music,取酷,print
来源： https://www.cnblogs.com/A3535/p/13589363.html