当前位置:首页 > 技术教程 > 正文内容

[Python] 酷我音乐歌曲爬取

万福Blog10个月前 (05-14)技术教程4130

1652461850(1).png


前言

写这篇博客的初衷是加深自己对网络请求发送和响应的理解,仅供学习使用,请勿用于非法用途!文明爬虫,从我做起。下面进入代码模式。

import asyncio
from urllib.parse import quote
import aiohttp
import logging
import aiofiles
 
referer = 'https://www.kuwo.cn'
# 请求头
headers = {
    "Cookie": "_ga=GA1.2.2021007609.1602479334; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1602479334,1602673632; "
              "_gid=GA1.2.168402150.1602673633; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1602673824; "
              "kw_token=5LER5W4ZD1C",
    "csrf": "5LER5W4ZD1C",
    "Referer": "{}".format(referer),
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                  "Chrome/86.0.4240.75 Safari/537.36",
}
 
logging.basicConfig(level=logging.DEBUG,
                    format='%(asctime)s - %(filename)s[line:%(lineno)d] - %(levelname)s: %(message)s')
 
 
async def searchSong(session, song_name):
    encodeName = quote(song_name)
    url = f'https://www.kuwo.cn/api/www/search/searchMusicBykeyWord?key={encodeName}&pn=1&rn=30&httpsStatus=1'
    res = await session.get(url=url, headers=headers)
    return await res.json()
 
 
async def downloadSong(session, rid, name, singer):
    url = f'http://www.kuwo.cn/api/v1/www/music/playUrl?mid={rid}&type=convert_url3&br=320kmp3'
    res = await session.get(url=url, headers=headers)
    res_json = await res.json()
    download_url = res_json['data']['url']
    response = await session.get(download_url, headers=headers)
    data = await response.content.read()
    async with aiofiles.open(f'music/{name}-{singer}.mp3', mode='wb') as f:
        logging.info(f"{name}-{singer}.mp3下载完成")
        await f.write(data)
 
 
async def main(song_name):
    async with aiohttp.ClientSession() as session:
        song_json = await searchSong(session, song_name)
        songs_info = song_json['data']['list']
        tasks = []
        for song_info in songs_info:
            name = song_info['name'].replace(' ', '').replace('へ-', '').replace('|', '')
            artist = song_info['artist']
            rid = song_info['rid']
            logging.info(f"歌曲名称:{name}|歌手:{artist}|id:{rid}")
            tasks.append(asyncio.create_task(downloadSong(session, rid, name, artist)))
        await asyncio.wait(tasks)
 
 
if __name__ == '__main__':
    loop = asyncio.get_event_loop()
    loop.run_until_complete(main("满天星辰不及你"))


 您阅读本篇文章共花了: 

扫描二维码推送至手机访问。

版权声明:本文由万福博客网发布,如需转载请注明出处。

本文链接:https://blog.08qq.cn/post/49.html

分享给朋友:

相关文章

根据时间自动切换网页背景颜色或图片代码

根据时间自动切换网页背景颜色或图片代码

有些时侯为了丰富页面的显示效果,将页面制作成根据时间变换页面背景的样式,这样会使浏览者对此网站不会感觉厌倦,同时也会觉得网站制作的非常新颖。本文通过 Date 对象的 getHours() 方法获得当前时间,然后根据不同的时间段来改变页面的...

PS通道抠像案例视频课程

PS通道抠像案例视频课程

课程介绍:教程—共有6集,分别讲解了素材的挑选、人物发丝的抠像方法、半透明图像的抠像方法以及两集超级酷炫吊炸天、冷艳高贵接地气的图像抠像教程,学完之后,你也可以像大神一样掌握头发丝级别的抠像处理。资源下载:    &nb...

新手无脑JMP搞定”福昕PDF转Word“会员问题

新手无脑JMP搞定”福昕PDF转Word“会员问题

简介:福昕PDF转Word,是福昕PDF软件自带的一个软件,可转换各种文档。1、打开软件,转换文档,提示“抱歉,您还未。。。”2、打开x32dbg附加程序,准备搜索字符串3、在字符串里查找“抱歉”,出来一些结果4、找到所需要的字符串,鼠标左...

Zblog设置网站动态标题(网站如何设置动态标题)

Zblog设置网站动态标题(网站如何设置动态标题)

我们经常逛别人的网站,有些网站当我们离开该页面浏览其他页面的时候,我们在离开的页面上面会看到比如本站的“你别走吖 Σ(っ °Д °;)っ”这样的字样,当我们点回来的时候页面上面会看到“(/≧▽≦/)你又回来了!”的字样。那么我们如何实现呢?...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。