当前位置:首页 > 技术教程 > 正文内容

[Python] 酷我音乐歌曲爬取

万福Blog2年前 (2022-05-14)技术教程7240

1652461850(1).png


前言

写这篇博客的初衷是加深自己对网络请求发送和响应的理解,仅供学习使用,请勿用于非法用途!文明爬虫,从我做起。下面进入代码模式。

import asyncio
from urllib.parse import quote
import aiohttp
import logging
import aiofiles
 
referer = 'https://www.kuwo.cn'
# 请求头
headers = {
    "Cookie": "_ga=GA1.2.2021007609.1602479334; Hm_lvt_cdb524f42f0ce19b169a8071123a4797=1602479334,1602673632; "
              "_gid=GA1.2.168402150.1602673633; Hm_lpvt_cdb524f42f0ce19b169a8071123a4797=1602673824; "
              "kw_token=5LER5W4ZD1C",
    "csrf": "5LER5W4ZD1C",
    "Referer": "{}".format(referer),
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) "
                  "Chrome/86.0.4240.75 Safari/537.36",
}
 
logging.basicConfig(level=logging.DEBUG,
                    format='%(asctime)s - %(filename)s[line:%(lineno)d] - %(levelname)s: %(message)s')
 
 
async def searchSong(session, song_name):
    encodeName = quote(song_name)
    url = f'https://www.kuwo.cn/api/www/search/searchMusicBykeyWord?key={encodeName}&pn=1&rn=30&httpsStatus=1'
    res = await session.get(url=url, headers=headers)
    return await res.json()
 
 
async def downloadSong(session, rid, name, singer):
    url = f'http://www.kuwo.cn/api/v1/www/music/playUrl?mid={rid}&type=convert_url3&br=320kmp3'
    res = await session.get(url=url, headers=headers)
    res_json = await res.json()
    download_url = res_json['data']['url']
    response = await session.get(download_url, headers=headers)
    data = await response.content.read()
    async with aiofiles.open(f'music/{name}-{singer}.mp3', mode='wb') as f:
        logging.info(f"{name}-{singer}.mp3下载完成")
        await f.write(data)
 
 
async def main(song_name):
    async with aiohttp.ClientSession() as session:
        song_json = await searchSong(session, song_name)
        songs_info = song_json['data']['list']
        tasks = []
        for song_info in songs_info:
            name = song_info['name'].replace(' ', '').replace('へ-', '').replace('|', '')
            artist = song_info['artist']
            rid = song_info['rid']
            logging.info(f"歌曲名称:{name}|歌手:{artist}|id:{rid}")
            tasks.append(asyncio.create_task(downloadSong(session, rid, name, artist)))
        await asyncio.wait(tasks)
 
 
if __name__ == '__main__':
    loop = asyncio.get_event_loop()
    loop.run_until_complete(main("满天星辰不及你"))


 您阅读本篇文章共花了: 

扫描二维码推送至手机访问。

版权声明:本文由万福博客网发布,如需转载请注明出处。

本文链接:http://blog.08qq.cn/post/49.html

分享给朋友:

相关文章

小米系统彻底关闭广告经验分享

小米系统彻底关闭广告经验分享

由于疫情原因,闲得慌在家研究了自己手机系统广告,发现广告一大堆于是利用在家隔离期间两个小时整理归档,总结出以下关闭广告方法。如朋友们还有其他补充 请直接评论即可 给大伙做个参考!1.设置→小米账号→声明与条款→系统广告→系统工具广告→关闭2...

此次放开双手,快速推送网站地图自动推送的PHP代码

此次放开双手,快速推送网站地图自动推送的PHP代码

利用宝搭的计划任务,自定义下述代码为任意文件名的php文件,配置好您的api,可实现自动读取网站的sitemap.xml地图文件,并像百度默认推送100条链接。可配合宝塔计划任务进行定时定量推送,各位自行琢磨!第一步打开宝搭控制面板后台找到...

根据时间自动切换网页背景颜色或图片代码

根据时间自动切换网页背景颜色或图片代码

有些时侯为了丰富页面的显示效果,将页面制作成根据时间变换页面背景的样式,这样会使浏览者对此网站不会感觉厌倦,同时也会觉得网站制作的非常新颖。本文通过 Date 对象的 getHours() 方法获得当前时间,然后根据不同的时间段来改变页面的...

PS通道抠像案例视频课程

PS通道抠像案例视频课程

课程介绍:教程—共有6集,分别讲解了素材的挑选、人物发丝的抠像方法、半透明图像的抠像方法以及两集超级酷炫吊炸天、冷艳高贵接地气的图像抠像教程,学完之后,你也可以像大神一样掌握头发丝级别的抠像处理。资源下载:    &nb...

发表评论

访客

◎欢迎参与讨论,请在这里发表您的看法和观点。