当前位置: 首页 > 后端技术 > Python

抖音超级好听的神曲音乐,Python教你一次性下载

时间:2023-03-26 19:09:00 Python

。。)。刚才说了,我以前喜欢用抖音。对于我这种佛系程序员来说,网上的整容妹子基本都差不多。喜欢抖音主要有两个初衷,学做饭和听音乐。以前朋友常说,人抖音看到女孩子开心的样子,你看人家做饭吃得津津有味,一个人在那里傻笑……人靠饭吃,我看菜色香味俱全,而且都煮的那么好吃的开心不就好了吗?抖音走红了很多人,也通过翻唱、混剪、视频配音等方式,制作了很多不太为人熟知的歌曲和BGM,从而传遍大街小巷。什么“若不是你,突然闯进我的心里……”或者“也许未来在遥远的光年里,我愿在未知的地方等你……”都成了那曲调,每个人在空闲时间都会哼唱。那么,你有没有想过批量下载这些好看的片段呢?Python链接抖音python下载抖音内容网上有帖子,但是比较麻烦,需要通过adb连接安卓手机,模拟运行。我好懒,玩不了这种东西……那么,抖音内容怎么获取呢?在网上搜索了一下,大概有两种方式,一种是浏览器插件快摇,还有一种就是今天要说的抖音网页版。其实两者的区别并不是很大。先把抖音的内容下载到服务器,开发一个简单的网站,配置好域名后,大家就可以访问了。来看看抖音网页版:哎呀,居然在昨天的爬虫里看到了《乔奶奶》……当然,今天的重点不是视频,而是全站音乐下载!爬虫实现对热歌榜内容的解析。先来看看这个抖音热门歌曲,每页20首,每页55首。但是一不小心,大家就会发现很多歌曲都有重复的问题。所以我们在等待爬虫的时候,需要先准备一个music_list来判断歌曲是否已经下载了。。。网页解析比较简单,一个div包裹着一个ul>li*20,是不是应该这样获取:soup.find('div',{"class":"pull-left"}).find('ul').findAll('a')如果你说是,那你肯定没看我的前天整理通过哪吒豆瓣影评,文章带大家分析python爬虫快速入门:https://www.jianshu.com/p/ae38f7607902,我在文章中特意提到了一个小技巧,通过使用attr的属性进行快速解析,那么最快的获取方式是:soup.findAll('a',attrs={'onclick':True})我们只需要获取所有的a标签,将这些切掉标签以包含onclick属性。巧妙地使用eval,我们解析的内容可以通过attr['onclick'],得到它的属性open1('night','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d)。如何快速获取歌曲名称和url呢?这里我们需要使用一个eval技巧:index="open1('Night','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')"index[5:]"('Night','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')"index_tuple=eval(index[5:])print(index_tuple,type(index_tuple))('night','http://p9-dy.byteimg.com/obj/61a20007a98954b0831d','')index_tuple[0]'night'index_tuple[1]'http://p9-dy.byteimg.com/obj/61a20007a98954b0831d'ps:今天有朋友说我写的代码没有注释。我在这里告诉你如何写出别人根本看不懂的代码,就不写注释了,哈哈!其实我在文中把代码一点点解释了,所以没写,但是抱着怕大佬拿走的心态,想补充一下。。。代码实现总体来说实现起来比较简单,所有代码如下:#-*-coding:utf-8-*-#@Author:王翔#@JianShu:QingfengPython#@Date:2019/7/3123:25#@Software:PyCharm#@version:Python3.7.3#@File:DouYinMusic.pyimportosimportrequestsfrombs4importBeautifulSoupimportthreadingimporttimeclassDouYinMusic:def__init__(self):self.music_list=[]self.path=self.download_path()@staticmethoddefdownload_path():"""获取代码执行目录,并在目录下创建Music文件夹:返回Music文件夹的完整路径"""base_dir=os.path.dirname(os.path.abspath(__file__))_path=os.path.join(base_dir,"Music")如果不是os.path.exists(_path):os.mkdir(_path)return_pathdefget_request(self,url):"""封装请求。得到method如果是网页请求,返回网页内容否则,解析音乐地址,返回音乐二进制文件:paramurl:请求url(分为网页和音乐两种):return:网页内容&音乐二进制文件“""r=requests.get(url,timeout=5)ifurl.endswith('html'):returnr.textelse:returnr.contentdefanalysis_html(self,html):"""根据获取的网页content,解析音乐名称、下载地址并调用音乐下载方法:paramhtml:webpagecontent"""soup=BeautifulSoup(html,'lxml')#根据关键词onclickfortag_ainsoup.content查找各个下载地址。findAll('a',attrs={'onclick':True}):#下载格式'("name","link","")',通过eval将str转为tuple类型link_list=eval(tag_a['onclick'][5:])music_name,music_link=link_list[:2]#因为有一些重复的音乐,所以设置判断下载的音乐跳过ifmusic_nameinself.music_list:continueself.music_list.append(music_name)t=threading.Thread(target=self.download_music,args=(music_name,music_link))time.sleep(0.5)t.start()defdownload_music(self,music_name,music_link):"""分析音乐文件并完成音乐下载:parammusic_name:音乐名称:parammusic_link:下载地址"""_full_name=os.path.join(self.path,music_name)withopen(_full_name+'.mp3','wb')asf:f.write(self.get_request(music_link))print("Music:{}downloadcomplete".format(music_name))defrun(self):"""主要方法,用于批量生成url"""forpageinrange(1,55):url="http://douyin.bm8.com.cn/t_{}.html".format(page)html=self.get_request(url)self.analysis_html(html)if__name__=='__main__':main=DouYinMusic()main.run()看看效果:网站是通过nginx负载均衡搭建的,有些链接已经过期了,最后下载了592首不重复的抖音音乐。同理,大家如果你喜欢的可以按照这个方法尝试下网站的抖音视频,本文作者华为云|清风Python点击??关注,第一时间了解华为云的新技术~