Python爬取抖音短视频-铭心博客

1. 使用更简单的方法

随便打开一个抖音个人主页，我选择的是爱奇艺体育,接着右键检查网页元素，点击network选项卡下的xhr选项，分析抓到的包

点到preview选项卡，点击video->download_addr->url_list

发现这下面跟着的两个网址正好是视频的网址（根本不需要构造，只是这个网址藏的有点深，需要非常耐心的寻找），打开网址查看：

提取到这个网址的时候我以为已经结束了，但是一个大佬@金亭玉立给我发来了一篇文章提醒了我一些没有想到的东西，在此表示感谢！

我们接着往下看，在下面的play_addr下面也有一个链接，这个链接下面的视频就是无水印版本的视频

ok，现在我们只要想办法提取到它就大功告成了

我这次使用的方法中用到了jsonpath模块，直接pip下载就可以了：

pip install jsonpath

2. 代码

import requests
import json
import jsonpath

class Douyin:
    def page_num(self,max_cursor):
        #随机码
        random_field = '00nvcRAUjgJQBMjqpgesfdNJ72&dytk=4a01c95562f1f10264fb14086512f919'
        #网址的主体
        url = 'https://www.iesdouyin.com/web/api/v2/aweme/post/?sec_uid=MS4wLjABAAAAU7Bwg8WznVaafqWLyLUwcVUf9LgrKGYmctJ3n5SwlOA&count=21&max_cursor=' + str(max_cursor) + '&aid=1128&_signature=' + random_field
        #请求头
        headers = {
            'user-agent':'Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.129 Safari/537.36',
        }
        response = requests.get(url,headers=headers).text
        #转换成json数据
        resp = json.loads(response)
        #提取到max_cursor
        max_cursor = resp['max_cursor']
        #遍历
        for data in resp['aweme_list']:
            # 视频简介
            video_title = data['desc']
            #使用jsonpath语法提取paly_addr
            video_url = jsonpath.jsonpath(data,'$..paly_addr')
            for a in video_url:
                #提取出来第一个链接地址
                video_realurl = a['url_list'][1]
            # 请求视频
            video = requests.get(video_realurl, headers=headers).content
            with open('t/' + video_title, 'wb') as f:
                print('正在下载：', video_title)
                f.write(video)

        #判断停止构造网址的条件
        if max_cursor==0:
            return 1
        else:
            douyin.page_num(max_cursor)

if __name__ == '__main__':
     douyin = Douyin()
     douyin.page_num(max_cursor=0)

3. 优点

这个方法的优点是可以省去很大一部分的分析网址的步骤，而且没有调用到webdriver（可以不限制浏览器），速度也会有显著提升,得到的视频也是无水印的

4. 不足

还是没有解决随机生成字符串的问题，操作比较麻烦

5. 使用方法

网址

相关声明 1 本站名称：铭心博客
2 本站永久网址：https://www.imxbk.com/
3 本文内容仅为技术科普，请勿用于非法用途。
4本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 根据《计算机软件保护条例》第十七条，本站所有软件请仅用于学习研究用途。
6 本文内容未隐讳任何个人、群体、公司。非文学作品，请勿用于阅读理解的练习。
7 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长进行删除处理。

THE END

Python爬取抖音短视频

1. 使用更简单的方法

2. 代码

3. 优点

4. 不足

5. 使用方法

1自建远程桌面服务RustDesk的搭建教程

2Linux 系统自动化部署系统

3华为交换机文件系统介绍

4CVE-2023-50386ApacheSolr

5Ubuntu升级或安装最新版本的Nginx

6Python打包.exe可执行文件