欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 新闻 > 焦点 > 利用命令行从youtube下载影片,并用huggingface的大语言模型翻译成中文

利用命令行从youtube下载影片,并用huggingface的大语言模型翻译成中文

2025/7/5 3:37:50 来源:https://blog.csdn.net/qq_35837578/article/details/141361347  浏览:    关键词:利用命令行从youtube下载影片,并用huggingface的大语言模型翻译成中文

今天,从网络流媒体上下载字幕,并把它翻译成各种语言是一个非常常规的操作。

我创建了一个工作流程。可以根着这个工作流程,从网上先下载影片,然后转出字幕,最后再做翻译。

https://github.com/victorspaceRMW/download-Youtube-with-yt-dlp-and-translate-with-HuggingFace-s-whisper-model/tree/main

(1), 如何下载字幕?
在这里我们使用yt-dlp工具下载字幕和youtube视频:

https://wiki.archlinux.org/title/Yt-dlp#:~:text=To%20get%20a%20list%20of%20the%20available%20formats%3A,%28requires%20FFmpeg%29%3A%20%24%20yt-dlp%20-x%20-f%20bestaudio%20URL

你可以直接一次性的运行这个.sh文件,也可以一行一行的自己去执行。

#!/bin/bash# 安装 yt-dlp
echo "安装 yt-dlp..."
pip install yt-dlp# 安装 ffmpeg
echo "安装 ffmpeg..."
if ! command -v ffmpeg &> /dev/null
thenecho "ffmpeg 未安装,正在安装..."sudo apt-get updatesudo apt-get install -y ffmpeg
elseecho "ffmpeg 已安装"
fi# 下载 YouTube 视频
VIDEO_URL=$1
OUTPUT_FILE=$2if [ -z "$VIDEO_URL" ] || [ -z "$OUTPUT_FILE" ]; thenecho "用法: $0 <YouTube 视频 URL> <输出文件名>"exit 1
fiecho "下载视频..."
yt-dlp -f bestvideo+bestaudio "$VIDEO_URL" -o "$OUTPUT_FILE"echo "下载完成: $OUTPUT_FILE"

(2). 我写了两个脚本:
第一个是用于从 yt-dlp 下载好的文件里面提取出字幕的。也就是extract document.py。
请参考该文件。里面有非常详细的注释。

第二个是利用hugging上的大模型来进行中英互译。
需要提前pip install transformer!

其他的参考translator.py即可。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com

热搜词