综合类个人主理频道,收录推送各类项目,开源推荐较多
#开源 #网站 #AI #教程 #notion #rss
访问主页: www.noisework.cn
投稿bot: @noisewowbot
搜索bot:@Efficiencysearchbot
网站bot:@noisesearchbot
RSS订阅: https://tg.i-c-a.su/rss/quanshoulu
频道页面:https://tg.noisework.cn
#开源 #网站 #AI #教程 #notion #rss
访问主页: www.noisework.cn
投稿bot: @noisewowbot
搜索bot:@Efficiencysearchbot
网站bot:@noisesearchbot
RSS订阅: https://tg.i-c-a.su/rss/quanshoulu
频道页面:https://tg.noisework.cn
#工具 #AI ByeType 是一个 Markdown 驱动的 AI 语音输入工具,用多模态大模型直接处理原始音频。编辑 Markdown 文件即可自定义专有词汇、转录规则和格式化策略,人名、术语、口水词、数字格式一次转录到位,减少二次修改。支持 macOS、Windows 和 iOS
https://github.com/lixiaojie001/byetype
https://github.com/lixiaojie001/byetype
#AI
AI Movie Clip – 基于python的智能视频剪辑系统
一个基于人工智能的自动视频剪辑系统,能够自动分析视频内容并根据用户需求生成编辑后的视频。该项目为视频剪辑mcp提供了一个新的研究方向,它使用python脚本来分析和处理视频,同时你可以编辑自己设定的模版进行一键创作。
开源:https://github.com/LumingMelody/Ai-movie-clip
功能特性
- 🎬 视频自动分析:使用CV和ML模型分析视频内容
- 🎨 多样化模板:支持多种视频风格模板(社交媒体、商业、教育等)
- 🤖 AI内容生成:集成文本生成、图像生成和语音合成
- 🎭 特效和转场:丰富的视频效果和转场动画
- 🚀 API服务:提供FastAPI接口,支持批处理
- 🔌 MCP集成:支持Model Context Protocol扩展
快速开始
环境要求
- Python 3.8+
- FFmpeg(用于视频处理)
- CUDA(可选,用于GPU加速)
安装步骤
1. 克隆项目
git clone https://github.com/LumingMelody/Ai-movie-clip.git
cd Ai-movie-clip
1. 安装依赖
pip install -r requirements.txt
1. 配置环境变量
复制环境变量模板并填写您的配置:
cp .env.example .env
编辑 .env 文件,填入您的API密钥:…
📡发布:https://noisevip.cn/18777.html
🪧关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
AI Movie Clip – 基于python的智能视频剪辑系统
一个基于人工智能的自动视频剪辑系统,能够自动分析视频内容并根据用户需求生成编辑后的视频。该项目为视频剪辑mcp提供了一个新的研究方向,它使用python脚本来分析和处理视频,同时你可以编辑自己设定的模版进行一键创作。
开源:https://github.com/LumingMelody/Ai-movie-clip
功能特性
- 🎬 视频自动分析:使用CV和ML模型分析视频内容
- 🎨 多样化模板:支持多种视频风格模板(社交媒体、商业、教育等)
- 🤖 AI内容生成:集成文本生成、图像生成和语音合成
- 🎭 特效和转场:丰富的视频效果和转场动画
- 🚀 API服务:提供FastAPI接口,支持批处理
- 🔌 MCP集成:支持Model Context Protocol扩展
快速开始
环境要求
- Python 3.8+
- FFmpeg(用于视频处理)
- CUDA(可选,用于GPU加速)
安装步骤
1. 克隆项目
git clone https://github.com/LumingMelody/Ai-movie-clip.git
cd Ai-movie-clip
1. 安装依赖
pip install -r requirements.txt
1. 配置环境变量
复制环境变量模板并填写您的配置:
cp .env.example .env
编辑 .env 文件,填入您的API密钥:…
📡发布:https://noisevip.cn/18777.html
🪧关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
📢导航站收录更新通知!
#AI·视频 #AI新时代
站点名称: Veo3 AI视频生成器
描述: Veo3 AI视频生成器,基于Google DeepMind技术,提供专业级视频创作,支持文本转视频、音频合成与唇语同步。
链接: https://www.veo-3.art/zh
前往导航: www.noisedh.cn 或 www.noisedh.link
#AI·视频 #AI新时代
站点名称: Veo3 AI视频生成器
描述: Veo3 AI视频生成器,基于Google DeepMind技术,提供专业级视频创作,支持文本转视频、音频合成与唇语同步。
链接: https://www.veo-3.art/zh
前往导航: www.noisedh.cn 或 www.noisedh.link
#AI语音 这是一个基于硅基流动 API 的文本转语音转换工具,提供了简洁直观的图形用户界面,支持实时文本转语音和音频播放控制。
https://github.com/axdlee/text2voice
https://github.com/axdlee/text2voice
#AI 一个完全本地运行的开源语音转文本 API,该项目基于 OpenAI 的 Whisper 模型,并利用 FastAPI 的异步特性对其进行高效包装,支持异步任务队列,文件处理,网络爬虫,以及更多自定义功能。
https://github.com/Evil0ctal/Whisper-Speech-to-Text-API
https://github.com/Evil0ctal/Whisper-Speech-to-Text-API
#AI
智能视频多语言AI配音/翻译工具 – Linly-Dubbing
介绍
Linly-Dubbing 是一个智能视频多语言AI配音和翻译工具,它融合了YouDub-webui的灵感,并在此基础上进行了拓展和优化。我们致力于提供更加多样化和高质量的配音选择,通过集成Linly-Talker的数字人对口型技术,为用户带来更加自然的多语言视频体验。
Github:https://github.com/Kedreamix/Linly-Dubbing
通过整合最新的AI技术,Linly-Dubbing 在多语言配音的自然性和准确性方面达到了新的高度,适用于国际教育、全球娱乐内容本地化等多种场景,帮助团队将优质内容传播到全球各地。
主要特点包括:
- 多语言支持: 支持中文及多种其他语言的配音和字幕翻译,满足国际化需求。
- AI 智能语音识别: 使用先进的AI技术进行语音识别,提供精确的语音到文本转换和说话者识别。
- 大型语言模型翻译: 结合领先的本地化大型语言模型(如GPT),快速且准确地进行翻译,确保专业性和自然性。
- AI 声音克隆: 利用尖端的声音克隆技术,生成与原视频配音高度相似的语音,保持情感和语调的连贯性。
- 数字人对口型技术: 通过对口型技术,使配音与视频画面高度契合,提升真实性和互动性。
- 灵活上传与翻译: 用户可以上传视频,自主选择翻译语言和标准,确保个性化和灵活性。
- 定期更新: 持续引入最新模型,保持配音和翻译的领先地位。
我们旨在为用户提供无缝、高质量的多语言视频配音和翻译服务,为内容创作者和企业在全球市场中提供有力支持。
-------------
TO DO LIST
- 完成AI配音和智能翻译功能的基础实现
- 集成CosyVoice的AI声音克隆算法,实现高质量音频翻译
- 增加FunASR的AI语音识别算法,特别优化对中文的支持
-…
📡发布:https://noisevip.cn/18506.html
🪧关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
智能视频多语言AI配音/翻译工具 – Linly-Dubbing
介绍
Linly-Dubbing 是一个智能视频多语言AI配音和翻译工具,它融合了YouDub-webui的灵感,并在此基础上进行了拓展和优化。我们致力于提供更加多样化和高质量的配音选择,通过集成Linly-Talker的数字人对口型技术,为用户带来更加自然的多语言视频体验。
Github:https://github.com/Kedreamix/Linly-Dubbing
通过整合最新的AI技术,Linly-Dubbing 在多语言配音的自然性和准确性方面达到了新的高度,适用于国际教育、全球娱乐内容本地化等多种场景,帮助团队将优质内容传播到全球各地。
主要特点包括:
- 多语言支持: 支持中文及多种其他语言的配音和字幕翻译,满足国际化需求。
- AI 智能语音识别: 使用先进的AI技术进行语音识别,提供精确的语音到文本转换和说话者识别。
- 大型语言模型翻译: 结合领先的本地化大型语言模型(如GPT),快速且准确地进行翻译,确保专业性和自然性。
- AI 声音克隆: 利用尖端的声音克隆技术,生成与原视频配音高度相似的语音,保持情感和语调的连贯性。
- 数字人对口型技术: 通过对口型技术,使配音与视频画面高度契合,提升真实性和互动性。
- 灵活上传与翻译: 用户可以上传视频,自主选择翻译语言和标准,确保个性化和灵活性。
- 定期更新: 持续引入最新模型,保持配音和翻译的领先地位。
我们旨在为用户提供无缝、高质量的多语言视频配音和翻译服务,为内容创作者和企业在全球市场中提供有力支持。
-------------
TO DO LIST
- 完成AI配音和智能翻译功能的基础实现
- 集成CosyVoice的AI声音克隆算法,实现高质量音频翻译
- 增加FunASR的AI语音识别算法,特别优化对中文的支持
-…
📡发布:https://noisevip.cn/18506.html
🪧关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
#AI ⚡ Edgen:OpenAI 的本地私有 GenAI 服务器替代品。无需 GPU。在本地运行 AI 模型:LLM(Llama2、Mistral、Mixtral...)、语音转文本(耳语)等等
https://github.com/edgenai/edgen
https://github.com/edgenai/edgen
#AI语音
简单强大的CV声音克隆工具
介绍
这是一个声音克隆工具,可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。
使用非常简单,没有N卡GPU也可以使用,下载预编译版本,双击 app.exe 打开一个web界面,鼠标点点就能用。
支持 中文、英文、日语、韩语 4种语言,可在线从麦克风录制声音。
为保证合成效果,建议录制时长5秒到20秒,发音清晰准确,不要存在背景噪声。
英文效果很棒,中文效果还凑合。
项目地址:https://github.com/jianchang512/clone-voice
视频演示:https://nftstorage.link/ipfs/bafybeidk2semsomdo6m23ik6b7ktzpth6wsb72zd4wwuzksue57ys633wy
使用方法
1. 右侧[Releases]https://github.com/jianchang512/clone-voice/releases中下载预编译版,适用于window 10/11(已含文字到语音模型,语音到语音模型需单独下载),Mac下请拉取源码自行编译
2. 下载后解压到某处,比如 E:/clone-voice 下
3. 双击 start.bat ,等待自动打开web窗口,如下
4. 转换操作步骤
◦ 在文本框中输入文字、或导入srt文件,或者选择“声音->声音”,选择要转换的声音wav格式文件
◦ 然后从“要使用的声音wav文件”下拉框中选择要用的声音,如果没有满意的,也可以点击“本地上传”按钮,选择已录制好的5-20s的wav声音文件。或者点击“开始录制”按钮,在线录制你自己的声音5-20s,录制完成点击使用
◦ 点击“立即开始生成”按钮,耐心等待完成。
5.…
📡发布:https://noisevip.cn/17427.html
📢关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
简单强大的CV声音克隆工具
介绍
这是一个声音克隆工具,可使用任何人类音色,将一段文字合成为使用该音色说话的声音,或者将一个声音使用该音色转换为另一个声音。
使用非常简单,没有N卡GPU也可以使用,下载预编译版本,双击 app.exe 打开一个web界面,鼠标点点就能用。
支持 中文、英文、日语、韩语 4种语言,可在线从麦克风录制声音。
为保证合成效果,建议录制时长5秒到20秒,发音清晰准确,不要存在背景噪声。
英文效果很棒,中文效果还凑合。
项目地址:https://github.com/jianchang512/clone-voice
视频演示:https://nftstorage.link/ipfs/bafybeidk2semsomdo6m23ik6b7ktzpth6wsb72zd4wwuzksue57ys633wy
使用方法
1. 右侧[Releases]https://github.com/jianchang512/clone-voice/releases中下载预编译版,适用于window 10/11(已含文字到语音模型,语音到语音模型需单独下载),Mac下请拉取源码自行编译
2. 下载后解压到某处,比如 E:/clone-voice 下
3. 双击 start.bat ,等待自动打开web窗口,如下
4. 转换操作步骤
◦ 在文本框中输入文字、或导入srt文件,或者选择“声音->声音”,选择要转换的声音wav格式文件
◦ 然后从“要使用的声音wav文件”下拉框中选择要用的声音,如果没有满意的,也可以点击“本地上传”按钮,选择已录制好的5-20s的wav声音文件。或者点击“开始录制”按钮,在线录制你自己的声音5-20s,录制完成点击使用
◦ 点击“立即开始生成”按钮,耐心等待完成。
5.…
📡发布:https://noisevip.cn/17427.html
📢关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
#AI
YouDub-优质视频中文化工具
简介
YouDub 是一个创新的开源工具,专注于将 YouTube 等平台的优质视频翻译和配音为中文版本。此工具融合了先进的 AI 技术,包括语音识别、大型语言模型翻译以及 AI 声音克隆技术,为中文用户提供具有原始 YouTuber 音色的中文配音视频。
项目地址:https://github.com/liuzhao1225/YouDub
主要特点
- AI 语音识别:有效转换视频中的语音为文字。
- 大型语言模型翻译:快速且精准地将文本翻译成中文。
- AI 声音克隆:生成与原视频配音相似的中文语音。
- 视频处理:集成的功能实现音视频的同步处理。
安装与使用指南
1. 克隆仓库
:
git clone https://github.com/liuzhao1225/YouDub.git
2. 安装依赖
: 进入
YouDub
目录并安装所需依赖:
cd YouDub
pip install -r requirements.txt
3. 运行程序
: 使用以下命令启动主程序:
python main.py
使用步骤
- 准备需要翻译的视频文件并放置于输入文件夹。
- 指定输出文件夹以接收处理后的视频。
- 系统将自动进行语音识别、翻译、声音克隆和视频处理。…
📡发布:https://noisevip.cn/17431.html
📢关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
YouDub-优质视频中文化工具
简介
YouDub 是一个创新的开源工具,专注于将 YouTube 等平台的优质视频翻译和配音为中文版本。此工具融合了先进的 AI 技术,包括语音识别、大型语言模型翻译以及 AI 声音克隆技术,为中文用户提供具有原始 YouTuber 音色的中文配音视频。
项目地址:https://github.com/liuzhao1225/YouDub
主要特点
- AI 语音识别:有效转换视频中的语音为文字。
- 大型语言模型翻译:快速且精准地将文本翻译成中文。
- AI 声音克隆:生成与原视频配音相似的中文语音。
- 视频处理:集成的功能实现音视频的同步处理。
安装与使用指南
1. 克隆仓库
:
git clone https://github.com/liuzhao1225/YouDub.git
2. 安装依赖
: 进入
YouDub
目录并安装所需依赖:
cd YouDub
pip install -r requirements.txt
3. 运行程序
: 使用以下命令启动主程序:
python main.py
使用步骤
- 准备需要翻译的视频文件并放置于输入文件夹。
- 指定输出文件夹以接收处理后的视频。
- 系统将自动进行语音识别、翻译、声音克隆和视频处理。…
📡发布:https://noisevip.cn/17431.html
📢关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
#AI
VALL-E X-轻便快速且强大的AI声音克隆
介绍
VALL-E X 只需 3 秒注册录音即可合成高质量的个性化语音 一个看不见的说话者作为声学提示,即使是另一种语言的单语说话者。 此实现支持三种语言(英语、中文、日语)的零镜头、单语言/跨语言文本到语音转换功能
GitHub:https://github.com/Plachtaa/VALL-E-X
演示页面:https://plachtaa.github.io/
特征
1. 多语言TTS:用三种语言 – 英语,中文和日语 – 自然和富有表现力的语音合成。
2. 零镜头语音克隆:注册一个看不见的演讲者的短短 3~10 秒录音,并观看 VALL-E X 创建听起来像他们的个性化、高质量的语音!
使用
必备环境: python3.10、git、FFmpeg6.0
安装
git clone https://github.com/Plachtaa/VALL-E-X.git
cd VALL-E-X python -m venv venv call venvscriptsactivate.bat
pip install -r requirements.txt
运行 python -X utf8 launch-ui.py
首次运行程序时,它会自动下载相应的模型。
如果下载失败并报告错误,请按照以下步骤手动下载模型。
(请注意文件夹的大小写)
1. 检查安装目录中是否有文件夹。 如果没有,请在安装目录中手动创建一个文件夹 ()。checkpoints``checkpoints``./checkpoints/…
📡发布:https://noisevip.cn/17341.html
📢关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
VALL-E X-轻便快速且强大的AI声音克隆
介绍
VALL-E X 只需 3 秒注册录音即可合成高质量的个性化语音 一个看不见的说话者作为声学提示,即使是另一种语言的单语说话者。 此实现支持三种语言(英语、中文、日语)的零镜头、单语言/跨语言文本到语音转换功能
GitHub:https://github.com/Plachtaa/VALL-E-X
演示页面:https://plachtaa.github.io/
特征
1. 多语言TTS:用三种语言 – 英语,中文和日语 – 自然和富有表现力的语音合成。
2. 零镜头语音克隆:注册一个看不见的演讲者的短短 3~10 秒录音,并观看 VALL-E X 创建听起来像他们的个性化、高质量的语音!
使用
必备环境: python3.10、git、FFmpeg6.0
安装
git clone https://github.com/Plachtaa/VALL-E-X.git
cd VALL-E-X python -m venv venv call venvscriptsactivate.bat
pip install -r requirements.txt
运行 python -X utf8 launch-ui.py
首次运行程序时,它会自动下载相应的模型。
如果下载失败并报告错误,请按照以下步骤手动下载模型。
(请注意文件夹的大小写)
1. 检查安装目录中是否有文件夹。 如果没有,请在安装目录中手动创建一个文件夹 ()。checkpoints``checkpoints``./checkpoints/…
📡发布:https://noisevip.cn/17341.html
📢关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
#AI
智能AI视频创作神器:一帧秒创
前言:关于一帧秒创我以前介绍过,只不过当时的模式只有AI视频方向,现在它得到了进一步成长,可以再来了解下
介绍
一帧秒创是基于秒创AIGC引擎的智能AI内容创作平台,为200万+创作者提供包括文字续写、文字转语音、文生图、图文转视频、AI成片、数字人播报等创作服务,产品包括秒创数字人、秒创AI帮写、秒创图文转视频、秒创AI视频、秒创AI语音、秒创AI作画等。
官网链接:https://aigc.yizhentv.com/?_f=nobaibao
功能
1、 秒创数字人
智能数字人播报平台,输入文案,一键生成“真人”营销视频。AI数字人是以数字孪生等AI技术为基础,1:1还原真人形象、动作、神态、声音,无限逼近真人的数字分身。甚至还可以1:1还原真人形象+1:1还原真人音色,定制专属于您的数字人形象和声音,帮助您快速完成企业和个人IP打造,助力营销增长。
2、 秒创图文转视频
作为国内领先的智能内容创作平台,输入文案,智能匹配,AI将根据语意自动匹配画面,快速实现从文案到视频的制作,实现全自动文章转视频、图文转视频。画面匹配、智能配音、智能字幕等功能,AI都能完美实现。高效产出内容的同时,支持非常灵活的细节调整,文稿、音乐、配音、粗剪、LOGO、字幕、语速等功能,一应俱全。海量在线素材,可任意替换选择,一键图文成片。
3、 秒创AI帮写
智能文案写作平台,输入灵感,文思泉涌,出“手”成章。一帧秒创提供短视频、营销、直播、风格文案4大类型AI帮写模板,全方位满足用户需求,甚至能直接输出直播脚本,大大提升运营和主播同学的效率。短视频内容、营销文案,秒创AI帮写统统都能帮你搞定。
4、 秒创AI作画…
📡发布:https://noisevip.cn/17103.html
📢关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
智能AI视频创作神器:一帧秒创
前言:关于一帧秒创我以前介绍过,只不过当时的模式只有AI视频方向,现在它得到了进一步成长,可以再来了解下
介绍
一帧秒创是基于秒创AIGC引擎的智能AI内容创作平台,为200万+创作者提供包括文字续写、文字转语音、文生图、图文转视频、AI成片、数字人播报等创作服务,产品包括秒创数字人、秒创AI帮写、秒创图文转视频、秒创AI视频、秒创AI语音、秒创AI作画等。
官网链接:https://aigc.yizhentv.com/?_f=nobaibao
功能
1、 秒创数字人
智能数字人播报平台,输入文案,一键生成“真人”营销视频。AI数字人是以数字孪生等AI技术为基础,1:1还原真人形象、动作、神态、声音,无限逼近真人的数字分身。甚至还可以1:1还原真人形象+1:1还原真人音色,定制专属于您的数字人形象和声音,帮助您快速完成企业和个人IP打造,助力营销增长。
2、 秒创图文转视频
作为国内领先的智能内容创作平台,输入文案,智能匹配,AI将根据语意自动匹配画面,快速实现从文案到视频的制作,实现全自动文章转视频、图文转视频。画面匹配、智能配音、智能字幕等功能,AI都能完美实现。高效产出内容的同时,支持非常灵活的细节调整,文稿、音乐、配音、粗剪、LOGO、字幕、语速等功能,一应俱全。海量在线素材,可任意替换选择,一键图文成片。
3、 秒创AI帮写
智能文案写作平台,输入灵感,文思泉涌,出“手”成章。一帧秒创提供短视频、营销、直播、风格文案4大类型AI帮写模板,全方位满足用户需求,甚至能直接输出直播脚本,大大提升运营和主播同学的效率。短视频内容、营销文案,秒创AI帮写统统都能帮你搞定。
4、 秒创AI作画…
📡发布:https://noisevip.cn/17103.html
📢关注频道:@quanshoulu
💬频道社群:https://www.noisework.cn/qun/
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
#AI #开源 #直播 #虚拟主播
GPT-vup BIliBili | 抖音 | AI | 虚拟主播
一个开源新项目用于BiliBili和抖音直播,基于生产者-消费者模型设计
使用了openai嵌入、GPT3.5 api,
项目访问地址:https://github.com/jiran214/GPT-vup
功能
- 基本功能,回答弹幕和SC、欢迎入场观众、感谢礼物
◦ speech:监听ctrl+t热键,输入语音转为文本和ai数字人交互
◦ action:根据观众的行为匹配对应人物动作
◦ schedule:隔一段时间触发某一事件,讲故事、唱rap…
◦ context:给问题补充上下文
B站直播
- 安装依赖库:>>pip install bilibili-api-python
- config.ini 的 room -> id 更改为自己的房间号,可以先随便找个
- src目录下运行:>>python manager.py run bilibili
抖音直播
- 参考 抖音弹幕抓取数据推送: 基于系统代理抓包打造的抖音弹幕服务推送程序
- 启动该项目
- 打开web或者桌面端抖音正在直播的直播间,数据开始抓取
- src目录下运行:>>python manager.py run douyin
Vtube Studio 安装及配置
- 在steam下载Vtube Studio软件
- 教程:https://www.bilibili.com/video/BV1nV4y1X7yJ?t=426.7
-…
📡发布:https://noisevip.cn/16756.html
📢关注频道:@quanshoulu
💬留言讨论:@Efficiencyfollow
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
GPT-vup BIliBili | 抖音 | AI | 虚拟主播
一个开源新项目用于BiliBili和抖音直播,基于生产者-消费者模型设计
使用了openai嵌入、GPT3.5 api,
项目访问地址:https://github.com/jiran214/GPT-vup
功能
- 基本功能,回答弹幕和SC、欢迎入场观众、感谢礼物
◦ speech:监听ctrl+t热键,输入语音转为文本和ai数字人交互
◦ action:根据观众的行为匹配对应人物动作
◦ schedule:隔一段时间触发某一事件,讲故事、唱rap…
◦ context:给问题补充上下文
B站直播
- 安装依赖库:>>pip install bilibili-api-python
- config.ini 的 room -> id 更改为自己的房间号,可以先随便找个
- src目录下运行:>>python manager.py run bilibili
抖音直播
- 参考 抖音弹幕抓取数据推送: 基于系统代理抓包打造的抖音弹幕服务推送程序
- 启动该项目
- 打开web或者桌面端抖音正在直播的直播间,数据开始抓取
- src目录下运行:>>python manager.py run douyin
Vtube Studio 安装及配置
- 在steam下载Vtube Studio软件
- 教程:https://www.bilibili.com/video/BV1nV4y1X7yJ?t=426.7
-…
📡发布:https://noisevip.cn/16756.html
📢关注频道:@quanshoulu
💬留言讨论:@Efficiencyfollow
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
#AI文本转语音
AI文本到语音play.ht
Play.ht使用AI技术支持文本语音转换、语音克隆、快速剪辑、API接口调用
支持不同语音声音,支持中文
访问:https://play.ht
📡发布:https://noisevip.cn/16418.html
📢关注频道:@quanshoulu
💬留言讨论:@Efficiencyfollow
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
AI文本到语音play.ht
Play.ht使用AI技术支持文本语音转换、语音克隆、快速剪辑、API接口调用
支持不同语音声音,支持中文
访问:https://play.ht
📡发布:https://noisevip.cn/16418.html
📢关注频道:@quanshoulu
💬留言讨论:@Efficiencyfollow
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
#AI #工具 #软件
基于ChatGPT3.5的字幕总结去水软件
用于视频内容总结,文案优化,快速提取视频重点,提高学习和工作效率
优势
无需配置环境,工程中包含了所有依赖,不依赖torch
whisper音频转文字自动调用GPU运算,2小时音频约15分钟转换完成
离线AI ASR服务,白嫖语音转文本,且支持超长音频输入
包含全链路工具,对无字幕视频可使用工具生成字幕
精心调试的prompt,保证chatgpt回复达到预期
编译文件仅5M。模型自动下载,不强制下载到c盘
使用方法
可在本工程dist目录中,下载预编译程序
设置标签页中填写openai的apikey和代理,代理支持http及socks
工具使用
依赖
编程语言aardio
openai
https://github.com/Const-me/Whisper
开源:https://github.com/xuncv/ChatSubtitle
下载:https://noise.lanzoul.com/id5pN0rwxp4h
📡发布:https://noisevip.cn/16117.html
📢关注频道:@quanshoulu
💬留言讨论:@Efficiencyfollow
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
基于ChatGPT3.5的字幕总结去水软件
用于视频内容总结,文案优化,快速提取视频重点,提高学习和工作效率
优势
无需配置环境,工程中包含了所有依赖,不依赖torch
whisper音频转文字自动调用GPU运算,2小时音频约15分钟转换完成
离线AI ASR服务,白嫖语音转文本,且支持超长音频输入
包含全链路工具,对无字幕视频可使用工具生成字幕
精心调试的prompt,保证chatgpt回复达到预期
编译文件仅5M。模型自动下载,不强制下载到c盘
使用方法
可在本工程dist目录中,下载预编译程序
设置标签页中填写openai的apikey和代理,代理支持http及socks
工具使用
依赖
编程语言aardio
openai
https://github.com/Const-me/Whisper
开源:https://github.com/xuncv/ChatSubtitle
下载:https://noise.lanzoul.com/id5pN0rwxp4h
📡发布:https://noisevip.cn/16117.html
📢关注频道:@quanshoulu
💬留言讨论:@Efficiencyfollow
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
#AI #colab
使用 AI 🔊 克隆任何声音
深度伪造的语音是通过使用文本到语音转换模型从文本生成语音来创建的。训练模型后,它可用于生成具有任何语音的语音。通常这样的模型分为语音编码器,合成器和声码器。语音编码器学习创建潜在的固定维度嵌入(矢量),以捕获特定人声的各种特征。合成器学习从特定声音的文本脚本创建 mel 频谱图。声码器从 mel 频谱图生成音频波形
这些代码通过colab运行,在运行界面我们能看到作者已为我们编译和写了代码释意
通过理解释意,简单的来说就是通过采样【我们已上传的声音】来训练加强模型,使用时注意请先拷贝到自己的空间再点击运行
使用地址:https://colab.research.google.com/drive/1NxiY3zHN4Nd8J3YAqFsbYaOB71IiLE04
来自youtuber Martin Thissen的教程:https://www.youtube.com/watch?v=Kfr_FZof_hs
📡发布:https://noisevip.cn/15371.html
📢关注频道:@quanshoulu
💬留言讨论:@Efficiencyfollow
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn
使用 AI 🔊 克隆任何声音
深度伪造的语音是通过使用文本到语音转换模型从文本生成语音来创建的。训练模型后,它可用于生成具有任何语音的语音。通常这样的模型分为语音编码器,合成器和声码器。语音编码器学习创建潜在的固定维度嵌入(矢量),以捕获特定人声的各种特征。合成器学习从特定声音的文本脚本创建 mel 频谱图。声码器从 mel 频谱图生成音频波形
这些代码通过colab运行,在运行界面我们能看到作者已为我们编译和写了代码释意
通过理解释意,简单的来说就是通过采样【我们已上传的声音】来训练加强模型,使用时注意请先拷贝到自己的空间再点击运行
使用地址:https://colab.research.google.com/drive/1NxiY3zHN4Nd8J3YAqFsbYaOB71IiLE04
来自youtuber Martin Thissen的教程:https://www.youtube.com/watch?v=Kfr_FZof_hs
📡发布:https://noisevip.cn/15371.html
📢关注频道:@quanshoulu
💬留言讨论:@Efficiencyfollow
📬投稿bot:@noisewowbot
📇搜索bot:@Efficiencysearchbot
🎁访问主页: www.noisework.cn