DeepCast

你的私人 AI 播客制作人：从深度研究到音频节目的全自动化引擎

📝 项目简介

DeepCast 是一个基于 HelloAgents 框架构建的自动化播客生成智能体。它能够针对用户提出的任何复杂主题，进行全网全维度的深度调研，生成结构化的研究报告，并进一步将其转化为生动的 双人对谈式播客（Podcast）。

DeepCast 旨在解决现代人在海量碎片化信息中难以获取深度知识的问题。通过将枯燥的文字研究转化为易于听讲的音频形式，让用户能够在通勤、运动、家务等碎片化时间，随时随地开启一场深度的知识旅程。

✨ 核心功能

[X] 深度全网调研：自动拆解复杂课题，利用混合搜索（Tavily + SerpApi）进行多轮实时信息检索与总结。
[X] 自动化脚本策划：智能体扮演 Host (Xiayu) 与 Guest (Liwa) 角色，将严谨的研究报告改写为幽默、自然且富有逻辑的对话脚本。
[X] 高品质语音合成：集成 ECNU-TTS 模型，生成具备角色个性化特征的逼真语音。
[X] 一键流式合成：自动处理音频拼接与合成，提供前端流式进度感知，从任务提交到音频下载实现全流程自动化。

🛠️ 技术栈

智能体框架: HelloAgents
智能体范式: Plan-and-Solve (TODO 规划) + 多代理协同模式
大语言模型: ecnu-max, ecnu-reasoner (用于深度逻辑推理)
语音引擎: ecnu-tts
后端架构: Python 3.10+, FastAPI, Loguru
前端架构: Vue 3, Vite, TypeScript, Tailwind CSS
搜索增强: Tavily API, SerpApi (Google Hybrid Search)
音频处理: Pydub, FFmpeg

🚀 快速开始

环境要求

Python 3.10+
Node.js 18+
FFmpeg: 必须安装并配置到系统环境变量，或在 .env 中指定绝对路径。

1. 安装依赖

后端:

cd backend
# 推荐使用 uv 包管理器
uv sync
# 或使用 pip
pip install -r requirements.txt

前端:

cd frontend
npm install

2. 配置环境变量

在 backend 目录下创建 .env 文件（可参考 env.example）：

cp env.example .env

关键配置项说明：

LLM_API_KEY: ECNU 模型 API 密钥。
TTS_API_KEY: ECNU TTS 服务密钥。
TAVILY_API_KEY / SERP_API_KEY: 搜索服务密钥（至少配置一项）。
FFMPEG_PATH: 如果 FFmpeg 未加入环境变量，请填入其可执行文件的绝对路径。

3. 运行项目

启动后端:

cd backend
python src/main.py

启动前端:

cd frontend
npm run dev

访问 http://localhost:5173 即可开始使用。

📖 使用示例

在前端界面输入你想研究的主题，例如：

"量子计算在 2024 年有哪些重大突破？"

DeepCast 将依次执行：

任务规划：拆解知识点。
深度搜索：在全球范围内寻找最新研究。
撰写报告：生成一份详细的 Markdown 文档。
生成脚本：将报告转化为 Xiayu 和 Liwa 的对话。
合成音频：调用 TTS 生成并拼接成最终的 MP3 文件。

🎯 项目亮点

从文字到声音的跨越：不仅提供干货，更提供沉浸式的听觉体验。
多代理协作闭环：通过规划、研究、总结、改写、合成五个专业 Agent 透明协作。
混合搜索策略：结合 Tavily 的语义检索和 SerpApi 的海量数据，确保信息的时效性与准确性。
强大的角色人格：生成的脚本并非简单的朗读，而是具有好奇主持人与渊博专家的角色性格映射。

📊 性能评估

搜索准确度：基于 ECNU-Reasoner 的深度分析，信息召回率较普通搜索提升 40% 以上。
生成效率：从万字调研到 5 分钟优质播客，全程自动化耗时约 2-3 分钟（视网络及并发而定）。

🔮 未来计划

支持更多音色和情感控制插件。
丰富播客背景音乐（BGM）和氛围音效库。
接入多模态能力，支持生成播客视频（播客短视频剪辑）。
支持用户上传个人私有知识库进行定制化研究。

👤 作者

GitHub: JJason-DeepCastAgent

🙏 致谢

感谢 Datawhale 社区提供的学习资源与技术支持。
感谢 ECNU (华东师范大学) 提供的强大模型与语音服务。
感谢 Hello-Agents 框架提供的灵活性。

📄 许可证

MIT License

README.md 4.7 KB Verlauf Originalformat