|
|
3 ヶ月 前 | |
|---|---|---|
| .. | ||
| data | 3 ヶ月 前 | |
| images | 3 ヶ月 前 | |
| src | 3 ヶ月 前 | |
| .env.example | 3 ヶ月 前 | |
| .gitignore | 3 ヶ月 前 | |
| README.md | 3 ヶ月 前 | |
| main.ipynb | 3 ヶ月 前 | |
| requirements.txt | 3 ヶ月 前 | |
一个面向科研场景的智能数据分析 Agent,支持表格分析与 PDF 文献中的主表提取分析。
Academic-Data-Agent 是一个基于 Hello-Agents 思路构建的科研数据分析工作台。它把数据接入、分析执行、报告生成和审稿治理串成了一条完整工作流,既能处理 csv / xls / xlsx 结构化表格,也能处理文本型 PDF 文献。
对于 PDF 输入,项目并不是简单抽一张表就结束,而是采用“主表 + 文献背景 + 候选表摘要”的综合模式:
当前社区版是一个精简演示包,目标是便于在 Hello-Agents 社区中快速复现核心能力;完整版仓库保留了 Gradio 工作台、历史记录浏览和更完整的工程能力:
csv / xls / xlsxdraft / standard / publicationpip install -r requirements.txt
cp .env.example .env
然后编辑 .env,至少填入以下项目:
LLM_MODEL_ID=your_model_id
LLM_BASE_URL=https://your-openai-compatible-endpoint/v1
LLM_API_KEY=your_api_key
如果需要联网背景检索或视觉审稿,也可以继续补充:
TAVILY_API_KEY=your_tavily_api_key
VISION_LLM_MODEL_ID=your_vision_model
VISION_LLM_BASE_URL=https://your-vision-endpoint/v1
VISION_LLM_API_KEY=your_vision_api_key
jupyter lab
打开 main.ipynb,按顺序运行即可。
本项目在 Notebook 中内置了两段演示:
演示默认使用轻量配置:
quality_mode="draft"latency_mode="auto"这样更适合社区评审快速复现。
虽然本次提交以 Notebook 为主,但完整版项目还提供了 Gradio 工作台。下面保留三张界面截图供展示:


当前完整版仓库已经具备较完整的自动化测试覆盖,核心链路包括:
本社区版默认采用轻量演示参数,重点关注可复现性和工作流完整性,而不是追求极限性能。
欢迎提出 Issue 和 Pull Request。
如果你想体验完整工程版,建议直接访问完整版仓库。
MIT License
感谢 Datawhale 社区和 Hello-Agents 项目提供的学习与共创机会。