搞学术的人看过来!
西湖大学做了个自动把学术论文转PPT的Agent。
前两天发了字节哈工大港大做的自动论文宣发Agent
今天就看到朋友分享的另一个工作
来自西湖大学的研究员们发布了Auto-Slides
这是一个用于创建和定制学术PPT的交互式多智能体系统
可以将研究论文转换为具有教学结构的、多模态的幻灯片(例如图表和表格)。
并且它不是简单的由LLM来设计,而是根据认知科学,来创建以演示为导向的叙述。
并通过交互式编辑器进行迭代优化,以匹配学习者的知识水平和目标。
与之前的AutoPR类似,Auto-Sildes也分为三个步骤生成(图2️⃣
1️⃣内容理解和结构化,其中解析器和规划器Agent分析源材料,以 JSON 格式设计幻灯片结构,指定每张幻灯片的内容、图表和表格。
2️⃣质量保证和优化,其中验证器和调整器Agent确保内容的真实性和完整性。
3️⃣生成和交互优化,其中生成器Agent以 LaTeX 代码格式生成最终演示文稿,编辑器Agent通过自然语言对话来完成人工参与修订。
为了评估该系统的效果,作者们使用人工和LLM进行了双重评估。
结果显示,使用Auto-Slides生成的PPT在人工和LLM评估中均优于直接使用LLM生成的PPT(图3️⃣和4️⃣
显著提高了学习者(听众)的理解和参与度。
其实我觉得这个项目潜力很大,特别是基于认知科学来进行讲解/叙述。
当然作者也承认,目前Auto-Sildes尚未整合动态或交互式媒体,如嵌入的视频、动画、交互式图表或可执行代码块。
希望在后续工作中能整合这些能力~
项目主页:
auto-slides.github.ioGithub:
github.comPaper:
arxiv.org