给 AI 论文助手做了两次「大脑手术」:从单打独斗到专家团队
做学术论文 AI 产品快一年了,最近连续完成了两个核心模块的架构升级——论文打磨模块和数据分析模块。分享一下思路。
Part 1:论文打磨模块
在 CoPaper.AI 里,论文初稿生成完成后会进入「论文打磨模式」——你可以通过对话让 AI 改论证、调结构、跑回归、润色文字、回复审稿意见。简单说,从初稿到终稿之间所有的迭代修改,都在这里完成。
之前的问题:一个 AI 干所有活
最早的设计是一个 AI 助手负责所有论文修改任务——改内容、调结构、跑回归、润文字、回审稿意见……二十多个工具全塞给一个 Agent。
结果就是:
- 它经常选错工具(你让它改图表,它去改了段落)
- 每次调用都要处理巨长的上下文
- 想加新功能就更臃肿
升级思路:一个调度中心 + 多个专家代理
借鉴了多代理协作的学术前沿思路,把一个「全能但平庸」的 Agent 拆成了一个调度中心 + 多个专业代理。每个代理只负责一类任务——有的专门改内容,有的专门调结构,有的专门处理实证分析,有的专门润色格式……各司其职。
核心设计理念
1. 上下文隔离
每个专家代理只加载与自己任务相关的信息。处理数据分析的代理不需要看文献综述,处理格式的代理不需要看代码。这样每次 AI 调用的 token 消耗大幅降低。
2. 模型分层
需要深度推理的任务用强模型,模式化任务用轻量模型。不同的任务匹配不同的模型,成本和质量的最优平衡。
3. 专属能力解锁
拆分后每个专家可以拥有自己的专属工具和能力——比如精细化的代码局部编辑、跨章节内容移动等。这些在单体架构下很难实现。
4. 适度修改原则
AI 修改的幅度应与用户请求的范围成正比。用户让你改一个段落,你就只改那个段落,不要顺手把全文都重写了。防止 AI「过度热心」。
效果
- 任务路由准确率明显提升
- 单次调用的上下文大幅减少
- 解锁了一批之前做不到的精细化功能
- 新旧架构可以平滑切换,零风险上线
对论文打磨意味着什么
论文从初稿到最终定稿,中间要经历大量反复修改——审稿人让你补一个稳健性检验,导师觉得第三章论证不够有力,你自己发现摘要和正文的数字对不上……这些修改类型完全不同,但以前全靠一个 Agent「猜」你想干什么。
升级后,打磨体验变了:你说「换一种回归方法」,负责实证的代理直接改代码跑分析、更新图表,不会误碰你刚润色好的文字;你说「适配某某期刊格式」,负责格式的代理只动排版和措辞,不会改你的模型设定。每个代理各司其职,修改精准且可预期。
对于做实证研究的同学来说,论文打磨往往比初稿更耗时间。这次架构升级,就是让 AI 在「改论文」这件事上,从一个手忙脚乱的实习生,变成一个配合默契的专家团队。
Part 2:数据分析模块
在 CoPaper.AI 里,你上传数据后就进入「数据分析模式」——这里的 AI 可以帮你做数据清洗、跑回归、画图表,甚至直接帮你写论文。从一个只能做简单数据清洗的工具,到现在能独立完成「数据 → 分析 → 论文」全流程,这个模块经历了一次脱胎换骨的进化。
进化之路:从「数据清洗工具」到「全能研究搭档」
这个模块的升级不是一步到位的,而是经历了渐进式的进化:
第一阶段:数据清洗工具
最初只是一个简单的数据预处理工具——上传数据、做简单清洗、导出结果。跑完清洗就完了。
第二阶段:实证分析平台
后来意识到,用户上传数据不只是为了「洗数据」,更想直接做实证分析。于是大幅扩展了统计分析能力,支持了多种主流的计量经济学方法和高级建模技术,同时加入了可视化输出和多数据集管理。
这个模块也从「数据清洗工具」正式更名,定位为一个完整的实证分析平台。
第三阶段:论文写作能力
这是最大的一次飞跃——不再只是「跑完模型给你看结果」,而是可以直接帮你把分析结果写成论文。AI 可以根据数据和分析结果自动生成论文大纲,然后分节撰写,分析代码和论文章节自动关联,最终可以导出为标准的文档格式。
整个体验变成了:上传数据 → 探索分析 → 生成大纲 → 逐节写作 → 导出论文,一站式完成。
第四阶段:多代理架构
功能越来越多,工具越来越多——于是遇到了和打磨模块一样的问题:单体 Agent 不堪重负。
同样引入了调度中心 + 多个专业子代理的架构:不同的子代理分别负责数据处理、统计建模、图表可视化、论文写作等任务。每个子代理只接收与自己任务相关的上下文,上下文精简带来了更准确的任务执行和更低的成本。
一个贯穿两个模块的设计原则
适度原则(Proportional Response)
无论是论文打磨还是数据分析,我们都遵循同一条原则:AI 做的事情应该精确匹配用户请求的范围,不多不少。
你让它跑一个描述性统计,它就只输出描述性统计,不会自作主张加上回归分析。你让它改一个段落,它就只改那个段落,不会顺手重写全文。
这条原则看起来简单,但在实际产品中非常关键——很多 AI 产品的痛点不是「做不到」,而是「做太多」,用户反而搞不清楚哪些是自己要的。
总结:做 AI 产品的两点感悟
做了两次架构升级后,最大的感悟:
1. 不是模型越强越好,而是让对的模型做对的事。 多个专注的专家,胜过一个什么都懂但什么都不精的通才。
2. AI 产品的核心体验不是「AI 有多聪明」,而是「AI 有多懂边界」。 教 AI「什么时候该收手」,比教它「怎么做得更多」更重要。
这个思路不只适用于论文场景,任何复杂的 AI Agent 产品,当工具数量增长到一定规模,都值得考虑拆成多代理架构。