我搭建了这套自审系统,在论文送盲审、答辩、查重前,逐条排查论文中可客观判定的问题,按七大类组织成一份问题清单。它不打分、不下「是否通过」结论,只定位问题、给出修改建议。
审查上采用分层阅读、对抗性校验、AI 痕迹扫描、主-子 agent 分工等方法。规则全部来自《中国农业大学研究生学位论文格式及书写规范(2025)》、学位论文模板与《研究方法与论文写作》四讲(约 450 页):先逐条提取 344 条原始规范,精炼编码为 97 条机器可查规则(格式 52、写作 45)。每份源文档都走「提取→编码→映射→登记→机检」五步入库并留痕。每条规则都对应一个审查类目,再以机检验证没有指向缺失类目的「孤儿规则」——源文档提到的每类规则,论文里同类问题都查得到(当前机检通过,无孤儿、无失联)。
七大类下设 40 小类(37 个在审;另外 3 个需主观判断的不审,报告里写明原因)。为在上下文受限下覆盖全文,采用两条正交切分轴:区域纵扫逐章排查局部问题,类别横扫沿单一视角通览全文、抓跨章问题(如编号跳号、术语漂移)。另设覆盖矩阵记录每个单元是否扫全,没到 100% 就不出报告。实质审查全部交给独立 agent,主线程只调度、不读原文、不下裁决;最后再加一个冷启 agent(不接触前序工作记忆),以「作者辩护律师」立场逐条复核,推翻其中误报和措辞不当者。三道机检(无孤儿规则、悬空引用、全角标点)和 15 项单元测试都通过。
只审有客观标准、文本就能判定的问题——格式版式、标点、数字单位、编号著录、前后一致性、可检测的方法学硬错误、AI 痕迹;创新价值这类需主观判断、没有客观标准的不审。文献与引用类设为最高优先核查级别,格式合规项由 97 条规则逐条机械核对。每条问题用「标题—定位—证据—为何是问题—修改建议」五段结构写,按必改 / 建议改 / 提醒三档分级,定位到页码、图表号。
问题类目只增不删(保留历史编号),新规则源沿同一「五步入库」流程接入,新论文类型靠填差异表纳入;用户反馈走 pending → accepted / rejected 闭环,稳定的经验沿「单案 → 多案沉淀 → 升为正式规范」阶梯固化。最近一次迭代,拿作者的修订稿做对照,回查原来没覆盖的问题,经冷启核验后新增 3 条规则,确认其余修订原规则都已覆盖,全过程在 changelog 里逐条可查。