国家第三轮“双一流”建设将于 2026年启动,《教育强国建设规划纲要(2024—2035 年)》已经明确,将聚焦优势学科适度扩大“双一流”建设范围。随着“双一流”建设深入推进,高校传统科研评价体系面临指标单一、动态性不足等问题。人工智能技术通过数据挖掘、机器学习等手段,为构建多维立体的科研评价体系提供了新视角新范式。本文拟从现实基础、现实挑战和创新路径三个维度,系统分析人工智能赋能高校科研评价体系的理论逻辑与实践路径,提出构建智能评价体系的创新策略,为“双一流”建设提供方法论支撑。
现实基础:人工智能赋能科研评价的理论逻辑
国家层面的政策文件为人工智能技术嵌入科研评价体系提供了政策导向。《2025年国务院政府工作报告》明确提出,“深化人才分类评价改革和科教界‘帽子’治理,建立以创新能力、质量、实效、贡献为导向的人才评价体系。”3 月 28 日,在国家智慧教育平台开通三周年之际,以“人工智能与教育变革”为主题,教育部召开国家教育数字化战略行动 2025 年部署会,怀进鹏部长在会上指出,必须勇于改革创新,深入推动人工智能赋能教育变革,将人工智能技术融入教育教学全要素、全过程。在技术层面,在跨领域算法创新的驱动下,自然语言处理技术(Natural Language Pro-cessing,NLP)通过与多模态数据、知识图谱及迁移学习方法的深度融合,逐渐突破传统文本分析的局限性。
“破四唯”要求与高校传统科研评价体系之间的矛盾为人工智能赋能科研评价体系提供了需求动能。2018 年 7 月,中共中央办公厅、国务院办公厅发布 《关于深化项目评审、人才评价、机构评估改革的意见》后,相关部门联合发布了《关于开展清理“唯论文、唯职称、唯学历、唯奖项”专项行动的通知》(简称“破四唯”)。因为高校传统评价体系存在的“四唯”倾向已难以适应建设“双一流”的需求。根据 2022 年版的“双一流”建设监测指标体系,对教师在国内外重要期刊发表的代表性论文以及教师获得国内外重要奖项都做了限项要求。但国家在要求扭转科技和教育评价功利化导向的同时,各级各类评奖、“帽子”工程依然没有停止,高校申报学位点或者进行学科评估时,评价权重也仍然依靠各种奖项和“帽子”支撑。面对矛盾,高校实质上是“破”易“立”难,更加科学合理的科研评价体系迫切需要人工智能介入。
随着人工智能技术的快速发展,科研评价体系也得到了技术层面的强力支持。2025 年被称为“AI Agent 爆发元年”,人工智能的升级迭代速度加快,人工智能以难以想象的速度赋能千行百业。比如,人工智能可以通过情感分析技术识别科研成果的社会价值,利用机器学习算法预测学科发展趋势。人工智能技术可以通过三个层面重构科研评价体系:在数据采集环节,光学字符识别 (Optical Character Recogni-tion,OCR) 技术可实现古籍文献的数字化处理;在特征提取环节,主题模型(LatentDirichlet Allocation,LDA) 能够识别跨学科研究热点;在智能决策环节,强化学习算法可根据学科特点动态调整评价指标权重,比如对基础学科可以增加理论创新权重,对应用学科则侧重社会贡献权重。
现实挑战:技术嵌入的系统性矛盾
当前 AI 技术在科研评价中依然存在技术瓶颈。首先是数据质量问题,据统计,ESI(Essential Science Indicators,基本科学指标) 数据库中重复率的问题严重影响评价结果的准确性;其次是算法黑箱问题,深度学习模型的决策过程难以解释,导致评价结果的可追溯性不足,使用 AI 评审系统可能会因算法偏差导致项目被误判;最后是评价维度失衡,过度依赖文献计量指标可能忽视科研过程的复杂性。例如,实验数据的真实性验证、团队协作的贡献度等难以量化、更难以被 AI 评价。
传统评价体系的路径依赖仍显著存在。当前,在许多高校,论文发表的数量和期刊的影响力往往被当作衡量专任教师学术水平的重要标准,更是作为职称评聘的必选条件之一。这种“唯论文”的评价体系,给专任教师施加了巨大的发表压力,导致一些老师为了追求职称晋升和职业发展,不得不采取一些急功近利的做法,比如选择容易发表的期刊、缩短研究周期、甚至不惜牺牲研究质量来迎合发表要求。导致越来越多的研究内容重复、相似,甚至只是在已有研究的基础上微小改变(被称为“学术套娃现象”)。更有甚者,将一个整体的研究成果分解为多篇论文发表,也就是发表“香肠论文”。这种做法不仅制造了大量低质量、缺乏创新性的论文,也严重扭曲了学术研究的初衷和本质。“唯论文”的评价体系还导致学术不端行为频发。全球顶尖科学期刊 《自然》 的数据显示,过去十年间,全球约有 4 万篇文章遭撤 稿 , 其 中 中 国 撤 稿 文 章 的 比 例 高 达0.3%,是全球平均水平的三倍。
此外,高校科研管理系统与 AI 技术存在接口兼容性障碍,大多数高校的科研管理系统无法直接对接知识图谱分析工具。AI 技术的应用还带来多重伦理挑战,比如数据的隐私保护、AI 辅助写作工具可能导致的学术成果原创性争议以及中西部客观存在的数字鸿沟等。
创新路径:智能评价体系的构建策略
人工智能赋能高校科研评价体系创新应遵循从点到面的渐进过程。在初期阶段,可以将单一的人工智能技术应用于科研评价的某个环节,以测试其有效性和适用性。在此基础上,进一步构建全过程集成化的智能评价体系,实现高校科研评价体系的智能化转型。
1.单一应用人工智能技术是构建智能评价体系的“探路石”。可解释性人工智能技术可以解决算法黑箱问题,数据分析可视化技术通过注意力机制可视化技术,可以将模型决策过程转化为热力图,构建动态权重模型则有助于大大提升科研评价的精准性。以上单一应用人工智能技术可以作为构建智能评价体系的探索与尝试,以人工智能赋能高校科研评价。
2.建设高校科研大数据中台是构建智能评价体系的“垫脚石”。高校科研评价体系的建设需实现多源数据的标准化治理。高校应该按照“让教师少跑路,让服务更精细,让决策更高效”的目标建设科研大数据中台,实现项目、经费数据实时更新、自动统计分析,论文成果自动抓取、匹配推送,助力老师们的高水平科研和科研管理部门的高效率决策。同时还要建立数字素养提升机制,将 AI 应用能力纳入高校教师考核体系。
3.完善人机协同评价机制是构建智能评价体系的“压舱石”。人工智能可以赋能科研评价,但不能完全取代人工评价。为保障智能评价的准确性,应设置人工复核环节。要用制度保障创新,在高校的科研评价文件中,明确智能评价的合法地位,规定人工智能评价结果的应用范围与效力。同时,强化人工智能时代的科研诚信建设,规避潜在学术不端风险。既要明确规定科研过程中人工智能工具的使用范围、方式和界限,又要建立专门的审查机制,对科研成果中的人工智能应用进行伦理审查。
人工智能赋能高校科研评价体系创新是“双一流”建设的必然选择。通过构建技术创新与制度变革的协同机制,推动评价体系从“经验驱动”向“数据驱动”转型,最终实现科研评价的科学化、精准化与可持续化,为建设世界一流大学提供有力支撑。
【作者系科学研究部副部长。本文系湖北省教育厅哲学社会科学研究项目 《“双一流”背景下高校科研评价体系创新研究》(编号:19G015)研究成果】