SciMetrics高校图书馆学科服务:基于教师花名册精准定位本校论文成果的 AI 作者映射用户手册

本手册面向高校图书馆学科服务场景,说明如何使用 SciMetrics 的 AI 作者映射功能,基于学校、学院或科研团队花名册,将文献数据库中的作者记录精准映射到本校教师,从而支持教师科研成果梳理、学科画像、学院成果统计和论文认领核验。

说明:本功能适用于“作者”和“通讯作者”两类对象。界面中可能显示为“AI 作者映射”或“AI 通讯作者映射”。

一、操作方法

1. 典型应用场景

高校图书馆在开展学科服务时,常常需要回答以下问题:

1. 某学院、某学科、某团队的老师近年发表了哪些论文?

2. 学校花名册中的教师,哪些可以在 WoS、Scopus、CNKI 等文献数据中精准定位?

3. 同名作者、英文缩写作者、拼音作者如何归并到校内真实教师?

4. 如何区分本校教师成果和校外同名作者成果?

5. 如何统计某教师、某学院或某岗位类型的论文成果、引用表现和合作网络?

AI 作者映射的核心用途,是把文献作者表中的原始作者写法,映射到用户提供的花名册标准写法。例如:

文献中的作者写法花名册中的教师记录映射结果
Wang, Q.计算机学院-王强计算机学院-王强
Chen Qiang图书馆学系-陈强图书馆学系-陈强
Li, B.[School of Packaging]包装学院-李彪包装学院-李彪
Wang Q.计算机学院-王强、材料学院-王清`计算机学院-王强

图1:高校图书馆学科服务中使用教师花名册匹配论文成果的示意图

2. 使用前准备

使用 AI 作者映射前,建议准备三类数据:

数据说明
文献数据从 WoS、Scopus、CNKI、万方、PubMed 等来源导入的论文数据。
作者或通讯作者表软件读取文献后自动生成的作者表、通讯作者表。
单位花名册学校、学院、学科或团队的教师名单,每行一位教师。

花名册建议包含尽可能多的辅助信息,尤其是学院、部门、单位、岗位或学科方向。推荐格式:

        
    计算机学院-王强   
    材料科学与工程学院-李娜   
    图书情报学院-陈强   
    包装学院-李彪   
    医学部-王琦   
        

准备花名册时建议遵循以下原则:

1. 每行只放一位教师。

2. 同一个教师使用一种标准写法。

3. 学院或部门名称尽量完整。

4. 同名教师必须加上学院、部门或其他辅助信息。

5. 离职、退休、附属医院、兼职教师是否纳入,应先由图书馆或业务部门确定口径。

图2:学校教师花名册示例

3. 导入文献数据并确认作者表

操作步骤:

1. 打开软件,导入需要分析的文献数据。

2. 数据读取完成后,在数据表区域查看 作者 表和 通讯作者 表。

3. 检查作者记录是否包含英文姓名、拼音姓名、缩写姓名、机构信息等内容。

4. 按业务需要勾选需要处理的作者记录。

图3:作者表中显示英文缩写、拼音和机构信息的作者记录

说明:

  • 如果要统计全部参与作者成果,可在 作者 表中使用 AI 作者映射。
  • 如果只关注通讯作者成果,可在 通讯作者 表中使用 AI 通讯作者映射。
  • 如果只处理本校成果,建议先通过机构、国家、省份或检索条件筛选出相关文献,再进行作者映射。

4. 选择要映射的作者记录

AI 作者映射只处理当前选中的作者记录。使用前需要先在作者表或通讯作者表中选择记录。

操作步骤:

1. 打开 作者 表或 通讯作者 表。

2. 勾选或选中需要映射的作者记录。

3. 对于初次使用,建议先选择几十条记录进行测试。

4. 测试结果符合预期后,再扩大到学院、学科或全校范围。

图4:智能体批量处理

建议:

  • 首次运行可先选择同一学院或同一学科的作者,便于检查结果。
  • 如果作者数量较多,建议启用智能体分批处理。
  • 如果同名作者较多,花名册中一定要保留学院或部门信息。

5. 打开 AI 作者映射功能

有两种常用入口。

入口一:主菜单

1. 进入 智能 -> AI分组 -> AI 作者映射。

2. 如果当前处理的是通讯作者,进入 智能 -> AI分组 -> AI 通讯作者映射。

入口二:右键菜单

1. 在 作者 表中选中记录。

2. 右键打开菜单,选择 AI 作者映射。

3. 在 通讯作者 表中右键时,选择 AI 通讯作者映射。

图5:主菜单中的 智能 -> AI分组 -> AI 作者映射 入口

图6:作者表右键菜单中的 AI 作者映射 入口

 6. 配置 AI 作者映射参数

打开功能后,会出现 AI 设置窗口。主要配置项包括模型、API Key、作者名单、分批处理和提示词。

图7:AI 作者映射设置窗口

参数说明:

参数说明
模型选择用于作者映射的 AI 模型。
API Key输入模型调用所需的密钥。
作者/通讯作者名单粘贴学校、学院或团队花名册。AI 只会从这份名单中选择结果。
启用分批处理当选中作者较多时,建议启用。
每批数量每次提交给 AI 的作者记录数,默认一般为 100。
提示词配置映射规则说明,通常不需要修改。

操作步骤:

1. 在 模型 中选择已配置的 AI 模型。

2. 填写或确认 API Key。

3. 将单位花名册粘贴到 作者/通讯作者名单 输入框。

4. 作者数量较多时勾选 启用分批处理。

5. 设置每批数量,建议从 50 到 100 开始。

6. 点击确定,开始映射。

7. 查看映射结果

映射完成后,软件会把结果写回作者表或通讯作者表。

关键字段:

字段含义
Record文献数据中提取的原始作者写法。
GroupAI 映射后的花名册标准写法。
GroupId映射标记,通常包含 AuthorMap、判断类型和模型名称。
ParId分组父级信息,作者映射时一般置为 0。

映射结果示例:

RecordGroupGroupId
Wang, Q.计算机学院-王强AuthorMap[Matched][模型名]
Chen, Q.[Beijing Inst Graph Commun]图书情报学院-陈强AuthorMap[Matched][模型名]
Wang Q.`计算机学院-王强材料学院-王清`

图8:作者表中 Group 字段写入映射结果

结果类型说明:

类型含义处理建议
MatchedAI 判断可以唯一匹配到花名册中的某位教师。可作为初步可信结果,建议抽样核验。
AmbiguousAI 判断可能对应多位教师,结果用 `` 分隔。
Unmatched无法在花名册中找到合理候选。不写入 Group,可补充花名册或人工复核。

8. 利用映射结果定位教师论文成果

作者映射完成后,可以用 Group 字段把文献作者统一到校内教师身份,从而开展成果统计。

常见操作:

1. 在作者表中搜索某位教师的标准写法,如 计算机学院-王强。

2. 使用“查看相关”功能定位该教师关联的文献。

3. 导出数据表或统计表,形成教师成果清单。

4. 按学院、学科或团队字段汇总教师论文数量、期刊、年份、合作机构等。

5. 对通讯作者映射结果单独统计,用于分析本校主导成果。

图9:截图占位:通过 Group 字段搜索某位教师

图10:查看某位教师关联论文列表

高校图书馆常见成果清单字段建议:

字段说明
教师标准名称来自花名册映射结果,如 计算机学院-王强。
原始作者写法文献数据库中的作者名称。
论文题名文献标题。
发表年份用于年度成果统计。
期刊 / 会议用于成果来源分析。
作者类型普通作者或通讯作者。
本校机构用于确认是否为本校成果。
被引次数用于影响力分析。
DOI / 文献号用于后续核验。

9. 结果复核建议

AI 作者映射可以显著提高定位效率,但涉及科研成果认领时,建议保留人工复核环节。

优先复核以下记录:

1. Group 中包含 | 的多候选记录。

2. 同名或同姓同首字母作者。

3. 文献作者缺少机构信息的记录。

4. 花名册中存在同名教师的学院。

5. 英文缩写过短的记录,例如 Wang, J.、Li, Y.。

6. 跨学院、附属医院、联合培养或兼职教师相关记录。

复核方法:

方法说明
看机构地址判断论文机构是否与教师所在学院或学校一致。
看研究方向题名、关键词、摘要是否符合教师研究方向。
看通讯作者通讯作者邮箱或地址是否指向本校。
看合作网络共同作者是否为同一学院或团队成员。
查 DOI / 原文对关键成果进行外部核验。

10. 保存和复用

AI 作者映射设置中的作者名单会被保存,便于下次继续使用。对于图书馆学科服务工作,建议建立多个花名册版本。

推荐命名方式:

        
    全校教师花名册_2026   
    计算机学院教师花名册_2026   
    图书情报学院教师花名册_2026   
    附属医院通讯作者名单_2026   
    重点学科团队名单_2026   
        

建议工作流:

1. 学校层面建立全校花名册。

2. 学院层面维护学院花名册。

3. 学科服务馆员可按服务对象维护专题花名册。

4. 每次成果统计前记录使用的花名册版本。

5. 对人工修正后的映射结果定期回填到花名册或规则库。

二、原理说明

1. AI 作者映射的基本逻辑

AI 作者映射本质上是一个“受控名单匹配”任务。系统把两类信息发送给 AI:

1. 用户提供的作者名单或通讯作者名单。

2. 当前选中的待识别作者记录。

AI 必须只从用户提供的名单中选择候选,不能编造名单外人员。匹配成功后,系统将名单中的原始写法写入 Group 字段。

例如,花名册中是:

        
    计算机学院-王强   
    材料学院-王清   
          

待识别作者是:

         
   Wang, Q.   
          

如果无法唯一判断是王强还是王清,AI 应返回多候选结果,并写为:

    计算机学院-王强|材料学院-王清            

2. 匹配依据

AI 作者映射会综合使用以下线索:

线索说明
中文姓名直接比较中文姓名是否一致。
拼音姓名比较 王强 与 Wang Qiang、Qiang Wang 等写法。
缩写姓名比较 Wang, Q.、Wang Q 等姓氏加首字母形式。
姓名前后顺序同时考虑名在前、姓在前。
学院 / 部门用作辅助证据,提高或降低置信度。
机构地址作者记录中带机构信息时,可辅助判断是否为本校教师。
候选唯一性如果同姓同首字母只有一个候选,可判为匹配;多个候选则判为模糊。

3. 写回规则

系统解析 AI 返回的 JSON 结果,并按以下方式写回数据表:

AI 返回系统写回
group_value 不为空写入 Group 字段。
decision = MatchedGroupId 写入 AuthorMap[Matched][模型名]。
decision = AmbiguousGroupId 写入 AuthorMap[Ambiguous][模型名]。
decision = Unmatched 且无 group_value不写入映射结果。
多个候选使用 `

系统要求 AI 返回结果覆盖每一个待识别 ID。如果某些 ID 被模型遗漏,程序会尝试只对遗漏 ID 再次请求,以提高结果完整性。

4. 为什么适合高校图书馆学科服务

高校成果分析的难点不只是“作者重名”,还包括:

1. 中文姓名在国际数据库中常被写成拼音。

2. 许多数据库只保留姓氏和名字首字母。

3. 同一学校内可能存在多位同姓同首字母教师。

4. 作者机构字段常包含英文缩写、旧机构名、二级学院或附属医院名称。

5. 学科服务需要按本校组织体系统计,而不是只按数据库作者字符串统计。

AI 作者映射允许图书馆把“组织花名册”作为受控知识输入,让 AI 在名单范围内完成解释和匹配,从而把文献数据转化为面向学校管理和学科服务的教师成果数据。

5. 方法局限

使用该功能时,需要注意以下限制:

1. AI 映射结果不能替代最终人工认领。

2. 花名册越完整,映射结果越稳定。

3. 缺少机构、题名或学科信息时,缩写作者更容易产生多候选。

4. 同姓同首字母教师较多时,应优先使用学院花名册分批处理。

5. 不同模型对复杂姓名和机构线索的判断能力不同,建议固定模型版本。

6. 成果用于正式考核、绩效或评价时,应进行人工复核和留痕。

推荐原则:

  • 用 AI 做初筛和批量归并。
  • 用馆员复核处理模糊候选。
  • 用教师本人或学院确认关键成果。
  • 用固定花名册版本保证统计口径一致。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注