SciMetrics:双一流高校外部人才精准引进-基于 SCI 的影响力指标用户手册

本手册面向“双一流”高校外部人才引进、学科方向布局、战略情报分析和图书馆学科服务场景,说明如何使用 SciMetrics 的影响力指标功能,对 SCI 数据中的作者、机构、国家或地区进行多维度影响力分析,为外部人才精准发现、候选人筛选、合作路径判断和引进决策提供数据支持。

本手册的数据源使用 SCI,为便于表述,下文中的 SCI 指学校订购的 Web of Science Core Collection 中 SCI / SCIE 相关论文数据。

一、操作方法

1. 操作流程总览

影响力指标分析建议按以下流程完成:

步骤操作目的
1从 SCI 下载文献数据获取目标学科、方向或人才主题的论文与参考文献信息。
2选择 JCR 词典为 SCI 期刊匹配 JCR 分区和 CNS 等高质量成果标识(SciMetrics提供)。
3读取 SCI 数据将下载文件导入 SciMetrics,生成文献、作者、机构、国家和参考文献等数据表。
4数据检查与勾选检查作者、机构、国家、出版物和参考文献字段,确定参与计算的数据范围。
5计算影响力指标导出作者、机构或国家影响力指数。
6存储 Excel 结果保存 .xlsm 结果文件,并用于排序、筛选、复核和报告撰写。

图1:人才影响力分析流程

2. 从 SCI 下载数据

在 SCI 平台下载数据时,建议先围绕学校拟引进方向建立检索式。检索对象可以是学科主题、关键技术、重点期刊、目标机构、代表性专家团队或其组合。

常见检索方式:

检索方式适用场景
主题检索适合围绕某个学科方向、前沿技术或交叉领域发现外部人才。
期刊检索适合围绕高水平期刊成果发现候选作者。
机构检索适合从目标高校、科研院所或企业研发机构中挖掘人才。
作者检索适合对已知候选人进行成果核验和影响力复核。
主题 + 年份适合关注近年活跃人才和新兴方向人才。

图2:SCI 平台检索式设置页面

 下载建议:

 1. 在 SCI 平台完成检索后,进入检索结果列表。

2. 根据数据量选择全部结果、当前页结果或分批导出。

3. 导出格式建议选择 Plain Text 或 Excel,并与后续读取过滤器保持一致。

4. 导出内容建议选择 Full Record and Cited References,确保包含完整记录和参考文献。

5. 如平台限制单次导出数量,应按记录号分批下载,并保持文件命名连续。

6. 下载后将同一检索式、同一时间范围的数据文件放入同一个文件夹。

图4:选择 Full Record and Cited References 的导出设置

建议保留的核心字段:

字段类型说明
文献唯一标识如 UT、DOI 等,用于识别和去重。
题名、摘要、关键词用于主题理解、成果核验和报告撰写。
作者与作者全称用于作者影响力计算和同名复核。
地址 / 机构字段用于机构归属、国家归属和合作关系判断。
通讯作者与通讯地址用于判断候选人的主导研究能力和联系方式。
来源期刊与年份用于 JCR 分区匹配、发文时间跨度计算和成果质量判断。
参考文献用于计算领域 H 指数和影响力扩散类指标。

数据下载后建议进行以下检查:

  • 文件是否可以正常打开。
  • 每批数据的记录范围是否连续,是否存在重复下载。
  • 导出内容中是否包含参考文献字段。
  • 检索式、下载日期、数据库范围和时间范围是否已记录。

3. 选择 JCR 词典

JCR 词典用于把 SCI 文献中的来源期刊和发表年份匹配到 JCR 分区,从而生成 JCR第一分区、JCR第二分区、JCR第三分区、JCR第四分区 和 CNS三刊 等字段。

在读取 SCI 数据前,建议先确认出版物词典使用的是 JCR 版本。

操作步骤:

1. 打开 SciMetrics。

2. 进入数据读取窗口,切换到 字典 或 字典文件 设置区域。

3. 找到 出版物 词典。

4. 将 出版物 词典选择为 JCR 分区词典。

5. 如果系统已内置 JCR 词典并设为默认出版物词典,可保持默认设置。

图5:数据读取窗口中的 字典 页

图6:选择 出版物 / JCR 分区词典的位置

JCR 词典选择建议:

情况建议
分析 2000-2024 年 SCI 数据可使用内置 JCR 分区词典,例如 publicationdic_Jcr_2000_2024.txt。
分析最新年份数据检查 JCR 词典是否覆盖最新发表年份;未覆盖时,最新年份论文的 JCR 字段可能为空。
分析历史跨度较长的数据确认 JCR 词典覆盖数据中的最早和最晚年份。
正式人才报告在报告中说明 JCR 词典版本和覆盖年份。

注意:

  • JCR 分区依赖“期刊名称 + 发表年份”的匹配。
  • 如果 SCI 数据中的期刊名称与词典名称差异较大,可能出现分区无法匹配。
  • 如果未选择 JCR 词典,影响力指标仍可计算,但 JCR 分区和 CNS 成果字段可能为空或不完整。

4. 读取 SCI 数据

完成数据下载和 JCR 词典选择后,开始读取 SCI 数据。

操作步骤:

1. 在主界面进入 数据 -> 数据分析。

2. 在 文件 中选择下载好的 SCI 数据文件;如为分批下载,可一次选择多个文件。

3. 在 过滤器 中选择 SCI / Web of Science 对应的读取过滤器。

4. 如果系统弹出推荐过滤器,可优先使用系统推荐的 SCI 过滤器。

5. 根据下载格式确认过滤器类型,例如 .txt 数据选择文本格式过滤器,.xlsx 数据选择 Excel 格式过滤器。

6. 在 编码 中选择与文件一致的编码,SCI 文本数据通常可优先尝试 UTF-8。

7. 在 语言 中选择 英文 或 中英。

8. 设置时间范围;如需要完整分析,可保留覆盖全部年份的范围。

9. 检查 统计、分析 等选项,确保作者、机构、国家、出版物、时间和参考文献相关字段会被读取。

10. 点击 计算,等待数据读取完成。

图7:数据 -> 导入 菜单入口

图8:选择 SCI 数据文件、过滤器、编码和保存位置

过滤器选择建议:

数据情况建议过滤器
SCI 文本数据选择 Web of Science / SCI 文本读取过滤器。
SCI Excel 数据选择 Web of Science / SCI Excel 读取过滤器。
用于外部人才引进优先选择能解析作者、机构、国家和通讯信息的 SCI 人才分析过滤器。
需要 JCR 分区选择能够保留来源期刊和年份字段的过滤器,并配合 JCR 出版物词典。

读取完成后,应在数据集区域检查以下数据表:

数据表检查重点
文献表题名、年份、来源期刊、文献 ID 是否正常。
作者表作者名称、作者全称、数量和分组是否正常。
机构表外部机构名称是否被正确解析。
国家表国家或地区字段是否完整。
出版物表期刊名称是否能与 JCR 词典匹配。
参考文献表是否读取到引用关系;该表直接影响 H 指数和影响力指数。

图9:SCI 数据读取完成后的数据集标签页

图10:文献表、作者表、机构表、国家表、出版物表和参考文献表检查示例

5. 数据检查、清洗与勾选

影响力指标以当前数据集中的记录和勾选范围为基础。计算前建议先完成必要的数据检查和清洗。

作者检查:

1. 在作者表中检查同一作者是否存在多种写法。

2. 对同一候选人的不同名称写法进行合并或分组。

3. 对高排名候选人,建议结合机构、研究方向和代表论文进行人工复核。

机构检查:

1. 合并同一机构的不同写法。

2. 对大学、学院、研究所、附属医院等层级进行统一。

3. 如只分析外部人才,可排除本校机构相关记录。

图11:作者表清洗、分组和勾选界面

图12:机构表中排除本校机构、保留外部机构的示例

6. 计算作者影响力指标

作者影响力指标是外部人才引进中最常用的结果表,用于发现高影响候选人、近期活跃候选人和与国内已有合作基础的候选人。

操作步骤:

1. 确认 SCI 数据已读取完成。

2. 确认作者表、文献表、机构表、国家表、出版物表和参考文献表正常。

3. 确认 JCR 词典已正确选择,出版物分区能够匹配。

4. 如只分析部分作者,在作者表中先勾选目标记录。

5. 进入 指数 -> 影响力指数 -> 作者影响力指数。

6. 在保存窗口中选择导出位置。

7. 输入文件名并保存为 .xlsm 文件。

图13:指数 -> 影响力指数 -> 作者影响力指数 菜单入口

图14:作者影响力指数保存为 .xlsm 的窗口

 

7. 计算机构和国家影响力指标

机构影响力和国家影响力常用于外部人才引进的前期研判。

机构影响力:

1. 进入 指数 -> 影响力指数 -> 机构影响力指数。

2. 选择保存位置。

3. 保存为 .xlsm 文件。

4. 用于识别高影响来源机构、重点高校、科研院所和企业研发团队。

国家或地区影响力:

1. 进入 指数 -> 影响力指数 -> 国家影响力指数。

2. 选择保存位置。

3. 保存为 .xlsm 文件。

4. 用于观察目标学科的国际竞争格局和合作网络。

人才引进场景下,建议采用“机构筛选 -> 作者定位 -> 成果复核”的顺序:

1. 先用机构影响力指数识别目标领域中的高影响外部机构。

2. 再在高影响机构中定位高影响作者。

3. 最后用作者影响力指数和文献明细核验候选人的代表成果、近期活跃度和合作基础。

8. 存储 Excel 结果

影响力指标导出的结果文件为 Excel 宏工作簿,后缀通常为 .xlsm。建议保留 .xlsm 格式,不要直接另存为普通 .xlsx,以免影响工作簿中的宏、格式或后续处理能力。

导出结果通常包含两个工作表:

工作表内容用途
Sheet1指标汇总表用于排序、筛选、候选人分层和报告制表。
Sheet2主体与文献明细表用于核验代表论文、作者机构、合作关系和成果出处。

图15:作者影响力指数 Excel 文件中的 Sheet1

建议同时保存:

文件作用
SCI 原始下载文件保证数据来源可追溯。
检索式说明保证检索口径可复核。
JCR 词典版本说明说明 JCR 分区字段的来源。
SciMetrics 数据集文件便于后续继续分析或复算。
影响力指数 .xlsm作为人才筛选和报告撰写的核心结果。

9. 读取 Excel 指标结果

导出后的 Sheet1 是核心指标表。常见字段如下:

字段含义
编号作者、机构或国家记录编号。
记录原始记录名称。
分组清洗或分组后的标准名称。
数量相关成果数量。
通讯论文作为通讯作者或通讯主体的论文数量。
JCR第一分区JCR Q1 论文数量。
JCR第二分区JCR Q2 论文数量。
JCR第三分区JCR Q3 论文数量。
JCR第四分区JCR Q4 论文数量。
CNS三刊Cell、Nature、Science 等顶级期刊成果数量。
领域H指数基于当前 SCI 数据集计算的领域 H 指数。
综合影响力指数主体在领域引用关系中的总体影响占比。
对其他作者影响力指数排除同作者内部影响后的外部作者影响。
对其他机构影响力指数排除同机构内部影响后的跨机构影响。
对其他国家地区影响力指数排除同国家或地区内部影响后的跨国家影响。
最早发文时间主体在当前 SCI 数据集中的最早发文年份。
最晚发文时间主体在当前 SCI 数据集中的最近发文年份。
国家/地区合作字段作者成果中共同出现的国家或地区数量,用于判断国际合作网络,以及与中国、国内机构或国内科研人员的合作基础。

对于外部人才引进,建议重点查看以下辅助判断字段:

辅助字段判断重点
最早发文时间判断候选人在该方向中的积累起点和学术资历。
最晚发文时间判断候选人近年是否仍活跃,避免把早期高影响但已转向或停滞的人才误列为重点候选。
国家/地区合作字段判断候选人与中国、国内机构或国内科研人员是否已有合作基础;可结合 Sheet2 文献明细进一步核验具体合作论文、机构和作者。

10. 面向外部人才引进的解读方式

建议按“影响力、活跃度、主导能力、合作基础、平台适配度”五个维度解释结果。

候选类型典型指标特征建议动作
高影响领军候选人领域 H 指数高、综合影响力高、近年仍有产出。作为重点引进或高层次人才联系对象。
青年潜力候选人发文时间较新、Q1 论文较多、外部影响开始出现。进入青年人才储备库,持续跟踪。
主导型候选人通讯论文多、Q1/Q2 成果多。重点评估独立 PI 能力和团队建设潜力。
国际扩散型候选人对其他国家地区影响力较高。适合作为国际合作和学科国际化引进对象。
与中国已有合作候选人国家/地区合作字段中存在中国相关合作,或 Sheet2 显示与国内机构、国内科研人员共同发表。更容易建立联系,可优先纳入合作型引进或柔性引进候选。
平台适配型候选人研究方向与学校重点平台高度契合,影响力中等以上。交由学院和平台专家进一步评估。

解读建议:

  • 不要只看论文数量,要结合外部影响力、高质量成果和近年活跃度。
  • 青年候选人可适当降低总量要求,更重视近期产出、Q1 成果和外部引用扩散。
  • 高层次候选人应同时具备高影响、持续产出和较强跨机构扩散。
  • 对与中国已有合作的候选人,应进一步核验具体合作论文、国内合作者和合作机构。
  • 正式人才报告应说明 SCI 检索式、下载日期、JCR 词典版本和人工复核规则。

11. 导出报告和后续分析

影响力指标导出后,可进一步用于:

1. 外部人才候选名单初筛。

2. 目标学科高影响作者榜单。

3. 重点来源机构和团队清单。

4. 候选引进人才 SCI 成果清单。

5. 候选人与校内团队的合作潜力分析。

6. 候选人与中国科研人员或国内机构合作基础分析。

7. 双一流学科建设外部人才引进专题报告。

图17:基于 SCI 影响力指标生成的人才梯队分析表。

建议在报告中保留以下信息:

信息作用
数据来源说明只使用 SCI 数据。
检索式和时间范围保证结果可复核。
下载日期和批次说明 SCI 数据下载时点和分批情况。
JCR 词典版本说明 JCR 分区字段的匹配依据。
数据清洗规则说明作者、机构、国家名称如何合并。
指标解释避免把影响力指标误读为单一排名。
人工复核说明对人才评价和引进决策尤其重要。

二、原理说明

1. 指标设计思想

影响力指标的核心思想是:在一个给定 SCI 检索数据集中,考察某个主体不仅贡献了多少论文,还考察其成果是否被领域内其他论文引用,以及这种影响是否突破自身作者群体、机构圈层和国家或地区边界。

相比单纯发文量,影响力指标更适合外部人才引进,因为它能够区分:

1. 数量型产出与高影响产出。

2. 内部循环影响与外部扩散影响。

3. 短期活跃与长期稳定影响。

4. 跟随型成果与主导型成果。

5. 本地影响与跨机构、跨国家影响。

2. SCI 数据和领域边界

本功能的计算对象不是全世界所有论文,而是用户当前下载并读取的 SCI 数据集。因此,指标解释必须绑定检索式、时间范围和数据下载日期。

例如,用户以“人工智能 + 医学影像”为主题下载 2018-2025 年 SCI 数据,则影响力指标反映的是候选人在该主题和该时间范围内的影响力,而不是候选人在所有学科中的总影响力。

3. JCR 词典匹配原理

JCR 词典通过“来源期刊 + 发表年份”匹配论文的期刊分区。匹配成功后,系统可统计主体名下的 Q1、Q2、Q3、Q4 论文数量,以及 CNS 三刊相关成果数量。

        
    SCI 论文来源期刊 + 发表年份 -> JCR 词典 -> JCR 分区字段   
        

如果期刊名称不一致、年份超出词典覆盖范围,或未选择 JCR 词典,则对应论文可能无法获得 JCR 分区。

4. 领域内引用关系

系统首先从 SCI 下载数据中的参考文献关系提取领域内引用关系。所谓领域内引用,是指当前 SCI 数据集中的文献之间形成的引用关系。

例如,数据集中论文 A 引用了论文 B,且 A、B 都在当前数据集中,则形成一条领域内引用关系。

        
    论文 A -> 引用 -> 论文 B   
        

系统会统计所有领域内引用关系总数,记为 R。后续影响力指数都以这个总数作为归一化分母。

5. 领域 H 指数

领域 H 指数用于衡量主体在当前 SCI 检索领域中的稳定影响。

计算方式:

1. 统计某主体相关论文在当前 SCI 数据集中的领域内被引次数。

2. 按被引次数从高到低排序。

3. 如果某主体至少有 h 篇论文分别被引用不少于 h 次,则其领域 H 指数为 h。

示例:

        
    某作者论文的领域内被引次数为:12, 8, 5, 3, 1   
    该作者领域 H 指数为 4   
        

因为前 4 篇论文均至少被引用 4 次,第 5 篇不满足 5 次。

6. 综合影响力指数

综合影响力指数表示某主体相关成果在领域内引用关系中的总体占比。

        
    综合影响力指数 = 主体相关引用关系数量 / 领域内全部引用关系数量   
        

该指标越高,说明该主体在当前 SCI 数据集所代表的知识网络中影响越大。

7. 对其他作者影响力指数

对其他作者影响力指数用于衡量主体的影响是否扩散到其他作者群体。

系统会判断引用关系两端是否存在相同作者。如果引用论文和被引论文没有共同作者,则计入“对其他作者影响”。

        
    对其他作者影响力指数 = 跨作者引用关系数量 / 领域内全部引用关系数量   
        

该指标可帮助识别候选人的影响是否突破自身团队或自引圈层。

8. 对其他机构影响力指数

对其他机构影响力指数用于衡量主体影响是否扩散到其他机构。

系统会比较引用论文和被引论文两端的机构集合。如果没有共同机构,则计入“对其他机构影响”。

        
    对其他机构影响力指数 = 跨机构引用关系数量 / 领域内全部引用关系数量   
        

该指标适合用于判断候选人才或机构的外部认可度。

9. 对其他国家地区影响力指数

对其他国家地区影响力指数用于衡量影响是否跨越国家或地区边界。

系统会比较引用论文和被引论文两端的国家或地区集合。如果没有共同国家或地区,则计入“对其他国家地区影响”。

        
    对其他国家地区影响力指数 = 跨国家或地区引用关系数量 / 领域内全部引用关系数量   
        

该指标适合分析国际影响力、海外合作潜力和全球学术扩散。

10. 通讯论文、高质量成果与发文时间

除引用扩散指标外,系统还统计以下辅助指标:

指标原理
通讯论文通过作者表与通讯作者表匹配,统计主体作为通讯作者的论文数量。
通讯作者邮箱汇总作者关联邮箱中占比最高的邮箱。
邮箱准确百分比某邮箱在该作者相关文献中的出现比例。
JCR 分区根据 JCR 词典统计 Q1、Q2、Q3、Q4 成果数量。
CNS 三刊统计 Cell、Nature、Science 等顶级期刊相关成果。
发文时间跨度统计主体最早和最晚发文时间。
国家/地区合作关系统计作者成果中共同出现的国家或地区,并结合文献明细观察候选人与中国机构、国内科研人员及其他国家科研人员的合作基础。

这些指标有助于从“主导能力、成果质量、持续活跃度、国内合作基础”四个方面补充影响力解释。对于人才引进而言,最晚发文时间可以辅助判断候选人是否仍在活跃产出,与中国或国内机构的合作关系则可以辅助判断联系路径、合作基础和引进可行性。

11. 输出结果的逻辑

导出的 .xlsm 文件包含两个层次:

层次作用
指标汇总表用于排序、筛选和比较主体影响力。
文献明细表用于回溯某主体对应的 SCI 论文成果。

这种设计适合人才工作中的“先筛选、再核验”流程:

1. 先通过指标汇总表定位高潜力人才或机构。

2. 再通过文献明细表核验代表性成果。

3. 最后结合专家判断、简历材料、项目经历和学院需求进行综合决策。

12. 使用边界

影响力指标适合辅助外部人才引进初筛和战略研判,但不应作为唯一评价依据。

需要注意:

1. 指标只反映当前 SCI 检索数据集范围内的影响力。

2. 不同学科之间不可直接横向比较。

3. SCI 数据下载范围、检索式和年份设置会直接影响结果。

4. JCR 词典版本会影响 Q1-Q4 和 CNS 统计结果。

5. 作者、机构清洗质量会直接影响指标准确性。

6. 高影响不等于完全适配学校发展方向。

7. 外部人才引进还需结合年龄阶段、任职机构、研究方向、平台需求、团队适配和发展潜力。

推荐使用方式:

  • 用指标发现候选对象。
  • 用明细表核验代表性成果。
  • 用 JCR 字段识别高质量论文。
  • 用最晚发文时间判断近期活跃度。
  • 用国内合作关系判断联系路径和引进可能性。
  • 用专家判断评估学术质量和平台匹配度。

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注