《文献与数据学报》2025年第3期目录及摘要
本期目录
《国家哲学社会科学文献中心最受欢迎期刊报告(2024年度)》分析…………………………………………………………………赵以安 李菲菲
基于弹幕文本方面级情感分析的产品画像构建……………………………………………………………………………钱明辉 李胡蓉 钟瑞玲 赵泽龙
基于BERTopic与GPT模型的社交媒体虚假信息文本主题内容研究……………………………………………………………………万宏静 崔 琦 程 谦
基础学科交叉特征及热点主题识别——以Web of Science大语言模型主题论文为例…………………………………………………王方媛 徐慧婷
数字人文视域下“兰亭雅集”主题绘画作品知识图谱构建研究……………………………………………………………………………随成龙 臧志栋
数据域外管辖的理论演进、现实逻辑与路径优化………………………………………………………………………………………………………阙凤忞
“类型—工具—周期”三维视角下我国省级政府数据管理政策文本分析………………………………………………………………李素云 白献阳
日本东京大学东洋文化研究所藏十五种中国宝卷叙录……………………………………………………………………………………………… 纪秋悦
《人间词话》三版本的历史衍变之探……………………………………………………………………………………………………………………赵莉莎
本期摘要
《国家哲学社会科学文献中心最受欢迎期刊报告(2024年度)》分析
赵以安 李菲菲
摘 要:[目的/意义] 为深入贯彻落实习近平总书记在哲学社会科学工作座谈会上的重要讲话精神,2025年5月17日《国家哲学社会科学文献中心最受欢迎期刊报告(2024年度)》正式发布。本报告对促进我国哲学社会科学学术期刊高质量发展,加快国家哲学社会科学文献中心建设具有重要意义。[方法/过程] 基于用户使用数据,从中文期刊受欢迎情况、学科热度、主题热度、优先发布期刊受欢迎情况、访问热度地域分布、中文期刊在国外受欢迎情况等维度进行分析。[结果/结论]分析表明,中文期刊的受欢迎程度和各学科热度均呈现整体上升趋势,国家哲学社会科学文献中心国际传播成效显著、综合影响力稳步提升。本研究为哲学社会科学工作者、期刊出版机构等提供数据支持,并为文化传播与学术交流提供助力。
关键词:国家哲学社会科学文献中心 最受欢迎期刊 学科热度 主题热度
基于弹幕文本方面级情感分析的产品画像构建
钱明辉 李胡蓉 钟瑞玲 赵泽龙
摘 要:[目的/意义]用户生成内容(UGC)是互联网时代企业洞察用户产品偏好和需求的重要数据源。产品测评类短视频所产生的弹幕作为用户生成内容的重要形式,对于企业构建契合用户情感价值的产品画像具有重要意义。[方法/过程]本文基于两次微调的BERT模型,对B站华为手机测评视频弹幕进行方面级情感分析,运用LDA对各方面下不同情感极性的弹幕进行主题分类,构建手机产品画像,并与基于购物网站在线评论构建的产品需求画像进行对比。[结果/结论]弹幕文本的方面级情感分析,能捕捉传统评论中易被忽略的情感化需求特征,准确地识别出视频用户对产品的情感取向,从而挖掘更细节的产品特征,有助于企业清晰定位产品各维度的主要竞品及威胁,从而制定更有针对性的竞争战略。
关键词:产品画像 方面级情感分析 弹幕分析 文本挖掘
基于BERTopic与GPT模型的社交媒体虚假信息文本主题内容研究
万宏静 崔 琦 程 谦
摘 要:[目的/意义]从不同主题维度对社交媒体虚假信息文本进行内容分析,有利于揭示社交媒体虚假信息传播特点与规律,针对性提升社交媒体的信息质量,进一步推动社交媒体健康发展。[方法/过程] 基于BERTopic主题模型,从公开数据集MCFEND及CHEF中提取共26 478条虚假信息相关主题,并使用GPT4.0模型进行主题标签凝练,实现对社交媒体虚假信息主题内容特征的深入分析。首先,利用BERTopic模型对预处理后的社交媒体虚假信息文本数据进行SBERT文本向量化、UMAP降维、HDBSCAN聚类与MMR主题优化,并从中自动提取30个核心主题。其次,引入GPT模型,提供prompt(提示词)凝练主题标签,提升主题标签的准确性和可解释性。最后,进一步归纳主题词,分析主题提取结果、主题内容强度及主题时间演化特征。[结果/结论]研究发现,社交媒体虚假信息传播具有如下特点与规律:社交媒体虚假信息主题内容泛化且跨国传播较为明显;特定虚假信息主题具有较高关注度并关联热点话题;地域差异或文化背景驱动社交媒体虚假信息主题内容出现分化。
关键词:BERTopic模型 GPT模型 社交媒体 虚假信息 主题模型
基础学科交叉特征及热点主题识别——以Web of Science大语言模型主题论文为例
王方媛 徐慧婷
摘 要:[目的/意义]本文聚焦大模型在基础学科的应用及其引起的学科交叉现象,为以大模型为代表的人工智能技术推动基础学科交叉融合提供理论支持与实践指引。[方法/过程]先从Web of Science核心合集的大模型主题研究论文中筛选出生命科学、材料科学、数学、化学、物理学和地球科学六类基础学科的论文,再选择涉及两种及以上基础学科的论文作为研究对象,构建学科交叉主题分析框架。采用BERTopic主题建模方法,结合多值邻接矩阵构建学科交叉网络,分析学科交叉特征。基于主题强度、影响力和关注度指标,采用熵权法计算综合主题热度,识别热点主题。[结果/结论]六类基础学科具有高度学科交叉性,其中化学、物理学与材料科学的交叉融合最为显著。本研究识别出“蛋白质序列预测与基因分析”等八个主题及“量子自旋与相变理论”“蛋白质序列预测与基因分析”“材料设计与化学合成”三个热点主题。
关键词:大语言模型 基础学科 BERTopic 学科交叉 主题模型
数字人文视域下“兰亭雅集”主题绘画作品知识图谱构建研究
随成龙 臧志栋
摘 要:[目的/意义]“雅集”作为中国传统绘画雅集母题题材,蕴含着丰富的知识特征和语义信息,挖掘作品图像信息并构建其知识图谱,对研究中国美学文化及数字化艺术发展具有重要意义。[方法/过程] 以“兰亭雅集”主题绘画作品为例,研究构建“雅集”主题绘画作品知识图谱。首先,从画中人物、画中器物、画中环境、画之款识题跋、画者情感五个角度描述画面内容实体分类;然后,复用CDWA、CADAL元数据标准构建“兰亭雅集”主题绘画作品元数据,并以此为基础组建相应本体;最后,运用Neo4j图数据库绘制作品知识图谱,实现知识组织、语义链接、知识检索和可视化展示等用户服务操作。[结果/结论]所构建的知识图谱能够实现“兰亭雅集”主题绘画作品知识检索与服务,可以促进“兰亭雅集”主题绘画的结构化与语义化,增强人文艺术与数字技术的关联性,还可为其他主题绘画作品提供适应性的研究路径与参考借鉴。
关键词:数字人文 “兰亭雅集” 元数据 知识图谱
数据域外管辖的理论演进、现实逻辑与路径优化
阙凤忞
摘 要:[目的/意义]数字技术正在重塑全球经济秩序,数据管辖权的法律边界与冲突协调已成为国家主权博弈与全球治理规则重构的核心议题。[方法/过程]基于主权视角下数据域外管辖权形成的理论基础,分析现实中数据管辖域外扩张之逻辑与挑战,归纳数据域外管辖权建构的现实逻辑与规则优化。[结果/结论]数据域外管辖应转向实质联系的管辖思路,以利益衡量补强数字时代联系弱化的问题,并接受公平正义价值导向的审视。我国数据域外管辖的建立可以丰富和调整数据域外管辖连接点,合理协调我国执法或司法中的数据域外管辖冲突。
关键词:域外管辖权 数据治理 数据主权 管辖原则 涉外法治
“类型—工具—周期”三维视角下我国省级政府数据管理政策文本分析
李素云 白献阳
摘 要:[目的/意义]数据管理能力是政府数字化转型中的核心能力,制定和完善有效的政府数据管理政策是推进政府数字化转型的基本保证。[方法/过程]采用内容分析法,构建包含政策类型、政策工具、数据生命周期三个维度的分析框架,对我国省级政府数据管理政策文本进行量化分析。[结果/结论]我国省级政府对更具目标性与实效性的数据管理政策关注度较高,政策重心集中在数据发布与传播阶段,对数据创建与汇交阶段以及数据监管阶段的政策关注度相对不足;政策工具应用呈现供给型工具应用较多、需求型工具应用相对不足且整体分布不够均衡的特点;中微观层面政策与宏观规划在政策重心与政策工具应用偏好上存在一定差异。因此,还需进一步完善省级政府数据管理政策体系结构,并从数据生命周期全局出发,均衡协调政策工具的作用,同时加强中微观层面政策与宏观规划的衔接。
关键词:关键词:政府数据 数据管理 数据生命周期 政策文本分析
日本东京大学东洋文化研究所藏十五种中国宝卷叙录
纪秋悦
摘 要:[目的/意义]全面了解各地宝卷收藏情况是深入开展海外藏中国宝卷研究的重要基础工作。东京大学东洋文化研究所是日本汉籍的著名收藏机构,对其所藏宝卷进行搜集整理,有助于窥见中国宝卷在日本的整体性庋藏与研究特征。[方法/过程]。目验东洋文化研究所藏15种中国宝卷,追溯宝卷来源,补遗宝卷书目,撰写宝卷叙录。[结果/结论]15种宝卷来源较清晰,文本功能类型丰富,个别版本稀见。此叙录有助于宝卷文献共享,推动中国宝卷学学术体系构建。
关键词:东洋文化研究所 宝卷 版本 讲唱文学
《人间词话》三版本的历史衍变之探
赵莉莎
摘 要:[目的/意义]通过研究《人间词话》的版本流变可以使我们厘清《人间词话》每版各自的内容形态特征和版本间的历史演化脉络,以此对《人间词话》的产生和形成获得更为清晰的认识,并因此发现十数年间王国维思想意识和学术取向的变动发展。[方法/过程]。本文采用版本释读与对勘的方法,梳理王国维生前自己改定过的三个版本,即手稿本、学报本和时报本,并对其进行综合分析。[结果/结论]《人间词话》版本间的历史演变轨迹体现的不仅是王国维对自己年少之作的精益求精和贯穿整个学术生涯的严谨认真的治学态度,更能反映出其晚年学术精进资深老成后的那种厚重的历史意识,及其历史纵深感的进一步增强。也正由此,我们才能更加理解其晚年放弃曾经研几极深的哲学和文学领域而一头扎进史学的学术选择,并看清这一学术转向实际上并非一蹴而就的,它在《人间词话》学报本的尾声就已显露出来,并逐渐体现在之后诞生的《宋元戏曲史》和终其余生的史学研究,尤其是对时报本的大幅删改之中。
关键词:《人间词话》 手稿本 学报本 时报本