National Science Library,Chinese Academy of Sciences
Not a member yet
10241 research outputs found
Sort by
基于机器学习的科学数据正式引用识别方法研究
[研究目的]科学数据已经成为科研产出的重要成果类型之一,通过研究和观察科学数据的使用情况可以发现科学数据的管理需求,提高科研人员共享和重用科学数据的积极性。[研究方法]以生物信息学领域学术论文全文信息作为研究对象,利用规则抽取和人工标注形成了生物信息学引文分类数据集,并对比评估了8种机器学习方法在数据集上的分类和识别效果。[研究结论]实证研究效果显示,机器学习分类方法可以用于科学数据正式引用识别,全文信息和样本集大小对分类效果起到关键性作用。 </p
我国单细胞技术发展态势分析
[目的/意义]近年来,我国单细胞技术发展迅速,取得了许多突破性创新成果。全面了解我国单细胞技术发展态势,能为国家在单细胞技术领域的发展布局和战略规划提供参考。[方法/过程]通过科学计量与基金分析相结合的方法,对我国2009-2019年间单细胞技术相关的研究论文、专利和国家自然科学基金项目数据进行分析,系统呈现我国单细胞技术领域的发展现状和趋势。[结果/结论]研究结果表明,我国单细胞技术论文和专利在数量上占据绝对优势,但质量有待提高。国家自然科学基金对单细胞技术研发给予有力支持,我国企业在单细胞技术研发中发挥着越来越重要的作用。单细胞技术具有广阔的应用前景,呈现多学科交叉、全领域发展态势,单细胞检测分析平台、单细胞测序、肿瘤诊断和治疗、单细胞基因表达调控等是单细胞技术研究的热点。
引用:蒋甜,许哲平,尹传昊,陈学娟,朱学军.我国单细胞技术发展态势分析[J].科学观察,2022,17(01):1-16.DOI:10.15978/j.cnki.1673-5668.202201001.</p
融合全文信息的科学数据正式引用识别方法研究
[目的/意义]科学数据已经成为数据驱动型科研的重要资料和产出成果,研究科学数据引用可以帮助追踪数据的使用状况、开展数据计量和评价、加速科研进程。[方法/过程]以生物信息学领域学术论文全文信息作为研究对象,利用规则抽取和人工标注形成了生物信息学引文分类数据集,对比评估6种深度学习模型与3种传统机器学习模型在数据集上的分类和识别效果。[结果/结论]实证研究效果显示,采用考虑语义和上下文特征的深度学习方法在科学数据正式引用识别任务中具有更优效果。[局限]未充分考虑数据类别不均衡问题。 </p
结合计量分析和内容分析的科学数据集使用特征研究
[目的/意义]从计量分析和内容分析两个视角对科学数据集的使用特征进行研究,定量化评估科学数据集对学科发展的影响,为科学数据管理服务及政策研究提供参考。[方法/过程]综合运用文本挖掘和文献计量方法对PubMed的全文文献进行分析,从时间分布、使用强度等7个方面全面考察科学数据集的使用情况,并在此基础上评估科学数据集对学科发展产生的实际影响。[结果/结论]研究结果表明,科学数据集对生物医学领域科研产生的影响力与日俱增,数据出版和高水平期刊促进了科学数据集的开放和共享,科学数据集的使用集中在论文的后半部分且正式引用较少,相应的标准规范还有待进一步加强。 </p