水产科技情报

基于人工智能的科技情报需求自动感知分析 

来源:水产科技情报 【在线投稿】 栏目:期刊导读 时间:2021-01-28

前言

当前科技情报服务对象不仅局限于特定的行业和领域,已经逐渐渗透至某一技术和个人,情报机构只有提升情报分析和反应能力才可以满足新需求。因此,机构有必要加强对用户需求的感知度,依托人工智能技术构建科技情报的感知框架,提升感知工作的合理性和高效性,进而挖掘科技情报感知领域的价值。

1 人工智能及科技情报感知概述

1.1 人工智能分析

人工智能又称AI,伴随着计算速度、核心算法的优化,该技术已经在神经网络、自然语言、机器学习等方面趋于成熟。当前人工智能技术可以定制个性化任务,结合不同的环境响应个体需求,制定解决方案[1]。因此,人工智能技术能够快速处理海量数据,若人类智力水平已无法满足严苛工作要求,可以借助人工智能技术处理复杂工作。同时,科技情报感知模块属于综合预测过程,因此有必要结合人工智能技术制定科技情报感知方案,实现情报工作向智慧化、个性化、精准化方向发展。

1.2 情报感知分析

科技情报感知主要是工作人员针对采集到的数据完成处理、分析,进而满足受众对于情报的需求,并对今后其发展过程进行预测。学者刘记曾指出,依托科技情报感知工作可以为实现国家治理体系和治理能力现代化提供支持,加快情报刻画、情报感知以及情报响应能力的建设进程。其中,情境感知的研究具有一定复杂度,G.Chen 通过调查情境信息、情境类型、情境传播等模型和系统,分析情境感知的应用程序,得出情境感知是领域普适学习的关键。例如,借助情境感知可以为用户提供体温、运动路径、温度等方面的服务。

因此,科技情报感知工作对于我国情报治理、预先感知等方面影响较大,结合人工智能技术创新科技情报感知模块已是大势所趋。当前大数据时代科技情报已经不仅停留于文献领域,正逐渐向多种数据源模式发展,要求科技情报软硬件不断升级优化,数据存储和处理水平逐渐升级,进而满足社会对情报数据的需求。

2 人工智能视域下科技情报需求自动感知研究

2.1 融合关键点

(1)创新驱动。当前科技情报需求逐渐向科技创新领域发展,依托我国创新驱动的发展战略,基于科学技术完成升级和发展。将科学技术和科技情报相结合后,情报工作的创新性较强,具有数字化和智慧化优势,并突出情报工作的个性化和精准性。因此,依托人工智能技术完成科技情报的自动感知十分关键,是当前科技发展的必经之路。

(2)前瞻性定位。新时期资源的网络化和数字化发展为科技情报研究工作提供大数据支持,可以在海量数据的收集、分析、处理方面发挥优势。传统的数据研究方式很难在大量数据的基础上提升情报研究质量,同时会增加研究人员的任务量。且每位工作人员自身的专业知识、情报敏感度、知识状态存在差异性,导致最终得出的情报结果不同甚至差异化较大。应用人工智能技术完成科技情报的自动感知十分重要,可以突出工作的准确性、高效性和稳定性。因此,将新兴人工智能技术和传统情报服务工作相融合是现代情报领域的关键,如自动获取和加工情报、高速处理文本信息、人工智能决策平台、依托语义内容的科研成果评价等[2]。

2.2 内容感知

(1)感知系统分析。大数据背景下,科技情报预测和传播功能受到重视和应用,属于科技领域的研究热点,可以对竞争、合作、研究方面进行正确的价值判断。科技情报感知主要依托可靠、丰富的数据,借助“互联网+大数据”模式获取信息,在多种资料中得到关键的信息和数据,进而完成科技情报的感知工作。同时,数据源具有冗余度高、形式多样、存储量大的优势,因此能够落实科技情报感知工作,筛选数据源、除去冗余数据、分析剩余有效信息。借助数据集模式与知识储备库、感知数据库一同为感知过程提供信息支持。内容感知系统内的数据源并非固定不变,且信息的更新速度较快、技术淘汰时间较短,因此内容感知是实时更新、持续变化的数据系统。基于相关辅助项目,帮助用户了解工作内容。例如,借助“科技情报产品报告”为感知系统研究和应用提供支持,该报告可以帮助用户了解系统,提前评估系统实际能力,便于用户针对性提出情报需求。

(2)系统实现模式。a.数据源存储。若想发挥科技情报的自动感知作用,系统内需要具备大容量数据集合,进而为感知产品提供分析支持。同时,数据处理过程中对于信息查询、存储挑战较大。因此,本课题结合Neo4j 数据库、互联网技术提升数据处理和存储效率,提高系统适应水平,保证其良好的查询效率。Neo4j 数据库主要划分为两类应用模式:服务器模式、内嵌模式。本课题利用内嵌模式,借助Java-API,将Neo4j 数据库和图模型相互整合。由于API 的特点是数据结构灵活,因此可以通过直接编码的模式和图数据库完成交互操作。b.数据源分类。若想对数据源完成自动分类,建议识别数据源的结构功能。例如,利用机器学习、词汇特征等方式划分数据源的功能及结构。依托数据源要素、类型词汇特点、词汇分布特征等方面,依托神经网络内分类器训练模式,围绕领域技术、专题、情报报告、组织数据库等方面对数据源进行分类[3]。c.构建任务抽取模型。结合用户需求抽取目标任务可以充分发挥科技情报的自动感知优势,优化RNN 模块。在研究阶段利用Bi-LSTM-CRF、卷积网络模型抽取数据源,并借助长短时双向记忆模型化解RNN 梯度爆炸、消失情况。抽取模型内的输入数据是卷积,包含知识元素、句子、词等特征向量,而输出数据则依托(Conditional random field)条件随机得到结果完成预测。此模型借助多元组的方式展示数据源抽取结果,围绕数据源性质、事项、主体、依据、对象等要素进行连接。

上一篇:新中国70年科技情报事业发展的经验和启示*
下一篇:大数据环境下科技情报研究模式的思考