在当前的信息科技领域,专利技术文档的自动摘要和关键信息提取是一项极具挑战性的任务。随着科技的不断发展,尤其是6G技术的出现和应用,专利文档的数量呈爆炸式增长,使得科技工作者在获取专利信息时面临信息过载和迷航的问题。因此,如何高效准确地从海量专利信息中抽取关键信息,成为了科技情报科学计量与评价领域的重要研究课题。
专利技术功效特征自动抽取方法探索是这项研究中的一个重要分支。技术功效特征通常指的是专利文献中描述的技术内容和该技术能够实现的功能效用。抽取这些特征的目的在于帮助用户更快地理解和吸收专利信息,为专利撰写提供可靠参考,同时降低信息噪音,优化专利检索与分析的工作流程。
当前,专利技术功效特征的自动抽取主要依赖于自动摘要技术。自动摘要技术在专利领域中被分为生成式文本摘要和抽取式文本摘要两大类。生成式摘要通过深度学习技术,如卷积神经网络(CNN)、循环神经网络(RNN)、长短期记忆网络(LSTM)、Transformer等,对文章语义信息进行提取,并通过模型生成新的句子。而抽取式摘要则依据句子的权重,选择那些与主题最相关的句子进行抽取。在专利领域,抽取式摘要通常被认为更适用,因为它可以提高摘要内容的正确性,避免生成不准确甚至错误的信息。
专利技术功效特征抽取方法的设计,需要深入分析专利文本的结构特性,并综合运用图论、机器学习、深度学习等方法。在此基础上,研究人员进一步构建了技术功效矩阵,该矩阵将专利文献中涉及的技术和通过这些技术产生的效果(功效)联系起来,从而精准地定位专利核心技术和客观描述其功能效用。
本文提出的专利技术功效特征自动抽取方法,以6G领域为例,重点对核心技术内容和功能效用描述进行抽取。研究团队设计了抽取方案,对所抽取到的技术内容语句进行核心性计算和评价,并对功能效用语句进行情感分析,从而凝练和筛选得到专利技术功效特征样本。通过对比试验,验证了该方法在ROUGE值(一种衡量自动摘要质量的指标)上的显著提升,说明其在实现专利技术功效特征自动抽取方面具备较同类方法更优的效果。
专利关键信息的自动提取,包括权利要求书和说明书中的技术内容和功能效用。在自动提取的过程中,研究者需要根据说明书的各个部分内容特征,设置合适的抽取范围与抽取方法。例如,技术领域、背景技术、发明内容与具体说明等部分,各自对应着不同的抽取策略。
在实现这些抽取策略时,研究人员需要利用多种技术,比如特征评分和基于图的方法,以及深度学习方法,如Lexrank和TextRank等。这些方法可以帮助研究者捕捉句子内部结构特征,并进行有效的摘要生成。
专利技术功效特征的自动抽取是现代信息科技与知识产权管理相结合的重要研究方向。随着深度学习技术的不断发展,相关的自动抽取方法也将不断进步。专利信息的高效处理不仅能够减轻科技工作者的工作压力,还能够促进技术创新和专利的商业化应用。对于专利分析和应用的研究,将有助于进一步推动6G等前沿技术的发展,并为科研和产业界的专利管理和应用提供强有力的支持。