中国科技核心期刊      中国指挥与控制学会会刊     军事装备类重点期刊
研究论文

一种融入领域知识的领域短文本命名实体识别方法

  • 戎纪光 ,
  • 任志国 ,
  • 李书强
展开
  • 中国电子科技集团公司第五十四研究所, 河北 石家庄 050081

戎纪光(1973—),男,硕士,高级工程师,研究方向为机器学习与数据融合。

任志国(1985—),男,工程师。

Copy editor: 胡前进

收稿日期: 2023-12-26

  修回日期: 2024-02-24

  网络出版日期: 2024-05-29

A domain short text naming entity recognition method integrated with domain knowledge

  • RONG Jiguang ,
  • REN Zhiguo ,
  • LI Shuqiang
Expand
  • The 54th Research Institute of China Electronics Technology Group Corporation,Shijiazhuang 050081, China

Received date: 2023-12-26

  Revised date: 2024-02-24

  Online published: 2024-05-29

摘要

针对领域短文本中命名实体在计算资源受限情况下识别率不高的问题,设计了一种融入领域知识的双BiLSTM_CRF+全连接网络模型,对领域短文本命名实体进行识别。利用领域知识图谱中的关键知识实体及其关键关系,经投影变换、聚类和全局向量词嵌入处理,并基于词向量相似性计算,发现与待识别领域命名实体相似的关键知识实体,将其替换为关键知识实体后生成新的领域短文本,与未替换的领域短文本一同输入模型中进行命名实体识别,使领域知识融入领域短文本的命名实体识别过程,实验结果表明本方法较现有其他同类方法获得了较优的识别能力。

本文引用格式

戎纪光 , 任志国 , 李书强 . 一种融入领域知识的领域短文本命名实体识别方法[J]. 指挥控制与仿真, 2024 , 46(3) : 123 -129 . DOI: 10.3969/j.issn.1673-3819.2024.03.018

Abstract

Addressing the issue of relatively low recognition rates for named entities in domain-specific short texts under resource-constrained computational environments, a novel hybrid model combining a Dual BiLSTM_CRF architecture with a fully connected network is designed to identify named entities in these texts. The model leverages critical knowledge entities and their key relationships from a domain knowledge graph, which undergoes projection transformation, clustering, and global vector word embedding processing. Based on the calculation of word vector similarities, it identifies similar critical knowledge entities to those being recognized within the domain. These identified knowledge entities are then substituted into the original domain short text, generating an augmented version that is fed, along with the unmodified text, into the model for named entity recognition. This integration of domain knowledge into the recognition process of named entities in domain-specific short texts has shown promising results. Experimental outcomes demonstrate that this method outperforms existing comparable approaches in terms of its enhanced identification capabilities.

在军事和警用领域中,信息大量依赖简短文本形式交互,诸如社情、舆情、军情、警情等信息。由于时间紧迫、人员技能不高、传输带宽受限等因素,该类文本在表现出领域性强及识别难度大的同时,还具有长度较短、指代不清、术语不准、上下文语境缺失、关键词上下文位置不固定、描述方式大相径庭等不足。迅速且精准地从领域短文本中识别出关键的命名实体,对于有效处理和分析相关情报有着较高的应用价值。在军事命名实体识别方面,诸多学者进行了积极探索。田俊玮[1]采用条件随机场(Conditional Random Fields, CRF)模型针对军事领域的中文术语进行抽取;冯蕴天[2]在建立条件随机场模型对军事命名实体进行识别的同时,还使用基于词典的方法和基于规则的方法对识别结果进行校正;单义栋[3]提出了一种基于多标签的标注方法,对复合的军事命名实体进行标注识别;杜晓明[4]设计并实现了一个基于PyQt5应用程序基本框架的命名实体识别语料库构建系统;徐建国[5]提出了一种基于深度学习的装备技术实体识别与选择的方法;雷树杰[6]设计了一种把军事领域特征向量引入Bi-LSTM+CRF的模型,专门针对武器装备名称实施自动识别的技术方案。在通用领域的命名实体识别方面,文献[7-10]使用BERT等预训练模型对中文命名实体进行识别并取得了良好的效果。但由于预训练模型所需的计算、存储等资源要求都较高,致使目前在计算、存储等资源受限的特定领域无法得到广泛应用。
本文的研究工作主要聚焦于如何在资源受限环境下提升领域短文本中命名实体识别的准确性。首先,本文通过利用领域知识图谱中已有的关键知识实体及其关系,并经过投影变换和聚类操作,在统一空间中加速相似知识实体的搜索;其次,创新设计了一种双BiLSTM_CRF+全连接网络模型,将替换关键知识实体后的领域短文本与未替换待识别命名实体的领域短文本输入该网络模型,从而将领域专业知识有机地融入领域短文本的命名实体识别流程中。

1 融入领域知识和深度学习的领域短文本命名实体识别

1.1 领域词向量空间及知识实体词向量生成

文献[11-13]将知识表示、知识抽取、知识融合等知识图谱相关技术运用到领域知识图谱构建和应用中,利用知识图谱带来的技术优势,促进领域知识在特定领域中的推广和运用;文献[14-16]将知识图谱技术运用到关键短语提取、短文本实体链接等中文短文本处理领域,有效获取与短文本相关的先验知识,弥补了短文本本身因篇幅限制而导致的上下文信息匮乏的问题,进而获得了较为明显的提升效果。文献[17-20]介绍了多种基于知识图谱的知识实体转换方法,为知识迁移、更新和重构提供了理论依据和技术支持,进一步拓宽了知识图谱技术在不同文本理解和智能信息处理任务中的适用范围和能力。
本文设计了一种融入领域知识的双BiLSTM_CRF+全连接网络领域命名实体识别模型,该模型融合了领域知识。首先,从已有领域知识图谱中,选取领域关键知识实体及关键知识实体间的关键实体关系,通过关键知识实体间的关键实体关系,将关键知识实体投影转换为新知识实体;其次,生成新知识实体关系和新知识实体邻接矩阵,并利用新知识实体邻接矩阵对新知识实体进行聚类,将已积累的领域短文本(其中的命名实体已被识别);最后,作者在使用JIEBA分词工具进行分词后,及新知识实体的邻接矩阵使用全局向量词嵌入模型(GloVe)[21]对进行词嵌入训练,生成领域词向量空间、新知识实体的词向量和聚簇中心新知识实体词向量,流程如图1所示。
图1 领域词向量空间及新知识实体词向量生成

Fig.1 Domain word vector space and new knowledge entity word vector generation

首先,从军事、警用等已有领域知识图谱中,选取领域关键知识实体及关系。如在军事领域的知识图谱中,关键知识实体主要包含作战主体、作战对象、编配装备、作战行为、作战意图等,关键知识实体间关键关系主要包含隶属、配属、编配、部署、执行、实现等(以下将“关键知识实体”简称“知识实体”,将“关键实体关系”简称“实体关系”)。
其次,通过如下步骤,可利用知识实体及知识实体间的实体关系,经投影变换生成新知识实体及新知识实体关系。
步骤1.根据知识实体间的实体关系,构建知识实体关联矩阵S,其中,矩阵中两知识实体关联度sij为领域知识图谱中知识实体ei,与知识实体ej在知识图谱中关联关系的度值,通过如下步骤,可基于知识实体关联矩阵S,生成知识实体投影转换矩阵A
步骤1-1:通过公式(1),计算wij,从而生成知识实体关联转换矩阵W,σ可默认取1。
wij= e - S i j σ 2
步骤1-2:通过公式(2),计算dii,从而生成对角矩阵D
dii= j = 1 nwij
步骤1-3:通过公式(3),生成知识实体投影转换矩阵A
A=D-1/2WD1/2
其次,通过如下步骤,生成新知识实体,对新知识实体进行聚类,并生成聚簇中心新知识实体集合。
步骤2-1:将知识实体e,通过投影转换矩阵A,生成新知识实体e',e'=Ae,对每个新知识实体e',E表示所有新知识实体集合, E表示所有新知识实体度的和,通过该新知识实体与其他新知识实体间关系度,构建新知识实体集合的关联矩阵S',利用新实体集合的关联矩阵S'计算存在关系的所有新知识实体的集合,其中,EiEj分别表示与新知识实体e'ie'j存在关系所有新知识实体的集合, E i表示集合Ei中各新知识实体度的和, E j表示集合Ej中各新知识实体度的和。
步骤2-2:通过公式(4),可计算新知识实体e'i和新知识实体e'j的相似性距离dij,其中,EiEj为集合Ei与集合Ej中共有新知识实体的集合, E i E j表示集合EiEj中新知识实体度的和。
dij=1- l n ( m a x ( E i , E j ) ) - l n ( E i E j ) l n ( E - l n ( m i n ( E i , E j ) ) )
步骤2-3:基于公式(4)的知识实体相似性距离,采用K-均值聚类方法对新知识实体进行聚类计算,得到新实体的聚类结果及每个聚类中心所对应的新知识实体e'c,全部新知识实体e'c构成聚簇中心新知识实体集合Ec
最后,本文将已积累的领域短文本(其中的命名实体已被识别),使用JIEBA分词工具进行分词和停用词后,与新知识实体集合的关联矩阵S',一起用全局向量词嵌入模型(GloVe)进行词嵌入训练,生成领域命名实体词向量空间及新知识实体词向量。

1.2 模型构建

在文献[22-23]等研究工作的基础上,本研究构建了一个双BiLSTM_CRF+全连接网络的新型模型。双BiLSTM_CRF网络分别为替换知识实体BiLSTM_CRF网络以及识别命名实体BiLSTM_CRF网络,将替换知识实体BiLSTM_CRF网络的输出与识别命名实体BiLSTM_CRF网络的输出,共同输入一个全连接网络,通过对各个网络参数进行联合训练,形成最终的融入领域知识的双BiLSTM_CRF+全连接领域命名实体识别模型,模型如图2所示。
图2 融入领域知识的双BiLSTM_CRF+全连接领域命名实体识别模型

Fig.2 A dual-BiLSTM_CRF + fully connected domain named entity recognition model that integrates domain knowledge

对于每一个BiLSTM_CRF网络,将词向量矩阵送入BiLSTM_CRF网络,可通过公式(5)(6),得到每个词向量前向与后向上下文的表示,其中,cl(wi)为词向量wi的前向上文表示,e(wi-1)为前向上文下一个词的词向量,W(l)为前向隐含层转移矩阵,W(sl)是另一前向隐含层转移矩阵,用于将当前词的语义与前向上文的下一个词相结合,bl为前向偏置参数;cr(wi)为词向量wi的逆向下文表示,e(wi+1)为逆向下文下一个词的词向量,W(r)为逆向隐含层转移矩阵,W(sr)是另一逆向隐含层转移矩阵,用于将当前词的语义与逆向下文的下一个词相结合,br为后向偏置参数;最后,通过公式(7),得到词向量wi的最终输出。
cl(wi)=tanh(W(l)cl(wi-1)+W(sl)e(wi-1)+bl)
cr(wi)=tanh(W(r)cr(wi+1)+W(sr)e(wi+1)+br)
c(wi)=[cl(wi)⊕cr(wi)]
对于每一个CRF模块,以BiLSTM网络提取的词向量输出序列C={c(w1),c(w2),…,c(wi),…,c(wn)}为输入,依据序列标签间的依赖关系,可通过如下步骤,求解最优标签序列。
首先,对于词向量输出序列C,其对应的预测标签序列可记为Y,Y={y1,y2,…,yi,…,yn},其中n为词向量序列长度,可通过公式(8)计算预测标签Y估值得分Z,其中, z y i , y i + 1为标签yi转移yi+1的概率, a c ( w i ) , y ic(wi)被标记为标签yi的概率。
S(Z,Y)= i = 1 n( z y i , y i + 1+ a c ( w i ) , y i)
接下来,通过公式(9),构建S(Z,Y)的似然函数,通过公式(10),计算标签序列Y最大似然值Y*
log e S ( Z , Y ) y ˜ Y S ( Z , y ˜ )=S(Z,Y)-log ( y ˜ Y e S ( Z , y ˜ ) )
Y*=argmax S(Z, y ˜)
最后,两个CRF模块的输出预测标签序列Y*,作为全连接层的输入,根据公式(11)计算最终的命名实体识别结果O,其中W是全连接网络的权重,b是偏置。
O=WY*+b

1.3 模型训练

首先,本文将包含已被识别命名实体的领域短文本,按照在该领域短文本中上下文关系,基于领域命名实体词向量空间,生成该领域短文本的命名实体词向量序列,在上文生成的新知识实体聚簇中,通过如下步骤,计算与命名实体词向量最相似的新知识实体。
步骤3-1:在命名实体词向量集合中顺序选取一个命名实体词向量,利用公式(12),计算命名实体词向量与新知识实体的相似性,其中rm是命名实体词向量, r e c '是聚簇中心新知识实体集合Ec中的某聚类中心实体ec'对应的新知识实体词向量。
s(rm, r e c ')= r m · r e c ' r m · r e c '
步骤3-2:计算max(s(rm, r e c ')),若最大值小于给定阈值∂(一般取0.6)则认为未找到相似新知识实体类,若最大值大于给定阈值∂且存在多个相同最大值,随机选择其中一个,则认为该rm隶属于该聚类,若最大值大于给定阈值∂且只存在一个,则认为该rm隶属于该聚类。
步骤3-3:利用公式(12),计算命名实体词向量与该聚类中每个新知识实体词向量的相似性,re'是新知识实体词向量,若相似性最大值小于给定阈值δ(一般取0.75)则认为未找到相似新知识实体,若最大值大于给定阈值δ且存在多个相同最大值,则随机选择其中一个re',为该命名实体最相似新知识实体的词向量,若存在最大值大于给定阈值δ且只存在一个,则为该命名实体最相似新知识实体的词向量。
步骤3-4:重复以上步骤,为命名实体词向量序列中每一个命名实体找到相应新知识实体向量。
其次,以相应新知识实体词向量替换集合中相应命名实体词向量,生成替换知识实体后的词向量序列,将替换知识实体后的词向量序列输入替换知识实体BiLSTM_CRF网络,将未替换知识实体后的词向量序列同步输入识别命名实体BiLSTM_CRF网络,把两个网络的输出,输入一个全连接神经网络。
最后,批量选取领域短文本,重复以上步骤,以领域命名实体识别交叉熵作为损失函数,以学习率为0.01的小批量随机梯度下降作为优化算法,联合训练替换知识实体BiLSTM_CRF网络、识别命名实体BiLSTM_CRF网络和全连接网络参数,形成最终的融入领域知识的双BiLSTM_CRF+全连接领域命名实体识别模型,模型训练流程如图3所示。
图3 训练融入领域知识的双BiLSTM_CRF+全连接领域命名实体识别模型

Fig.3 Train a dual-BiLSTM_CRF + fully connected domain named entity recognition model that integrates domain knowledge

2 实验与分析

2.1 实验数据集

本文实验采用的数据包含军事领域知识图谱数据集和军事领域短文本数据集,其中军事领域知识图谱数据集由知识实体、实体关系、实体属性和知识实体描述文本等元素组成。军事领域短文本数据集从5类不同用户积累的数据中随机抽取组成,且每份领域短文本中包含的领域命名实体已由专业处理人员识别标记出,实验数据集见表1
表1 实验数据集

Tab.1 Experimental data set

数据集 领域短文
本数量
平均长度
(包含汉字数量)
平均领域命名
实体数量
User1 510 172 15
User2 545 163 13
User3 458 245 23
User4 474 288 29
User5 502 180 17

2.2 参数设置

本文使用Adam作为训练的优化算法,采用L2正则化来降低过拟合,将5类用户数据使用K折交叉验证法进行训练和测试,实验参数设置见表2
表2 实验参数设置

Tab.2 Experimental parameter settings

参数名称 参数值
读取批量 64
序列长度 100
领域词表 3 000
词向量维度 100
隐藏单元 256
隐藏层数 4
学习率 0.01

2.3 实验结果及分析

实验结果采用了机器学习领域常用的正确率P(Precision)、召回率R(Recall)和F1值作为评价指标,F1为PR的调和平均值,选取RNN、LSTM、BiLSTM和BiLSTM_CRF四种循环神经网络模型作对比实验,实验结果见表3
表3 实验结果

Tab.3 Experimental results

模型名称 准确率P/% 召回率R/% F1/%
RNN 67.03 68.14 67.58
LSTM 71.34 70.92 71.13
BiLSTM 75.89 76.39 76.14
BiLSTM_CRF 79.23 79.10 79.16
本方法 84.37 84.84 84.60
从实验结果可以看出,由于能够从前向和反向两个方向对领域短文本中的领域命名实体进行学习,以及加入条件随机场CRF,BiLSTM_CRF模型在正确率P、召回率RF1方面,比RNN、LSTM和BiLSTM模型都有提升。本研究提出的融入领域知识的双BiLSTM_CRF+全连接领域命名实体识别模型,由于融入了已积累的领域知识实体知识,比BiLSTM_CRF模型在正确率P、召回率RF1方面有了进一步提升。
基于5类不同用户积累的数据,将未使用知识实体投影变换、聚类处理的本方法与包含完整处理过程的本方法,也进行了对比实验,两类方法的实验结果见表4
表4 实验统计结果

Tab.4 Experimental results

数据集 平均领域命名
实体数量
包含投影聚类处理与不包含
投影聚类处理的时间比/%
User1 15 90.43
User2 13 95.29
User3 23 85.37
User4 29 84.67
User5 17 87.29
均值 88.61
从实验结果可以看出,模型在整体花费时间方面,包含知识实体投影、聚类处理所花费时间,均小于未包含知识实体投影和聚类处理所花费时间,且随领域短文本中的待识别命名数量增加,减少时间的幅度还会增加。这是由于虽然知识实体投影变换和聚类处理会损失一定的时间,但该过程只是在命名实体及其关系发生变化时才进行处理,并不是每次都参与命名实体识别过程,聚类结果在一定程度上降低了替换知识实体与知识实体相似性搜索的时间消耗,对降低整体识别时间花费产生了一定帮助。

3 结束语

在军事和警用等特定领域中,由于数据稀疏、资源有限以及领域专业知识的复杂性,传统的基于深度学习的命名实体识别方法难以取得理想效果。为解决这一问题,本研究设计了一种将领域知识结合深度学习方法的创新策略。首先,利用已有的军事或警用领域知识,从中提取关键知识实体及其关联关系,通过投影变换和聚类技术将这些实体及关系结构化,并运用全局向量词嵌入模型生成高质量的知识实体词向量表示。模型根据词向量的相似度对领域短文本中的待识别命名实体进行替换,从而减少歧义。其次,将经过知识实体替换操作后的领域短文本与原始未处理的短文本一并输入双BiLSTM_CRF模型中,并附加全连接层以增强模型的特征表达和分类能力。这种设计旨在充分利用领域知识来提升模型对领域特有命名实体的理解和识别准确性。
当然,本文方法也存在着一定的局限性,主要体现在两个方面:一是当前关键知识实体的选择还依赖于人工经验,未来需探索更为自动化的从不同场景下抽取关键知识实体方法;二是尽管该方法在军事领域取得了初步成效,但在其他领域的应用效果和模型泛化能力还需进一步通过更大范围、更多样性的数据集来验证和改进。
[1]
田俊玮. 军事领域中文术语抽取的研究[D]. 大连: 大连理工大学, 2013.

TIAN J W. Research for Chinese Term Extraction in the Military Domain[D]. Dalian: Dalian University of Technology, 2013.

[2]
冯蕴天, 张宏军, 郝文宁. 面向军事文本的命名实体识别[J]. 计算机科学, 2015, 42(7): 15-18, 47.

DOI

FENG W /YT, ZHANG H J, HAO W N. Named entity recognition for military text[J]. Computer Science, 2015, 42(7): 15-18, 47.

[3]
单义栋, 王衡军, 王娜. 基于多标签的军事领域命名实体识别[J]. 计算机科学, 2019, 46(S2): 9-12.

SHAN Y D, WANG H J, WANG N. Named entity recognition in military field based on multi-tags[J]. Computer Science, 2019, 46(S2): 9-12.

[4]
杜晓明, 袁清波, 杨帆, 等. 军事指控保障领域命名实体识别语料库的构建[J]. 计算机科学, 2022, 49(S01): 133-139.

DU X M, YUAN Q B, YANG F, et al. Construction of named entity recognition corpus in field of military command and control support[J]. Computer Science, 2022, 49(S01): 133-139.

[5]
徐建国. 装备技术体系技术实体识别及其影响预测方法[D]. 长沙: 国防科技大学, 2019.

XU J G. Entities Recognition and Impact Prediction Approaches for Technology System-of-systems[D]. Changsha: National University of Defense Technology, 2019.

[6]
雷树杰, 邢富坤, 王闻慧. 融合领域特征向量的武器装备名深度学习识别方法[J]. 计算机应用与软件, 2019, 36(10): 183-189, 226.

LEI S J, XING F K, WANG W H. Deep learning recognition method of weapon equipment Name based on domain feature vector fusion[J]. Computer Applications and Software, 2019, 36(10): 183-189, 226.

[7]
CHANG Y, KONG L, JIA K J, et al. Chinese named entity recognition method based on BERT[C]// 2021 IEEE International Conference on Data Science and Computer Application (ICDSCA). Dalian 2021: 294-299.

[8]
杨飘, 董文永. 基于BERT嵌入的中文命名实体识别方法[J]. 计算机工程, 2020, 46(4): 40-45, 52.

DOI

YANG P, DONG W Y. Chinese named entity recognition method based on BERT embedding[J]. Computer Engineering, 2020, 46(4): 40-45, 52.

DOI

[9]
陈剑, 何涛, 闻英友, 等. 基于BERT模型的司法文书实体识别方法[J]. 东北大学学报(自然科学版), 2020, 41(10):1382-1 387.

CHEN J, HE T, WEN Y Y, et al. Entity recognition method for judical documents based on BERT model[J]. Journal of Northeastern University(Natural Science), 2020, 41(10):1382-1 387.

[10]
蔡庆. 多准则融合的中文命名实体识别方法[J]. 东南大学学报(自然科学版), 2020, 50(5): 929-934.

CAI Q. Chinese named entity recognition based on multi-criteria fusion[J]. Journal of Southeast University(Natural Science Edition), 2020, 50(5): 929-934.

[11]
邢萌, 杨朝红, 毕建权. 军事领域知识图谱的构建及应用[J]. 指挥控制与仿真, 2020, 42(4): 1-7.

DOI

XING M, YANG C H, BI J Q. Construction and application of domain-specific knowledge graph in military field[J]. Command Control & Simulation, 2020, 42(4): 1-7.

[12]
李涛. 威胁情报知识图谱构建与应用关键技术研究[D]. 郑州: 战略支援部队信息工程大学, 2020.

LI T. Research on key technologies for the construction and application of a threat intelligence knowledge graph[D]. Zhengzhou: Strategic Support Force Information Engineering University, 2020.

[13]
佟立飞. 面向海上军事应用的知识图谱智能推荐方法[J]. 舰船电子工程, 2021, 41(8): 34-37.

TONG L F. Intelligent recommended method on knowledge graph for maritime military applications[J]. Ship Electronic Engineering, 2021, 41(8): 34-37.

[14]
徐远威, 李劲华. 基于知识图谱的中文关键短语提取算法[J]. 计算机应用与软件, 2023, 40(6): 250-256, 265.

XU Y W, LI J H. Chinese key phrase extraction algorithm based on knowledge graph[J]. Computer Applications and Software, 2023, 40(6): 250-256, 265.

[15]
MA B, YANG Y T, ZHOU X, et al. Graph-based short text Entity Linking: a data integration perspective[C]// 2016 International Conference on Asian Language Processing (IALP). Tainan 2016: 193-197.

[16]
LI Y, SHI J E, YANG X. Entity linking for Chinese short texts based on BERT and entity name embed-dings[J]. Chinese Journal of Information, 2019, 33(12):66.

[17]
Bordes A, Usunier N, García-Durán A, et al. Translating embeddings for modeling multi-relational data[C]//In: Proc. Of the 26th Int’l Conf. on Neural Information Processing Systems (NIPS). Lake Tahoe: Curran Associates Inc., 2013: 2 787-2 795.

[18]
WANG Z, ZHANG J W, FENG J L, et al. Knowledge graph embedding by translating on hyperplanes[J]// Proceedings of the AAAI Conference on Artificial Intelligence, 2014, 28(1): 1 112-1 119.

[19]
LIN Y K, LIU Z Y, SUN M S, et al. Learning entity and relation embeddings for knowledge graph completion[J]. Proceedings of the AAAI Conference on Artificial Intelligence, 2015, 29(1): 2 181-2 187.

[20]
XIAO H, HUANG M L, HAO Y, et al. TransA: an adaptive approach for knowledge graph embedding[EB/OL]. ArXiv e-Prints, 2015: arXiv: 1509.05490.

[21]
PENNINGTON J, SOCHER R, MANNING C. Glove: global vectors for word representation[C]// Proceedings of the 2014 Conference on Empirical Methods in Natural Language Processing (EMNLP). Doha 2014: 1 532-1 543.

[22]
GRAVES A, MOHAMED A R, HINTON G. Speech recognition with deep recurrent neural networks[C]// 2013 IEEE International Conference on Acoustics, Speech and Signal Processing. Vancouver 2013: 6 645-6 649.

[23]
LAFFERTY J D, MCCALLUM A, PEREIRA F C N. Conditional random fields: probabilistic models for segmenting and labeling sequence data[C]// Proceedings of the Eighteenth International Conference on Machine Learning. 2001: 282-289.

文章导航

/