自然语言处理第9章句法和语义的关系ppt课件.ppt
《自然语言处理第9章句法和语义的关系ppt课件.ppt》由会员分享,可在线阅读,更多相关《自然语言处理第9章句法和语义的关系ppt课件.ppt(66页珍藏版)》请在三一办公上搜索。
1、Chapter 9 句法和语义的关系 2000.04,这一章将讨论联系句子的逻辑形式和句法结构的方法。 这使得在剖析句子过程中,可以的到它的逻辑形式,这种方法我们称之为语义理解 (semantic interpretation); 另外,有一种方法允许我们由一个特定的逻辑形式产生相应的句子结构树,即语义实现 (semantic realization)。 为了完整的联系句法和语义,就需要每一个成分都有其合适的意思表达式。成分的意思和子成分的意思之间的关系可以在带有特征的文法中指定,因为每一个句法规则都有其相应的语义理解规则,这种方法常称为 rule-by-rule方式 的语义理解。,9.7由逻
2、辑形式产生句子,9.1 语义理解和合成性,9.2 一个用于语义理解的简单文法 字典,9.3介词短语和动词短语,9.4词条化的语义理解和语义角色,9.5简单问题的处理,9.6用特征合一的语义理解,End,考查语言中的一些基本结构,在剖析一小段英语过程中建立一个文法来产生每一个成分的逻辑形式,在这两节中所用的逻辑形式是命题-变量的结构。,讨论语义合成的观点并引入演算(lambda calculus)作为建立合成理论的工具。,如何用语义角色来产生逻辑形式,并主要讨论建立分级字典的必要性,因为用它可以减少确定词条意思的工作量。,讨论语义理解中如何处理简单的问题 。,讲述形成逻辑形式的另一种方法,它将利
3、用附加特征,从而比表达方法更具有选择性,这样允许我们表达可逆的文法。,讨论语义实现,阐述对于给出逻辑形式和可逆文法,如何产生相应的句子。,9.1 语义理解和合成性,在语义理解过程中,我们有一个重要的假定:语义的合成过程(compositional process)。这就意味着一个成分的意思可以由它的子成分的意思单独地推导出。合成理论有一些很吸引人的性质,尤其理解可以随着子短语的理解而增加,例如句法中的上下文无关文法就是关于句法的合成理论,只需将规则应用于子成分的类型,不用考虑它们的内部结构,如规则:S NP VP,不管NP的特定形式,通过简单的加入一个NP规则:NP PRO,这样一个新类型的句
4、子就产生了,即具有一个代词处于可接受的位置的任何句子,这个吸引人的性质正是我们进行语义理解所需要的。,语言的合成性常根据严格的标准来定义,一个子成分的意思将在其它子成分的意思映射到新成分的过程中起作用,而在合成方法中,要求常大大放宽,只要按一个成分,一个成分的意思逐渐增加即可。,这将是我们用合成理论所会碰到的难题之一。围绕这个问题,可以引入无范围的逻辑形式(the unscoped logical form)。如果我们定义语义理解的目标是产生一个无范围的逻辑形式,则上个句子将表达成:(LOVES l1 (NAME j1 “Jill”) )它更加接近句子的句法结构。,例1一个典型的问题是带有量词
5、的句子: Jill loves every dog. 这个句子的句法结构只是将词聚集在一起组成短语:(Jill) (loves (every dog) 但这个句子的无歧义的逻辑形式若用谓词-变量的形式(predicate-argument form)描述,则为:(EVERY d :(DOG1 d) (LOVES1 l1 (NAME j1 “Jill”) d),合成模型倾向于使文法更容易扩展和维持。但建立一个语义理解的合成理论看似容易,但做起来难:首先,句子的句法结构和逻辑形式的结构之间存在结构的不一致。,例如:短语every dog是动词短语 loves every dog的一个子成分,然而它
6、的语义理解广义的量化短语(EVERY d :(DOG1 d) 看起来象是把动词短语的意思作为它的一部分;更糟糕的是好象把every dog的理解分裂开了:将量词结构和变量从谓词中分离出来。结果是很难看出every dog孤立地代表什么意思及如何用它来构造整个句子的意思。,这表明对于每条狗 d 都有一个由 Jill loving d 的事件l1。在这当中,逻辑形式的各个部分和句法分析中的成分之间就不是简单的一一对应关系。,它的意思是 Jack died,这种理解似乎与动词 kick 以及 bucket 毫无关系。这样的句子的意思就不象是由子成分的意思构造出来,处理这种情况的一种方法是允许将语义意
7、思赋予整个短语,而不是根据语义合成。我们原来就假设基本单元是单词(或词素),习惯用语的表达则建议将其推广,使得一个完整的短语可以有一个基本的(即不用推导的)意思。这样动词短语 kick the bucket 有着类似于动词 die 的基本意思。在合成意思不能应用于理解习惯用语时,通过观察特定的句法意译来匹配这些句子。 例如:表示被动的句子The bucket was kicked by Jack,就不能解释成 Jack died。,对于合成理论的另外一个挑战是习惯用语。 例2 你可以说Jack kicked the bucket。,解决这个问题的另一种方法是对习惯用语中出现的单词引入新的意义。
8、例如,kick 将有一个意思 DIE1,它的宾语的子词类是 BUCKET1 类型。虽然习惯用语是语言中一个非常有趣而且很重要的方面,但在接下去的几章中,我们将没有讨论它。为了达到本书的目的,你可以假设基本意思总是和单词联系在一起。,有趣的是,这个句子是有歧义的,它有一个由每个词的意思所构造的意思:(KICK1 k1 (NAME j1 “Jack”) 而另一个由词Jack和短语kick the bucket的基本意思所构造的意思:(DIE1 d1 (NAME j1 “Jack”),如果语义理解的过程是合成,那么你必须能够赋予任何的句法成分一个相应的语义结构。比如:你必须能够赋予每一个动词短语一些
9、固定的意思形式,使它能够用于含有VP子成分的规则。,考虑最简单的情况,动词短语只包含一个不及物动词,如句子 Jack laughed。一种方法是动词短语 laughed 的意思是作为一个一元谓词 (a unary predicate),这对任何对象的 laughed(过去形式)动作来说是为真。这种方法能一般化吗?也就是说,每个动词短语VP都有一个意思,即是作为一个一元谓词吗?考虑句子 Jack kissed Sue。它的逻辑形式是:KISS1 k1 (NAME j1 “Jack”) (NAME s1 “Sue”) 动词短语 kiss Sue 的意思是什么?它作为一元谓词,对任意对象作了kiss
10、ed Sue 的动作来说都是为真的吗? 但是,到目前为止我们仍无法表达这样复杂的一元谓词。,BOX 9.1 演算 (lambda calculus) 和变换(lambda reduction),演算的式子包含一个等价的断言: = 这个系统中最关键的公理是 ( x Px )a) = Px/a其中Px是包含x的任意式子,在式子Px/a中,用a替代所有的x。我们定义两种操作:变换(lambda reduction) 提取(lambda abstraction) ,演算将可以用来表达上面的例子,尤其表达式 (x (KISS k1 x(NAME s1 “Sue”) 是带一个变量的谓词,你可以将 x 看作
11、变量,而且这个谓词对任意的对象 O 来说都是为真的,这样在表达式的最终结果中子成分 O 对 x 来说是一个正确的命题。象其他谓词,你可以由表达式和变量构造一个命题。在逻辑形式语言,下面这个命题:(x (KISS1 k1 x (NAME s1 “Sue”) (NAME j1 “Jack”),我们通常说的最终表达式是通过表达式 (x (KISS1 x (NAME s1 “Sue”)应用于变量 (NAME j1 “Jack”)而获得的,这个操作称为 变换 (lambda reduction )。,当且仅当 (NEME j1 “Jack”) 满足谓词 (x(KISS k1 x(NAMEs1 “Sue”
12、)时,这个命题为真。 而当且仅当 (KISS1 k1 (NAME j1 “Jack”) (NAME s1 “Sue”)为真,上述定义的命题为真。,我们已经不得不引入新的概念如表达式。你可以试图放去这种方法,而建立其他方式的语义理解,然而,当处理更大的文法或更复杂的情况时,合成理论将更吸引人。,例3 用这种方式,动词短语可以容易地连接,即使他们具有不同的句法结构,象句子:Sue laughs and opens the door. 这个句子含有两个VP:laughs和opens the door。,它们可以合并成为一个复杂的一元谓词,即(a (&LAUGHS1 l2 a) (OPENS1 o2
13、a ) 它在句子someone who both laughs and open the door.中作一元的谓词是为真的。,这是动词短语的正确形式,它可以和其它成分 (如其它VP) 连接,比如可以应用于作主语的NP,其逻辑形式为 (NAME s1 “Sue”) ,从而形成一个原始的句子: (& (LAUGHS1 l2 (NAME s1 “Sue”) (OPENS1 o2 (NAME s1 “Sue”) ),前者是在句子 someone who laughs. 中作一元谓词是为真的,即 (a (LAUGHS1 l2 a); 后者在句子 someone who opens the door. 中
14、作一元谓词是为真的,即(a (OPENS1 o2 a )。,考虑其它例子:介词短语修饰的名词短语可以有很多方法处理,例如对于名词短语 The man in the store 中的介词短语 in the store,我们可以有一个不独立的意思。一种特定的技巧可先寻找修饰的位置,然后合起来理解。但这种技巧在理解句子 The man is in the store.或The man was thought to be in the store.时是无助的。如果介词短语有一个独立的意思,如一元谓词:(o (IN-LOC1 o ) 它作为名词短语的修饰语(增加一个新的限制)以及作为句子的谓语一样,很容
15、易理解。,名词短语The man in the store的逻辑形式是:) 而句子The man is in the store.的逻辑结构则为 ) 这是两个简单的例子,如果你采纳语义合成的话,那么还会产生许多其他推广。,通常,每个主要的句法短语都对应着特定的语义结构: VPs和PPs 映射为一元的谓词 (可能是不能用表达式建立的复杂的表达式); 句子映射到命题; NPs则映射到术语; 小的词类映射到表达式,在表达式中定义它们在大的词类中的作用。,既然在相同的句法中的每个成分映射到同种的语义结构,这可以按一定的格式处理,例如:你可以不知道VP的特定结构,只要它的意思是一个一元谓词,你就可以用它
16、来建立包含它的更大的成分。,9.2一个用于语义理解的简单文法和字典,这一部分将构造一个简单文法和字典来说明:在剖析时如何利用特征建立逻辑形式。为了使例子简单化,我们所要的逻辑形式先不用主题角色表示(the thematic role representation) ,而是采用上一节的谓词-变量结构来表示,这使得所有带相同子类型结构的动词可以以相同的方法处理。在9.4节再讨论确定主题角色的框架是如何生成。,对于每一条词条和文法规则,我们需要增加一个SEM特征,例如:规则(S SEM (?semvp ?semnp) (NP SEM ?semnp) (VP SEM ?semvp) 在给了带有SEM
17、(NAME m1 “Mary”) 的NP子成分和带有SEM (a (SEE1 e8 a (NEME j1 “Jack”)的VP子成分时,考虑这条规则是什么? 新成分S的SEM特征是简单的表达式: ( (a (SEES e8 a (NAME j1 “Jack”) (NAME m1 “Mary”) ),用变换简化后:(SEES1 e8 (NAME m1 “Mary”) (NAME j1 “Jack”) 它正是我们所希望得到的句子。 图9.1 给出了当每个成分带有SEM特征时句子的剖析过程。,S SEM (SEES1 e8 (NAME m1 “Mary”) (NAME j1 “Jack”),NPSE
18、M (NAME m1“Mary”),VP SEM ( a (SEES1 e8 a NAME j1“Jack”),V SEM SEES1,NP SEM (NAME m1 “Jack”),图9.1 带有SEM特征的一棵剖析树,Exit,在字典中,我们用SEM特征来描述各个单词的可能意思,因为有不同的一元谓词, 故通常一个词的不同子类型有着不同词意。图9.2给了一个简单的字典。,一个词的不同 SEM 形式取决于它的句法特征,这就需要有不同的词条。例如:动词decide有两个词条:一是 SUBCAT 为 _none 的情况;另一个是 SUBCAT为 _pp:on;单词fish也有两个词条,因为它的SE
19、M特征取决它是单数还是复数。, (VP VAR ?v SEM ( a2 (?semv ?v a2) (V_none SEM ?semv) (VP VAR ?v SEM ( a3 (?semv ?v a3 ?semnp ) (V_np SEM ?semv) (NP SEM ?semnp) 规则2、3则处理及物和不及物动词并形成合适的VP解释。它们都带有SEM特征 (?semv) 从而构造了一个一元谓词,这个谓词能够应用于主语。代表动词时态的变量包含三部分:一个事件变量 an event variable (存储于VAR特征中)、代表主语的变量以及其它子类型成分变量。,对于文法9.3,它能接受很简
20、单的句子和动词短语并建立其逻辑形式,注意到我们又引入一个附加于SEM特征的新特征:VER。它存贮着与成分相对应的语段变量(the discourse variable),它对后面处理一定形式的修饰语特别有用。当由单词构造词条成分时,VER特征将由剖析器自动生成,通过把VER当作主特征来沿剖析树传递,它保证了语段变量的唯一。,(S SEM (?semvp ?semnp) (NP SEM ?semnp) (VP SEM ?semvp),Exit,(NP WH- VAR ?v SEM (PRO ?v ?sempro) (PRO SEM ?sempro) 给定代词的形态 (?sempro) 后,规则4
21、则为代词构造一个带合适的SEM特征 ;,(NP VAR ?v SEM (NAME ?v ?semname) (NAME SEM ?semname) 规则5对合适的names做同样的变换;,(NP VAR ?v SEM ) (ART SEM ?semart) (CNP SEM ?semcnp)规则6定义一个未量化的表达式,它包含量词 ?semart,语段变量 ?v 和一个命题(可以将一元谓词 ?semcnp 应用于语段变量来获得)。例如:假设语段变量 ?v 为m1,名词短语the man将绑定 the 的SEM特征 (即操作THE)和 man 的SEM特征(即MAN1),从而得到表达式;, (C
22、NP SEM ?semn) (N SEM ?semn) 规则7建立一个关于单个N的简单CNP,因为普通名词的SEM特征已经是一元谓词,故其值就是CNP的SEM特征。,为了处理SEM特征,关于词型推导的词条规则就需要修改,如将一个带有SEM特征的单数名词转换成复数,就要增加复数操作:(N AGR 3p SEM (PLUR?semn) (N AGR 3s IRREG-PL SEM ?semn) +S,我们可以用一个相似的技巧:对于现在时和过去时,插入一个无时态操作。修改后的词型规则如文法9.4所示,这些规则和文法4.5的初始规则相同,只增加了SEM特征 (详见Page 269):,文法 4.5,文
23、法 9.4,在处理语义理解时,只需修改标准的图表剖析方法中的两个地方: 当一条词条规则能使用时,将VER特征赋予一个新的语段变量。 无论何时建立一个成分,都用所有可能的变换来简化SEM特征。 经过这两个变化,现有的剖析器可以剖析并形成逻辑形式。考虑句子:Jill saw the dog.它的剖析过程如图9.5所示。,这一节总的介绍基本的语义理解过程,并引入两个新的特征和两处小的扩展。在剖析过程中由文法建立其逻辑形式,这种技术可以用于本书讨论的任何基于图表剖析方法。,图9.5,9.3 介词短语和动词短语,首先,考虑处理助动词的规则:(VP SEM (a1 (?semaux (?semvp a1)
24、 (AUX SUBCAT ?v SEM ?semaux) (VP VFORM ?v SEM ?semvp),这样有助于观察这种类型的SEM式子:通过将表示主语的变量移动 (“lifting”)到 CAN1 操作之后。以动词短语的理解 (x (LAUGHS1 e3 x)开始,建立一个新的包含CAN1操作的式子,而在式子的外部仍为主语保留变量。注意到:象所有的VPs,新的SEM特征是一个一元谓词,可以将它应用于主语,因此,助动词规则就可以递归地分析更复杂的助动词系列。,在这条规则为新的VP在合适位置插入一个情态动词,如果?semaux是情态动词 (如CAN1);?semvp为表达式 (x (LAU
25、GHS1 e3 x),根据助动词规则,动词短语can laugh的SEM特征是(a1 (CAN1 ( x (LAUGHS1 e3 x)a1),它可以简化为 (a1 (CAN1 (LAUGHS1 e3 a1)。,上一节已引入我们在语义理解时所需要的东西,而这只引入简单的理解技术而已。这一节将举一些例子:利用文法规则来处理一些更复杂的情况,更详细的讨论对动词短语和介词短语的理解。,我们先考虑作修饰语的情况,此时PP的SEM特征是一元谓词,它将应用于最终修饰的成分。这样下面的规则是用于建立PP修饰语:(PP SEM ( y (?semp y ?semnp) (P SEM ?semp)(NP SEM
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自然语言 处理 章句 语义 关系 ppt 课件
链接地址:https://www.31ppt.com/p-1465402.html