编译原理及技术(二)——上下文无关文法及推导-白红宇

编译原理及技术(二)——上下文无关文法及推导

阅读量：796 次

发布时间：2019-03-25

本文共 1114 字，大约阅读时间需要 3 分钟。

一、语法和语义

什么是语法？

语法是程序形式结构的规则集合，定义了程序的描述方式。它包括词法规则和语法规则两部分。

词法规则

词法规则定义单词符号的形成规则，主要包括：

常数、标识符、基本字、算符、界符等

描述工具：有限自动机

语法规则

语法规则定义语法单位的形成规则，通常包括：

表达式、语句、分程序、过程、函数、程序等

描述工具：上下文无关文法

什么是语义？

语义是程序意义的规则集合，描述程序执行的目的和结果。常用的描述方法有：

自然语言描述（具有二义性、含有隐含错误和不完整性）

形式描述（如 πεγ-形式理论）

二、文法

文法是描述语言语法结构的规则体系，强调语言形式的规范性。常用于处理自然语言的例子：（示例：句子 "He gave me a book." 的文法规则）

三、语法描述的几个基本概念

（示例图片：语法单元、语法树、推导过程等）

四、上下文无关文法

上下文无关文法（CFG）是一个由四元组 G = (VT, VN, S, P) 定义的形式语言体系，其中：

VT：终结符集合

VN：非终结符集合

S：语法描述的基本形式

P：产生式集合

其特点是产生式中的 P 可以由终结符 a(阿尔法)自由替换，无需依赖上下文。

例如，定义仅包含 "+" 和 "*" 的算术表达式文法：

G = ( {i, +, *, (, )}, {E}, E, P )

其中 P 的产生式为：

E → i

E → E + i

E → E * i

E → (E)

E → (i)

五、文法推导

推导过程是从一个句型到另一个句型的过程，可能不唯一。可能使用最左推导或最右推导（最右推导也称为规范推导）。

推导过程：

含a> 表示带有 a 上下文，可以自由替换。

"+" 表示非平方推导（至少一步）

"*" 表示推导（至少一步）

文法推导的结果通常以语法树的形式呈现。语法树不唯一意味着文法可能具有二义性。

六、语法树与二义性

文法的二义性（Ambiguity）是指同一个文法推导可能产生两个或多个不同的语法树。

（示例图片：二义性所致的语法树差异）

七、乔姆斯基形式语言体系

乔姆斯基在 1956 年提出了形式语言体系，包含四种文法类型：

型 0 文法：没有非终结符，无法产生下 shifts（无法向后移动）

型 1 文法：有一个非终结符，允许向左和向右移动

型 2 文法：有多个非终结符，可以通过下 shifts 或右移[Sh Ve]

型 3 文法：如型 1 文法，允许自由移动非终结符

型 2 和型 3 文法的主要区别在于是否允许自由移动非终结符。

型 0 和型 1 文法应用广泛，常用于描述上下文无关文法限定产生式的语法规则。

转载地址：http://wxbyk.baihongyu.com/

你可能感兴趣的文章