博客
关于我
编译原理及技术(二)——上下文无关文法及推导
阅读量:796 次
发布时间:2019-03-25

本文共 1114 字,大约阅读时间需要 3 分钟。

一、语法和语义

什么是语法?

语法是程序形式结构的规则集合,定义了程序的描述方式。它包括词法规则语法规则两部分。

词法规则

词法规则定义单词符号的形成规则,主要包括:

  • 常数、标识符、基本字、算符、界符等
  • 描述工具:有限自动机
语法规则

语法规则定义语法单位的形成规则,通常包括:

  • 表达式、语句、分程序、过程、函数、程序等
  • 描述工具:上下文无关文法

什么是语义?

语义是程序意义的规则集合,描述程序执行的目的和结果。常用的描述方法有:

  • 自然语言描述(具有二义性、含有隐含错误和不完整性)
  • 形式描述(如 πεγ-形式理论)

二、文法

文法是描述语言语法结构的规则体系,强调语言形式的规范性。常用于处理自然语言的例子:(示例:句子 "He gave me a book." 的文法规则)

三、语法描述的几个基本概念

(示例图片:语法单元、语法树、推导过程等)

四、上下文无关文法

上下文无关文法(CFG)是一个由四元组 G = (VT, VN, S, P) 定义的形式语言体系,其中:

  • VT:终结符集合
  • VN:非终结符集合
  • S:语法描述的基本形式
  • P:产生式集合

其特点是产生式中的 P 可以由终结符 a(阿尔法)自由替换,无需依赖上下文。

例如,定义仅包含 "+" 和 "*" 的算术表达式文法:

G = ( {i, +, *, (, )}, {E}, E, P )

其中 P 的产生式为:

  • E → i
  • E → E + i
  • E → E * i
  • E → (E)
  • E → (i)

五、文法推导

推导过程是从一个句型到另一个句型的过程,可能不唯一。可能使用最左推导或最右推导(最右推导也称为规范推导)。

推导过程:

  • 含a> 表示带有 a 上下文,可以自由替换。
  • "+" 表示非平方推导(至少一步)
  • "*" 表示推导(至少一步)

文法推导的结果通常以语法树的形式呈现。语法树不唯一意味着文法可能具有二义性。

六、语法树与二义性

文法的二义性(Ambiguity)是指同一个文法推导可能产生两个或多个不同的语法树。

(示例图片:二义性所致的语法树差异)

七、乔姆斯基形式语言体系

乔姆斯基在 1956 年提出了形式语言体系,包含四种文法类型:

  • 型 0 文法:没有非终结符,无法产生下 shifts(无法向后移动)
  • 型 1 文法:有一个非终结符,允许向左和向右移动
  • 型 2 文法:有多个非终结符,可以通过下 shifts 或右移[Sh Ve]
  • 型 3 文法:如型 1 文法,允许自由移动非终结符

型 2 和 型 3 文法的主要区别在于是否允许自由移动非终结符。

型 0 和 型 1 文法应用广泛,常用于描述上下文无关文法限定产生式的语法规则。

转载地址:http://wxbyk.baihongyu.com/

你可能感兴趣的文章
php7和PHP5对比的新特性和性能优化
查看>>
PHP7安装pdo_mysql扩展
查看>>
PHP7实战开发简单CMS内容管理系统(7) 后台登录架构 用户登录校验
查看>>
php7,从phpExcel升级到PhpSpreadsheet
查看>>
PHP8.1 + ThinkPHP实战指南:高效构建现代化网站的六大技巧
查看>>
PHP8中match新语句的操作方法
查看>>
PHP:第一章——PHP中常量和预定义常量
查看>>
PHP:第一章——PHP中的位运算
查看>>
phpcms
查看>>
phpcms 2008 product.php pagesize参数代码注射漏洞
查看>>
phpcms V9 自定义添加 全局变量{DIY_PATH}方法
查看>>
Redis五种核心数据结构的基本使用与应用场景
查看>>
Redis五种数据结构简介
查看>>
PHPCMS多文件上传和上传数量限制
查看>>
phpEnv的PHP集成环境
查看>>
PHPExcel一些基本设置总结
查看>>
phpexcel中文手册
查看>>
PHPExcel导入导出 若在thinkPHP3.2中使用(无论实例还是静态调用(如new classname或classname::function)都必须加反斜杠,因3.2就命名空间,如/c...
查看>>
phpize及其用法
查看>>
phpMailer发送邮件
查看>>