语义分析理论中并没有语法和词法分析阶段中那么多算法。如同整个编译原理里大部分理论
一样,其都是为实践编码提供理论支持,从而可以让实现简单机械地进行---语法制导翻译
也正是出于这个目的:通过建立理论,使得从语法树翻译到中间代码(或者虚拟机代码)更
为简单。
个人理解,语法制导翻译就是在文法中加上属性和各种动作,这些动作基本也就是这里的“
翻译”;而语义分析,则是在整个过程所要进行的一些上下文相关的分析动作(如类型检查
)。
罗列一些概念:
- 属性:就是语法树各个节点上所需要的“值”,例如对于算术表达式a=b+c,在其语法树
中,每一个节点都会有一个数字属性。属性明显不止包含数字/值这些东西,某个节点包含
哪些具体属性完全取决于编译器实现的需要。对于表达式a=b如果需要检查a和b的类型是否
可以赋值(如在c语言中,struct XXX b就无法传给int a),就需要在其节点中附加类型属
性。---这里举的例子也正是一种语义分析行为。
- 综合属性:某个节点的属性依赖于其子节点的属性,这种属性计算起来很简单,尤其在递
归下降分析程序中。
- 继承属性:某个节点的属性依赖于其父节点或者其兄弟节点。这个属性计算起来要稍微麻
烦一些,需要一种属性传递机制。在上一篇LL分析法的练习程序中,就使用了一个“值栈”
来传递属性。
- 依赖图:上面提到属性之间的依赖,在一棵语法中,通过箭头描绘出这种依赖关系就得到
依赖图,说白了就是拿来方便看的,无视。
- 语法制导定义(SDD):学编译原理最烦的就是这些定义,一句话里总觉得有若干未知概
念,尤其在翻译比较烂的时候。我觉得这个SDD就是在文法中穿插了若干属性和翻译动作的
表示。
- S属性的SDD:如果一个SDD的每一个属性都是综合属性,那它就是S属性的。
- L属性的SDD:无视了,就是夹杂着综合属性和继承属性的SDD,不过继承属性有诸多条件
限制,大致上就是其某个属性的依赖关系仅限于其左兄弟或者父节点。
其实这一切都并非它看上去的那么繁杂。在有了语法分析的基础上,因为马上涉及到翻译为
中间代码(甚至会直接翻译为虚拟机代码),在这个阶段直接把代码中会做的事情书写到文
法里,就得到了SDD。按照这个SDD,就可以较为机械地对应写出代码。另一方面,在实际中
为了处理不同的翻译问题,如类型检查、各种控制语句的翻译,直接参考相关的资料,看看
别人怎么处理的就行了。
练习程序是一个简单地处理c语言定义变量、定义struct类型的代码。因为c语言里的变量会
附带类型属性,用于类型检查之类的问题,所以程序中保存这些变量的符号表自然也要保存
其类型。定义新的struct类型我这里直接建立了一个类型表,用于存储所有的类型:基本类
型和程序员自定义类型。
练习程序直接使用了lex和yacc来生成词法和语法分析模块,通过直接在文法文件里(*.y)的
文法中穿插各种动作来完成具体的处理逻辑。本来我最开始是想个类型检查程序的,起码可
以检查一般的类型不匹配错误/警告,不过后来仅仅做了变量/类型定义,就发现有一定代码
量了,索性就懒得做下去了。
下载例子