0
  • 聊天消息
  • 系统消息
  • 评论与回复
登录后你可以
  • 下载海量资料
  • 学习在线课程
  • 观看技术视频
  • 写文章/发帖/加入社区
会员中心
创作中心
发布

完善资料让更多小伙伴认识你,还能领取20积分哦,立即完善>

3天内不再提示

编译器理论之别名分析分类

openEuler 来源:openEuler 作者:openEuler 2022-09-14 10:51 次阅读

1.简介

别名分析是编译器理论中的一种技术,用于确定存储位置是否可以以多种方式访问。如果两个指针指向相同的位置,则称这两个指针为别名。但是,它不能与指针分析混淆,指针分析解决的问题是一个指针可能指向哪些对象或者指向哪些地址,而别名分析解决的是两个指针指向的是否是同一个对象。指针分析和别名分析通常通过静态代码分析来实现。

别名分析在编译器理论中非常重要,在代码优化和安全方面有着非常广泛且重要的应用。编译器级优化需要指针别名信息来执行死代码消除(删除不影响程序结果的代码)、冗余加载/存储指令消除、指令调度(重排列指令)等。编译器级别的程序安全使用别名分析来检测内存泄漏和内存相关的安全漏洞。

2.别名分析分类

别名分析种类繁多,通常按如下属性进行分类:域敏感度(field-sensitivity)、过程内分析(Intra-Procedural)v.s.过程间分析(Inter-Procedural)、上下文敏感度(context-sensitivity)和流敏感度(flow-sensitivity)。

2.1 域敏感(Field-Sensitivity)

域敏感度是对用户自定义类型进行分析的一种策略(亦可以处理数组)。在域敏感维度共有三种分析策略:域敏感(field-sensitive)、域非敏感(field-insensitive)、域基础分析(field-based)。以下面代码为例:

structTest{ intfield1; intfield2; } Testa1; Testa2;

Note:field这里为结构体或者类的数据成员。

域非敏感:对每个对象建模,而对对象中的成员不进行处理;其建模后的结果如下图,仅有a1.*和a2.*的区别:

40092054-334d-11ed-ba43-dac502259ad0.png

域基础分析:仅对结构体中的成员进行建模,而不感知对象。其建模后的结果如下图,仅有*.field1和*.field2:

40233764-334d-11ed-ba43-dac502259ad0.png

域敏感:既对对象建模,又对成员变量进行处理。其建模后的结果如下图,有a1.field1、a1.field2、a2.field1、a2.field2:

403a31b2-334d-11ed-ba43-dac502259ad0.png

处理数组时,相同的原则亦适用。以C整数数组为例:int a[10],域非敏感分析仅使用一个节点建模:a[*],而域敏感分析创建10个节点:a[0]、a[1]、...、a[9]。

总结:域敏感别名分析准确性高,但是当存在嵌套结构或者大数组时,节点数量会迅速增加,分析成本也会陡然上升。

2.2 过程内分析(Intra-Procedural)v.s.过程间分析(Inter-Procedural)

过程内分析仅分析函数体内部的指针,并没有考虑与其他函数之间的相互影响。需要特别指出的是,过程内分析当处理包含指针入参的函数或者返回指针的函数时,其分析可能不够准确。相反,过程间分析会在函数调用过程中处理指针的行为。

过程内分析不易于扩展,精度较低。相比过程间分析,过程内分析更容易实现,且过程内/间分析与上下文敏感度分析高度相关,因为一个上下文敏感分析必定是一个过程间分析。

2.3 上下文敏感度(Context-Sensitivity)

上下文敏感度用来控制函数调用该如何分析。有两种分析方法:上下文敏感(context-sensitive) 和上下文非敏感(context-insensitive)。上下文敏感在分析函数调用的目标(被调用者)时考虑调用上下文(调用者)。以如下代码为参考[1]:

1publicstaticvoidmain(String[]args){ 2Stringname1=getName(3);//Tainted 3Stringsql1="select*fromuserwherename="+name1; 4sqlExecute(sql1);//TaintSink 5 6Stringname2=getName(-1);//NotTainted 7Stringsql2="select*fromuserwherename="+name2; 8sqlExecute(sql2); 9} 10 11privatestaticStringgetName(intx){ 12if(x>0){ 13returnSystem.getProperty("name"); 14}else{ 15return"zhangsan"; 16} 17}

如上所示,getName()方法基于入参的不同,会返回不同的结果,在第2行和第6行,获取到的name1和name2的污点信息不同,当入参为3时,返回的是一个从环境变量中获取的污染的数据,导致sql注入,而当入参为-1时,返回的是一个常量,不是污染数据,不会有问题。在上下文敏感的分析中,在第4行应该报一个sql注入问题,而在第8行则不应该报sql注入问题。而上下文非敏感的分析中,不考虑传入参数的不同,getName()方法则全部返回一个{System.getProperty("name")}∨{zhangsan},从而导致第4行和第8行都会报一个sql注入的问题。

上下文敏感别名分析需要有一种方法,为函数getName创建抽象描述,以便每次调用它时,分析器都可以将调用上下文应用于抽象描述。

总结:上下文敏感分析比较准确,但是增加了复杂度。

2.4 流敏感度(Flow-Sensitivity)

流敏感度是一种是否考虑代码顺序的原则。有两种方法:流敏感(flow-sensitive)和流非敏感(flow-insensitive)。

流非敏感不考虑代码顺序,并为整个程序生成一组别名分析结果,而流敏感考虑代码顺序,计算程序中每个指针出现的位置的别名信息。以如下代码为例:

1inta,b; 2int*p; 3p=&a; 4p=&b;

流非敏感的分析结果是针对整个代码块,其结果应该是:指针p可能指向变量a或者变量b。流敏感生成的别名信息是,在第3行,指针p指向变量a,在第4行以后指针p指向变量b。

Note:当程序具有许多条件语句、循环或递归函数时,流敏感分析的复杂性会大大增加。要执行流敏感分析,需要完整的控制流图。因此,流敏感分析非常精确,但对于大多数情况来说,它的分析成本过高,无法在整个程序上执行。

3.别名分析常见算法介绍

常见的别名算法共有三种:Andersen's指针分析算法、Steensgaard's指针分析算法和数据结构分析算法。

Andersen's指针分析是一种流非敏感和上下文非敏感的分析算法。Andersen's指针分析算法复杂度较高,实践应用性较差,其时间复杂度为,其中n为指针节点个数。

Steensgaard's指针分析算法也是一种流非敏感,上下文非敏感且域非敏感的别名分析算法。其时间复杂度较低,实现相对简单,实践应用广,其时间复杂度为,其中无限接近于1,但是其别名分析的准确性较低。

数据结构分析算法是一种流非敏感,上下文敏感和域敏感的算法。其时间复杂度较低,为O(n * log(n)) ,应用性较好,但是由于不支持MustAlias(参考“AliasAnalysis Class概览”章节),导致其应用有局限性。

4.别名分析在LLVM中的应用与实现

4.1 应用

别名分析在代码优化和安全方面有着非常重要且广泛的应用,以下面C代码为例,来简单介绍别名分析在代码优化方面的应用[2]。

intfoo(int__attribute__((address_space(0)))*a, int__attribute__((address_space(1)))*b){ *a=42; *b=20; return*a; }

__attribute__属性指定了变量a指向地址0,变量b指向地址1。我们知道在ARM架构中,地址0和地址1是完全不同的,修改地址0中的内存永远不会修改地址1中的内存。以下为该函数可能生成的LLVM IR信息:

definei32@foo(i32addrspace(0)*%a,i32addrspace(1)*%b)#0{ entry: storei3242,i32addrspace(0)*%a,align4 storei3220,i32addrspace(1)*%b,align4 %0=loadi32,i32*%a,align4 reti32%0 }

第一个store将42存储到变量a指向的地址,第二个store指令将20存储到变量b指向的地址。%0 = ... 指向的行将变量a中的值加载到一个临时变量0中,并在最后一行返回该临时变量0。

上述代码是未对foo函数进行优化的情况,下面我们考虑对foo函数进行优化。

我们优化后的代码可能如下:删除了load指令对应的行,最后一行直接返回了常量42。

definei32@foo(i32addrspace(0)*%a,i32addrspace(1)*%b)#0{ entry: storei3242,i32addrspace(0)*%a,align4 storei3220,i32addrspace(1)*%b,align4 reti3242 }

然而,我们进行优化的时候需要仔细一些,因为上述优化仅在a和b指向的地址不会相互影响时有效。例如:当我们给foo函数传递的指针相互影响时:

inti=0; intresult=foo(&i,&i);

在未开启优化的版本中,变量i将先被设置为42,然后被设置为20,最后返回20。然而,在优化版本中,虽然我们执行了两次store操作依次将42、20赋值给变量i,但是返回值是42,而不是20。因此优化版本破坏了foo函数本身的行为。

如果应用了别名分析,编译器能够合理地执行上述优化。在执行优化前判断入参a和b是否为别名,如果是别名,则不执行删除load指令对应行的操作,否则执行删除操作。

4.2 实现

本文以LLVM16.0.0版本为参考,从代码接口入手,带领大家学习别名分析的代码实现。

LLVM AliasAnalysis类是LLVM系统中客户使用和别名分析实现的主要接口,或者说一个“基类” 。除了简单的别名分析信息外,这个类还声明了Mod/Ref信息,从而使强大的分析和转换能够很好地协同工作。

源码参考链接:AliasAnalysis.h[3]、AliasAnalysis.cpp[4]。

4.2.1 基础知识

MemoryLocation:LLVM中对内存地址的描述,主要应用在别名分析中,我们需要掌握该类中三个属性:

404e26d6-334d-11ed-ba43-dac502259ad0.png

其中,Ptr表示内存开始地址,Size表示内存大小,AATags是描述内存位置别名的metadata节点集合 。

4.2.2 AliasAnalysis Class概览

AliasAnalysis类定义了各种别名分析实现应该支持的接口。这个类导出两个重要的枚举:AliasResult和ModRefResult,它们分别表示别名查询或mod/ref查询的结果。

1、关键代码如下,AliasAnalysis为AAResults类别名:

406343e0-334d-11ed-ba43-dac502259ad0.png

2、AliasResult关键代码如下:

407fbb9c-334d-11ed-ba43-dac502259ad0.png

其中NoAlias表示两个内存对象没有任何重叠区域;MayAlias表示两个指针可能指向同一对象;PartialAlias表示两个内存对象对应的地址空间有重叠;MustAlias表示两个内存对象总是从同一位置开始。

3、ModRefResult关键代码

40a5a3c0-334d-11ed-ba43-dac502259ad0.png

其中NoModRef表示访问内存的操作既不会修改该内存也不会引用该内存;Ref表示访问内存的操作会可能引用该内存;Mod表示访问内存的操作可能会修改该内存;ModRef表示访问内存的操作既可能引用该内存也可能修改该内存。

alias接口

其接口定义如下:

40ba2f66-334d-11ed-ba43-dac502259ad0.png

别名方法是用于确定两个MemoryLocation对象是否相互别名的主要接口。它接受两个MemoryLocation对象作为输入,并根据需要返回MustAlias、PartialAlias、MayAlias或NoAlias。与所有AliasAnalysis接口一样,alias方法要求其入参的两个MemoryLocation对象定义在同一个函数中,或者至少有一个值是常量。

其接口实现如下:

40cdeb0a-334d-11ed-ba43-dac502259ad0.png

getModRefInfo 接口

getModReInfo方法返回关于给定的指令执行是否可以读取或修改给定内存位置的信息。Mod/Ref信息具有保守性:如果一条指令可能读或写一个位置,则返回ModRef。其接口定义众多,我们以如下接口为例来进行学习。

40fef858-334d-11ed-ba43-dac502259ad0.png

其接口实现如下:

411b6b32-334d-11ed-ba43-dac502259ad0.png

从上述代码可知,处理共分为四步:

(1)遍历AAs,如果发现其任一结果是NoModRef,则直接返回,对应代码行228-234;

(2)调用节点(call)操作中是否访问了一个在LLVM IR中无法访问的地址,如果是的话,直接返回NoModRef,否则获取其调用节点的ModRefInfo信息,对应代码行239-240;

(3)处理调用节点中指针入参的ModRefInfo信息,如果发现是NoModRef,则直接返回NoModRef,否则将ModRefInfo信息和之前的结果合并,对应代码行247-266;

(4)如果getModRefInfo函数中的入参Loc指定的内存地址具有常量属性并且ModRefInfo信息包含Mod,则调用节点一定不会修改Loc内存,因此需要将Ref属于与之前的结果做逻辑与操作,对应代码行271-272。

4.2.3 LLVM中已经实现的别名分析

-basic-aa pass

-basic-aa pass是一种激进的本地分析,它提供许多重要的事实信息[5]:

不同的全局变量、堆栈分配和堆分配永远不能别名。

全局变量、栈分配的变量和堆分配变量永远不会和空指针别名。

结构体中的不同字段不能别名。

同一数组,索引不同的两个对象不能别名。

许多通用的标准C库函数从不访问内存或只读取内存。

-globals-aa pass

这个pass实现了一个简单的对内部全局变量(该变量的地址没有被获取过)进行上下文敏感的mod/ref分析和别名分析。如果某个全局变量的地址没有被获取,则该pass可以得出如下结论:没有指针作为该全局变量的别名。该pass还会识别从不访问内存或从不读取内存的函数。这允许某些指定的优化(例如GVN)完全消除调用指令。

这个pass的真正威力在于它为调用指令提供了上下文敏感的mod/ref信息。这使优化器清楚的了解到对于某些函数的调用不会破坏或读取全局变量的值,从而允许消除加载和存储指令。

Note:该pass在使用范围上有一定限制,仅支持没有被取过地址的全局变量,但是该pass分析速度非常快。

除了上述pass外,LLVM中还实现了cfl-steens-aa、cfl-anders-aa、tbaa、scev-aa。目前LLVM中O1,O2,O3优化默认开启的别名分析是basic-aa,globals-aa和tb-aa。

5.写在最后

编译器技术从20世纪50年代起,已经发展了近70年的历史,但是编译器技术发展到今天,依然是一个非常热门的技术,各大硬件厂商都在开发自己的编译器,包括因特尔推出的InterC++、ARM公司推出的armclang以及华为推出的毕昇编译器等,且上述三款编译器都是基于LLVM开发。

编译器技术是一门庞大且繁杂的技术,对于初学者来说,这条学习之路道阻且长,盼那些热爱这门技术的赶路人能够行而不辍,未来可期。

审核编辑:彭静
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表德赢Vwin官网 网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
  • 数据
    +关注

    关注

    8

    文章

    6670

    浏览量

    88164
  • 代码
    +关注

    关注

    30

    文章

    4637

    浏览量

    67613
  • 编译器
    +关注

    关注

    1

    文章

    1594

    浏览量

    48857

原文标题:编译器优化那些事儿(6):别名分析概述

文章出处:【微信号:openEulercommunity,微信公众号:openEuler】欢迎添加关注!文章转载请注明出处。

收藏 人收藏

    评论

    相关推荐

    编译器优化那些事儿(6):别名分析概述

    1.简介 别名分析编译器 理论中的一种技术,用于确定存储位置是否可以以多种方式访问。如果两个指针指向相同的位置,则称这两个指针为 别名。但是,它不能与指针
    发表于09-15 14:09

    C编译器的设计文档与源代码

    C- 编译器的设计文档与源代码:本压缩包包含了C- 编译器的设计文档与源代码,供学习参考。  整体框架. 3 词法 分析. 3 Class CTokeniz
    发表于02-09 11:13 45次下载

    ICC AVR编译器的安装与使用

    ICCAVR 编译器的安装、运行、破解、使用 用ICCAVR 编译器产生初始化程序和程序框架
    发表于07-09 18:06 258次下载

    基于CoSy的编译器开发的研究

    CoSy是ACE公司开发的 编译器构造框架[1]。它提供共享工具和引擎来构造 编译器编译器开发者只专注于目标机相关代码的开发。CoSy框架生成的 编译器具有可扩展性和可移植性。可以根据目
    发表于08-19 17:49 0次下载
    基于CoSy的<b class='flag-5'>编译器</b>开发的研究

    PICC编译器下载

    PICC 编译器下载
    发表于05-25 17:44 168次下载

    NEC编译器培训手册

    NEC 编译器培训手册,开发者可根据功能要求对 编译器进行设计。
    发表于05-03 14:23 15次下载

    编译器是如何工作的_编译器的工作过程详解

    随着计算机的发展, 编译器已经发挥着十分重要的作用。本文主要介绍了 编译器的种类、 编译器的工作原理以及 编译器工作的具体操作过程及步骤详解。
    发表于12-19 12:54 1.6w次阅读

    编译器原理到底是怎样的带你简单的了解编译器原理

    编程语言是怎样工作的 理解 编译器内部原理,可以让你更高效利用它。按照 编译的工作顺序,逐步深入编程语言和 编译器是怎样工作的。本文有大量的链接、样例代码和图表帮助你理解 编译器
    的头像 发表于12-23 17:25 1.1w次阅读

    既然C编译器是C语言写,那么第一个C编译器是怎样来的?

    既然C 编译器是C语言写的,那第一个C 编译器是怎样来的?
    的头像 发表于02-25 15:47 2911次阅读

    Verilog HDL编译器指令说明

    Verilog HDL 编译器指令 复杂一点的系统在进行设计或者验证时,都会用到一些 编译器指令,那么什么是 编译器指令? Verilog HDL 编译器指令由重音符(‘)开始。在Ver
    的头像 发表于11-03 09:31 3363次阅读
    Verilog HDL <b class='flag-5'>编译器</b>指令说明

    GH集成开发环境和编译器

    说实话,以前也用过正版的 编译器,我记得之前用过正版的IAR 编译器license也没有多贵,而最近用了个10万一个license的 编译器 编译嵌入式代码,因为对功能安全有要求,而这个Gre
    的头像 发表于03-16 17:08 1586次阅读

    交叉编译器安装教程

    交叉 编译器中“交叉”的意思就是在一个架构上 编译另外一个架构的代码,相当于两种架构“交叉”起来了。Ubuntu 自带的 gcc 编译器是针对 X86 架构的,而我们现在要 编译的是 ARM
    的头像 发表于09-29 09:12 3130次阅读

    领域编译器发展的前世今生

    近年来,随着GPU和DSA架构在不同领域的广泛应用,特别是AI系统相关技术的飞速发展,对于 编译器的需求越来越强烈。 编译器已经从一个相对小众的研究领域,变为学界和业界都高度关注并大量投入的方向
    的头像 发表于02-03 10:37 1413次阅读

    编译器优化那些事儿:别名分析概述

    别名分析编译器 理论中的一种技术,用于确定存储位置是否可以以多种方式访问。如果两个指针指向相同的位置,则称这两个指针为 别名
    的头像 发表于05-24 16:16 456次阅读
    <b class='flag-5'>编译器</b>优化那些事儿:<b class='flag-5'>别名分析</b>概述

    人工智能编译器与传统编译器的区别

    人工智能 编译器(AI 编译器)与传统 编译器在多个方面存在显著的差异。这些差异主要体现在设计目标、功能特性、优化策略、适用范围以及技术复杂性等方面。以下是对两者区别的详细探讨,旨在全面解析其内在差异。
    的头像 发表于07-17 18:19 1057次阅读