`
zhangziyangup
  • 浏览: 1078457 次
文章分类
社区版块
存档分类
最新评论

自动检测并行 Java 程序中的错误

 
阅读更多

当 CPU 进入多核时代之后,并行编程将更加流行,但是编写并行程序更容易出错。在开发过程中,工程师能注意到同一个程序在单线程运行时是正确的,但是在多线程时,它会有可能出错。和并行相关的错误的产生原因通常都非常隐晦,而且在一次测试中,它们的出现与否具有很强的随机性。由于程序中多个线程之间可能以任意的方式交错执行,即使一个并行程序正确的运行了成百上千次,下一次运行仍然可能出现新的错误。

Multi-Thread Run-time Analysis Tool 是由 IBM 为多线程 Java 程序开发的运行时分析工具,它可用于分析并查找 Java 代码中的一些不容易发现的潜在并行程序错误,比如数据竞争 (Data Race) 和死锁 (Deadlock),从而提高并行程序的代码质量。本文将介绍检测 Java 程序中随机并行错误的一种新工具 (http://alphaworks.ibm.com/tech/mtrat),检查 Java 代码中的潜在的并行程序错误,从而提高代码的安全性和稳定性,并演示其对于潜在而并未发生的错误的发掘能力。

概述

Java 编程语言为编写多线程应用程序提供强大的语言支持。但是,编写有用的、没有错误的多线程程序仍然比较困难。编程语言中线程面临很多挑战。在这些挑战中,最主要的就是编程复杂度的提高。这些编程复杂度是由同步共享变量的访问,潜在的依赖于时序的错误和调试和优化并行程序的复杂性造成的。

MTRAT 只所以把不同的技术集成到了一个单一的开发工具中,是为了掩盖工具内部的复杂性,并使得 MTRAT 方便使用。 MTRAT 主要由以下部分组成,

  • 简单的命令行界面和 Eclipse 插件。输出 MTRAT 检查到的并行错误。
  • 动态的 Java 字节码修改引擎。可以在 Java 类文件被 Java 虚拟机加载的时候,修改 Java 类。
  • 程序运行时信息收集器。收集程序的动态信息,比如内存访问,线程同步,创建和结束。
  • 高效的运行时分析引擎。收集到的运行时信息会被在线分析,如果发现潜在的并行错误,将会通过界面报告给用户。

检测数据竞争

在并行程序中,当两个并行的线程,在没有任何约束的情况下,访问一个共享变量或者共享对象的一个域,而且至少要有一个操作是写操作,就会发生数据竞争错误。MTRAT 最强大的功能就是发现并行程序中潜在的数据竞争错误。在下边的 Java 程序就隐藏了一个潜在的数据竞争错误。

Value声明一个整形域x,一个同步方法add修改这个域,和一个方法get返回域x的值。类Task以两个类Value的实例来构造。

以 MTRAT 运行类sample.DataRace,可以在运行时刻检查程序中的潜在的数据竞争错误

在图形界面Eclipse中运行,得到以下结果:


Figure 1.
Sample figure containing an image

MTRAT 报告出了两个数据竞争错误,因为类Task的两个实例会访问类Value的对象,然而这个共享的对象却没有被一个共同的锁保护。

例如,在并行程序执行过程中,可能存在这样的时刻,一个线程执行方法get读域x的值,而另外一个线程执行执行方法add写域x

根据检查结果,MTRAT 发现了两个数据竞争错误,在类sample/Valuex。程序员在得到这两个数据竞争错误后,很容易就能发现程序中存在两个线程并发访问同一个对象域的可能。如果两个线程可以顺序访问这个对象域,这两个数据竞争问题就可以被消除了。

检测死锁

死锁问题也是并行 Java 程序中常见的问题。在 Java 程序中出现死锁,是因为 synchronized 关键字会造成运行的线程等待关联到某个一个对象上的锁。由于线程可能已经获得了别的锁,两个线程就有可能等待对方释放掉锁。在这种情况下,两个线程将永远等待下去。

在下边的 Java 程序就隐藏了一个潜在死锁问题,

在类 Deadlockharness2 方法中,类 Deadlock 的两个实例被创建,作为参数传递到类 T3 的构造函数中。在类 T3run 方法中,线程会依次获得这个两个对象的锁,然后以相反的顺序释放这两个锁。由于两个 StringBuffer 实例以不同的顺序传递给类 T3,两个线程会以不同的顺序获得这两个锁。这样,死锁就出现了。

以 MTRAT 运行类 sample.Deadlock,可以在运行时刻检查程序中的潜在的死锁错误:

 $ mtrat -Dcom.ibm.mtrat.deadlock=true  -cp . sample.Deadlock 

 Thread 7 : Acquire L1 L2 
 Dead Lock 1 
     Thread 7, acquired lock1 -> try lock2  sample/T3  line 109 
     Thread 8, acquired lock2 -> try lock1  sample/T3  line 109 

 Thread 8 : Acquire L2 L1

在图形界面Eclipse中运行,得到以下结果:


图 2.
图 2

在 MTRAT 的死锁检查报告中我们可以发现,线程 Thread 7 已经获得了锁 lock1,在程序 109 行试图获得锁 lock2。然而,线程 Thread 8 已经获得了锁 lock2,在程序 109 行试图获得锁lock1

根据 MTRAT 的死锁检查报告,程序员可以很容易得知道,这个死锁问题是由于两个线程按照相反的顺序上锁造成的。避免这种问题的一种方法是让代码按固定的全局顺序获取锁。那么如果两个线程按照一致的顺序去上锁,死锁错误就可以被消除了。

分享到:
评论

相关推荐

    ORACLE9i_优化设计与系统调整

    §2.4.1.5 在运行控制实用程序中设置日志参数 50 §2.4.1.6 理解监听日志中信息 50 §2.4.1.7 理解连接管理器信息 53 §2.4.2 跟踪文件( Trace File ) 53 §2.4.2.1 跟踪文件的命名: 54 §2.4.2.2 参数设置与初始化...

    RED HAT LINUX 6大全

    12.5 在/etc/passwd文件中使用NISisms 232 12.6 使用网络组 232 12.7 解决问题的一些技巧 233 12.8 小结 233 第13章 网络文件系统 235 13.1 NFS安装 235 13.2 启动和停止NFS守护程序 236 13.3 NFS状态 236 13.4 配置...

    Oracle数据库管理员技术指南

    1.6.1 利用 Oracle 安装程序创建数据库 1.6.2 使用安装程序创建数据库的注意 事项 1.6.3 怎样建立自己的定制数据库创建 脚本 1.6.4 如何从已有数据库克隆数据库 1.6.5 怎样利用 Database Configuration ...

    Flash 反编译工具(JPEXS Free Flash Decompiler) v3.0 中文版.zip

    Windows中安装 Java 7,Linux或Mac OS 需要的Java 7或更高版本 适用于Windows,Linux和MacOS 用户界面标签树显示 蓝色Office 2003的外观和感觉 功能区面板,标签和应用程序图标 与类别标签树(形状,精灵,...

    Eclipse权威开发指南2.pdf

    第4章 Java程序的运行与调试 107 4.1 运行Java代码...... 108 4.1.1 使用运行和调试命令..... 108 4.1.2 管理启动配置..... 109 4.1.3 对代码片断编辑测试窗页面中的表达式进行求值..... 111 4.2 调试...... 112 ...

    Eclipse权威开发指南3.pdf

    第4章 Java程序的运行与调试 107 4.1 运行Java代码...... 108 4.1.1 使用运行和调试命令..... 108 4.1.2 管理启动配置..... 109 4.1.3 对代码片断编辑测试窗页面中的表达式进行求值..... 111 4.2 调试.....

    Eclipse权威开发指南1.pdf

    第4章 Java程序的运行与调试 107 4.1 运行Java代码...... 108 4.1.1 使用运行和调试命令..... 108 4.1.2 管理启动配置..... 109 4.1.3 对代码片断编辑测试窗页面中的表达式进行求值..... 111 4.2 调试.....

    华为编程开发规范与案例

    近日在CDB并行测试中发现一个问题:我们需要的小区负荷话统结果总是为零,开始还以为小区负荷太小,于是加大短消息下发数量,但还为零,于是在程序中加入测试代码,把收到的数据在BAM上打印出来, 结果打印出来的...

    OCPOCA认证考试指南全册:Oracle Database 11g(1Z0-051,1Z0-052,1Z0-053)--详细书签版(第2/2部分)

    8.7.1 与撤销相关的错误条件 294 8.7.2 用于撤销管理与保留保证的参数 294 8.7.3 调整与监视撤销表空间 295 8.7.4 创建和管理撤销表空间 297 8.8 本章知识点回顾 297 8.9 自测题 299 8.10 自测题答案 301 第...

    OCPOCA认证考试指南全册:Oracle Database 11g(1Z0-051,1Z0-052,1Z0-053)--详细书签版(第1/2部分)

    8.7.1 与撤销相关的错误条件 294 8.7.2 用于撤销管理与保留保证的参数 294 8.7.3 调整与监视撤销表空间 295 8.7.4 创建和管理撤销表空间 297 8.8 本章知识点回顾 297 8.9 自测题 299 8.10 自测题答案 301 第...

Global site tag (gtag.js) - Google Analytics