测试中的随机性(3)

发表于:2015-12-01来源:uml.org.cn作者:不详点击数: 标签:软件测试
char kind1 = s[0], kind2 = s[0]; for (int i = 0; i s.Length kind1 == kind2; ++i) { if (s[i] != kind1) kind2 = s[i]; } 我将模式字符串中的第一个字符指定给第一种符号,接着扫描整

char kind1 = s[0], kind2 = s[0];
for (int i = 0; i < s.Length && kind1 == kind2; ++i)
{
if (s[i] != kind1) kind2 = s[i];
}

  我将模式字符串中的第一个字符指定给第一种符号,接着扫描整个模式字符串,直到找到第二种符号类型。接下来,将执行两项简单的错误检查,以确保该模式中至少存在两种不同字符并且存在的字符类型不超过两种。

if (kind2 == kind1)
throw new Exception("字符串必须具有两种不同的类型");

for (int i = 0; i < s.Length; ++i)
if (s[i] != kind1 && s[1] != kind2)
throw new Exception("字符串只能具有两种类型");

  如果要考虑性能,则可将这三次对模式字符串的遍历重新转换为仅仅一次遍历,但清晰性可能会受到一些影响。

  现在,我就可以开始计算模式中每种类型符号的数量以及游程数了:

int n1 = 0, n2 = 0, runs = 1;
for (int i = 0; i < s.Length-1; ++i)
{
if (s[i] == kind1) ++n1;
else if (s[i] == kind2) ++n2;
if (s[i+1] != s[i]) ++runs;
}
if (s[s.Length-1] == kind1) ++n1;
else if (s[s.Length-1] == kind2) ++n2;

  我从第一个字符开始扫描该模式,一直持续到倒数第二个字符。如果当前字符与我先前确定的符号类型匹配,则我将递增相应的计数器。为计算模式中的游程数,我利用了游程取决于符号类型的变化的这样一个事实。如果当前字符与下一个字符不同,则我就知道又出现一个游程,然后我将相应递增游程计数器。由于我在模式字符串中的倒数第二个字符处停止,因此最后我要检查最后一个字符。我还会从 1(而不是 0)开始累计游程计数器,因为根据定义,所有模式都至少具备一个游程。

  Wald-Wolfowitz 检验方法仅在所分析模式中每种类型符号的数量为 8 或大于 8 时才有效,因此我将执行以下检查:

if (n1 < 8 || n2 < 8)
throw new Exception("n1 和 n2 必须均大于等于 8," +
"本次测试才有意义");

  分析过程进行到这时,我已算出模式中两种符号类型中每一种的数量以及实际游程数。现在,如果两个符号类型是随机生成,则我将计算模式中的预期游程数:

double expectedRuns = 1 + ((2.0*n1*n2) / (n1 + n2));

  然后我将计算游程数的方差(如果随机生成),如下所示:

double varianceNumerator = (2.0*n1*n2) * (2.0*n1*n2 - N);
double varianceDenominator = (double)((N*N)*(N-1));
double variance = varianceNumerator / varianceDenominator;

  分析中的下一步是计算标准化检验统计量 z:

double z = (R - expectedRuns) / Math.Sqrt(variance);

  z 统计量等于模式中的实际游程数减去模式中的预期游程数,然后再除以预期游程数的标准偏差(即方差的平方根)后所得到的值。解译模式中的标准化游程数要比解译实际游程数容易。解译代码很简单,但在概念上稍微有些隐晦。它的开头如下所示:

if (z < -2.580 || z > 2.580)
{
Console.Write("充分证明 (1%) 模式不是随机生成的:");
Console.WriteLine(z < -2.580 ? "游程太少。" : 游程太多。");
}

  我以百分之一的显著性水平执行了一次所谓的双侧检验。如果标准化检验统计量的绝对值大于 2.580,则不严格地说,这意味着所分析模式由随机过程生成的几率不到百分之一。值 2.580 源自统计表。如果检验统计量为负值,则实际游程数小于预期游程数,反之亦然。在图 2 中,我也在查找证明该模式不是随机生成的不充分证据。请注意,您在任何时候都不能肯定地说给定模式是随机生成的;您只能通过检验来了解是否存在统计证据来证明该模式不是随机生成的。

原文转自:http://www.uml.org.cn/Test/200611225.htm