面T家,被要求实现一个字符串转整型数的算法,当时手写有点遗漏,现在回头来看看jdk的实现。
常用的是Integer.valueOf方法来实现转换:
public static Integer valueOf(String s) throws NumberFormatException {
return Integer.valueOf(parseInt(s, 10));
}
默认会调用parseInt方法进行转换,参数中的10说明是按照10进制进行转换的。
看看parseInt方法:
public static int parseInt(String s, int radix)
throws NumberFormatException
{
if (s == null) {
throw new NumberFormatException("null");
}
if (radix < Character.MIN_RADIX) {
throw new NumberFormatException("radix " + radix +
" less than Character.MIN_RADIX");
}
if (radix > Character.MAX_RADIX) {
throw new NumberFormatException("radix " + radix +
" greater than Character.MAX_RADIX");
}
int result = 0;
boolean negative = false;
int i = 0, len = s.length();
int limit = -Integer.MAX_VALUE;
int multmin;
int digit;
if (len > 0) {
char firstChar = s.charAt(0);
if (firstChar < '0') {
// Possible leading "+" or "-"
if (firstChar == '-') {
negative = true;
limit = Integer.MIN_VALUE;
} else if (firstChar != '+')
throw NumberFormatException.forInputString(s);
if (len == 1) // Cannot have lone "+" or "-"
throw NumberFormatException.forInputString(s);
i++;
}
multmin = limit / radix;
while (i < len) {
// Accumulating negatively avoids surprises near MAX_VALUE
digit = Character.digit(s.charAt(i++),radix);
if (digit < 0) {
throw NumberFormatException.forInputString(s);
}
if (result < multmin) {
throw NumberFormatException.forInputString(s);
}
result *= radix;
if (result < limit + digit) {
throw NumberFormatException.forInputString(s);
}
result -= digit;
}
} else {
throw NumberFormatException.forInputString(s);
}
return negative ? result : -result;
}
首先看到5-17行是边界检查:
- 如果字符串s是空指针,直接抛异常
- 如果进制小于最小进制(常量定义为2),抛异常
- 如果进制大于最大进制(常量定义为36),抛异常
接下来19-24行是局部变量定义,这里需要注意一个就是limit被赋值为int表示的最大正整型数的负值,也就是-2147483647。
再往下看到26-38行,如果字符串s长度大于0,那么首先看看首字符:
- 如果首字符小于字符0,那么可能是符号 + 或者 - ,要区别对待了
- 如果是符号 - ,说明是个负数,将布尔值变量negative设置为true,并将limit设置为int型整数的下限值,也就是==-2147483648==
- 如果首字符不是符号 +,说明首字符既不是数字也不是符号,则抛出异常
- 再接下来看,如果首字符是符号 - 或者 +,但是字符串长度只有1,也就是说只有一个符号,那么也是不能够转为整型数的,直接抛异常
再往下39-54行
局部变量mulmin赋值为limit除以当前转换的进制。接下来是一个循环,i代表处理的字符串的位数。
用局部变量digit记录字符串s第i位数字的相应进制的值,接下来又是一些判断了:
- 如果digit小于0,抛异常
- 如果result变量小于mulmin,抛异常,这里可以限制之后的乘法操作肯定不溢出;之后result变量乘以当前转换进制。(如果result小于mulmin也就是limit/radix了,那么后面的乘以radix肯定就会小于limit,对于负数就超过了Integer的范围,对于正数也是超过了Integer.MAX_VALUE)
- 如果此时result小于limit加上digit,抛异常,这里可以限制之后的减法操作不会溢出;之后result变量减去digit的值。(这个抛异常和上一条原因类似,也是为了防止溢出)
最后58行,如果negative为true,则直接返回result,否则返回负的result。
这个有点意思,如果是负数直接输出,如果是正数反而是用负数取负,负负得正来表示的。
个人觉得应该是整型数从绝对值来看,负数的范围比正数大1,如果用result += digit这样来进行计算的话,那么最小值-2147483648会无法被正确转换。因为2147483640+8会得到-2147483648,然后再取负数的话,就变成0了。但是使用-=来计算,因为负数的范围更大,因此正数是可以全部表示出来的,而且不管是+0还是-0都不会有问题,都可以得到数值0。