C学习:一个百思不得其解的无符号数移位问题
问题背景
在做一个算法定点化移位过程中,遇到个奇怪问题:分别按无符号数和有符号数进行右移,竟然不管啥输入,res1和res2结果都一样。代码如下:
int64_t tmp = -16;
    int32_t res1 = (int32_t)(((uint64_t)tmp) >> 1);
    int32_t res2 = (int32_t)(tmp >> 1);
    if (res1 != res2) {
          
   
        printf("res1=%d, res2=%d
", res1, res2);
    } 
照之前博客分析,,这不符合科学啊,相当于之前的博客是一顿瞎分析的。
验证分析
接下来,我分别对tmp单独移位验证了下,看无符号和有符号数移位是否有区别。代码如下:
int16_t a = -16;
    printf("0x%hx
", a);
    a >>= 1;
    printf("0x%hx
", a);
    printf("%d
", a);
    a = -16;
    uint16_t b = (uint16_t)a;
    printf("0x%hx
", b);
    b >>= 1;
    printf("0x%hx
", b);
    printf("%hu
", b); 
从辅助验证的结果可知,按有符号数移位时,符号位是带着在变的,说明之前的博客分析没错。
这,问题来了。。。
理论上第一段代码中第二行加了强制无符号64位转换后**(uint64_t)**,应该移位结果跟第三行结果不一样啊,为啥res1和res2又是相等的?
于是,我把第一段代码进一步拆解后,发现了答案。
int64_t tmp = -16;
    int64_t a;
    uint64_t b;
    a = tmp >> 1;
    b = ((uint64_t)tmp) >> 1;
    printf("0x%llx
", a);
    printf("0x%llx
", b);
    int32_t res1 = (int32_t)b; // 31 shift
    int32_t res2 = (int32_t)a;
    printf("res1=%d, res2=%d
", res1, res2);  
tmp移位结果确实是不一样的,但是问题关键在于截断,由64位向32位截断时,取的是低32位字节,于是结果一致。所以这里更重要的知识点要看下博客。
简而言之,有符号数移位后确实结果有差异,但截断后掩盖了这种差异,关键在于高位宽数据向低位宽数据转换的原理。需要注意的是,如果移位的位数过多,可能导致截断后依然有差异,比如上述代码中如tmp赋值-2147483648,右移33位,结果就有巨大差异。
另一个值得注意的问题,实践中常用右移左移来替代2的幂次方乘除,但是在有符号数场景,由于负数补码的关系,常与预期相反。比如,比如-2向右移两位,若按算术移位处理,结果不等于除以4的商,即0,而是-1。进而,向右移大于等于两位时,结果都一直为-1。所以,在移位后商为0的场景,务必要注意是否符合预期。
参考资料
- C学习:不同位宽整数扩展问题分析,
- C学习:无符号有符号数的移位问题分析总结,
上一篇:
			            通过多线程提高代码的执行效率例子 
			          
			          下一篇:
			            python 中yaml文件简单用法总结 
			          
			        
