位操作(Bit Manipulation)有很多有趣的技巧,其中一个比较著名的资源是 Bit Twiddling Hacks 网站,它收集了各种位操作的高阶玩法,网址是:
http://graphics.stanford.edu/~seander/bithacks.html
不过,这些技巧大多相对晦涩,并不适合每个人深入学习,更多时候它们更适合作为参考资料。真正值得掌握的是那些既有趣又实用的位运算技巧。
因此,本文会从浅入深,先介绍一些有趣的但可能用处不大的位运算技巧,再总结一些在算法问题和实际开发中非常常见且实用的位运算技巧。
0. 几个有趣的位操作
// 1. 利用或操作 `|` 和空格将英文字符转换为小写
('a' | ' ') = 'a'
('A' | ' ') = 'a'// 2. 利用与操作 `&` 和下划线将英文字符转换为大写
('b' & '_') = 'B'
('B' & '_') = 'B'// 3. 利用异或操作 `^` 和空格进行英文字符大小写互换
('d' ^ ' ') = 'D'
('D' ^ ' ') = 'd'// 4. 不用临时变量交换两个数
int a = 1, b = 2;
a ^= b;
b ^= a;
a ^= b;
// 现在 a = 2, b = 1// 5. 加一
int n = 1;
n = -~n;
// 现在 n = 2// 6. 减一
int n = 2;
n = ~-n;
// 现在 n = 1// 7. 判断两个数是否异号
int x = -1, y = 2;
boolean f = ((x ^ y) < 0); // trueint x = 3, y = 2;
boolean f = ((x ^ y) < 0); // false
如果说前 6 个技巧的用处不大,这第 7 个技巧还是比较实用的,利用的是补码编码的符号位。整数编码最高位是符号位,负数的符号位是 1,非负数的符号位是 0,再借助异或的特性,可以判断出两个数字是否异号。
当然,如果不用位运算来判断是否异号,需要使用 if else 分支,还挺麻烦的。你可能想利用乘积来判断两个数是否异号,但是这种处理方式容易造成整型溢出,从而出现错误。
1. index & (arr.length - 1)
的运用
环形数组,其实就是利用求模(余数)的方式让数组看起来头尾相接形成一个环形,永远都走不完:
int[] arr = {1,2,3,4};
int index = 0;
while (true) {// 在环形数组中转圈print(arr[index % arr.length]);index++;
}
// 输出:1,2,3,4,1,2,3,4,1,2,3,4...
但模运算 %
对计算机来说其实是一个比较昂贵的操作,所以我们可以用 &
运算来求余数:
int[] arr = {1,2,3,4};
int index = 0;
while (true) {// 在环形数组中转圈print(arr[index & (arr.length - 1)]);index++;
}
// 输出:1,2,3,4,1,2,3,4,1,2,3,4...
注意这个技巧只适用于数组长度是 2 的幂次方的情况,比如 2、4、8、16、32 以此类推。
简单说,& (arr.length - 1)
这个位运算能够替代 % arr.length
的模运算,性能会更好一些。
那问题来了,现在是不断地 index++
,你做到了循环遍历。但如果不断地 index--
,还能做到环形数组的效果吗?
答案是,如果你使用 %
求模的方式,那么当 index 小于 0 之后求模的结果也会出现负数,你需要特殊处理。但通过 &
与运算的方式,index 不会出现负数,依然可以正常工作:
int[] arr = {1,2,3,4};
int index = 0;
while (true) {// 在环形数组中转圈print(arr[index & (arr.length - 1)]);index--;
}
// 输出:1,4,3,2,1,4,3,2,1,4,3,2,1...
我们自己写代码一般用不到这个技巧,但在学习一些其他代码库时可能会经常看到,这里留个印象,到时候就不会懵逼了。
2. n & (n-1)
的运用
n & (n - 1)
操作会将 n 的二进制表示中的最低位的 1 变为 0。它通过与 n - 1
的按位与运算,消除最低位的 1,而不影响其他位。
1.假设我们有一个整数 n = 36,它的二进制表示是 100100。
2.n - 1 = 35,二进制表示为 100011。
3.n & (n - 1):100100 (36)
& 100011 (35)
--------100000 (32)4.在这个例子中,n & (n - 1) 的操作将 n 二进制表示中最低位的 1 清除了。
其核心逻辑就是,将 n 的二进制表示中最右边的 1 变成 0。
2.1 计算汉明权重(Hamming Weight)
通过重复执行 n & (n - 1)
,可以快速统计一个数字中 1 的个数(称为汉明重量)。这是力扣第 191 题「位 1 的个数」:
就是让你返回 n 的二进制表示中有几个 1。因为 n & (n - 1)
可以消除最后一个 1,所以可以用一个循环不停地消除 1 同时计数,直到 n 变成 0 为止。
class Solution {int hammingWeight(int n) {int res = 0;while (n != 0) {n = n & (n - 1);res++;}return res;}
}
2.2 判断 2 的指数
力扣第 231 题「2 的幂」就是这个问题。
一个数如果是 2 的指数,那么它的二进制表示一定只含有一个 1:
如果使用 n & (n-1)
的技巧就很简单了(注意运算符优先级,括号不可以省略):
class Solution {boolean isPowerOfTwo(int n) {if (n <= 0)return false;return (n & (n - 1)) == 0;}
}
3. a ^ a = 0
的运用
异或运算有一些非常重要的性质需要记住:
- 一个数与它自己做异或运算,结果是 0,即
a ^ a = 0
。 - 一个数与 0 做异或运算,结果是它本身,即
a ^ 0 = a
。
3.1 查找只出现一次的元素
通过以上运用,我们可以很轻松解决下吗这道题:这是力扣第 136 题「只出现一次的数字」:
对于这道题,我们只需要对所有数字进行异或操作。因为成对的数字异或后会变成 0,而剩下的唯一数字与 0 异或后仍然是它本身。因此,最终的异或结果就是那个只出现一次的数字。
class Solution {int singleNumber(int[] nums) {int res = 0;for (int n : nums) {res ^= n;}return res;}
}
3.2 寻找缺失的元素
这是力扣第 268 题「丢失的数字」:
给定一个长度为 n
的数组,索引范围是 [0, n)
,但现在我们要放入 n + 1
个元素,范围是 [0, n]
,那么肯定有一个元素无法容纳。因此,问题就是要找出缺失的元素。
这道题不难,直观的方法是先对数组进行排序,然后遍历一遍,轻松找到缺失的元素。
另外,也可以使用哈希表,将数组中出现的元素存储起来,再遍历 [0, n]
范围内的数字,查找哈希表中是否存在,就能找到缺失的元素。
不过,排序方法的时间复杂度是 O(NlogN)
,哈希表的方法时间复杂度是 O(N)
,但还需要 O(N)
的空间复杂度来存储哈希表。
本篇文章的重点是位运算,我们来探讨如何利用位运算技巧来高效解决这个问题。
回顾一下异或运算的特性:一个数和它自己做异或运算结果是 0,一个数与 0 做异或运算仍然是它本身。
而且异或运算满足交换律和结合律,也就是说:
2 ^ 3 ^ 2 = 3 ^ (2 ^ 2) = 3 ^ 0 = 3
这道题可以巧妙地利用异或运算的性质来找出缺失的元素。我们可以通过以下方式来理解:
假设我们在数组的索引上多加一位,然后让每个元素与它应该对应的索引相匹配。例如,假设 nums = [0, 1, 4, 5, 2]
:
首先,我们假设数组的索引从 [0, n]
都有对应的元素,然后将每个元素与其索引进行配对。这样做后,除了缺失的元素,其他元素的索引和元素会一一对应。
接着,通过使用异或操作,我们可以找出那个落单的索引 3
,它就是缺失的元素的索引。通过这个索引,我们就能确定缺失的元素。
如何找这个落单的数字呢,只要把所有的元素和索引做异或运算,成对儿的数字都会消为 0,只有这个落单的元素会剩下,也就达到了我们的目的:
class Solution {public int missingNumber(int[] nums) {int n = nums.length;int res = 0;// 先和新补的索引异或一下res ^= n;// 和其他的元素、索引做异或for (int i = 0; i < n; i++)res ^= i ^ nums[i];return res;}
}
由于异或运算满足交换律和结合律,因此我们可以确保成对的数字会相互消除,最终只剩下缺失的那个元素。
位运算通常能够以更简洁、效率更高的方式解决问题,尤其是在空间和时间复杂度上常常有优势。这些技巧并不需要死记硬背,最重要的是掌握运算的原理和应用场景。只要对基本的位运算有一个清晰的印象,遇到实际问题时就能灵活应用。