Hamming Distance(汉明距离)是用于衡量两个等长字符串在相同位置上不同字符的个数的度量。它通常用于比较两个二进制字符串或编码序列的差异。
给定两个长度相同的字符串 A A A 和 B B B,它们的汉明距离 D ( A , B ) D(A,B) D(A,B) 是在相同位置上字符不同的位置的数量。
- 二进制字符串:
- A=1011101
- B=1001001
- 汉明距离 D ( A , B ) = 2 D(A,B)=2 D(A,B)=2(第3位和第5位不同)。
- 字符串:
- A=“karolin”
- B=“kathrin”
- 汉明距离 D ( A , B ) = 3 D(A,B)=3 D(A,B)=3(第3、4、5位不同)。
- 错误检测与纠正:在通信和编码理论中,汉明距离用于检测和纠正数据传输中的错误。
- 生物信息学:用于比较 DNA 序列的相似性。
- 机器学习:在分类算法中,用于计算样本之间的距离。
- 比较两个字符串的每一位。
- 统计不同位的数量。
- 返回统计结果作为汉明距离。
对于长度为 n n n 的两个字符串 A A A 和 B B B,汉明距离为:
D ( A , B ) = ∑ i = 1 n δ ( A i , B i ) D(A,B)= ∑_{i=1}^n δ(A_i ,B_i) D(A,B)=i=1∑nδ(Ai,Bi)
其中, δ ( A i , B i ) δ(A_i ,B_i ) δ(Ai,Bi) 是指示函数,当 A i ≠ B i A_i \neq B_i Ai=Bi 时为1,否则为0。
461. Hamming Distance
The Hamming distance between two integers is the number of positions at which the corresponding bits are different.
Given two integers x
and y
, return the Hamming distance between them.
Example 1:
Input: x = 1, y = 4
Output: 2
1 (0 0 0 1)
4 (0 1 0 0)↑ ↑
The above arrows point to positions where the corresponding bits are different.
Example 2:
Input: x = 3, y = 1
Output: 1
C++ 实现
int hammingDistance(int x, int y) {int xor_result = x ^ y; // 异或操作int distance = 0;// 统计 xor_result 中 1 的个数while (xor_result != 0) {distance += xor_result & 1; // 检查最低位是否为 1xor_result >>= 1; // 右移一位}return distance;
这个算法的时间复杂度为 O ( l o g n ) O(log\, n) O(logn),其中 n n n 是 x
和 y