当前位置：首页 > C > 正文

C语言字符串哈希详解（从零开始掌握字符串哈希算法）

主机测评网
C
2025-12-19
312

在计算机科学中，字符串哈希是一种将任意长度的字符串映射为固定长度整数的技术。这种技术广泛应用于字典、数据库索引、编译器符号表以及网络安全等领域。本文将带你从零开始理解并实现C语言字符串哈希算法，即使你是编程小白也能轻松上手！

什么是哈希函数？

哈希函数是一种将输入（如字符串）转换为固定大小整数值的函数。理想情况下，不同的输入应产生不同的哈希值（称为“无冲突”），但实际中完全避免冲突是不可能的，因此我们需要设计良好的哈希函数来尽量减少冲突。

C语言字符串哈希详解（从零开始掌握字符串哈希算法） C语言字符串哈希字符串哈希算法哈希函数实现 C语言哈希教程第1张

常见的C语言字符串哈希算法

在C语言哈希教程中，我们将重点介绍两种经典且高效的字符串哈希算法：DJB2 和 FNV-1a。

1. DJB2 哈希算法

DJB2 是由 Daniel J. Bernstein 提出的一种简单而高效的哈希算法，特别适合短字符串。

unsigned long djb2_hash(const char *str) {    unsigned long hash = 5381;    int c;    while ((c = *str++)) {        hash = ((hash << 5) + hash) + c; // hash * 33 + c    }    return hash;}

2. FNV-1a 哈希算法

FNV（Fowler–Noll–Vo）是一组非加密哈希函数，FNV-1a 是其改进版本，具有良好的分布性和速度。

#define FNV_OFFSET 14695981039346656037UL#define FNV_PRIME 1099511628211ULunsigned long fnv1a_hash(const char *str) {    unsigned long hash = FNV_OFFSET;    unsigned char *p = (unsigned char *)str;    while (*p) {        hash ^= *p++;        hash *= FNV_PRIME;    }    return hash;}

如何选择合适的哈希函数？

选择哈希函数时需考虑以下因素：

速度：计算是否快速？
分布性：哈希值是否均匀分布？
冲突率：不同字符串产生相同哈希值的概率高吗？
适用场景：是用于哈希表、校验和还是其他用途？

完整示例：测试你的哈希函数

下面是一个完整的 C 程序，演示如何使用 DJB2 哈希函数：

#include <stdio.h>#include <string.h>unsigned long djb2_hash(const char *str) {    unsigned long hash = 5381;    int c;    while ((c = *str++)) {        hash = ((hash << 5) + hash) + c;    }    return hash;}int main() {    const char *test_str = "Hello, World!";    printf("Hash of '%s' is %lu\n", test_str, djb2_hash(test_str));    return 0;}