当前位置：首页 > C > 正文

C语言哈夫曼编码详解（从零开始掌握数据压缩核心算法）

主机测评网
C
2025-12-10
945

在计算机科学中，C语言哈夫曼编码是一种经典的数据压缩算法，由 David A. Huffman 于 1952 年提出。它利用字符出现的频率构建一棵最优二叉树（即哈夫曼树），从而为每个字符分配变长编码——高频字符用短码，低频字符用长码，最终达到压缩数据的目的。

本教程将手把手教你用 C语言 实现哈夫曼编码，即使你是编程小白，也能轻松理解并写出自己的压缩程序！

一、什么是哈夫曼树？

哈夫曼树（Huffman Tree）是一棵带权路径长度最短的二叉树。它的构建过程如下：

统计每个字符在文本中出现的频率；
将每个字符视为一个节点，频率作为权重；
每次选择两个权重最小的节点合并成一个新节点，新节点的权重为两者之和；
重复步骤3，直到只剩一棵树。

C语言哈夫曼编码详解（从零开始掌握数据压缩核心算法） C语言哈夫曼编码哈夫曼树实现数据压缩算法 C语言数据结构第1张

二、C语言实现哈夫曼编码的核心步骤

我们将分四步完成整个程序：

1. 定义哈夫曼树节点结构；
2. 统计字符频率；
3. 构建哈夫曼树；
4. 生成哈夫曼编码。

三、完整C语言代码实现

下面是一个简化但功能完整的 C 语言哈夫曼编码示例：

#include <stdio.h>#include <stdlib.h>#include <string.h>// 哈夫曼树节点结构typedef struct Node {    char ch;    int freq;    struct Node* left;    struct Node* right;} Node;// 创建新节点Node* createNode(char ch, int freq) {    Node* node = (Node*)malloc(sizeof(Node));    node->ch = ch;    node->freq = freq;    node->left = node->right = NULL;    return node;}// 打印哈夫曼编码（递归）void printCodes(Node* root, char str[], int top) {    if (root->left) {        str[top] = '0';        printCodes(root->left, str, top + 1);    }    if (root->right) {        str[top] = '1';        printCodes(root->right, str, top + 1);    }    if (!root->left && !root->right) {        str[top] = '\0';        printf("%c: %s\n", root->ch, str);    }}// 简单构建哈夫曼树（仅用于演示，实际需优先队列）int main() {    char data[] = "abracadabra";    int freq[] = {5, 2, 1, 1, 2}; // a:5, b:2, r:2, c:1, d:1    char chars[] = {'a', 'b', 'r', 'c', 'd'};        int n = 5;    Node* nodes[n];        for (int i = 0; i < n; i++) {        nodes[i] = createNode(chars[i], freq[i]);    }        // 此处省略优先队列合并逻辑（实际项目建议使用最小堆）    // 为简化，我们手动构造一个小例子    Node* left = createNode('\0', 2); // c+d    left->left = nodes[3]; // c    left->right = nodes[4]; // d        Node* right = createNode('\0', 4); // b+r    right->left = nodes[1]; // b    right->right = nodes[2]; // r        Node* root = createNode('\0', 11);    root->left = nodes[0]; // a    root->right = createNode('\0', 6);    root->right->left = left;    root->right->right = right;        char str[100];    printf("哈夫曼编码结果：\n");    printCodes(root, str, 0);        return 0;}