当前位置：首页 > Python > 正文

LZW压缩算法详解（Python语言实现LZW无损压缩与解压教程）

主机测评网
Python
2025-12-05
295

在数据处理和文件传输中，压缩技术扮演着至关重要的角色。其中，LZW压缩算法（Lempel-Ziv-Welch）是一种经典的无损压缩方法，广泛应用于GIF图像、TIFF文件以及早期的Unix压缩工具中。本教程将带你从零开始，用Python语言一步步实现LZW压缩与解压缩功能，即使你是编程小白，也能轻松掌握！

什么是LZW压缩算法？

LZW压缩算法由Abraham Lempel、Jacob Ziv和Terry Welch共同提出，其核心思想是通过构建一个“字典”来记录已经出现过的字符串，并用较短的代码（通常是整数）代替重复出现的字符串，从而实现压缩。

举个例子：假设原始文本是 ABABABA，LZW会先看到 A 和 B，然后发现 AB 重复出现，于是把 AB 存入字典并赋予编号（比如256），后续再遇到 AB 就直接用256表示，节省了空间。

LZW压缩算法详解（Python语言实现LZW无损压缩与解压教程） LZW压缩算法 Python LZW实现 LZW无损压缩 LZW编码解码第1张

LZW压缩的Python实现

下面我们用Python编写一个完整的LZW压缩器。整个过程分为两步：压缩和 解压缩。

1. 压缩函数（encode）

def lzw_compress(uncompressed):    """使用LZW算法压缩字符串"""    # 初始化字典：将所有单字符映射为ASCII值    dict_size = 256    dictionary = {chr(i): i for i in range(dict_size)}        w = ""    result = []        for char in uncompressed:        wc = w + char        if wc in dictionary:            w = wc        else:            result.append(dictionary[w])            # 将新字符串加入字典            dictionary[wc] = dict_size            dict_size += 1            w = char        # 处理最后一个字符串    if w:        result.append(dictionary[w])            return result

这段代码做了以下事情：

初始化字典，包含所有256个ASCII字符；
逐个读取输入字符，尝试组合成更长的字符串；
如果组合后的字符串已在字典中，继续扩展；否则，输出当前字符串的编码，并将新组合加入字典；
最后处理剩余未输出的部分。

2. 解压缩函数（decode）

def lzw_decompress(compressed):    """使用LZW算法解压缩编码列表"""    # 重建初始字典    dict_size = 256    dictionary = {i: chr(i) for i in range(dict_size)}        # 第一个编码一定是单字符    w = chr(compressed.pop(0))    result = w        for k in compressed:        if k in dictionary:            entry = dictionary[k]        elif k == dict_size:            # 特殊情况：k等于当前字典大小（如 ABABA 中的 ABA）            entry = w + w[0]        else:            raise ValueError('无效的压缩数据')                result += entry                # 将 w + entry[0] 加入字典        dictionary[dict_size] = w + entry[0]        dict_size += 1                w = entry            return result

完整使用示例

# 测试字符串text = "TOBEORNOTTOBEORTOBEORNOT"# 压缩compressed = lzw_compress(text)print("压缩结果:", compressed)# 解压缩decompressed = lzw_decompress(compressed)print("解压结果:", decompressed)# 验证是否一致print("原始 == 解压?", text == decompressed)

运行后你会看到压缩后的数字列表，以及成功还原的原始字符串。这说明我们的 Python LZW实现 是正确的！