哈希算法：MD5、SHA 家族与完整性校验

FreeGuideOnline 最新 2026-06-18

什么是哈希算法？从“数字指纹”说起

哈希算法（Hash Function）是一种将任意长度的数据转换成**固定长度摘要（指纹）**的数学函数。这个过程不需要密钥，完全由输入数据决定输出，且好的哈希算法应具备以下特性：

正是这些特性，让哈希算法成为密码学、数据完整性校验、数字签名、区块链等领域的基石。

MD5（Message Digest Algorithm 5）由 Ron Rivest 于 1991 年设计，能产生 128 位（16 字节）的哈希值，通常表示为 32 个十六进制字符。

MD5("hello") = 5d41402abc4b2a76b9719d911017c592

使用建议：MD5 绝不要用于安全敏感场景。 仅可用于非安全校验，如检测传输过程中的随机错误，但绝不可防范恶意篡改。

SHA（Secure Hash Algorithm）由美国国家安全局（NSA）设计，NIST 发布，是一系列不断迭代强化的标准哈希算法。

SHA‑1 曾是 MD5 的替代者，输出 160 位（20 字节），表示为 40 个十六进制字符。

SHA1("hello") = aaf4c61ddcc5e8a2dabede0f3b482cd9aea9434d

现状：2005 年发现理论弱点，2017 年 Google 与 CWI 联合实现了首个实际碰撞（SHAttered 攻击）。SHA‑1 现已不应用于证书、数字签名等安全场景。

SHA‑2 是当前最广泛使用的安全哈希标准，包含不同输出长度的版本，内部结构相似，均基于 Merkle‑Damgård 构造：

示例（SHA‑256）：

SHA256("hello") = 2cf24dba5fb0a30e26e83b2ac5b9e29e1b161e5c1fa7425e73043362938b9824

安全性：截至目前，SHA‑2（尤其 SHA‑256 及以上）足以抵抗所有已知攻击，是绝大多数应用的推荐选择。

SHA‑3 并非 SHA‑2 的直接升级，而是基于完全不同的 Keccak 海绵结构，通过公开竞赛选出，旨在提供与 SHA‑2 可替代但又结构迥异的备用算法。当未来 SHA‑2 出现危机时，SHA‑3 可作为无缝替代。

常见版本：SHA3‑224、SHA3‑256、SHA3‑384、SHA3‑512，还有两个扩展输出函数 SHAKE128、SHAKE256。

SHA3-256("hello") = 3338be694f50c5f338814986cdf0686453a888b84f424d792af4b9202398f392

无论下载软件、传输数据还是备份验证，掌握如下命令可以让你立刻上手校验。

# MD5（不推荐用于安全校验）
md5sum filename.iso

# SHA‑256
sha256sum filename.iso

# SHA‑512
sha512sum filename.iso

# macOS 下使用 shasum -a 256 filename

# PowerShell 内置
Get-FileHash -Algorithm SHA256 .\filename.iso

# 也支持 MD5、SHA1、SHA384、SHA512 等

实战提醒：比对哈希值时，使用 diff 命令或肉眼逐字符比对。很多攻击会伪造文件名接近的恶意文件并附上无意义的哈希，请务必从可信渠道获取校验值。

哈希速度快在这成了弱点。MD5/SHA 的设计初衷是“快”，而攻击者可以利用 GPU 每秒尝试数十亿次组合。密码应使用专门的慢哈希函数，并结合随机盐值，如 bcrypt、scrypt、Argon2。

掌握了今天的知识，你就拥有了鉴别数据完整性的核心能力。从此刻起，面对任何“未经验证”的数据，你都可以自信地丢给它一个哈希——就像用数字指纹验明正身。