開源世界崩潰的第一槍——chardet AI授權洗白案的始末

上週,一場圍繞著Python library: chardet的授權爭議,在開源社群大爆炸——這極有可能是開源世界大核彈。 為什麼影響這麼大?因為 chardet 的使用範圍極廣,每月約1.3 億次的下載量。 題外話,chardet是 Python的字元編碼偵測工具—— 想像一下,我不知道這個套件時,我如果拿到亂碼的文字檔案,我就會開啟vscode change file encoding亂猜。 這個套件就是讓你不用猜,chardet 會自動偵測出來UTF-8、Big5、Shift-JIS 還是 GBK 如果你不知道chardet,那以一定聽過requests,requests正是chardet的使用者。 本文基於 Simon Willison 的分析、GitHub Issue #327 的 211 則討論、以及 The Register 的報導,深入拆解這場爭議的每一個爭點。 故事的起點:一次「輕描淡寫」的版本發布 2026年3月4日,chardet的維護者Dan Blanchard發布了7.0.0版本,發布說明裡寫著: Ground-up, MIT-licensed rewrite of chardet. Same package name, same public API — drop-in replacement for chardet 5.x/6.x. Just way faster and more accurate! 翻譯過來就是:我們從零重寫了整個專案,把授權從 LGPL 改成了 MIT,而且更快更準。 這個改動有多大?LGPL 到 MIT 的轉變,也就代表所有下游使用者可以不必開源了。 但問題是——他有權這樣做嗎? 原作者的怒火:「你們沒有這個權利」 隔天,一個消失了15年的名字重新出現在GitHub上。 Mark Pilgrim——chardet的原作,同時也是《Dive Into Python》的作者——開了一個Issue,標題直截了當:No right to relicense this project。 ...

March 7, 2026 · 3 分鐘 · map[name:GoatWang]