Sneaky spam in conversational replies to blog posts

Terence Eden’s Blog

View Original ↗
AI 導讀 technology AI 重要性 2/5

偽裝成三人對話的垃圾留言鏈,把賭場連結藏進去掉 https 的第二則

  • 三則假留言每隔 3 分鐘一則,來自菲律賓同一 IP 卻偽裝成不同讀者
  • 賭場連結省略 https 後混入普通文字,不觸發超連結的視覺警示
  • 更多防護門檻只趕走真讀者,有利潤動機的垃圾發送者持續繞過

每天有數百則垃圾留言被自動擋下,但最難纏的,是那種偽裝成真實對話的留言鏈。英國部落客 Terence Eden 記錄了一個案例:三則互相「回覆」的假留言,把賭場連結悄悄藏在中間那則——每隔 3 分鐘一則,來自菲律賓同一個 IP,卻幾乎騙過了人工審查。

每天過濾數百則:Antispam Bee 仍放行了什麼

Eden 的 WordPress 部落格使用 Antispam Bee(開源的 WordPress 反垃圾外掛)自動過濾,平均每天擋下數百則垃圾留言。自動系統擅長抓量大、模式重複的廉價垃圾,但它的弱點在於「規則」——凡是能繞過已知規則的留言,就有機會混入人工審核佇列。

這次的三則留言就是如此。每則都有獨立的電子郵件地址,使用者名稱沒有明顯異常,個人網址欄位留空——這幾個欄位正是垃圾過濾器常用的特徵檢查項,全部被這批留言刻意迴避了。外觀上,它們和普通讀者互動幾乎沒有差異,成功通過了自動篩選,靜靜等待人工確認。

菲律賓同一 IP 發出的三則假對話留言

三則留言構造出一個完整的對話邏輯。第一則像是有人在社群媒體分享了 Eden 文章後附上的簡短感想,這種形式接近常見的 pingback 通知,初看沒有觸發懷疑。第二則偽裝成對第一則的回應,繼續「討論」文章,稍微空洞但語氣像是善意的閱讀心得。第三則又是一則追加回覆,三個層次讓整組留言看起來像是一段真實發生的讀者對話。

事後調查 IP,三則留言全部來自菲律賓同一個 IP 位址,是同一操作者(或同一批自動化腳本)發出的。時間戳記也洩露了機械性:每則留言之間間隔恰好 3 分鐘,分毫不差。這種精確的等距間隔在真實讀者討論中幾乎不會發生,但在審查當下,這個細節被「對話看起來很正常」的整體印象掩蓋掉了。

去掉 https 就不顯示為連結的賭場廣告

垃圾留言放置連結的目的,未必是讓讀者點擊,而是讓連結出現在頁面的 HTML 原始碼裡,藉此積累反向連結(backlink)計數,短暫提升目標網站在搜尋引擎的排名——這是黑帽 SEO(搜尋引擎優化,藉不正當手段拉抬排名)的慣用手法。規模化操作時,同時向數萬個部落格散布含連結的留言,即使每個網站的存留時間不長,累積效果仍相當可觀,背後有賭場或詐騙網站廣告主在付費委託。

帶有 https:// 開頭的網址在多數留言系統裡會自動渲染成可點擊的藍色超連結,格外醒目,管理者很容易一眼識破。這次第二則留言採用了一個簡單但有效的規避方式:直接寫裸網域名稱,省略 https://。不帶協議前綴的文字不會被介面自動轉換成超連結,視覺上就是一串普通文字,和周圍的句子混成一片。賭場網址就這樣夾在兩則「正常回覆」之間,很容易被快速瀏覽的管理者當成無害內文帶過。

每隔 3 分鐘一則:AI 生成留言的辨識特徵

回頭仔細閱讀,Eden 認為三則留言都帶有明顯的 AI slop(AI 廢話,指 LLM 大型語言模型生成的語句通順但語義空洞的文字)特徵:說了很多字,幾乎沒有傳遞任何具體觀點或資訊。模型能夠在統計意義上模擬「一個讀者在回應文章」的語言形式,卻無法真正理解文章在討論什麼。

更關鍵的是「對話鏈」的設計效果。認知上,「看到三個人在對話」會讓審查者預設這是三個不同的真實人物,這種社交框架提高了我們整體感受「真實性」的門檻。Eden 指出,他習慣的垃圾留言是單則出現的;而把廣告藏在「三則對話的第二則」,讓審查者的注意力自然先落在第一則和第三則確認對話邏輯,中間那則反而被帶過。這是一種社交工程(social engineering,利用人的認知習慣與心理弱點,而非技術漏洞的操控手法)策略,只是換了個應用場景。

加防護只趕走真讀者:社交問題沒有技術解法

Eden 最後提出他認為最根本的觀察:「記住,社交問題沒有技術解法。」為留言系統加上越來越多的障礙——驗證碼、強制帳號註冊、審核延遲——確實提高了垃圾發送者的成本,但同樣也在提高真實讀者的成本。對一般讀者而言,繁瑣的留言流程是最直接的放棄理由;但對以垃圾留言為業的操作者而言,利潤動機(profit motive)持續驅使他們研究新的繞過方式。

這並不是說自動過濾毫無意義——Antispam Bee 每天確實擋下了數百則,大幅減少人工審核的負擔。真正的問題在於,「加了防護」不等於「問題被解決了」。當垃圾留言開始刻意模擬人類社交對話,並借助 AI 壓低每則留言的生成成本,純技術篩選就碰到了它的能力邊界,仍然需要人的脈絡判斷去識別邊界案例。

同一 IP 三則假對話、賭場連結藏進去掉 https 的中間一則——你下次審留言,還敢只看第一眼嗎?

Abstract

I'm grateful that my blog posts attract lots of engaged, funny, and challenging comments. But any popular post also attracts spammers. I use Antispam Bee to automatically eradicate a couple of hundred crappy comments per day. Nevertheless, some get through. Here's a particularly pernicious one - it appeared as three comments ostensibly in reply to each other. At first glance these look like …