全文
★4
AI
Mon, 20 Ap
OpenAI 將網路安全信任存取計畫擴展至數千名驗證防禦者與數百個企業團隊。此次擴編的核心是推出專為資安防禦微調的 GPT-5.4-Cyber 模型。新機制打破 AI 對安全指令全面拒絕的現狀,透過分層授權讓專家能順利執行二進位逆向工程,重新定義 AI 雙用途界線。 GPT-5.4-Cyber 解鎖無原始碼二進位逆…
原文:OpenAI Scales Trusted Access for Cyber Defense With GPT-5.4-Cyber: a Fine-Tuned Model Built for Verified Security Defend…
全文
★4
infrastructure
Mon, 20 Ap
月之暗面(Moonshot AI)與清華大學透過跨資料中心架構,將 **1T** 參數模型推論吞吐量提升 **54%**。新技術 **PrfaaS** 打破高成本網路限制,僅耗用 **13%** 乙太網路頻寬,便成功將預填充與解碼階段跨叢集分離。 傳統 GQA 模型的 60 Gbps 資料傳輸瓶頸 要理解 Prfa…
原文:Moonshot AI and Tsinghua Researchers Propose PrfaaS: A Cross-Datacenter KVCache Architecture that Rethinks How LLMs are …
全文
★4
AI
Sun, 19 Ap
Google 開源的深度學習模型 **Magika** 能夠直接從檔案的原始位元組(raw bytes)精準辨識格式,徹底打破傳統依賴副檔名的脆弱資安防線。本篇技術導讀將帶領讀者結合 **Magika 1.0.2** 與 **OpenAI API**,建構出能自動攔截偽造檔案、生成威脅評估,並將底層二進位數據轉化為高…
原文:A Coding Implementation to Build an AI-Powered File Type Detection and Security Analysis Pipeline with Magika and OpenAI
全文
★4
AI
Sun, 19 Ap
處理結構化表格資料(Tabular data)時,決策樹模型長期佔據主流地位。然而,近期一項針對 5,000 筆樣本的分類測試顯示,基於上下文學習架構的 **TabPFN** 基礎模型完全略過傳統的資料集訓練過程,僅花費 **0.47 秒**就完成模型擬合,並以 **98.8%** 的準確率擊敗了主流的 **CatB…
原文:How TabPFN Leverages In-Context Learning to Achieve Superior Accuracy on Tabular Datasets Compared to Random Forest and …
全文
★4
AI
Sun, 19 Ap
Anthropic 從未對外公開 Claude Mythos 的技術細節,但全新開源專案 **OpenMythos** 透過 PyTorch 進行了理論重建。這套系統證實了僅需 **770M** 參數的遞迴架構,就能達到 **1.3B** 傳統模型的推理能力。 揚棄傳統堆疊的 RDT 運算架構 主流的語言模型(如 …
原文:Meet OpenMythos: An Open-Source PyTorch Reconstruction of Claude Mythos Where 770M Parameters Match a 1.3B Transformer
全文
★4
AI
Fri, 17 Ap
突破傳統滲透測試侷限:AI 紅隊演練的核心定義 高達 19 款專屬防護工具在 2026 年成為企業 AI 標配,因為傳統滲透測試完全無法防禦提示詞注入與資料中毒。**AI 紅隊演練(AI Red Teaming)**已成為高風險模型不可或缺的防線,直接發掘未知的對抗性威脅。這類演練涵蓋了提示詞注入、越獄攻擊、偏差利…
原文:Top 19 AI Red Teaming Tools (2026): Secure Your ML Models
全文
★4
infrastructure
Sat, 18 Ap
透過原生 MXFP4 量化技術,開發者僅需 **16GB VRAM**(如 T4 GPU),即可在 Google Colab 完整運行需要 **40GB** 磁碟空間的 OpenAI 開源模型 **gpt-oss-20b**。 僅需 16GB VRAM:正確載入 OpenAI gpt-oss-20b 模型 在執行 …
原文:A End-to-End Coding Guide to Running OpenAI GPT-OSS Open-Weight Models with Advanced Inference Workflows
全文
★4
AI
Sat, 18 Ap
6059名開發者調查指出的除錯耗時問題 **Google** 的一份內部調查指出,38.4% 的整合測試失敗需要耗費超過一小時來診斷,而最新推出的 **Auto-Diagnose** 系統成功在 71 個真實失敗案例中達到 **90.14%** 的根本原因診斷準確率。這套完全依賴提示詞工程的系統,已經在超過五萬個失…
原文:Google AI Releases Auto-Diagnose: An Large Language Model LLM-Based System to Diagnose Integration Test Failures at Scal…
全文
★4
AI
Sat, 18 Ap
Anthropic 最新推出的 **Claude Opus 4.7** 在 CursorBench 程式碼基準測試中取得 **70%** 的成績,並將視覺解析度推升至 **3.75 百萬像素**。這次發布針對代理型軟體工程、多模態推論與長時間自主任務執行等開發者需求,進行了精準且大幅度的升級。 Opus 4.7 通…
原文:Anthropic Releases Claude Opus 4.7: A Major Upgrade for Agentic Coding, High-Resolution Vision, and Long-Horizon Autonom…
全文
★3
infrastructure
Fri, 17 Ap
拋棄 Redis 依賴:以 SQLite 與 Huey 建立單一檔案任務隊列 背景任務系統不一定要依賴重量級的 **Redis**,透過輕量的 **Huey** 搭配單一 **SQLite** 檔案,就能處理包含重試、排程與並發控制的 **7 大**非同步核心場景。 在現代軟體開發中,非同步任務處理是不可或缺的一環…
原文:A Coding Guide to Build a Production-Grade Background Task Processing System Using Huey with SQLite, Scheduling, Retries…