MarkTechPost — RadPulse

MarkTechPost 全文 ★4 AI Mon, 20 Ap

OpenAI 推出專為資安微調的 GPT-5.4-Cyber，透過三層身分驗證框架放行逆向工程，打破全面拒絕限制。

OpenAI 將網路安全信任存取計畫擴展至數千名驗證防禦者與數百個企業團隊。此次擴編的核心是推出專為資安防禦微調的 GPT-5.4-Cyber 模型。新機制打破 AI 對安全指令全面拒絕的現狀，透過分層授權讓專家能順利執行二進位逆向工程，重新定義 AI 雙用途界線。 GPT-5.4-Cyber 解鎖無原始碼二進位逆…

原文：OpenAI Scales Trusted Access for Cyber Defense With GPT-5.4-Cyber: a Fine-Tuned Model Built for Verified Security Defend…

MarkTechPost 全文 ★4 infrastructure Mon, 20 Ap

Moonshot AI 與清華大學提出 PrfaaS 架構，透過跨資料中心部署將 1T 參數模型推論吞吐量提升 54%。

月之暗面（Moonshot AI）與清華大學透過跨資料中心架構，將 **1T** 參數模型推論吞吐量提升 **54%**。新技術 **PrfaaS** 打破高成本網路限制，僅耗用 **13%** 乙太網路頻寬，便成功將預填充與解碼階段跨叢集分離。傳統 GQA 模型的 60 Gbps 資料傳輸瓶頸要理解 Prfa…

原文：Moonshot AI and Tsinghua Researchers Propose PrfaaS: A Cross-Datacenter KVCache Architecture that Rethinks How LLMs are …

MarkTechPost 全文 ★4 AI Sun, 19 Ap

結合 Google Magika 的位元組級精準辨識與 OpenAI 語言分析，能有效防堵副檔名偽造並自動生成資安威脅評估報告。

Google 開源的深度學習模型 **Magika** 能夠直接從檔案的原始位元組（raw bytes）精準辨識格式，徹底打破傳統依賴副檔名的脆弱資安防線。本篇技術導讀將帶領讀者結合 **Magika 1.0.2** 與 **OpenAI API**，建構出能自動攔截偽造檔案、生成威脅評估，並將底層二進位數據轉化為高…

原文：A Coding Implementation to Build an AI-Powered File Type Detection and Security Analysis Pipeline with Magika and OpenAI

MarkTechPost 全文 ★4 AI Sun, 19 Ap

TabPFN 基礎模型透過上下文學習，在 5,000 筆樣本分類中以 98.8% 準確率擊敗 CatBoost，僅需 0.47 秒即可完成擬合。

處理結構化表格資料（Tabular data）時，決策樹模型長期佔據主流地位。然而，近期一項針對 5,000 筆樣本的分類測試顯示，基於上下文學習架構的 **TabPFN** 基礎模型完全略過傳統的資料集訓練過程，僅花費 **0.47 秒**就完成模型擬合，並以 **98.8%** 的準確率擊敗了主流的 **CatB…

原文：How TabPFN Leverages In-Context Learning to Achieve Superior Accuracy on Tabular Datasets Compared to Random Forest and …

MarkTechPost 全文 ★4 AI Sun, 19 Ap

OpenMythos 證實：770M 參數的遞迴深度模型能匹敵 1.3B 傳統架構。

Anthropic 從未對外公開 Claude Mythos 的技術細節，但全新開源專案 **OpenMythos** 透過 PyTorch 進行了理論重建。這套系統證實了僅需 **770M** 參數的遞迴架構，就能達到 **1.3B** 傳統模型的推理能力。揚棄傳統堆疊的 RDT 運算架構主流的語言模型（如 …

原文：Meet OpenMythos: An Open-Source PyTorch Reconstruction of Claude Mythos Where 770M Parameters Match a 1.3B Transformer

MarkTechPost 全文 ★4 AI Fri, 17 Ap

傳統滲透無法阻擋提示詞注入，19 款 AI 紅隊演練工具成為企業防禦標配。

突破傳統滲透測試侷限：AI 紅隊演練的核心定義高達 19 款專屬防護工具在 2026 年成為企業 AI 標配，因為傳統滲透測試完全無法防禦提示詞注入與資料中毒。**AI 紅隊演練（AI Red Teaming）**已成為高風險模型不可或缺的防線，直接發掘未知的對抗性威脅。這類演練涵蓋了提示詞注入、越獄攻擊、偏差利…

原文：Top 19 AI Red Teaming Tools (2026): Secure Your ML Models

MarkTechPost 全文 ★4 infrastructure Sat, 18 Ap

透過原生 MXFP4 量化技術，僅需 16GB VRAM 即可在 Google Colab 上完整運行 40GB 的開源權重模型 gpt-oss-20b。

透過原生 MXFP4 量化技術，開發者僅需 **16GB VRAM**（如 T4 GPU），即可在 Google Colab 完整運行需要 **40GB** 磁碟空間的 OpenAI 開源模型 **gpt-oss-20b**。僅需 16GB VRAM：正確載入 OpenAI gpt-oss-20b 模型在執行 …

原文：A End-to-End Coding Guide to Running OpenAI GPT-OSS Open-Weight Models with Advanced Inference Workflows

MarkTechPost 全文 ★4 AI Sat, 18 Ap

Google 推出 Auto-Diagnose 系統，以語言模型分析日誌，將 90% 的整合測試失敗診斷縮短至 56 秒。

6059名開發者調查指出的除錯耗時問題 **Google** 的一份內部調查指出，38.4% 的整合測試失敗需要耗費超過一小時來診斷，而最新推出的 **Auto-Diagnose** 系統成功在 71 個真實失敗案例中達到 **90.14%** 的根本原因診斷準確率。這套完全依賴提示詞工程的系統，已經在超過五萬個失…

原文：Google AI Releases Auto-Diagnose: An Large Language Model LLM-Based System to Diagnose Integration Test Failures at Scal…

MarkTechPost 全文 ★4 AI Sat, 18 Ap

Anthropic 推出 Opus 4.7，不僅將視覺解析度提升至 3.75 百萬像素，更在 CursorBench 測試中突破 70% 通過率。

Anthropic 最新推出的 **Claude Opus 4.7** 在 CursorBench 程式碼基準測試中取得 **70%** 的成績，並將視覺解析度推升至 **3.75 百萬像素**。這次發布針對代理型軟體工程、多模態推論與長時間自主任務執行等開發者需求，進行了精準且大幅度的升級。 Opus 4.7 通…

原文：Anthropic Releases Claude Opus 4.7: A Major Upgrade for Agentic Coding, High-Resolution Vision, and Long-Horizon Autonom…

MarkTechPost 全文 ★3 infrastructure Fri, 17 Ap

背景任務系統不一定要依賴重量級的 Redis，透過輕量的 Huey 搭配單一 SQLite 檔案，就能處理包含重試、排程與並發控制的 7 大非同步核心場景。

拋棄 Redis 依賴：以 SQLite 與 Huey 建立單一檔案任務隊列背景任務系統不一定要依賴重量級的 **Redis**，透過輕量的 **Huey** 搭配單一 **SQLite** 檔案，就能處理包含重試、排程與並發控制的 **7 大**非同步核心場景。在現代軟體開發中，非同步任務處理是不可或缺的一環…

原文：A Coding Guide to Build a Production-Grade Background Task Processing System Using Huey with SQLite, Scheduling, Retries…

📖 MarkTechPost