🤖 AI中文導讀

已導讀 339 篇 待處理 12156 篇

醫療 AI 與通用 AI(arXiv 預印本 + OpenAI / Anthropic / DeepMind / Karpathy Curated 等部落格)

📡 訂閱本分類 RSS

arXiv 全文 ★4 AI 2026-04-17

東京大學提出 Neural Gabor Splatting,透過神經網路基元在 5% 極限預算下實現高畫質即時渲染。

3D 高斯潑濺技術處理複雜場景紋理時,常引發高達數 GB 的記憶體暴增。東京大學團隊提出 Neural Gabor Splatting,替單一高斯基元植入微型多層感知機網路,在僅 **5%** 數據預算下仍能精準渲染高頻細節,並維持最高 **500 FPS** 即時幀率。 3DGS 在高頻表面重建的記憶體暴增困境 …

原文:Neural Gabor Splatting: Enhanced Gaussian Splatting with Neural Gabor for High-frequency Surface Reconstruction

arXiv 全文 ★4 general 2026-04-17

將 N=2 準精確可解量子模型轉換至一維馬可夫過程,利用 E_1>0 的最慢可觀測量重構系統,大幅簡化了數學推導與物理詮釋。

傳統上在建構具有 **$N=2$** 個明確能階的準精確可解(Quasi-Exactly-Solvable,簡稱 QES)量子哈密頓量時,物理學家多半需要處理複雜的薛丁格方程式微積分與波函數推導。然而,來自法國巴黎薩克雷大學的最新研究指出,若將視角切換至滿足細緻平衡(detailed-balance)的一維馬可夫(M…

原文:On the role of the slowest observable in one-dimensional Markov processes to construct quasi-exactly-solvable generators…

arXiv 全文 ★3 general 2026-04-17

研究團隊首次將多層法模擬導入第 5 階泰勒展開,並與多晶鋁鎂合金實驗數據對齊,打破傳統完美晶格的技術限制。

高解析度電子背散射繞射 (HR-EBSD) 技術在次微米尺度的彈性應變測量中扮演著關鍵角色。近期一篇發布於 arXiv 的論文首度將多層法 (Multi-slice, MS) 的第 5 階泰勒展開應用於實際多晶鋁鎂合金的實驗數據比對,成功打破過去該演算法僅限於純理論探討的瓶頸,讓非完美晶體的精確繞射圖樣模擬成為現實。…

原文:Experimentally-validated multi-slice simulation of electron diffraction patterns

arXiv 全文 ★4 AI 2026-04-17

傳統 3DGS 人體模型難以處理寬鬆衣物,Cloth-HUGS 透過解耦圖層與物理約束,在 40 分鐘內實現降低 28% LPIPS 誤差的 60 FPS 即時渲染。

傳統的 3D 人體重建技術通常將人體與衣物視為單一整體,導致處理寬鬆衣物時邊界模糊且無法分離編輯。最新發布的 Cloth-HUGS 框架打破這項限制,透過 3D 高斯濺射(3DGS)技術將人體與衣物解耦為獨立圖層。這套系統能在單張 NVIDIA L40S GPU 上於 40 分鐘內完成訓練,並實現每秒 60 幀(FP…

原文:CLOTH-HUGS: Cloth Aware Human Gaussian Splatting

arXiv 全文 ★4 AI 2026-04-17

浙江大學團隊推出 UniEditBench 統一評估框架,將千億參數裁判模型蒸餾至 4B 規模,顯存需求大幅降至 12 GB 且維持極高人類偏好對齊率。

傳統視覺生成模型的評估面臨巨大的運算成本瓶頸,直接使用超大型多模態模型作為自動裁判,往往需要高達 **470.8 GB** 的硬體顯存。浙江大學團隊推出的 **UniEditBench** 打破了這個資源限制,透過兩階段知識蒸餾技術,將千億參數規模的 **Qwen3-VL-235B-A22B** 壓縮至 **4B/8…

原文:UniEditBench: A Unified and Cost-Effective Benchmark for Image and Video Editing via Distilled MLLMs

arXiv 全文 ★4 AI 2026-04-17

Splats in Splats++ 框架透過球諧函數分級加密與雜湊網格映射,在 3DGS 模型中無縫嵌入 3D/4D 隱藏資訊,保真度提升 6.28 dB 且渲染加速 3 倍。

3D 高斯濺射(3DGS)正迅速成為新一代數位資產的標準格式。然而,這種高度顯式且易於複製的資料結構,讓版權保護面臨嚴峻挑戰。北京大學與上海交通大學等團隊提出的 Splats in Splats++ 框架,成功將高容量的 3D 與 4D 隱藏資訊無縫嵌入原生模型中。這套機制在隱藏訊息保真度上超越現有方案達 **6.2…

原文:Splats in Splats++: Robust and Generalizable 3D Gaussian Splatting Steganography

arXiv 全文 ★4 AI 2026-04-17

CHOP 為文本注入連續性標籤,將 RAG 檢索命中率推升至 90.77%。

RAG 系統常因固定長度截斷遺失上下文。HDC LABS 提出 CHOP 框架,為文本區塊注入連續性感知標籤,將多文件檢索的 Top-1 命中率推升至 **90.77%**,大幅超越常規切割法的 81.28%。 RAG 多文件檢索的長度切割與上下文遺失 LLM(大型語言模型)常在特定領域遇到知識幻覺,而 RAG(檢…

原文:CHOP: Chunkwise Context-Preserving Framework for RAG on Multi Documents

arXiv 全文 ★4 market 2026-04-17

研究團隊開發專為單側線性超音波陣列設計的頻域全波形反演演算法,僅需 64 個常規陣元即可精準重建 0.5 mm 病灶的定量聲速分佈。

傳統超音波 B-mode 影像僅能提供定性的結構回聲,難以精確量化組織的物理特性。以色列魏茨曼科學研究學院團隊提出一種專為單側線性超音波陣列設計的頻域 FWI(全波形反演,利用波動方程式推導介質特性的技術)框架,成功在僅有 **64** 個陣元的臨床常規探頭限制下,精準重建出直徑小至 **0.5 mm** 的甲狀腺囊…

原文:TV-Regularized Frequency-Domain Full-Waveform Inversion for Single-Sided Linear Ultrasound Array Data

arXiv 全文 ★4 AI 2026-04-17

FC-GSSL 演算法透過逆向破壞圖資料中的低頻貢獻,迫使模型融合高低頻訊號,在 14 個資料集上全面提升圖神經網路效能。

圖神經網路的自監督學習在處理包含超過 **40,000** 個節點的大型網路資料時,往往會面臨一個反直覺的困境:深度學習模型天生傾向保留平滑的全域低頻特徵,卻將包含豐富局部偏好的高頻訊號誤判為隨機雜訊並加以抑制。為了解決高頻訊號難以被模型吸收的結構性問題,近期一項名為 **FC-GSSL**(基於頻率破壞的圖自監督學…

原文:Graph self-supervised learning based on frequency corruption

arXiv 全文 ★4 AI 2026-04-17

將邏輯推論引入資訊理論,透過閉包保真度將知識庫的零失真傳輸率壓縮至 P_A H(π_A),突破傳統香農極限。

在傳統香農理論中,零錯誤通訊意味著必須消耗等同於資訊熵 H(P_O) 的傳輸率。上海交通大學最新研究指出,若將傳輸對象視為具備邏輯推論能力的知識庫,允許接收端自行推論補齊資訊,零失真傳輸率能大幅壓縮至 P_A H(π_A)。這項突破將邏輯冗餘轉化為實質的頻寬節省,挑戰了僅依賴字元比對的壓縮極限。 超越符號級比對:演…

原文:Rate-Distortion Theory for Deductive Sources under Closure Fidelity

arXiv 全文 ★4 AI 2026-04-17

透過在極座標域注入額外雜訊的 Noisier2Inverse 框架,無需乾淨原圖即可修復高達 20 度實體探測器造成的造影模糊。

光聲斷層掃描受限於探測器物理體積,常產生高達 **20 度**的角度解析度模糊。最新研究提出 **Noisier2Inverse** 自監督框架,完全無需乾淨原圖,僅透過極座標域的加噪運算就能逼近監督學習的重建水準,突破影像還原的資料瓶頸。 實體探測器引發的 2D 角度模糊 光聲斷層掃描(PAT)巧妙結合了光學對比…

原文:Self-Supervised Angular Deblurring in Photoacoustic Reconstruction via Noisier2Inverse

arXiv 全文 ★3 AI 2026-04-17

NK-GAD 框架破解圖神經網路同質性盲區,在七大數據集中將無監督異常檢測 AUC 提升 3.29%。

傳統圖神經網路常假設相連節點擁有相似特徵,但真實世界的社群與金融圖資卻顯示,無論異常或正常節點的連線,其屬性相似度多半落在極低的 0 到 0.25 區間。這個反直覺現象促使研究團隊開發出 NK-GAD 框架,直接將無監督圖異常檢測的平均 AUC 提升了 **3.29%**。 突破同質性假設:圖結構中的屬性異質性現象…

原文:NK-GAD: Neighbor Knowledge-Enhanced Unsupervised Graph Anomaly Detection

arXiv 全文 ★4 AI 2026-04-17

ERR 框架透過頻譜解耦分三階段修復影像,同時釋出 82,126 張 UHD 測試影像庫。

當前超高畫質(UHD)影像修復技術經常在運算成本與細節保留之間妥協,傳統的降採樣模式極易流失關鍵資訊。近期,研究團隊證實了非線性激勵函數才是注入高頻細節的真正推手。基於此,南京大學等機構設計出漸進式頻譜解耦框架 ERR,並釋出包含 82,126 張高品質影像的超大規模資料集 LSUHDIR,不僅徹底改變了從零頻到高頻…

原文:From Zero to Detail: A Progressive Spectral Decoupling Paradigm for UHD Image Restoration with New Benchmark

arXiv 全文 ★4 AI 2026-04-17

SPLIT 框架透過多重數據分割與測量域損失,成功讓 5 通道多光譜 CT 在零真實影像下完成非線性自監督重建。

機器學習在斷層掃描(CT)重建任務中表現驚人,但高階監督式訓練高度仰賴大量「成對測量與真實影像」,這在實務場景中往往難以取得。為了解決非線性反問題中缺乏基準影像的困境,研究團隊提出 **SPLIT** 自監督學習框架。這項全新技術完全不需要任何高畫質真實影像作為參考,就能在處理 **5** 個能量通道、包含 **26…

原文:SPLIT: Self-supervised Partitioning for Learned Inversion in Nonlinear Tomography

MarkTechPost 全文 ★4 AI Sun, 19 Ap

OpenMythos 證實:770M 參數的遞迴深度模型能匹敵 1.3B 傳統架構。

Anthropic 從未對外公開 Claude Mythos 的技術細節,但全新開源專案 **OpenMythos** 透過 PyTorch 進行了理論重建。這套系統證實了僅需 **770M** 參數的遞迴架構,就能達到 **1.3B** 傳統模型的推理能力。 揚棄傳統堆疊的 RDT 運算架構 主流的語言模型(如 …

原文:Meet OpenMythos: An Open-Source PyTorch Reconstruction of Claude Mythos Where 770M Parameters Match a 1.3B Transformer

MarkTechPost 全文 ★4 AI Sun, 19 Ap

TabPFN 基礎模型透過上下文學習,在 5,000 筆樣本分類中以 98.8% 準確率擊敗 CatBoost,僅需 0.47 秒即可完成擬合。

處理結構化表格資料(Tabular data)時,決策樹模型長期佔據主流地位。然而,近期一項針對 5,000 筆樣本的分類測試顯示,基於上下文學習架構的 **TabPFN** 基礎模型完全略過傳統的資料集訓練過程,僅花費 **0.47 秒**就完成模型擬合,並以 **98.8%** 的準確率擊敗了主流的 **CatB…

原文:How TabPFN Leverages In-Context Learning to Achieve Superior Accuracy on Tabular Datasets Compared to Random Forest and …

MarkTechPost 全文 ★4 AI Sun, 19 Ap

結合 Google Magika 的位元組級精準辨識與 OpenAI 語言分析,能有效防堵副檔名偽造並自動生成資安威脅評估報告。

Google 開源的深度學習模型 **Magika** 能夠直接從檔案的原始位元組(raw bytes)精準辨識格式,徹底打破傳統依賴副檔名的脆弱資安防線。本篇技術導讀將帶領讀者結合 **Magika 1.0.2** 與 **OpenAI API**,建構出能自動攔截偽造檔案、生成威脅評估,並將底層二進位數據轉化為高…

原文:A Coding Implementation to Build an AI-Powered File Type Detection and Security Analysis Pipeline with Magika and OpenAI

Karpathy Curated 全文 ★4 AI 2026-04-19

AI 代理推動無頭架構普及,將徹底顛覆傳統 SaaS 的按人頭計費商業模式。

在 2026 年的軟體生態系中,傳統依賴人類透過瀏覽器點擊網頁的互動模式正面臨邊際效益遞減的困境。根據技術專家 Simon Willison 最新引述的產業觀察,未來的個人化 AI 將全面推動無頭化(Headless)架構的普及。當 **Salesforce** 等軟體巨頭開始宣告「API 就是使用者介面」,這不僅意…

原文:Headless everything for personal AI

Karpathy Curated 全文 ★3 policy 2026-04-19

歐洲公部門正面臨至少 3 項美國法律的資料存取威脅,卻試圖用厚重的合規文件掩蓋依賴外國雲端的風險。

將社會與政府的核心資料託管給美國伺服器,正面臨**至少 3 項**美國法律的直接存取威脅。公部門沒有選擇重建自主技術,而是斥資聘請顧問產出成堆的合規文件,試圖用官僚程序掩蓋數位主權流失的現實。 白宮與 3 項美國法律工具破壞歐洲資料自主權 將國家基礎設施交給美國雲端供應商,伴隨著兩個無法迴避的硬傷。系統能正常運作的…

原文:Big tech clouds worden niet veiliger met stapels papier

Karpathy Curated 全文 ★3 AI 2026-04-19

低速過熱的二手車預示了未來:人類必須依賴 AI,才能修復 AI 寫的程式碼。

在 2000 年代初期,一台只要時速低於 40 英里就會發生引擎過熱的二手綠色廂型車,意外預示了當今 AI 輔助軟體工程的發展軌跡。當機械零件被看不見的數位感測器取代,即使經驗豐富的修車技師沒有專用診斷電腦也只能束手無策。這段從類比跨越到數位時代的童年回憶,如今正精準對應到由 **LLM(大型語言模型)** 驅動的程…

原文:Hook It Up to the Machine

Karpathy Curated 全文 ★3 general 2026-04-19

奧斯卡影后 Jessica Chastain 證實,因政治遇刺事件遭推遲的 Apple TV+ 影集《The Savant》預計於 7 月上架。

奧斯卡影后 **Jessica Chastain** 證實,原訂於 **2025 年 9 月** 首播卻遭無限期推遲的 **Apple TV+** 政治驚悚影集《The Savant》,即將迎來重見天日的機會。這部探討暗網與國內恐怖主義的敏感作品,在經歷政治人物遇刺事件導致的撤檔風波後,內部消息指出蘋果已計畫於 **…

原文:Jessica Chastain Says Apple TV Will Finally Release ‘The Savant’

Karpathy Curated 全文 ★2 general 2026-04-19

透過 FFmpeg 與 ExifTool 將 LG 360 雙魚眼影片轉換為等距圓柱投影,精準設定 189 度視角可有效解決影像重疊問題。

透過 **FFmpeg** 濾鏡將舊款 LG 360 攝影機產出的雙魚眼影片,精準轉換為涵蓋 **189 度**視角的等距圓柱投影格式,是確保沉浸式影像在現代播放器正常運作的關鍵技術路徑。這項工作不僅涉及像素的幾何重映射,更需要處理感光元件的物理裁切限制與中繼資料的注入。 LG 360 雙魚眼影片轉換為等距圓柱投影…

原文:Reprojecting Dual Fisheye Videos to Equirectangular (LG 360)

MarkTechPost 全文 ★4 AI Sat, 18 Ap

Anthropic 推出 Opus 4.7,不僅將視覺解析度提升至 3.75 百萬像素,更在 CursorBench 測試中突破 70% 通過率。

Anthropic 最新推出的 **Claude Opus 4.7** 在 CursorBench 程式碼基準測試中取得 **70%** 的成績,並將視覺解析度推升至 **3.75 百萬像素**。這次發布針對代理型軟體工程、多模態推論與長時間自主任務執行等開發者需求,進行了精準且大幅度的升級。 Opus 4.7 通…

原文:Anthropic Releases Claude Opus 4.7: A Major Upgrade for Agentic Coding, High-Resolution Vision, and Long-Horizon Autonom…

Karpathy Curated 全文 ★4 infrastructure 2026-04-18

7.8億美元和解金,讓漏洞百出的投票機因政治對立成為無法檢討的禁忌。

在 2020 年大選後,Fox News 因散布投票機作票陰謀論付出 **7.875 億美元**的和解金。這個天價賠償引發了一個反直覺的現象:原本長年批評投票機存在資安漏洞的科技倡議者,突然因為政治對立而轉向捍衛這些設備。事實上,目前的投票機系統客觀上仍充滿安全缺陷。 回溯 IEEE 無效標準與 Diebold 版…

原文:Pluralistic: Georgia's voting technology blunder (18 Apr 2026)

Karpathy Curated 全文 ★3 policy 2026-04-18

美國封鎖荷莫茲海峽引發全球供應鏈混亂,同時五角大廈正推動車廠轉型軍工生產,無人機市場預估將達 500 億美元。

荷莫茲海峽封鎖與500億美元無人機市場 2026年4月的全球供應鏈正因美國封鎖荷莫茲海峽(Strait of Hormuz)而陷入混亂,甚至導致日本衛浴設備廠因缺乏黏合劑而被迫停工。本週的產業動態聚焦於地緣政治衝突引發的物流與製造業重組,涵蓋五角大廈推動傳統車廠轉型生產軍火、底特律角逐無人機供應鏈核心,以及四足機器…

原文:Reading List 04/18/2026

TLDR AI 全文 ★4 AI Fri, 17 Ap

Anthropic 推出支援 3.75 百萬畫素視覺輸入的 Claude Opus 4.7,引入 xhigh 運算層級,大幅提升長效程式碼生成與代理工作流的穩定性。

Anthropic 正式推出 **Claude Opus 4.7**,維持每百萬輸入代幣 5 美元的定價,但在高難度軟體工程與長文本處理上展現突破。這款新模型支援高達 **3.75 百萬畫素**的高解析度影像輸入,並引入全新的 `xhigh` 運算層級,讓開發者能將過去需要密切監督的複雜程式碼任務,安心交由 AI 獨…

原文:Claude Opus 4.7 (8 minute read)

TLDR AI 全文 ★4 AI Fri, 17 Ap

Opus百萬Token僅25美元,預訓練硬體除錯與通訊極限決定AI模型成敗。

提取Opus 4.6模型1兆Token僅需2500萬美元,實驗室隱藏思維鏈以阻擋低成本蒸餾的防線正岌岌可危。本文彙整模型蒸餾防禦、打破因果引發的預訓練失敗,及FSDP平行運算底層瓶頸。 1兆Token僅需2500萬美元的Opus模型蒸餾防禦 頂尖實驗室究竟能否阻止開源模型透過蒸餾技術快速追趕?以 Opus 4.6…

原文:What I learned this week (20 minute read)

TLDR AI 全文 ★4 AI Fri, 17 Ap

分離主機與沙盒環境,將巨型 PR 拆為獨立的 Agent 修補任務,大幅降低程式碼遷移風險。

將巨大的單一 **PR(合併請求)** 丟給審查者不僅風險極高,也難以推進程式碼現代化。透過將 **Agents SDK** 控制程式保留在信任主機外,並讓 Agent 在隔離沙盒中每次執行單一範圍的編輯與測試任務,能有效降低遷移風險。 將大型遷移 PR 拆解為受控的 Agent 沙盒任務 程式碼現代化是一個永無止…

原文:Sandboxed Agents for Codebase Migration (19 minute read)

TLDR AI 全文 ★4 AI Fri, 17 Ap

PrismML 推出 1.58 位元模型 Ternary Bonsai,將 8B 參數模型壓縮至 1.75 GB,並能在 iPhone 17 上實現每秒 27 托肯生成。

PrismML 發布 1.58 位元架構 Ternary Bonsai PrismML 發布 1.58 位元模型 Ternary Bonsai,8B 版本僅占 1.75 GB 記憶體,卻在基準測試中逼近 16 GB 常規模型的表現,並能在 iPhone 17 上達成每秒 27 個托肯的生成速度。這款專為平衡嚴苛記憶…

原文:Introducing Ternary Bonsai: Top Intelligence at 1.58 Bits (4 minute read)

TLDR AI 全文 ★4 infrastructure Fri, 17 Ap

OpenAI 擲 200 億美元買 Cerebras 算力,將換取最高 10% 股權。

**OpenAI** 承諾在未來三年內豪擲超過 **200 億美元**購買晶片新創 **Cerebras** 的算力設備,並可能藉此取得該公司最高 **10% 的股權**。這項規模翻倍的最新協議,直接凸顯了 AI 模型在推論階段對龐大算力的急迫需求。 OpenAI 砸 200 億美元綁定 Cerebras 算力 根…

原文:OpenAI to spend more than $20 billion on Cerebras chips, receive stake, The Information reports (2 minute read)