🤖 醫療 AI 導讀

AJNR Ahead 全文 ★4 2026-03-20

萬例跨國 AI 竟輸給兩千例在地模型？這項前瞻性研究指出，訓練神經膠質母細胞瘤切分 AI 時，人口多樣性比純粹的資料海量更關鍵。

訓練單一腦腫瘤 AI，一萬筆跨國影像的模型居然輸給僅兩千筆資料的北美在地模型——後者的對比增強切分 Dice 分數逼近完美的 0.999。這項前瞻性研究用令人深思的數據證實：一味追求龐大的影像資料量，遠不如確保訓練資料的人口組成多樣性來得關鍵。破除腦腫瘤資料量迷思：為何 10k+ 跨國巨集未必勝過 2k 北美庫 …

原文：Evaluating Sociodemographic Biases in Artificial Intelligence-Based Glioblastoma Response Assessment Algorithms [ARTIFIC…

arXiv 全文 ★4 2026-04-17

開放式事件預測從單一結果轉向散彈槍模式，SCATTER 框架結合強化學習，成功讓模型生成多樣且合理的未來假設。

當前基於大型語言模型的事件預測技術中，高達 **90% 以上** 的研究與應用皆集中於給出單一最可能的結果，卻忽略了真實世界固有的高度不確定性。中國傳媒大學與新加坡管理大學的研究團隊提出一項全新視角，將開放式事件預測從精準的單點預測轉變為散彈槍模式。透過生成涵蓋多種合理情境的假設集合，模型在處理複雜動態時，能更全面地…

原文：Scattered Hypothesis Generation for Open-Ended Event Forecasting

MarkTechPost 全文 ★4 Mon, 20 Ap

OpenAI 推出專為資安微調的 GPT-5.4-Cyber，透過三層身分驗證框架放行逆向工程，打破全面拒絕限制。

OpenAI 將網路安全信任存取計畫擴展至數千名驗證防禦者與數百個企業團隊。此次擴編的核心是推出專為資安防禦微調的 GPT-5.4-Cyber 模型。新機制打破 AI 對安全指令全面拒絕的現狀，透過分層授權讓專家能順利執行二進位逆向工程，重新定義 AI 雙用途界線。 GPT-5.4-Cyber 解鎖無原始碼二進位逆…

原文：OpenAI Scales Trusted Access for Cyber Defense With GPT-5.4-Cyber: a Fine-Tuned Model Built for Verified Security Defend…

arXiv 全文 ★4 2026-04-17

全新發表的 SVGD-EDA 演算法結合史坦排斥力，在 256 維黑盒最佳化中擊敗 83 款模型。

在處理高維度的離散黑盒最佳化難題時，傳統演算法常因過早收斂而陷入次優的死胡同。法國昂熱大學團隊發表的全新架構 SVGD-EDA，首度將連續空間專用的史坦變分梯度下降演算法導入離散最佳化領域。在具備 **256** 個變數的高維度測試環境中，該演算法擊敗了包含 Nevergrad 函式庫在內的 **83** 種主流模型…

原文：Stein Variational Black-Box Combinatorial Optimization

arXiv 全文 ★4 2026-04-17

CiPO 框架結合反事實推理與動態疊代，精準清除大模型思維鏈的敏感資訊。

當語言模型進化為具備長思維鏈的大型推理模型時，機器的知識遺忘技術面臨了全新的困境。根據香港科技大學與香港中文大學聯合發表的研究，現有的模型遺忘技術若非無法徹底清除隱藏在數百字推理步驟中的敏感資訊，就是會導致模型在 GSM8K 等數學推理基準測試上的表現大幅暴跌。為解決此問題，研究團隊開發了 CiPO 框架，透過生成反…

原文：CiPO: Counterfactual Unlearning for Large Reasoning Models through Iterative Preference Optimization

arXiv 全文 ★4 2026-04-17

將 25 維恆星參數映射至投影空間，PISP 框架使推論效率提升 4 倍，豐度誤差降低 0.72 dex。

面對 **722,896** 筆 **APOGEE** 觀測光譜與 **25** 維恆星參數，傳統演算法常因參數高度相關而陷入收斂泥淖。團隊提出的「投影空間恆星參數推論」（**PISP**）框架，成功將多種元素豐度推論誤差降低達 **0.72 dex**，並實現近 **4** 倍的效率提升，替未來的巨量天文觀測數據處…

原文：PISP: Projected-Space Inference of Stellar Parameters

AJNR Ahead 全文 ★4 2026-03-20

與其精雕細琢顯影邊界，包含水腫的整顆腫瘤紋理才是預測 IDH 突變的抗擾動利器，能讓模型 AUC 躍升至 0.94。

臨床上我們常執著於精準圈出膠質瘤的顯影核心，但如果要用 AI 預測基因突變，**96.1%** 最穩定且具備預測力的特徵其實來自包含水腫區的整顆腫瘤巨觀紋理。這篇即將刊登於 AJNR 的研究指出，只要先把對邊界微小變化過於敏感的雜訊特徵剔除，不需更換預測演算法，就能將預測 IDH 突變的 AUC 從 **0.81**…

原文：Towards robust and generalizable radio(gen)omics predictive models for brain tumor characterization [BRAIN TUMOR IMAGING…

AJNR Ahead 全文 ★4 2026-03-20

DIVA-seg 結合偽標籤技術，在未破裂腦動脈瘤的外部驗證中達到 0.861 相似度，大幅降低標註成本。

由 AI 自動圈選的腦動脈瘤與血管，在盲測中已經讓神經放射科醫師無法分辨是機器還是真人畫的，其外部驗證的動脈瘤切割相似度高達 **0.861**。然而當我們試圖依賴這個完美的 3D 模型來計算體積與球形度時，卻在統計上發現了不可忽視的比例偏差，這意味著依賴演算法決定是否介入治療前，我們仍需謹慎審視邊緣。未破裂腦動…

原文：Towards improved decision making of unruptured intracranial aneurysms using automated segmentation from MRA-TOF with ite…

arXiv 全文 ★4 2026-04-17

NNVMC 基底轉換新技術：僅引入單一空間參數，其能量優化效果即超越擴充一萬個模型參數。

復旦大學研究團隊近期提出針對神經網路變分蒙地卡羅（NNVMC）的基底轉換新技術，僅透過引入一個可學習的空間參數 α，就能顯著降低變分能量。在三維均勻電子氣（3DHEG）測試中，這項單一參數帶來的能量改善幅度，甚至超越在 FermiNet 架構中硬加上 10,000 多個額外參數的效果。這項研究證明，改變目標基態的物理…

原文：Enhancing Neural-Network Variational Monte Carlo through Basis Transformation

arXiv 全文 ★4 2026-04-17

常數後門無解 QBF 難題，研究藉量詞深度與強化後門成功打通 FPT 演算法。

量化布林公式（QBF）向來被視為 SAT 求解的終極進階版。當產業界高度依賴後門（Backdoor）結構加速運算時，最新研究卻提出反直覺的鐵證：即使擁有通往 2-SAT 等易解類別、尺寸僅為**常數**的後門，QBF 依然維持 **PSpace-hard** 的極限難度。團隊最終透過引入量詞交替次數與創新的**強化後…

原文：Backdoors for Quantified Boolean Formulas

AJNR Ahead 全文 ★4 2026-03-20

AI 突破肉眼極限：萃取 T2 影像隱藏紋理，精準鑑別多發性硬化症與預測未來失能。

常規 T2/FLAIR 影像上看似穩定的多發性硬化症病灶，AI 卻能提前兩年預測患者即將面臨的失能惡化，準確度 AUC 高達 **0.84**。這份 2026 年 AJNR 發表的系統性回顧明白指出，單看大腦斑塊數量與體積的傳統閱片模式已經面臨瓶頸；肉眼無法察覺的像素級紋理異質性，才是決定病患未來神經功能衰退軌跡的關…

原文：Radiomics and Artificial Intelligence in Multiple Sclerosis MRI: A Comprehensive Review [ARTIFICIAL INTELLIGENCE]

arXiv 全文 ★4 2026-04-17

整合偵測頭，Llama2 生成幻覺率成功降至 13.29%。

**Qwen3-4B** 模型在整合僅 **370 萬**參數的輕量級偵測頭後，其 Token 級別的幻覺偵測 AUROC 達到了 **92.69%**。傳統檢索增強生成（RAG）系統的幻覺檢測多半屬於事後補救，難以從根本改善生成品質。德國明斯特大學團隊提出 RAGognizer 架構，將幻覺偵測轉為聯合最佳化訓練，…

原文：RAGognizer: Hallucination-Aware Fine-Tuning via Detection Head Integration

arXiv 全文 ★4 2026-04-17

STAGE-BO 演算法捨棄超體積計算，透過尋找帕雷托前緣缺口並轉化為約束條件，突破 4 個目標以上的運算瓶頸。

多目標貝氏最佳化（MOBO）在處理複雜決策時，一旦評估指標數量超過 **4 個**，傳統基於超體積（Hypervolume）的演算法計算成本便會呈指數級暴增。為突破此運算極限，研究團隊提出 **STAGE-BO** 演算法，徹底捨棄超體積計算路徑，改為在帕雷托前緣（Pareto front）直接尋找並填充最大的幾何缺…

原文：Multi-Objective Bayesian Optimization via Adaptive \varepsilon-Constraints Decomposition

AJNR Ahead 全文 ★4 2026-03-20

開源模型 LLaMA3-70B 免微調即可以 94.8% 準確率自動擷取中風手術報告，完勝人類標註員且保障病歷不出院。

讓無醫學背景的行政助理去撈取中風血栓移除手術的數據，錯誤率可能高達兩成；但現在，單機部署的開源語言模型 LLaMA3.3-70B，在未經微調的情況下，對著雜亂無章的手術報告進行萃取，準確率竟直衝 **94.8%**。這不僅大幅超越了醫院現有的非專業標註員，在 8 項核心臨床變數中，AI 甚至在 7 項指標上與具備醫學…

原文：Large Language Models for Accurate Medical Chart Abstraction: Enabling Scalable and Secure AI Deployment in Stroke [ARTI…

arXiv 全文 ★4 2026-04-17

WORC 框架透過群體智能演算法精準定位多智能體系統的「弱勢節點」，並重新分配運算預算，在 6 大推理測試達到 82.2% 準確率。

多智能體協作在大型語言模型的複雜推理任務中展現了極大潛力，但系統往往會因為單一「弱勢節點」的錯誤而導致整體邏輯崩潰。一項刊登於 arXiv 的最新研究提出 WORC 框架，透過群體智能演算法精準找出系統中的弱點，並反直覺地將額外的推理運算資源傾斜分配給表現最差的智能體。實驗結果顯示，這項「補短板」策略讓系統在 6 大…

原文：Weak-Link Optimization for Multi-Agent Reasoning and Collaboration

arXiv 全文 ★4 2026-04-17

用一般照片訓練的 Faster R-CNN 物件偵測架構，能在每張圖僅 0.3 個假陽性的嚴苛條件下，精準框出 90% 的乳癌病灶，完勝傳統 CAD 系統。

拿普通照片訓練的通用物件偵測模型，不加任何醫學先驗知識，抓乳癌的精準度卻能超越傳統精心設計的專用輔助軟體——在公開測試集達到驚人的 **AUC 0.95**。這套把乳房攝影當作「找貓狗」來解的深度學習架構，不僅在八萬筆資料的挑戰賽拿下亞軍，更證明了單純讓模型標定可疑病灶，遠比給出整張影像的單一風險機率更符合放射科的日…

原文：Between automation and alienation: rethinking AI's role in radiologist well-being.

Korean J Radiol 全文 ★4 2026-Apr

破解多分類 AI 評估陷阱：Micro-AUC 可能因樣本失衡嚴重高估，M-index 才是最穩定的鑑別力指標

當你在評估一套新的多分類 AI 模型時，高達 **0.99** 的微平均面積（Micro-averaged AUC）可能只是單純資料不平衡所造成的數學假象。這篇來自延世大學的最新模擬研究證實，當各類別樣本數嚴重失衡時，我們最熟悉的整體正確率與微平均面積會出現極度的高估現象。想要真實反映模型在五個 LI-RADS 等級…

原文：Key Measures for Evaluating Diagnostic Accuracy in Multi-Class Classification: An Overview and Simulation-Based Comparis…

Korean J Radiol 全文 ★4 2026-Apr

AI 報告雖能大幅縮短閱片時間，但長期依賴恐讓醫師陷入致命自動化偏誤。

放射科醫師在連續使用 AI 生成胸部 X 光報告後，對錯誤內容的照單全收率會隨時間悄悄攀升——這份韓國胸腔放射線醫學會（KSTR）的最新回覆指出，即便生成式 AI 在多世代驗證中達到 **87.6%** 的臨床可接受度，但其語句通順的特質，反而讓「自動化偏誤」成為臨床端最危險的地雷。超過 1000 例真實 CXR…

原文：Response to Comments on "Artificial Intelligence-Driven Drafting of Chest X-Ray Reports: 2025 Position Statement From th…

Korean J Radiol 全文 ★4 2026-Apr

韓國學會證實 AI 報告僅在健檢場景達 86% 準確率，強烈警告純文字生成的自動化偏見風險。

41 項關於 AI 生成胸部 X 光報告的專家共識中，高達 33 項的投票結果竟是中立。韓國胸腔放射醫學會針對生成式 AI 輔助起草報告發布了最新立場聲明，探討 AI 導入臨床的真實效益與潛在風險。這份聲明為放射科醫師的日常實務劃出了明確的安全界線，特別點出現階段語言模型的極限與統計盲區。商用 KARA-CXR …

原文：Comments on "Artificial Intelligence-Driven Drafting of Chest X-Ray Reports: 2025 Position Statement From the Korean Soc…

European Radiology 全文 ★4 2026-Apr-02

導入 AI 卻更累？缺乏連續學習框架，才是加劇放射科倦怠的癥結。

市面上雖有超過 100 種商用放射科 AI 產品，多數卻無法融入打片流程——最大阻力不是準確度，而是缺乏將模型轉為連續學習系統的治理框架。若不從領導層面著手，盲目導入只會加劇值班醫師的倦怠。突破 1971 年以來的硬體思維與急診 24/7 倦怠放射科始終是醫療數位轉型的發源地。一九七一年，第一台電腦斷層掃描儀運…

原文：Deep learning improves image quality in motion-robust and sedation-free pediatric brain MRI.

arXiv 全文 ★4 2026-04-17

維吉尼亞理工團隊利用時間分佈迭代演算法，在 5 輛車的自駕模擬中僅用 3 次迭代便解決了賽局預測控制的運算延遲難題。

傳統自動駕駛賽局模型預測控制常因頻繁計算奈許均衡，導致系統運算嚴重過載。維吉尼亞理工團隊提出的時間分佈迭代解法，在 **5** 輛車的無號誌路口模擬中，證明僅需 **3** 次極限迭代即可大幅降低運算延遲，讓龐大運算量的多車賽局演算法具備即時落地的潛力。自動駕駛賽局模型預測控制（GT-MPC）的運算瓶頸自駕車在…

原文：Real-Time Solution-Seeking for Game-Theoretic Autonomous Driving via Time-Distributed Iterations

European Radiology 全文 ★4 2026-Apr-07

高達 0.78 的預測模型在外部驗證暴跌至擲硬幣水準，徹底揭開影像組學過度擬合的面紗。

曾經高達 C-statistic **0.78** 的神準影像組學模型，換了一批病患後，預測能力竟暴跌到與丟銅板無異的 **0.39**。這項針對大腸直腸癌肝轉移熱消融後局部復發的多中心外部驗證研究，無情地戳破了人工智慧預測的過度樂觀，提醒我們在未經獨立驗證前，別輕易把演算法的訓練結果當成臨床決策的依據。 53% …

原文：Do MRI radiomic models truly generalize? External validation of three studies in parotid lesion characterization.

arXiv 全文 ★4 2026-04-17

透過字典剪枝技術將模型詞彙量縮減 36%，Llama-3.1-8B 翻譯表現不僅顯著提升，更大幅降低記憶體負擔。

透過刪減不需要的語言詞彙，開源語言模型的字典大小可減少高達 **36%**，且在韓語到英語的機器翻譯評測中，**Llama-3.1-8B-Inst** 的分數從 0.5879 顯著提升至 0.6342。面對多語言語言模型帶來的記憶體負擔與語言混淆問題，詞彙剪枝（Token Pruning）成為一種極具潛力的模型壓縮技…

原文：Optimizing Korean-Centric LLMs via Token Pruning

Korean J Radiol 全文 ★4 2026-Apr-01

腫瘤棲地分析是空間視覺化的利器，但疊加放射組學反而會陷入雙重不確定性的陷阱。

看似先進的棲地放射組學模型，反而會讓預測精準度倒退——當你把高維度特徵硬套在沒有生物學標準答案的叢集上，得到的往往是缺乏臨床意義的黑盒子。這篇文章明確指出，透過無監督學習切分出的腫瘤棲地，實際上只是機率性的空間分佈，例如某個體積像素可能只是呈現 **80%** 棲地 X 與 **20%** 棲地 Y 的特徵，而非絕對…

原文：Uncover This Tech Term: Tumor Habitat Analysis.

European Radiology 全文 ★4 2026-Apr-17

骨折敏感度高達 97% 的外傷常規報告，若直接用於 AI 訓練，其骨質流失高達 84% 的偽陰性將毒害演算法的精準度。

常規外傷 X 光報告的骨質流失敏感度僅 30%，若直接拿去訓練 AI 將引發嚴重資訊偏誤。這份研究精準拆解了臨床報告的真實數據，揭示骨折診斷高達 97% 的敏感度背後，哪些次要發現是演算法不能依賴的毒藥。 618 筆外傷 X 光檢驗：臨床報告對決雙盲閱片訓練醫療 AI（人工智慧，讓電腦模擬人類判讀影像）需要海量且…

原文：Independent bone-level diagnostic accuracy study of an AI tool for detecting appendicular skeletal fractures on radiogra…

RadioGraphics 全文 ★4 2026-Mar

機器學習結合進階影像標記，將多發性硬化症預測特異度翻倍至50%。

單憑 T1 加權影像預測臨床孤立症候群轉化為多發性硬化症，準確率竟然等同於盲猜。多發性硬化症的病程高度異質，即使臨床發現了滿腦子的白質病灶，數量卻經常與實際失能程度脫鉤，使得及早投藥的決策充滿變數。然而，透過機器學習結合進階的磁振造影生物標記，最新的預測模型已經將特異度推升至 **50%**，直接翻倍超越傳統 McD…

原文：Conventional and Emerging MRI Biomarkers of Multiple Sclerosis.

arXiv 全文 ★4 2026-04-16

突破數十個幾何參數的隱性綁定，透過雙路徑調變機制讓單圖 3D 虛擬人實現獨立的情感控制。

現有單圖 3D 頭部生成技術中，控制臉部動作的數十個幾何參數往往將語音與「情感」隱式打包，導致難以針對單一情緒進行獨立且一致的修改。這篇來自南京大學與微軟亞洲研究院的研究，提出將情感獨立為第一類顯式控制訊號。透過全新的雙路徑調變機制，讓 3D 虛擬人能在完全不改變原有前饋網路架構的條件下，展現獨立於語音的精準情感變化…

原文：Giving Faces Their Feelings Back: Explicit Emotion Control for Feedforward Single-Image 3D Head Avatars

arXiv 全文 ★4 2026-04-16

NTIRE 2026 超解析度賽事由 SamsungAICamera 以 33.73 dB 奪冠，兩階段架構與擴散模型成為技術新標竿。

NTIRE 2026 影像超解析度（x4）挑戰賽共吸引 **194 名**註冊參賽者，最終由 **SamsungAICamera** 團隊以破紀錄的 **33.73 dB** 峰值信噪比（PSNR）奪下雙軌賽道冠軍。本屆賽事標誌著技術典範的轉移，兩階段架構與擴散模型已正式取代傳統單一網路，成為突破視覺感知與像素保真度…

原文：The Fourth Challenge on Image Super-Resolution ($\times$4) at NTIRE 2026: Benchmark Results and Method Overview

Korean J Radiol 全文 ★4 2025-Nov

非閘控CT的AI鈣化評分極高精準，但需提防左前降支的解剖定位誤判。

就算沒有心電圖閘控，AI 算出的總體鈣化分數與人工圈選的 ICC 仍高達 **0.992**，但演算法有高達 **38.9%** 的極端誤差來自把 LAD 鈣化誤認為左主幹。這項針對 913 位胃癌與大腸癌病患的非顯影胸部 CT 分析證實，利用例行癌症追蹤影像來篩檢潛在心血管風險已具備高度臨床可行性。只是在極端值中，…

原文：Comments on "Impact of Deep Learning-Based Image Conversion on Fully Automated Coronary Artery Calcium Scoring Using Thi…