全文
★4
2026-03-20
訓練單一腦腫瘤 AI,一萬筆跨國影像的模型居然輸給僅兩千筆資料的北美在地模型——後者的對比增強切分 Dice 分數逼近完美的 0.999。這項前瞻性研究用令人深思的數據證實:一味追求龐大的影像資料量,遠不如確保訓練資料的人口組成多樣性來得關鍵。 破除腦腫瘤資料量迷思:為何 10k+ 跨國巨集未必勝過 2k 北美庫 …
原文:Evaluating Sociodemographic Biases in Artificial Intelligence-Based Glioblastoma Response Assessment Algorithms [ARTIFIC…
arXiv
全文
★4
2026-04-17
當前基於大型語言模型的事件預測技術中,高達 **90% 以上** 的研究與應用皆集中於給出單一最可能的結果,卻忽略了真實世界固有的高度不確定性。中國傳媒大學與新加坡管理大學的研究團隊提出一項全新視角,將開放式事件預測從精準的單點預測轉變為散彈槍模式。透過生成涵蓋多種合理情境的假設集合,模型在處理複雜動態時,能更全面地…
原文:Scattered Hypothesis Generation for Open-Ended Event Forecasting
全文
★4
Mon, 20 Ap
OpenAI 將網路安全信任存取計畫擴展至數千名驗證防禦者與數百個企業團隊。此次擴編的核心是推出專為資安防禦微調的 GPT-5.4-Cyber 模型。新機制打破 AI 對安全指令全面拒絕的現狀,透過分層授權讓專家能順利執行二進位逆向工程,重新定義 AI 雙用途界線。 GPT-5.4-Cyber 解鎖無原始碼二進位逆…
原文:OpenAI Scales Trusted Access for Cyber Defense With GPT-5.4-Cyber: a Fine-Tuned Model Built for Verified Security Defend…
arXiv
全文
★4
2026-04-17
在處理高維度的離散黑盒最佳化難題時,傳統演算法常因過早收斂而陷入次優的死胡同。法國昂熱大學團隊發表的全新架構 SVGD-EDA,首度將連續空間專用的史坦變分梯度下降演算法導入離散最佳化領域。在具備 **256** 個變數的高維度測試環境中,該演算法擊敗了包含 Nevergrad 函式庫在內的 **83** 種主流模型…
原文:Stein Variational Black-Box Combinatorial Optimization
arXiv
全文
★4
2026-04-17
當語言模型進化為具備長思維鏈的大型推理模型時,機器的知識遺忘技術面臨了全新的困境。根據香港科技大學與香港中文大學聯合發表的研究,現有的模型遺忘技術若非無法徹底清除隱藏在數百字推理步驟中的敏感資訊,就是會導致模型在 GSM8K 等數學推理基準測試上的表現大幅暴跌。為解決此問題,研究團隊開發了 CiPO 框架,透過生成反…
原文:CiPO: Counterfactual Unlearning for Large Reasoning Models through Iterative Preference Optimization
arXiv
全文
★4
2026-04-17
面對 **722,896** 筆 **APOGEE** 觀測光譜與 **25** 維恆星參數,傳統演算法常因參數高度相關而陷入收斂泥淖。團隊提出的「投影空間恆星參數推論」(**PISP**)框架,成功將多種元素豐度推論誤差降低達 **0.72 dex**,並實現近 **4** 倍的效率提升,替未來的巨量天文觀測數據處…
原文:PISP: Projected-Space Inference of Stellar Parameters
全文
★4
2026-03-20
臨床上我們常執著於精準圈出膠質瘤的顯影核心,但如果要用 AI 預測基因突變,**96.1%** 最穩定且具備預測力的特徵其實來自包含水腫區的整顆腫瘤巨觀紋理。這篇即將刊登於 AJNR 的研究指出,只要先把對邊界微小變化過於敏感的雜訊特徵剔除,不需更換預測演算法,就能將預測 IDH 突變的 AUC 從 **0.81**…
原文:Towards robust and generalizable radio(gen)omics predictive models for brain tumor characterization [BRAIN TUMOR IMAGING…
全文
★4
2026-03-20
由 AI 自動圈選的腦動脈瘤與血管,在盲測中已經讓神經放射科醫師無法分辨是機器還是真人畫的,其外部驗證的動脈瘤切割相似度高達 **0.861**。然而當我們試圖依賴這個完美的 3D 模型來計算體積與球形度時,卻在統計上發現了不可忽視的比例偏差,這意味著依賴演算法決定是否介入治療前,我們仍需謹慎審視邊緣。 未破裂腦動…
原文:Towards improved decision making of unruptured intracranial aneurysms using automated segmentation from MRA-TOF with ite…
arXiv
全文
★4
2026-04-17
復旦大學研究團隊近期提出針對神經網路變分蒙地卡羅(NNVMC)的基底轉換新技術,僅透過引入一個可學習的空間參數 α,就能顯著降低變分能量。在三維均勻電子氣(3DHEG)測試中,這項單一參數帶來的能量改善幅度,甚至超越在 FermiNet 架構中硬加上 10,000 多個額外參數的效果。這項研究證明,改變目標基態的物理…
原文:Enhancing Neural-Network Variational Monte Carlo through Basis Transformation
arXiv
全文
★4
2026-04-17
量化布林公式(QBF)向來被視為 SAT 求解的終極進階版。當產業界高度依賴後門(Backdoor)結構加速運算時,最新研究卻提出反直覺的鐵證:即使擁有通往 2-SAT 等易解類別、尺寸僅為**常數**的後門,QBF 依然維持 **PSpace-hard** 的極限難度。團隊最終透過引入量詞交替次數與創新的**強化後…
原文:Backdoors for Quantified Boolean Formulas
全文
★4
2026-03-20
常規 T2/FLAIR 影像上看似穩定的多發性硬化症病灶,AI 卻能提前兩年預測患者即將面臨的失能惡化,準確度 AUC 高達 **0.84**。這份 2026 年 AJNR 發表的系統性回顧明白指出,單看大腦斑塊數量與體積的傳統閱片模式已經面臨瓶頸;肉眼無法察覺的像素級紋理異質性,才是決定病患未來神經功能衰退軌跡的關…
原文:Radiomics and Artificial Intelligence in Multiple Sclerosis MRI: A Comprehensive Review [ARTIFICIAL INTELLIGENCE]
arXiv
全文
★4
2026-04-17
**Qwen3-4B** 模型在整合僅 **370 萬**參數的輕量級偵測頭後,其 Token 級別的幻覺偵測 AUROC 達到了 **92.69%**。傳統檢索增強生成(RAG)系統的幻覺檢測多半屬於事後補救,難以從根本改善生成品質。德國明斯特大學團隊提出 RAGognizer 架構,將幻覺偵測轉為聯合最佳化訓練,…
原文:RAGognizer: Hallucination-Aware Fine-Tuning via Detection Head Integration
arXiv
全文
★4
2026-04-17
多目標貝氏最佳化(MOBO)在處理複雜決策時,一旦評估指標數量超過 **4 個**,傳統基於超體積(Hypervolume)的演算法計算成本便會呈指數級暴增。為突破此運算極限,研究團隊提出 **STAGE-BO** 演算法,徹底捨棄超體積計算路徑,改為在帕雷托前緣(Pareto front)直接尋找並填充最大的幾何缺…
原文:Multi-Objective Bayesian Optimization via Adaptive \varepsilon-Constraints Decomposition
全文
★4
2026-03-20
讓無醫學背景的行政助理去撈取中風血栓移除手術的數據,錯誤率可能高達兩成;但現在,單機部署的開源語言模型 LLaMA3.3-70B,在未經微調的情況下,對著雜亂無章的手術報告進行萃取,準確率竟直衝 **94.8%**。這不僅大幅超越了醫院現有的非專業標註員,在 8 項核心臨床變數中,AI 甚至在 7 項指標上與具備醫學…
原文:Large Language Models for Accurate Medical Chart Abstraction: Enabling Scalable and Secure AI Deployment in Stroke [ARTI…
arXiv
全文
★4
2026-04-17
多智能體協作在大型語言模型的複雜推理任務中展現了極大潛力,但系統往往會因為單一「弱勢節點」的錯誤而導致整體邏輯崩潰。一項刊登於 arXiv 的最新研究提出 WORC 框架,透過群體智能演算法精準找出系統中的弱點,並反直覺地將額外的推理運算資源傾斜分配給表現最差的智能體。實驗結果顯示,這項「補短板」策略讓系統在 6 大…
原文:Weak-Link Optimization for Multi-Agent Reasoning and Collaboration
arXiv
全文
★4
2026-04-17
來自台夫特理工大學的最新理論研究,首度將「解複合」機率推論問題推廣至緊緻對稱空間。研究證明在擁有 **m** 個觀測值下,其密度估計的均方誤差收斂率可達 **m^{-2s/(2s+d)}**,為處理非歐幾里得流形資料奠定數學基礎。 解複合技術演進:從金融數學到緊緻對稱空間 處理潛藏變數的統計推論問題時,經常會面臨觀…
原文:Decompounding on Compact Symmetric Spaces
European Radiology
全文
★4
2026-Mar-20
拿普通照片訓練的通用物件偵測模型,不加任何醫學先驗知識,抓乳癌的精準度卻能超越傳統精心設計的專用輔助軟體——在公開測試集達到驚人的 **AUC 0.95**。這套把乳房攝影當作「找貓狗」來解的深度學習架構,不僅在八萬筆資料的挑戰賽拿下亞軍,更證明了單純讓模型標定可疑病灶,遠比給出整張影像的單一風險機率更符合放射科的日…
原文:Between automation and alienation: rethinking AI's role in radiologist well-being.
Korean J Radiol
全文
★4
2026-Apr
當你在評估一套新的多分類 AI 模型時,高達 **0.99** 的微平均面積(Micro-averaged AUC)可能只是單純資料不平衡所造成的數學假象。這篇來自延世大學的最新模擬研究證實,當各類別樣本數嚴重失衡時,我們最熟悉的整體正確率與微平均面積會出現極度的高估現象。想要真實反映模型在五個 LI-RADS 等級…
原文:Key Measures for Evaluating Diagnostic Accuracy in Multi-Class Classification: An Overview and Simulation-Based Comparis…
Korean J Radiol
全文
★4
2026-Apr
放射科醫師在連續使用 AI 生成胸部 X 光報告後,對錯誤內容的照單全收率會隨時間悄悄攀升——這份韓國胸腔放射線醫學會(KSTR)的最新回覆指出,即便生成式 AI 在多世代驗證中達到 **87.6%** 的臨床可接受度,但其語句通順的特質,反而讓「自動化偏誤」成為臨床端最危險的地雷。 超過 1000 例真實 CXR…
原文:Response to Comments on "Artificial Intelligence-Driven Drafting of Chest X-Ray Reports: 2025 Position Statement From th…
Korean J Radiol
全文
★4
2026-Apr
41 項關於 AI 生成胸部 X 光報告的專家共識中,高達 33 項的投票結果竟是中立。韓國胸腔放射醫學會針對生成式 AI 輔助起草報告發布了最新立場聲明,探討 AI 導入臨床的真實效益與潛在風險。這份聲明為放射科醫師的日常實務劃出了明確的安全界線,特別點出現階段語言模型的極限與統計盲區。 商用 KARA-CXR …
原文:Comments on "Artificial Intelligence-Driven Drafting of Chest X-Ray Reports: 2025 Position Statement From the Korean Soc…
European Radiology
全文
★4
2026-Apr-02
市面上雖有超過 100 種商用放射科 AI 產品,多數卻無法融入打片流程——最大阻力不是準確度,而是缺乏將模型轉為連續學習系統的治理框架。若不從領導層面著手,盲目導入只會加劇值班醫師的倦怠。 突破 1971 年以來的硬體思維與急診 24/7 倦怠 放射科始終是醫療數位轉型的發源地。一九七一年,第一台電腦斷層掃描儀運…
原文:Deep learning improves image quality in motion-robust and sedation-free pediatric brain MRI.
arXiv
全文
★4
2026-04-17
傳統自動駕駛賽局模型預測控制常因頻繁計算奈許均衡,導致系統運算嚴重過載。維吉尼亞理工團隊提出的時間分佈迭代解法,在 **5** 輛車的無號誌路口模擬中,證明僅需 **3** 次極限迭代即可大幅降低運算延遲,讓龐大運算量的多車賽局演算法具備即時落地的潛力。 自動駕駛賽局模型預測控制(GT-MPC)的運算瓶頸 自駕車在…
原文:Real-Time Solution-Seeking for Game-Theoretic Autonomous Driving via Time-Distributed Iterations
European Radiology
全文
★4
2026-Apr-07
曾經高達 C-statistic **0.78** 的神準影像組學模型,換了一批病患後,預測能力竟暴跌到與丟銅板無異的 **0.39**。這項針對大腸直腸癌肝轉移熱消融後局部復發的多中心外部驗證研究,無情地戳破了人工智慧預測的過度樂觀,提醒我們在未經獨立驗證前,別輕易把演算法的訓練結果當成臨床決策的依據。 53% …
原文:Do MRI radiomic models truly generalize? External validation of three studies in parotid lesion characterization.
arXiv
全文
★4
2026-04-17
透過刪減不需要的語言詞彙,開源語言模型的字典大小可減少高達 **36%**,且在韓語到英語的機器翻譯評測中,**Llama-3.1-8B-Inst** 的分數從 0.5879 顯著提升至 0.6342。面對多語言語言模型帶來的記憶體負擔與語言混淆問題,詞彙剪枝(Token Pruning)成為一種極具潛力的模型壓縮技…
原文:Optimizing Korean-Centric LLMs via Token Pruning
Korean J Radiol
全文
★4
2026-Apr-01
看似先進的棲地放射組學模型,反而會讓預測精準度倒退——當你把高維度特徵硬套在沒有生物學標準答案的叢集上,得到的往往是缺乏臨床意義的黑盒子。這篇文章明確指出,透過無監督學習切分出的腫瘤棲地,實際上只是機率性的空間分佈,例如某個體積像素可能只是呈現 **80%** 棲地 X 與 **20%** 棲地 Y 的特徵,而非絕對…
原文:Uncover This Tech Term: Tumor Habitat Analysis.
European Radiology
全文
★4
2026-Apr-17
常規外傷 X 光報告的骨質流失敏感度僅 30%,若直接拿去訓練 AI 將引發嚴重資訊偏誤。這份研究精準拆解了臨床報告的真實數據,揭示骨折診斷高達 97% 的敏感度背後,哪些次要發現是演算法不能依賴的毒藥。 618 筆外傷 X 光檢驗:臨床報告對決雙盲閱片 訓練醫療 AI(人工智慧,讓電腦模擬人類判讀影像)需要海量且…
原文:Independent bone-level diagnostic accuracy study of an AI tool for detecting appendicular skeletal fractures on radiogra…
RadioGraphics
全文
★4
2026-Mar
單憑 T1 加權影像預測臨床孤立症候群轉化為多發性硬化症,準確率竟然等同於盲猜。多發性硬化症的病程高度異質,即使臨床發現了滿腦子的白質病灶,數量卻經常與實際失能程度脫鉤,使得及早投藥的決策充滿變數。然而,透過機器學習結合進階的磁振造影生物標記,最新的預測模型已經將特異度推升至 **50%**,直接翻倍超越傳統 McD…
原文:Conventional and Emerging MRI Biomarkers of Multiple Sclerosis.
arXiv
全文
★4
2026-04-16
現有單圖 3D 頭部生成技術中,控制臉部動作的數十個幾何參數往往將語音與「情感」隱式打包,導致難以針對單一情緒進行獨立且一致的修改。這篇來自南京大學與微軟亞洲研究院的研究,提出將情感獨立為第一類顯式控制訊號。透過全新的雙路徑調變機制,讓 3D 虛擬人能在完全不改變原有前饋網路架構的條件下,展現獨立於語音的精準情感變化…
原文:Giving Faces Their Feelings Back: Explicit Emotion Control for Feedforward Single-Image 3D Head Avatars
arXiv
全文
★4
2026-04-16
NTIRE 2026 影像超解析度(x4)挑戰賽共吸引 **194 名**註冊參賽者,最終由 **SamsungAICamera** 團隊以破紀錄的 **33.73 dB** 峰值信噪比(PSNR)奪下雙軌賽道冠軍。本屆賽事標誌著技術典範的轉移,兩階段架構與擴散模型已正式取代傳統單一網路,成為突破視覺感知與像素保真度…
原文:The Fourth Challenge on Image Super-Resolution ($\times$4) at NTIRE 2026: Benchmark Results and Method Overview
Korean J Radiol
全文
★4
2025-Nov
就算沒有心電圖閘控,AI 算出的總體鈣化分數與人工圈選的 ICC 仍高達 **0.992**,但演算法有高達 **38.9%** 的極端誤差來自把 LAD 鈣化誤認為左主幹。這項針對 913 位胃癌與大腸癌病患的非顯影胸部 CT 分析證實,利用例行癌症追蹤影像來篩檢潛在心血管風險已具備高度臨床可行性。只是在極端值中,…
原文:Comments on "Impact of Deep Learning-Based Image Conversion on Fully Automated Coronary Artery Calcium Scoring Using Thi…