🤖 醫療 AI

已導讀 193 篇

依 AI 自動分類的次專科導讀 · 依重要性與時間排序

📡 訂閱本次專科 RSS

Korean J Radiol 全文 ★5 2026-Jan

FDA 雖核准高達 692 款 AI 醫療軟體,但無解的模型漂移與嚴峻的醫療究責機制,才是阻礙放射科常規採用的最大難關。

截至 2023 年 10 月,FDA 已火速核准高達 692 款醫療軟體,且其中 75% 集中在放射科,但真實世界多數機構的常規採用率卻近乎停滯。亞太放射醫學會(AOSR)的跨國共識文件明確指出,導致這個極端斷層的癥結並非單純的演算法準確率,而是在於無解的模型漂移與醫事責任歸屬。若機構未能建立與日常 PACS 隔離的…

原文:Access and Reimbursement for Artificial Intelligence in Radiology: The Asian Oceanian Society of Radiology Perspective.

Korean J Radiol 全文 ★5 2026-Mar

最新評測證明,Gemini 2.5 Pro 在加入影像後準確率激增至 70%,正式告別 AI 只會看文字通靈的時代。

雖然 OpenAI 的 o3 在日本放射專科考試中創下 **72%** 的驚人正確率,但最駭人的事實是:它在「完全不看圖」的瞎猜模式下也能拿 **67%**。真正學會看片的其實是 Google 的 Gemini 2.5 Pro,給予影像後正確率從 **59%** 狂飆至 **70%**(**p=0.001**)。 …

原文:Evaluating the Accuracy and Diagnostic Reasoning of Multimodal Large Language Models in Interpreting Neuroradiology Case…

AJNR Current 全文 ★5 2026-04-02

打破 CTP 單一血流閾值迷思,3D nnU-Net 能針對「打通與否」雙情境,將最終梗塞預測準確率翻倍。

傳統閾值預測梗塞核心的準確率低得驚人——在完全打通的病患中,常規軟體的 Dice 分數僅有 **15.73%**。這篇 AJNR 最新研究用 3D nnU-Net 打破迷思,證實 AI 能將預測準確度翻倍。我們終於不用再盲信單一血流標準,而是能針對「打通」與「沒打通」兩種情境,預判最終的腦組織生死。 突破單一血流閾…

原文:Multimodal CT Perfusion-Based Deep Learning for Predicting Stroke Lesion Outcomes in Complete and No Recanalization Scen…

Radiology: AI 全文 ★4 2026-Jan

單一醫學中心的大數據準嗎?102萬兒童世代透過GIS對比社區人口,揭露雖然種族與年齡分布嚴重偏移,但特定傳染病預測率仍精準對齊真實世界。

拿單一醫學中心的病歷資料去推估整個都會區的疾病盛行率,往往被認為是充滿抽樣偏誤的學術大忌。但這項涵蓋費城都會區 102 萬名兒童的大數據分析打破了這個預設立場:即便院內就診族群的低收入戶比例與特定族裔顯著偏高,當我們實際拿來預測侵襲性肺炎鏈球菌的感染率時,院內推估值為每十萬人 18 例,與真實社區背景值的 10 例相…

原文:US-derived Pediatric Kidney Length and Volume Percentiles by Age: A Big Data Approach.

PubMed 全文 ★4 2026-Apr-19

在7項變數測試中,傳統邏輯迴歸外部驗證AUC達0.95,表現更勝複雜神經網路。

在預測模型開發領域,學界與業界長久以來不斷追求更複雜的機器學習演算法,但最新研究推翻了這項「越複雜越好」的預設前提。針對包含 960 名內部訓練與 504 名外部驗證的年輕成人糖尿病患樣本,使用僅 7 項常規變數進行測試時,傳統的**邏輯迴歸(Logistic regression)**在外部驗證中的 **ROC A…

原文:Clinical Machine Learning Model for Predicting Pathological Complete Response in Patients with Esophageal and Gastroesop…

Radiology: AI 全文 ★4 2026-Mar

十萬份腦部 MRI 報告能在半小時內被 AI 精準標記,但在血管異常與腦軟化等特定病灶,報告與影像的真實一致性卻出現顯著衰退。

拿放射科報告直接餵給 AI 當作影像訓練標籤,可能會讓模型學到不精準的特徵——在血管異常與腦軟化症的判讀上,報告標籤與真實影像標籤的預測 AUC 差距高達 0.067。這份涵蓋超過十二萬筆腦部 MRI 的大型研究指出,即便強大的語言模型能在 30 分鐘內讀完十萬份報告並精準分類,若沒有經過「重新看片」的交叉驗證,我們…

原文:Self-Supervised Text-Vision Alignment for Automated Brain MRI Abnormality Detection: A Multicenter Study (ALIGN Study).

Radiology: AI 全文 ★4 2026-Mar

盲目採取多位專家的多數決反而會拉低 AI 效能!評估標註者的「可學習性」才是建立強大黃金標準的關鍵。

集合 11 位重症專家的多數決來訓練 AI 模型,其外部驗證的 F1 micro 分數竟然會慘跌到 0.254。這徹底打破了醫學影像與預測模型高度依賴「多數決即為黃金標準」的迷思。研究數據明確指出,與其盲目統合所有專家的意見,不如先剔除標註邏輯自相矛盾的專家,僅採用具備高「可學習性」的專家標註,能將外部驗證效能大幅翻…

原文:Impact of Label Noise from Large Language Model-generated Annotations on Evaluation of Diagnostic Model Performance.

AJNR Ahead 全文 ★4 2026-03-20

AI 量化腦血管周圍間隙,成功抓出肉眼分級遺漏的糖尿病與早期認知退化。

視覺評分看似尋常的基底核血管周圍間隙,透過全自動深度學習模型精準計數後,竟暴露出與糖尿病具備極高的病理關聯(β = 11.51)。當大腦額頂葉的間隙數量高達平均 414.9 個時,傳統肉眼分級容易陷入天花板效應而忽略微小變化。這份來自 MESA 世代研究的影像分析證實,放棄半定量量表改用連續數值,是找出小血管疾病與神…

原文:Comparative Analysis of AI-based Quantification vs. Visual Rating of Enlarged Perivascular Spaces in the MESA Cohort [OR…

arXiv 全文 ★4 2026-04-17

Neural CTMC 模型將馬可夫鏈拆解為跳躍時間與方向雙神經網路,以純均勻前向過程在 TinyStories 創下 ≤16.36 困惑度,打破遮罩擴散模型的統治地位。

在語言模型極度依賴自迴歸(Autoregressive)架構的當下,離散擴散模型(Discrete Diffusion)正開闢另一條全新路徑。最新研究提出的 Neural CTMC 模型,在 TinyStories 資料集上以 50 步採樣達成 **≤ 16.36** 的生成困惑度(Perplexity),大幅超越現…

原文:Neural Continuous-Time Markov Chain: Discrete Diffusion via Decoupled Jump Timing and Direction

AJNR Ahead 全文 ★4 2026-03-20

下視丘次神經核分割技術全面盤點:深度學習雖有效率優勢,但兒童髓鞘化時期的影像模型仍面臨嚴重斷層。

下視丘體積僅佔全腦不到 1%,卻主控著人體能量代謝與日夜節律,然而針對兒童族群的高精度自動分割模型數量卻幾乎是 0 個。這篇發表於 AJNR 的最新影像醫學綜述,徹底盤點了下視丘次神經核分割的兩大技術流派,直接點出當前模型缺乏統一協定而無法跨研究比較的致命缺陷。 常規 3T 磁振造影下視丘次神經核的成像困境 針對下…

原文:Recent Advances in Hypothalamic Segmentation for Neuroimaging: A Comprehensive Review [REVIEW ARTICLE]

arXiv 全文 ★4 2026-04-17

DepCap 免訓練框架動態劃分區塊並偵測運算衝突,為 LLaDA-1.5 模型創下 5.63 倍加速並提升 7.4% 準確率。

擴散語言模型(DLMs)具備全域修改與平行生成的優勢,卻深陷解碼速度與品質的拉扯。來自中國科學技術大學的研究團隊提出免訓練推理框架 DepCap,不僅在 **LLaDA 系列**模型平均達成 **3.57 倍**速度躍升,更在 **MBPP** 程式碼基準測試中,為 **LLaDA-1.5** 帶來 **5.63 倍…

原文:DepCap: Adaptive Block-Wise Parallel Decoding for Efficient Diffusion LM Inference

arXiv 全文 ★4 2026-04-17

導入語音階層先驗的 HiCoDiT 模型,精準還原無聲影片,取得 57% 偏好勝率。

復旦大學與中科院提出 **HiCoDiT** 階層式擴散模型,首度將語音階層先驗引入無聲影片轉語音任務。模型經 **261.5 小時**訓練,有效解決跨模態不對稱,並在盲測中取得 **57.0%** 的壓倒性偏好勝率。 突破影片轉語音的跨模態對齊與 RVQ 階層 傳統的影片轉語音技術(VTS)旨在僅依靠視覺線索合成…

原文:Hierarchical Codec Diffusion for Video-to-Speech Generation

arXiv 全文 ★4 2026-04-17

西北大學提出隨插即用的 Motion-Adapter 模組,利用解耦交叉注意力遮罩引導擴散模型,成功在 484 種複合指令測試中生成極度流暢的雙重物理動作。

讓 AI 生成一段「邊走路邊舉啞鈴」的同時動作序列,成功率往往出乎意料地低。現有文字生成動作(Text-to-Motion)擴散模型在處理這類需求時,常因為特徵過度融合,導致動作相互覆蓋或肢體空間位置混亂。西北大學研究團隊提出的 **Motion-Adapter** 模組,無需成對的複合動作訓練資料,僅靠單一動作庫訓…

原文:Motion-Adapter: A Diffusion Model Adapter for Text-to-Motion Generation of Compound Actions

AJNR Ahead 全文 ★4 2026-03-20

MRI視神經鞘直徑結合ML模型,精準揪出高達八成機率需要重置引流管的IIH高風險病患。

在評估特發性顱內壓增高症(IIH)的引流管置放術前,臨床與影像科常忽略了神經影像標記的預測潛力。這篇研究證實,只要在術前評估加上磁振造影的視神經鞘直徑測量,就能讓預測引流管需要重置的機器學習模型準確率大幅提升,在獨立測試集的 AUC 達到 **82.7%**。配備非可調壓閥門的腰椎腹腔引流管,若加上術前有明顯視乳頭水…

原文:Preoperative Neuroimaging Markers, Clinical Severity Measures, and Shunt Characteristics for Predicting Shunt Revision i…

arXiv 全文 ★4 2026-04-17

LaviGen 框架將 3D 場景生成轉移至原生幾何空間,使物理合理性提升 19%,運算時間削減 65%。

北京航空航天大學與騰訊等機構共同推出的 3D 場景佈局框架 **LaviGen**,直接在原生 3D 空間中以自迴歸方式放置物件。與現有語言驅動模型相比,它將場景生成的物理合理性大幅提升 **19%**,同時將運算時間削減了 **65%**,徹底解決了虛擬物件相互碰撞或漂浮在空中的空間錯亂問題。 突破文字指令盲區,…

原文:Repurposing 3D Generative Model for Autoregressive Layout Generation

arXiv 全文 ★4 2026-04-17

抑制 Hessian 二階干涉,新演算法在 5 量子位元實驗成功加速量子機器學習收斂。

量子機器學習常面臨訓練停滯的問題。最新研究提出觀測量引導的生成元挑選演算法,在 **5** 量子位元、**100** 筆樣本的實驗中成功加速了模型收斂。該技術透過維持梯度的一階敏感度,並將 **Hessian** 矩陣的二階干涉降至最低,結合理論證明為量子電路設計開闢新路徑。 超越 ADAPT-VQE 框架:Hes…

原文:Observable-Guided Generator Selection for Improving Trainability in Quantum Machine Learning with a $ \mathfrak{g} $-Pur…

arXiv 全文 ★4 2026-04-17

針對 MARL 代理人常因雜訊陷入互不信任的問題,RATTL 演算法提出將魯棒性應用於梯度方差而非回報,成功在擾動中維持近乎 100% 合作率。

多智能體強化學習(MARL)演算法在訓練中經常面臨一個反直覺困境:即使合作能帶來最高收益,代理人在面對夥伴的探索雜訊時,往往會陷入不可逆的背叛聯鎖反應。最新登上 arXiv 的研究指出,傳統的風險規避策略反而會擴大這種不穩定性。研究團隊提出全新 RATTL 演算法,透過動態調節梯度更新的信任因子,在劇烈的非平穩環境下…

原文:The Price of Paranoia: Robust Risk-Sensitive Cooperation in Non-Stationary Multi-Agent Reinforcement Learning

arXiv 全文 ★4 2026-04-17

LP²DH 壓縮高維特徵為 40 位元,在 UCLA 測試創下 99.80% 準確率。

動態紋理辨識技術在處理空間與時間特徵時,長期面臨著嚴重的維度暴增問題。當傳統演算法嘗試提取 5×5×5 的局部像素空間時,往往會產生高達 124 維的龐大數據量。為突破此運算瓶頸,諾丁漢大學與南洋理工大學的研究團隊提出 LP²DH 框架,成功將高維像素差異壓縮為僅 40 位元的二進位編碼,並在 UCLA 資料集創下 …

原文:LP$^{2}$DH: A Locality-Preserving Pixel-Difference Hashing Framework for Dynamic Texture Recognition

arXiv 全文 ★4 2026-04-17

透過結合蒙地卡羅樹搜尋的雙層最佳化框架,LLM 代理程式技能在複雜問答任務上的準確率從 0.906 提升至 0.937。

最佳化大型語言模型(LLM)代理程式的技能結構與內容,能讓複雜問答任務的準確率從 **0.906** 提升至 **0.937**。這項來自加州大學柏克萊分校與新加坡國立大學等機構的最新研究,提出一套結合蒙地卡羅樹搜尋(MCTS)的雙層最佳化框架,將原本依賴人工反覆試錯的代理技能(Agent Skills)轉變為可系統…

原文:Bilevel Optimization of Agent Skills via Monte Carlo Tree Search

arXiv 全文 ★4 2026-04-17

突破多色關聯叢聚 2.11 理論極限,愛荷華州立大學團隊提出 C4 演算法與全域不等式,成功將最佳近似比壓回 2.06。

標準關聯叢聚演算法的近似比長期停留在 2.06,但加入多種關係的「染色」後,其理論極限卻死死卡在 2.11。愛荷華州立大學團隊最新研究解開了這個謎團:多類別關係中的「中性邊」會產生一個精確到 0.0734 的常數懲罰。他們提出全新的 C4 演算法,利用一條全域不等式成功將近似比壓回 2.06,同時解決了機器學習中計算…

原文:Why Colors Make Clustering Harder:Global Integrality Gaps, the Price of Fairness, and Color-Coupled Algorithms in Chroma…

arXiv 全文 ★4 2026-04-17

快手科技證實生成式推薦系統的 AR-NTP 機制在數學上嚴格等同於全詞表 MLE,成功將 $O(V)$ 複雜度降至 $O(k \cdot V_m)$。

快手科技(Kuaishou Technology)的研究團隊近期發布論文,嚴格證明了在面臨 **$10^6$ 到 $10^9$** 級別候選物品的大規模生成式推薦系統中,自迴歸下一個 Token 預測與全物品詞表最大似然估計在數學上具備嚴格的等價關係。這份研究解開了業界長期的疑惑,為當前主流的生成式推薦範式提供了首個…

原文:On the Equivalence Between Auto-Regressive Next Token Prediction and Full-Item-Vocabulary Maximum Likelihood Estimation …

arXiv 全文 ★4 2026-04-17

最新研究提出 HDPSO 演算法,透過超圖建模精準捕捉高階群體互動,在 144 項影響力最大化測試中成功壓制傳統基準方法。

影響力最大化(Influence Maximization, IM)是複雜網路分析的核心難題,但在真實世界的群體互動中,傳統圖形模型往往無法精確捕捉多人同時參與的高階關聯。為了突破這個盲區,最新研究提出基於超圖(Hypergraph)的離散粒子群最佳化演算法 HDPSO,透過兩層局部影響力近似與獨特的離散更新機制,在…

原文:Enhancing Discrete Particle Swarm Optimization for Hypergraph-Modeled Influence Maximization

AJNR Ahead 全文 ★4 2026-03-20

萬例跨國 AI 竟輸給兩千例在地模型?這項前瞻性研究指出,訓練神經膠質母細胞瘤切分 AI 時,人口多樣性比純粹的資料海量更關鍵。

訓練單一腦腫瘤 AI,一萬筆跨國影像的模型居然輸給僅兩千筆資料的北美在地模型——後者的對比增強切分 Dice 分數逼近完美的 0.999。這項前瞻性研究用令人深思的數據證實:一味追求龐大的影像資料量,遠不如確保訓練資料的人口組成多樣性來得關鍵。 破除腦腫瘤資料量迷思:為何 10k+ 跨國巨集未必勝過 2k 北美庫 …

原文:Evaluating Sociodemographic Biases in Artificial Intelligence-Based Glioblastoma Response Assessment Algorithms [ARTIFIC…

arXiv 全文 ★4 2026-04-17

開放式事件預測從單一結果轉向散彈槍模式,SCATTER 框架結合強化學習,成功讓模型生成多樣且合理的未來假設。

當前基於大型語言模型的事件預測技術中,高達 **90% 以上** 的研究與應用皆集中於給出單一最可能的結果,卻忽略了真實世界固有的高度不確定性。中國傳媒大學與新加坡管理大學的研究團隊提出一項全新視角,將開放式事件預測從精準的單點預測轉變為散彈槍模式。透過生成涵蓋多種合理情境的假設集合,模型在處理複雜動態時,能更全面地…

原文:Scattered Hypothesis Generation for Open-Ended Event Forecasting

MarkTechPost 全文 ★4 Mon, 20 Ap

OpenAI 推出專為資安微調的 GPT-5.4-Cyber,透過三層身分驗證框架放行逆向工程,打破全面拒絕限制。

OpenAI 將網路安全信任存取計畫擴展至數千名驗證防禦者與數百個企業團隊。此次擴編的核心是推出專為資安防禦微調的 GPT-5.4-Cyber 模型。新機制打破 AI 對安全指令全面拒絕的現狀,透過分層授權讓專家能順利執行二進位逆向工程,重新定義 AI 雙用途界線。 GPT-5.4-Cyber 解鎖無原始碼二進位逆…

原文:OpenAI Scales Trusted Access for Cyber Defense With GPT-5.4-Cyber: a Fine-Tuned Model Built for Verified Security Defend…

arXiv 全文 ★4 2026-04-17

全新發表的 SVGD-EDA 演算法結合史坦排斥力,在 256 維黑盒最佳化中擊敗 83 款模型。

在處理高維度的離散黑盒最佳化難題時,傳統演算法常因過早收斂而陷入次優的死胡同。法國昂熱大學團隊發表的全新架構 SVGD-EDA,首度將連續空間專用的史坦變分梯度下降演算法導入離散最佳化領域。在具備 **256** 個變數的高維度測試環境中,該演算法擊敗了包含 Nevergrad 函式庫在內的 **83** 種主流模型…

原文:Stein Variational Black-Box Combinatorial Optimization

arXiv 全文 ★4 2026-04-17

CiPO 框架結合反事實推理與動態疊代,精準清除大模型思維鏈的敏感資訊。

當語言模型進化為具備長思維鏈的大型推理模型時,機器的知識遺忘技術面臨了全新的困境。根據香港科技大學與香港中文大學聯合發表的研究,現有的模型遺忘技術若非無法徹底清除隱藏在數百字推理步驟中的敏感資訊,就是會導致模型在 GSM8K 等數學推理基準測試上的表現大幅暴跌。為解決此問題,研究團隊開發了 CiPO 框架,透過生成反…

原文:CiPO: Counterfactual Unlearning for Large Reasoning Models through Iterative Preference Optimization

arXiv 全文 ★4 2026-04-17

將 25 維恆星參數映射至投影空間,PISP 框架使推論效率提升 4 倍,豐度誤差降低 0.72 dex。

面對 **722,896** 筆 **APOGEE** 觀測光譜與 **25** 維恆星參數,傳統演算法常因參數高度相關而陷入收斂泥淖。團隊提出的「投影空間恆星參數推論」(**PISP**)框架,成功將多種元素豐度推論誤差降低達 **0.72 dex**,並實現近 **4** 倍的效率提升,替未來的巨量天文觀測數據處…

原文:PISP: Projected-Space Inference of Stellar Parameters

AJNR Ahead 全文 ★4 2026-03-20

與其精雕細琢顯影邊界,包含水腫的整顆腫瘤紋理才是預測 IDH 突變的抗擾動利器,能讓模型 AUC 躍升至 0.94。

臨床上我們常執著於精準圈出膠質瘤的顯影核心,但如果要用 AI 預測基因突變,**96.1%** 最穩定且具備預測力的特徵其實來自包含水腫區的整顆腫瘤巨觀紋理。這篇即將刊登於 AJNR 的研究指出,只要先把對邊界微小變化過於敏感的雜訊特徵剔除,不需更換預測演算法,就能將預測 IDH 突變的 AUC 從 **0.81**…

原文:Towards robust and generalizable radio(gen)omics predictive models for brain tumor characterization [BRAIN TUMOR IMAGING…

AJNR Ahead 全文 ★4 2026-03-20

DIVA-seg 結合偽標籤技術,在未破裂腦動脈瘤的外部驗證中達到 0.861 相似度,大幅降低標註成本。

由 AI 自動圈選的腦動脈瘤與血管,在盲測中已經讓神經放射科醫師無法分辨是機器還是真人畫的,其外部驗證的動脈瘤切割相似度高達 **0.861**。然而當我們試圖依賴這個完美的 3D 模型來計算體積與球形度時,卻在統計上發現了不可忽視的比例偏差,這意味著依賴演算法決定是否介入治療前,我們仍需謹慎審視邊緣。 未破裂腦動…

原文:Towards improved decision making of unruptured intracranial aneurysms using automated segmentation from MRA-TOF with ite…