🤖 醫療 AI 導讀

arXiv 全文 ★5 2026-04-17

頂尖 AI 模型 FLUX 生成特定良性概念組合時，產生隱性違規圖像機率高達 99.52%，揭示既有安全機制的重大盲區。

圖像生成模型在理解複雜指令上取得巨大進展，但面對組合型安全測試時卻顯得不堪一擊。最新研究顯示，當輸入由單純良性詞彙組成的特定提示時，頂尖開源模型 **FLUX.1** 產生不安全圖像的機率高達 **99.52%**。這種由單一安全概念組合而成的隱性風險，正成為生成式人工智慧亟需解決的邊界問題。拆解 TwoHams…

原文：TwoHamsters: Benchmarking Multi-Concept Compositional Unsafety in Text-to-Image Models

Korean J Radiol 全文 ★5 2026-Jan

FDA 雖核准高達 692 款 AI 醫療軟體，但無解的模型漂移與嚴峻的醫療究責機制，才是阻礙放射科常規採用的最大難關。

截至 2023 年 10 月，FDA 已火速核准高達 692 款醫療軟體，且其中 75% 集中在放射科，但真實世界多數機構的常規採用率卻近乎停滯。亞太放射醫學會（AOSR）的跨國共識文件明確指出，導致這個極端斷層的癥結並非單純的演算法準確率，而是在於無解的模型漂移與醫事責任歸屬。若機構未能建立與日常 PACS 隔離的…

原文：Access and Reimbursement for Artificial Intelligence in Radiology: The Asian Oceanian Society of Radiology Perspective.

Korean J Radiol 全文 ★5 2026-Mar

打破 CTP 單一血流閾值迷思，3D nnU-Net 能針對「打通與否」雙情境，將最終梗塞預測準確率翻倍。

傳統閾值預測梗塞核心的準確率低得驚人——在完全打通的病患中，常規軟體的 Dice 分數僅有 **15.73%**。這篇 AJNR 最新研究用 3D nnU-Net 打破迷思，證實 AI 能將預測準確度翻倍。我們終於不用再盲信單一血流標準，而是能針對「打通」與「沒打通」兩種情境，預判最終的腦組織生死。突破單一血流閾…

原文：Multimodal CT Perfusion-Based Deep Learning for Predicting Stroke Lesion Outcomes in Complete and No Recanalization Scen…

arXiv 全文 ★4 2026-04-17

引入星系豐度至 CNN 模型，星系團質量預測標準差降至 0.111 dex。

利用機器學習預測星系團質量迎來全新突破。天文學家運用 **Uchuu-UniverseMachine** 模擬星表建構帶有視線速度的二維影像，成功讓卷積神經網路（CNN）推斷出絕對中位數殘差小於 **0.01 dex** 的星系團質量。將星系豐度加入網路輸入特徵中，更能讓預測標準差從 **0.133 dex 降至 0…

原文：Inferring Halo Mass and Scale Radius of Galaxy Clusters Using Convolutional Neural Networks and Uchuu-UniverseMachine Ca…

arXiv 全文 ★4 2026-04-17

測試250萬筆合成數據發現，參數優化讓TabDDPM效能飆升85,797%。

在評估高達 **250 萬筆**表格數據的合成品質時，直接使用模型預設參數可能導致嚴重失真。一項比較 **7 款**主流合成模型的最新研究顯示，經過系統性的超參數優化後，擴散模型 **TabDDPM** 的效能可飆升 **85,797%**。這項針對德國癌症登記等大型健康資料集的研究，為評估合成數據的保真度提供了一套…

原文：Evaluating quality in synthetic data generation for large tabular health datasets

JMIRS ★4 2026-Jan

AI 將心血管造影時間縮減 80%，並使影像結構相似性指標提升 56%。

深度學習正將心血管磁振造影掃描時間縮減 **70% 到 80%**。研究證實，AI 具備 **90%** 的瑕疵辨識準確率，更能將影像結構相似性提升 **56%**，徹底打破傳統心臟造影在時間與品質上的技術雙重限制。 CMR 心臟造影的假影與憋氣挑戰檢視現代醫療影像技術，`CMR（心血管磁振造影）` 一直是評估心…

原文：The role of AI in optimizing CMR image quality: A scoping review.

AJNR Current 全文 ★4 2026-03-20

AI 體積測量精準預測胎兒水腦症，超過正常 11 個標準差即預告 100% 產後需開刀引流。

預測胎兒腦室擴大出生後是否需要開刀，切點竟然高達正常值的 11 個標準差（SD）。胎兒磁振造影（MRI）常發現腦室擴大，但多數為良性，僅少數會惡化為水腦症並需要腦脊髓液分流手術。我們常依賴 2D 的心房寬度來評估，卻忽略了 3D 體積的爆發性變化。這項 UCSF 的研究利用自動化 AI 建立常態模型，精準點出這個 1…

原文：Prediction of CSF Intervention in Fetal Ventriculomegaly via Artificial Intelligence-Powered Normative Modeling [ARTIFIC…

arXiv 全文 ★4 2026-04-16

普林斯頓大學提出弱到強的知識蒸餾機制，以較弱教師引導模型早期訓練，創下 ImageNet 分類任務 4.8 倍提速。

傳統知識蒸餾多由強大教師指導小型學生模型以進行參數壓縮，普林斯頓大學團隊最新研究則打破此常規，提出「弱到強（Weak-to-Strong）」的蒸餾加速架構。透過讓較弱的教師模型僅在早期訓練階段提供引導，研究團隊在不損失最終準確率的前提下，成功讓 **ImageNet** 分類任務的訓練速度大幅提升高達 **4.8 倍…

原文：Weak-to-Strong Knowledge Distillation Accelerates Visual Learning

arXiv 全文 ★4 2026-04-16

研究團隊提出結合信賴域與直接搜尋的動態切換演算法，突破傳統模型停滯瓶頸，大幅提升多目標機器學習最佳化效率。

無導數最佳化專攻目標函數導數未知或運算成本高昂的難題。傳統信賴域方法易在代理模型擬合不良時陷入停滯，而直接搜尋法雖然強健但收斂遲緩。研究團隊提出全新的 TR-DS 動態切換演算法，融合兩者優勢，在多目標機器學習任務中展現出色的收斂效率。無導數最佳化在模擬驅動與機器學習的挑戰當代許多工程應用高度依賴運算密集的模擬…

原文：Enhancing Model Based Derivative Free Optimization using Direct Search

arXiv 全文 ★4 2026-04-16

墨爾本大學最新研究揭示，量子模型的數學對稱性並不能保證防禦力，抑制特定的脆弱傅立葉模態才是確保系統強健性的關鍵。

墨爾本大學針對量子機器學習模型進行 5 種資料集測試，發現單純的數學對稱性無法保證防禦力。當模型依賴「環狀平均強度」特徵時極易遭古典攻擊擊潰，但只要抑制特定的 m=0 傅立葉模態，就能大幅提升強健性。測試5大資料集：幾何量子模型的對稱性盲區量子機器學習（QML）在處理具有幾何結構的任務時，經常採用「群等變架構」…

原文：Feature-level analysis and adversarial transfer in rotationally equivariant quantum machine learning

AJNR Current 全文 ★4 2026-03-20

兩階段AI以演化策略破解盲區，僅66筆影像即達100%脈絡膜轉移敏感度。

在標準腦部 MRI 判讀中，眼眶邊緣的微小脈絡膜轉移極易被忽略，但只要靠著先裁切再判讀的兩階段 AI 策略，即使分類網路的訓練資料只有極端的 **66** 筆影像，依然能以演化策略模型達到 **100%** 的敏感度與 **0.93** 的 AUC。這打破了深度神經網路非得依賴巨量標註資料不可的迷思，為放射科揪出周邊…

原文：Two-Step Semiautomated Classification of Choroidal Metastases on MRI: Orbit Localization via Bounding Boxes Followed by …

arXiv 全文 ★4 2026-04-16

ExoNet 模型透過融合光變曲線與恆星參數，在兩小時內完成訓練，成功從 TESS 數據揪出高達 99.64% 信心度的類地行星目標。

NASA 的 TESS（凌日系外行星巡天衛星）至今已標記超過 **7,800 個**候選系外行星，卻僅有不到 **720 個**獲得正式確認。面對龐大的數據驗證瓶頸，全新開源的多模態深度學習框架 **ExoNet**，透過融合光變曲線與恆星參數，在兩小時內即可完成模型訓練，成功從未確認清單中揪出 **35 個**高信…

原文：ExoNet: Multimodal Deep Learning for TESS Exoplanet Candidate Identification via Phase-Folded Light Curves, Stellar Para…

arXiv 全文 ★4 2026-04-17

HQRN 結合 10 層量子殘差塊，不僅可繼承經典權重，更成功突破對抗性量子糾纏分類。

一項結合 **10** 層量子殘差塊的新型混合量子殘差網路 (HQRN)，在抽樣達到 **1,000,000** 次時，能將量子與經典網路的分類分歧率降至 **3%**。該架構不僅可直接繼承經典模型的優化權重以避開訓練瓶頸，更成功辨識出模仿糾纏特徵的對抗性狀態，展現了超越經典演算法的量子特徵提取能力。橋接經典與量…

原文：Bridge the Gap between Classical and Quantum Neural Networks with Residual Connections

arXiv 全文 ★4 2026-04-17

P3T 僅以 2M 參數在 3D 分類達 94% 準確率，成功突破大模型的跨域泛化瓶頸。

傳統 3D 視覺語言模型的全微調極易破壞預訓練累積的泛化能力。最新提出的 P3T 架構將可學習參數全數移至輸入端，僅需更新 2M 個參數，較基準模型銳減 91%，即在 ModelNet40 達到 94.0% 準確率，並於跨領域測試中維持卓越的辨識度。 3D 視覺語言模型微調破壞嵌入空間的泛化難題引進大型預訓練模型…

原文：P3T: Prototypical Point-level Prompt Tuning with Enhanced Generalization for 3D Vision-Language Models

arXiv 全文 ★4 2026-04-17

僅 25.3M 參數，SSMamba 於病理影像分類徹底擊敗 11 款主流大模型。

病理影像基礎模型雖具備強大表徵能力，但其龐大參數往往伴隨鉅額運算成本。西北大學與諾丁漢大學聯合提出的 **SSMamba** 框架，僅使用 **25.3M** 的輕量化參數，即在 10 個公開感興趣區域（ROI）資料集上擊敗了包含 **Virchow2** 與 **Prov-GigaPath** 在內的 11 款主流…

原文：SSMamba: A Self-Supervised Hybrid State Space Model for Pathological Image Classification

arXiv 全文 ★4 2026-04-17

僅需不到 300 參數，量子增強模型即達成大模型準確率，提升百倍效率。

高能物理實驗每年產生 PB 級巨量數據，傳統模型需耗費數十萬參數與百萬筆數據訓練。最新研究結合量子計算與 LSTM 模型，僅用不到 300 個參數與 2 萬筆數據，便達成與大型模型僅差 1% 的準確率，實現 100 倍資源效率提升。高能物理 PB 級數據運算瓶頸與量子硬體限制大型強子對撞機（LHC）等現代高能物…

原文：Federated Learning with Quantum Enhanced LSTM for Applications in High Energy Physics

arXiv 全文 ★4 2026-04-17

SSFT 模型僅用 51.6 萬參數，不到前代基準 2% 的體積，即在三大高光譜影像分類測試中奪得最高總分。

高光譜影像分類技術長期面臨標註數據稀缺與領域差異的挑戰，使得龐大的深度學習模型容易陷入過度擬合。研究團隊提出全新輕量級光譜-空間融合變換器（SSFT），僅使用 **51.6 萬參數**——不到前代領先方法 **2%** 的體積，便在多領域 HSI-Benchmark 測試中奪下最高總分 **84.87**。更有趣的是…

原文：SSFT: A Lightweight Spectral-Spatial Fusion Transformer for Generic Hyperspectral Classification

AJNR Ahead 全文 ★4 2026-03-20

聽神經瘤切割有了新突破，U-Mamba 模型斬獲 0.927 分數擊潰 MedSAM 大模型。

大模型未必完勝。在聽神經瘤 3D 切割中，U-Mamba 模型於外部測試斬獲 0.927 的高分，徹底擊潰通用大模型 MedSAM。這個體積誤差僅 0.08% 的專用 AI，正是解放放射科每天手動測量腫瘤的關鍵。內聽道聽神經瘤測量與 2692 筆掃描解方在小腦橋腦角（CPA）與內聽道的擁擠空間中，聽神經瘤的生長…

原文：Comparative Evaluation of Deep Learning Models for 3D Segmentation and Volumetry of Vestibular Schwannomas Using Large H…

Radiology: AI 全文 ★4 2026-Jan

單一醫學中心的大數據準嗎？102萬兒童世代透過GIS對比社區人口，揭露雖然種族與年齡分布嚴重偏移，但特定傳染病預測率仍精準對齊真實世界。

拿單一醫學中心的病歷資料去推估整個都會區的疾病盛行率，往往被認為是充滿抽樣偏誤的學術大忌。但這項涵蓋費城都會區 102 萬名兒童的大數據分析打破了這個預設立場：即便院內就診族群的低收入戶比例與特定族裔顯著偏高，當我們實際拿來預測侵襲性肺炎鏈球菌的感染率時，院內推估值為每十萬人 18 例，與真實社區背景值的 10 例相…

原文：US-derived Pediatric Kidney Length and Volume Percentiles by Age: A Big Data Approach.

PubMed 全文 ★4 2026-Apr-19

在7項變數測試中，傳統邏輯迴歸外部驗證AUC達0.95，表現更勝複雜神經網路。

在預測模型開發領域，學界與業界長久以來不斷追求更複雜的機器學習演算法，但最新研究推翻了這項「越複雜越好」的預設前提。針對包含 960 名內部訓練與 504 名外部驗證的年輕成人糖尿病患樣本，使用僅 7 項常規變數進行測試時，傳統的**邏輯迴歸（Logistic regression）**在外部驗證中的 **ROC A…

原文：Clinical Machine Learning Model for Predicting Pathological Complete Response in Patients with Esophageal and Gastroesop…

Radiology: AI 全文 ★4 2026-Mar

十萬份腦部 MRI 報告能在半小時內被 AI 精準標記，但在血管異常與腦軟化等特定病灶，報告與影像的真實一致性卻出現顯著衰退。

拿放射科報告直接餵給 AI 當作影像訓練標籤，可能會讓模型學到不精準的特徵——在血管異常與腦軟化症的判讀上，報告標籤與真實影像標籤的預測 AUC 差距高達 0.067。這份涵蓋超過十二萬筆腦部 MRI 的大型研究指出，即便強大的語言模型能在 30 分鐘內讀完十萬份報告並精準分類，若沒有經過「重新看片」的交叉驗證，我們…

原文：Self-Supervised Text-Vision Alignment for Automated Brain MRI Abnormality Detection: A Multicenter Study (ALIGN Study).

Radiology: AI 全文 ★4 2026-Mar

盲目採取多位專家的多數決反而會拉低 AI 效能！評估標註者的「可學習性」才是建立強大黃金標準的關鍵。

集合 11 位重症專家的多數決來訓練 AI 模型，其外部驗證的 F1 micro 分數竟然會慘跌到 0.254。這徹底打破了醫學影像與預測模型高度依賴「多數決即為黃金標準」的迷思。研究數據明確指出，與其盲目統合所有專家的意見，不如先剔除標註邏輯自相矛盾的專家，僅採用具備高「可學習性」的專家標註，能將外部驗證效能大幅翻…

原文：Impact of Label Noise from Large Language Model-generated Annotations on Evaluation of Diagnostic Model Performance.

AJNR Ahead 全文 ★4 2026-03-20

AI 量化腦血管周圍間隙，成功抓出肉眼分級遺漏的糖尿病與早期認知退化。

視覺評分看似尋常的基底核血管周圍間隙，透過全自動深度學習模型精準計數後，竟暴露出與糖尿病具備極高的病理關聯（β = 11.51）。當大腦額頂葉的間隙數量高達平均 414.9 個時，傳統肉眼分級容易陷入天花板效應而忽略微小變化。這份來自 MESA 世代研究的影像分析證實，放棄半定量量表改用連續數值，是找出小血管疾病與神…

原文：Comparative Analysis of AI-based Quantification vs. Visual Rating of Enlarged Perivascular Spaces in the MESA Cohort [OR…

arXiv 全文 ★4 2026-04-17

Neural CTMC 模型將馬可夫鏈拆解為跳躍時間與方向雙神經網路，以純均勻前向過程在 TinyStories 創下 ≤16.36 困惑度，打破遮罩擴散模型的統治地位。

在語言模型極度依賴自迴歸（Autoregressive）架構的當下，離散擴散模型（Discrete Diffusion）正開闢另一條全新路徑。最新研究提出的 Neural CTMC 模型，在 TinyStories 資料集上以 50 步採樣達成 **≤ 16.36** 的生成困惑度（Perplexity），大幅超越現…

原文：Neural Continuous-Time Markov Chain: Discrete Diffusion via Decoupled Jump Timing and Direction

AJNR Ahead 全文 ★4 2026-03-20

下視丘次神經核分割技術全面盤點：深度學習雖有效率優勢，但兒童髓鞘化時期的影像模型仍面臨嚴重斷層。

下視丘體積僅佔全腦不到 1%，卻主控著人體能量代謝與日夜節律，然而針對兒童族群的高精度自動分割模型數量卻幾乎是 0 個。這篇發表於 AJNR 的最新影像醫學綜述，徹底盤點了下視丘次神經核分割的兩大技術流派，直接點出當前模型缺乏統一協定而無法跨研究比較的致命缺陷。常規 3T 磁振造影下視丘次神經核的成像困境針對下…

原文：Recent Advances in Hypothalamic Segmentation for Neuroimaging: A Comprehensive Review [REVIEW ARTICLE]

arXiv 全文 ★4 2026-04-17

DepCap 免訓練框架動態劃分區塊並偵測運算衝突，為 LLaDA-1.5 模型創下 5.63 倍加速並提升 7.4% 準確率。

擴散語言模型（DLMs）具備全域修改與平行生成的優勢，卻深陷解碼速度與品質的拉扯。來自中國科學技術大學的研究團隊提出免訓練推理框架 DepCap，不僅在 **LLaDA 系列**模型平均達成 **3.57 倍**速度躍升，更在 **MBPP** 程式碼基準測試中，為 **LLaDA-1.5** 帶來 **5.63 倍…

原文：DepCap: Adaptive Block-Wise Parallel Decoding for Efficient Diffusion LM Inference

arXiv 全文 ★4 2026-04-17

導入語音階層先驗的 HiCoDiT 模型，精準還原無聲影片，取得 57% 偏好勝率。

復旦大學與中科院提出 **HiCoDiT** 階層式擴散模型，首度將語音階層先驗引入無聲影片轉語音任務。模型經 **261.5 小時**訓練，有效解決跨模態不對稱，並在盲測中取得 **57.0%** 的壓倒性偏好勝率。突破影片轉語音的跨模態對齊與 RVQ 階層傳統的影片轉語音技術（VTS）旨在僅依靠視覺線索合成…

原文：Hierarchical Codec Diffusion for Video-to-Speech Generation

arXiv 全文 ★4 2026-04-17

西北大學提出隨插即用的 Motion-Adapter 模組，利用解耦交叉注意力遮罩引導擴散模型，成功在 484 種複合指令測試中生成極度流暢的雙重物理動作。

讓 AI 生成一段「邊走路邊舉啞鈴」的同時動作序列，成功率往往出乎意料地低。現有文字生成動作（Text-to-Motion）擴散模型在處理這類需求時，常因為特徵過度融合，導致動作相互覆蓋或肢體空間位置混亂。西北大學研究團隊提出的 **Motion-Adapter** 模組，無需成對的複合動作訓練資料，僅靠單一動作庫訓…

原文：Motion-Adapter: A Diffusion Model Adapter for Text-to-Motion Generation of Compound Actions

🤖 醫療 AI

頂尖 AI 模型 FLUX 生成特定良性概念組合時，產生隱性違規圖像機率高達 99.52%，揭示既有安全機制的重大盲區。

FDA 雖核准高達 692 款 AI 醫療軟體，但無解的模型漂移與嚴峻的醫療究責機制，才是阻礙放射科常規採用的最大難關。

最新評測證明，Gemini 2.5 Pro 在加入影像後準確率激增至 70%，正式告別 AI 只會看文字通靈的時代。

打破 CTP 單一血流閾值迷思，3D nnU-Net 能針對「打通與否」雙情境，將最終梗塞預測準確率翻倍。

引入星系豐度至 CNN 模型，星系團質量預測標準差降至 0.111 dex。

測試250萬筆合成數據發現，參數優化讓TabDDPM效能飆升85,797%。

AI 將心血管造影時間縮減 80%，並使影像結構相似性指標提升 56%。

AI 體積測量精準預測胎兒水腦症，超過正常 11 個標準差即預告 100% 產後需開刀引流。

普林斯頓大學提出弱到強的知識蒸餾機制，以較弱教師引導模型早期訓練，創下 ImageNet 分類任務 4.8 倍提速。

研究團隊提出結合信賴域與直接搜尋的動態切換演算法，突破傳統模型停滯瓶頸，大幅提升多目標機器學習最佳化效率。

最新研究透過分層摘要過濾雜訊，使大型語言模型的預測一致性提升達 30%。

墨爾本大學最新研究揭示，量子模型的數學對稱性並不能保證防禦力，抑制特定的脆弱傅立葉模態才是確保系統強健性的關鍵。

兩階段AI以演化策略破解盲區，僅66筆影像即達100%脈絡膜轉移敏感度。

ExoNet 模型透過融合光變曲線與恆星參數，在兩小時內完成訓練，成功從 TESS 數據揪出高達 99.64% 信心度的類地行星目標。

HQRN 結合 10 層量子殘差塊，不僅可繼承經典權重，更成功突破對抗性量子糾纏分類。

P3T 僅以 2M 參數在 3D 分類達 94% 準確率，成功突破大模型的跨域泛化瓶頸。

僅 25.3M 參數，SSMamba 於病理影像分類徹底擊敗 11 款主流大模型。

僅需不到 300 參數，量子增強模型即達成大模型準確率，提升百倍效率。

SSFT 模型僅用 51.6 萬參數，不到前代基準 2% 的體積，即在三大高光譜影像分類測試中奪得最高總分。

聽神經瘤切割有了新突破，U-Mamba 模型斬獲 0.927 分數擊潰 MedSAM 大模型。

單一醫學中心的大數據準嗎？102萬兒童世代透過GIS對比社區人口，揭露雖然種族與年齡分布嚴重偏移，但特定傳染病預測率仍精準對齊真實世界。

在7項變數測試中，傳統邏輯迴歸外部驗證AUC達0.95，表現更勝複雜神經網路。

十萬份腦部 MRI 報告能在半小時內被 AI 精準標記，但在血管異常與腦軟化等特定病灶，報告與影像的真實一致性卻出現顯著衰退。

盲目採取多位專家的多數決反而會拉低 AI 效能！評估標註者的「可學習性」才是建立強大黃金標準的關鍵。

AI 量化腦血管周圍間隙，成功抓出肉眼分級遺漏的糖尿病與早期認知退化。

Neural CTMC 模型將馬可夫鏈拆解為跳躍時間與方向雙神經網路，以純均勻前向過程在 TinyStories 創下 ≤16.36 困惑度，打破遮罩擴散模型的統治地位。

下視丘次神經核分割技術全面盤點：深度學習雖有效率優勢，但兒童髓鞘化時期的影像模型仍面臨嚴重斷層。

DepCap 免訓練框架動態劃分區塊並偵測運算衝突，為 LLaDA-1.5 模型創下 5.63 倍加速並提升 7.4% 準確率。

導入語音階層先驗的 HiCoDiT 模型，精準還原無聲影片，取得 57% 偏好勝率。

西北大學提出隨插即用的 Motion-Adapter 模組，利用解耦交叉注意力遮罩引導擴散模型，成功在 484 種複合指令測試中生成極度流暢的雙重物理動作。