🤖 醫療 AI

已導讀 214 篇

依 AI 自動分類的次專科導讀 · 依重要性與時間排序

📡 訂閱本次專科 RSS

arXiv 全文 ★5 2026-04-17

頂尖 AI 模型 FLUX 生成特定良性概念組合時,產生隱性違規圖像機率高達 99.52%,揭示既有安全機制的重大盲區。

圖像生成模型在理解複雜指令上取得巨大進展,但面對組合型安全測試時卻顯得不堪一擊。最新研究顯示,當輸入由單純良性詞彙組成的特定提示時,頂尖開源模型 **FLUX.1** 產生不安全圖像的機率高達 **99.52%**。這種由單一安全概念組合而成的隱性風險,正成為生成式人工智慧亟需解決的邊界問題。 拆解 TwoHams…

原文:TwoHamsters: Benchmarking Multi-Concept Compositional Unsafety in Text-to-Image Models

Korean J Radiol 全文 ★5 2026-Jan

FDA 雖核准高達 692 款 AI 醫療軟體,但無解的模型漂移與嚴峻的醫療究責機制,才是阻礙放射科常規採用的最大難關。

截至 2023 年 10 月,FDA 已火速核准高達 692 款醫療軟體,且其中 75% 集中在放射科,但真實世界多數機構的常規採用率卻近乎停滯。亞太放射醫學會(AOSR)的跨國共識文件明確指出,導致這個極端斷層的癥結並非單純的演算法準確率,而是在於無解的模型漂移與醫事責任歸屬。若機構未能建立與日常 PACS 隔離的…

原文:Access and Reimbursement for Artificial Intelligence in Radiology: The Asian Oceanian Society of Radiology Perspective.

Korean J Radiol 全文 ★5 2026-Mar

最新評測證明,Gemini 2.5 Pro 在加入影像後準確率激增至 70%,正式告別 AI 只會看文字通靈的時代。

雖然 OpenAI 的 o3 在日本放射專科考試中創下 **72%** 的驚人正確率,但最駭人的事實是:它在「完全不看圖」的瞎猜模式下也能拿 **67%**。真正學會看片的其實是 Google 的 Gemini 2.5 Pro,給予影像後正確率從 **59%** 狂飆至 **70%**(**p=0.001**)。 …

原文:Evaluating the Accuracy and Diagnostic Reasoning of Multimodal Large Language Models in Interpreting Neuroradiology Case…

AJNR Current 全文 ★5 2026-04-02

打破 CTP 單一血流閾值迷思,3D nnU-Net 能針對「打通與否」雙情境,將最終梗塞預測準確率翻倍。

傳統閾值預測梗塞核心的準確率低得驚人——在完全打通的病患中,常規軟體的 Dice 分數僅有 **15.73%**。這篇 AJNR 最新研究用 3D nnU-Net 打破迷思,證實 AI 能將預測準確度翻倍。我們終於不用再盲信單一血流標準,而是能針對「打通」與「沒打通」兩種情境,預判最終的腦組織生死。 突破單一血流閾…

原文:Multimodal CT Perfusion-Based Deep Learning for Predicting Stroke Lesion Outcomes in Complete and No Recanalization Scen…

arXiv 全文 ★4 2026-04-17

引入星系豐度至 CNN 模型,星系團質量預測標準差降至 0.111 dex。

利用機器學習預測星系團質量迎來全新突破。天文學家運用 **Uchuu-UniverseMachine** 模擬星表建構帶有視線速度的二維影像,成功讓卷積神經網路(CNN)推斷出絕對中位數殘差小於 **0.01 dex** 的星系團質量。將星系豐度加入網路輸入特徵中,更能讓預測標準差從 **0.133 dex 降至 0…

原文:Inferring Halo Mass and Scale Radius of Galaxy Clusters Using Convolutional Neural Networks and Uchuu-UniverseMachine Ca…

arXiv 全文 ★4 2026-04-17

測試250萬筆合成數據發現,參數優化讓TabDDPM效能飆升85,797%。

在評估高達 **250 萬筆**表格數據的合成品質時,直接使用模型預設參數可能導致嚴重失真。一項比較 **7 款**主流合成模型的最新研究顯示,經過系統性的超參數優化後,擴散模型 **TabDDPM** 的效能可飆升 **85,797%**。這項針對德國癌症登記等大型健康資料集的研究,為評估合成數據的保真度提供了一套…

原文:Evaluating quality in synthetic data generation for large tabular health datasets

JMIRS ★4 2026-Jan

AI 將心血管造影時間縮減 80%,並使影像結構相似性指標提升 56%。

深度學習正將心血管磁振造影掃描時間縮減 **70% 到 80%**。研究證實,AI 具備 **90%** 的瑕疵辨識準確率,更能將影像結構相似性提升 **56%**,徹底打破傳統心臟造影在時間與品質上的技術雙重限制。 CMR 心臟造影的假影與憋氣挑戰 檢視現代醫療影像技術,`CMR(心血管磁振造影)` 一直是評估心…

原文:The role of AI in optimizing CMR image quality: A scoping review.

AJNR Current 全文 ★4 2026-03-20

AI 體積測量精準預測胎兒水腦症,超過正常 11 個標準差即預告 100% 產後需開刀引流。

預測胎兒腦室擴大出生後是否需要開刀,切點竟然高達正常值的 11 個標準差(SD)。胎兒磁振造影(MRI)常發現腦室擴大,但多數為良性,僅少數會惡化為水腦症並需要腦脊髓液分流手術。我們常依賴 2D 的心房寬度來評估,卻忽略了 3D 體積的爆發性變化。這項 UCSF 的研究利用自動化 AI 建立常態模型,精準點出這個 1…

原文:Prediction of CSF Intervention in Fetal Ventriculomegaly via Artificial Intelligence-Powered Normative Modeling [ARTIFIC…

arXiv 全文 ★4 2026-04-16

普林斯頓大學提出弱到強的知識蒸餾機制,以較弱教師引導模型早期訓練,創下 ImageNet 分類任務 4.8 倍提速。

傳統知識蒸餾多由強大教師指導小型學生模型以進行參數壓縮,普林斯頓大學團隊最新研究則打破此常規,提出「弱到強(Weak-to-Strong)」的蒸餾加速架構。透過讓較弱的教師模型僅在早期訓練階段提供引導,研究團隊在不損失最終準確率的前提下,成功讓 **ImageNet** 分類任務的訓練速度大幅提升高達 **4.8 倍…

原文:Weak-to-Strong Knowledge Distillation Accelerates Visual Learning

arXiv 全文 ★4 2026-04-16

研究團隊提出結合信賴域與直接搜尋的動態切換演算法,突破傳統模型停滯瓶頸,大幅提升多目標機器學習最佳化效率。

無導數最佳化專攻目標函數導數未知或運算成本高昂的難題。傳統信賴域方法易在代理模型擬合不良時陷入停滯,而直接搜尋法雖然強健但收斂遲緩。研究團隊提出全新的 TR-DS 動態切換演算法,融合兩者優勢,在多目標機器學習任務中展現出色的收斂效率。 無導數最佳化在模擬驅動與機器學習的挑戰 當代許多工程應用高度依賴運算密集的模擬…

原文:Enhancing Model Based Derivative Free Optimization using Direct Search

arXiv 全文 ★4 2026-04-16

最新研究透過分層摘要過濾雜訊,使大型語言模型的預測一致性提升達 30%。

大型語言模型在企業資料分析常因隨機性,導致產出的情感分數劇烈浮動。最新研究針對三大平台逾 **43 萬** 筆評論進行測試,證實透過分層摘要框架能有效引導模型注意力,並過濾雜訊使預測一致性提升最高達 **30%**。 企業級情感預測面臨的語言模型隨機性難題 在現代商業環境中,基於資料驅動的決策是企業維持競爭優勢的關…

原文:Consistency Analysis of Sentiment Predictions using Syntactic & Semantic Context Assessment Summarization (SSAS)

arXiv 全文 ★4 2026-04-16

墨爾本大學最新研究揭示,量子模型的數學對稱性並不能保證防禦力,抑制特定的脆弱傅立葉模態才是確保系統強健性的關鍵。

墨爾本大學針對量子機器學習模型進行 5 種資料集測試,發現單純的數學對稱性無法保證防禦力。當模型依賴「環狀平均強度」特徵時極易遭古典攻擊擊潰,但只要抑制特定的 m=0 傅立葉模態,就能大幅提升強健性。 測試5大資料集:幾何量子模型的對稱性盲區 量子機器學習(QML)在處理具有幾何結構的任務時,經常採用「群等變架構」…

原文:Feature-level analysis and adversarial transfer in rotationally equivariant quantum machine learning

AJNR Current 全文 ★4 2026-03-20

兩階段AI以演化策略破解盲區,僅66筆影像即達100%脈絡膜轉移敏感度。

在標準腦部 MRI 判讀中,眼眶邊緣的微小脈絡膜轉移極易被忽略,但只要靠著先裁切再判讀的兩階段 AI 策略,即使分類網路的訓練資料只有極端的 **66** 筆影像,依然能以演化策略模型達到 **100%** 的敏感度與 **0.93** 的 AUC。這打破了深度神經網路非得依賴巨量標註資料不可的迷思,為放射科揪出周邊…

原文:Two-Step Semiautomated Classification of Choroidal Metastases on MRI: Orbit Localization via Bounding Boxes Followed by …

arXiv 全文 ★4 2026-04-16

ExoNet 模型透過融合光變曲線與恆星參數,在兩小時內完成訓練,成功從 TESS 數據揪出高達 99.64% 信心度的類地行星目標。

NASA 的 TESS(凌日系外行星巡天衛星)至今已標記超過 **7,800 個**候選系外行星,卻僅有不到 **720 個**獲得正式確認。面對龐大的數據驗證瓶頸,全新開源的多模態深度學習框架 **ExoNet**,透過融合光變曲線與恆星參數,在兩小時內即可完成模型訓練,成功從未確認清單中揪出 **35 個**高信…

原文:ExoNet: Multimodal Deep Learning for TESS Exoplanet Candidate Identification via Phase-Folded Light Curves, Stellar Para…

arXiv 全文 ★4 2026-04-17

HQRN 結合 10 層量子殘差塊,不僅可繼承經典權重,更成功突破對抗性量子糾纏分類。

一項結合 **10** 層量子殘差塊的新型混合量子殘差網路 (HQRN),在抽樣達到 **1,000,000** 次時,能將量子與經典網路的分類分歧率降至 **3%**。該架構不僅可直接繼承經典模型的優化權重以避開訓練瓶頸,更成功辨識出模仿糾纏特徵的對抗性狀態,展現了超越經典演算法的量子特徵提取能力。 橋接經典與量…

原文:Bridge the Gap between Classical and Quantum Neural Networks with Residual Connections

arXiv 全文 ★4 2026-04-17

P3T 僅以 2M 參數在 3D 分類達 94% 準確率,成功突破大模型的跨域泛化瓶頸。

傳統 3D 視覺語言模型的全微調極易破壞預訓練累積的泛化能力。最新提出的 P3T 架構將可學習參數全數移至輸入端,僅需更新 2M 個參數,較基準模型銳減 91%,即在 ModelNet40 達到 94.0% 準確率,並於跨領域測試中維持卓越的辨識度。 3D 視覺語言模型微調破壞嵌入空間的泛化難題 引進大型預訓練模型…

原文:P3T: Prototypical Point-level Prompt Tuning with Enhanced Generalization for 3D Vision-Language Models

arXiv 全文 ★4 2026-04-17

僅 25.3M 參數,SSMamba 於病理影像分類徹底擊敗 11 款主流大模型。

病理影像基礎模型雖具備強大表徵能力,但其龐大參數往往伴隨鉅額運算成本。西北大學與諾丁漢大學聯合提出的 **SSMamba** 框架,僅使用 **25.3M** 的輕量化參數,即在 10 個公開感興趣區域(ROI)資料集上擊敗了包含 **Virchow2** 與 **Prov-GigaPath** 在內的 11 款主流…

原文:SSMamba: A Self-Supervised Hybrid State Space Model for Pathological Image Classification

arXiv 全文 ★4 2026-04-17

僅需不到 300 參數,量子增強模型即達成大模型準確率,提升百倍效率。

高能物理實驗每年產生 PB 級巨量數據,傳統模型需耗費數十萬參數與百萬筆數據訓練。最新研究結合量子計算與 LSTM 模型,僅用不到 300 個參數與 2 萬筆數據,便達成與大型模型僅差 1% 的準確率,實現 100 倍資源效率提升。 高能物理 PB 級數據運算瓶頸與量子硬體限制 大型強子對撞機(LHC)等現代高能物…

原文:Federated Learning with Quantum Enhanced LSTM for Applications in High Energy Physics

arXiv 全文 ★4 2026-04-17

SSFT 模型僅用 51.6 萬參數,不到前代基準 2% 的體積,即在三大高光譜影像分類測試中奪得最高總分。

高光譜影像分類技術長期面臨標註數據稀缺與領域差異的挑戰,使得龐大的深度學習模型容易陷入過度擬合。研究團隊提出全新輕量級光譜-空間融合變換器(SSFT),僅使用 **51.6 萬參數**——不到前代領先方法 **2%** 的體積,便在多領域 HSI-Benchmark 測試中奪下最高總分 **84.87**。更有趣的是…

原文:SSFT: A Lightweight Spectral-Spatial Fusion Transformer for Generic Hyperspectral Classification

AJNR Ahead 全文 ★4 2026-03-20

聽神經瘤切割有了新突破,U-Mamba 模型斬獲 0.927 分數擊潰 MedSAM 大模型。

大模型未必完勝。在聽神經瘤 3D 切割中,U-Mamba 模型於外部測試斬獲 0.927 的高分,徹底擊潰通用大模型 MedSAM。這個體積誤差僅 0.08% 的專用 AI,正是解放放射科每天手動測量腫瘤的關鍵。 內聽道聽神經瘤測量與 2692 筆掃描解方 在小腦橋腦角(CPA)與內聽道的擁擠空間中,聽神經瘤的生長…

原文:Comparative Evaluation of Deep Learning Models for 3D Segmentation and Volumetry of Vestibular Schwannomas Using Large H…

Radiology: AI 全文 ★4 2026-Jan

單一醫學中心的大數據準嗎?102萬兒童世代透過GIS對比社區人口,揭露雖然種族與年齡分布嚴重偏移,但特定傳染病預測率仍精準對齊真實世界。

拿單一醫學中心的病歷資料去推估整個都會區的疾病盛行率,往往被認為是充滿抽樣偏誤的學術大忌。但這項涵蓋費城都會區 102 萬名兒童的大數據分析打破了這個預設立場:即便院內就診族群的低收入戶比例與特定族裔顯著偏高,當我們實際拿來預測侵襲性肺炎鏈球菌的感染率時,院內推估值為每十萬人 18 例,與真實社區背景值的 10 例相…

原文:US-derived Pediatric Kidney Length and Volume Percentiles by Age: A Big Data Approach.

PubMed 全文 ★4 2026-Apr-19

在7項變數測試中,傳統邏輯迴歸外部驗證AUC達0.95,表現更勝複雜神經網路。

在預測模型開發領域,學界與業界長久以來不斷追求更複雜的機器學習演算法,但最新研究推翻了這項「越複雜越好」的預設前提。針對包含 960 名內部訓練與 504 名外部驗證的年輕成人糖尿病患樣本,使用僅 7 項常規變數進行測試時,傳統的**邏輯迴歸(Logistic regression)**在外部驗證中的 **ROC A…

原文:Clinical Machine Learning Model for Predicting Pathological Complete Response in Patients with Esophageal and Gastroesop…

Radiology: AI 全文 ★4 2026-Mar

十萬份腦部 MRI 報告能在半小時內被 AI 精準標記,但在血管異常與腦軟化等特定病灶,報告與影像的真實一致性卻出現顯著衰退。

拿放射科報告直接餵給 AI 當作影像訓練標籤,可能會讓模型學到不精準的特徵——在血管異常與腦軟化症的判讀上,報告標籤與真實影像標籤的預測 AUC 差距高達 0.067。這份涵蓋超過十二萬筆腦部 MRI 的大型研究指出,即便強大的語言模型能在 30 分鐘內讀完十萬份報告並精準分類,若沒有經過「重新看片」的交叉驗證,我們…

原文:Self-Supervised Text-Vision Alignment for Automated Brain MRI Abnormality Detection: A Multicenter Study (ALIGN Study).

Radiology: AI 全文 ★4 2026-Mar

盲目採取多位專家的多數決反而會拉低 AI 效能!評估標註者的「可學習性」才是建立強大黃金標準的關鍵。

集合 11 位重症專家的多數決來訓練 AI 模型,其外部驗證的 F1 micro 分數竟然會慘跌到 0.254。這徹底打破了醫學影像與預測模型高度依賴「多數決即為黃金標準」的迷思。研究數據明確指出,與其盲目統合所有專家的意見,不如先剔除標註邏輯自相矛盾的專家,僅採用具備高「可學習性」的專家標註,能將外部驗證效能大幅翻…

原文:Impact of Label Noise from Large Language Model-generated Annotations on Evaluation of Diagnostic Model Performance.

AJNR Ahead 全文 ★4 2026-03-20

AI 量化腦血管周圍間隙,成功抓出肉眼分級遺漏的糖尿病與早期認知退化。

視覺評分看似尋常的基底核血管周圍間隙,透過全自動深度學習模型精準計數後,竟暴露出與糖尿病具備極高的病理關聯(β = 11.51)。當大腦額頂葉的間隙數量高達平均 414.9 個時,傳統肉眼分級容易陷入天花板效應而忽略微小變化。這份來自 MESA 世代研究的影像分析證實,放棄半定量量表改用連續數值,是找出小血管疾病與神…

原文:Comparative Analysis of AI-based Quantification vs. Visual Rating of Enlarged Perivascular Spaces in the MESA Cohort [OR…

arXiv 全文 ★4 2026-04-17

Neural CTMC 模型將馬可夫鏈拆解為跳躍時間與方向雙神經網路,以純均勻前向過程在 TinyStories 創下 ≤16.36 困惑度,打破遮罩擴散模型的統治地位。

在語言模型極度依賴自迴歸(Autoregressive)架構的當下,離散擴散模型(Discrete Diffusion)正開闢另一條全新路徑。最新研究提出的 Neural CTMC 模型,在 TinyStories 資料集上以 50 步採樣達成 **≤ 16.36** 的生成困惑度(Perplexity),大幅超越現…

原文:Neural Continuous-Time Markov Chain: Discrete Diffusion via Decoupled Jump Timing and Direction

AJNR Ahead 全文 ★4 2026-03-20

下視丘次神經核分割技術全面盤點:深度學習雖有效率優勢,但兒童髓鞘化時期的影像模型仍面臨嚴重斷層。

下視丘體積僅佔全腦不到 1%,卻主控著人體能量代謝與日夜節律,然而針對兒童族群的高精度自動分割模型數量卻幾乎是 0 個。這篇發表於 AJNR 的最新影像醫學綜述,徹底盤點了下視丘次神經核分割的兩大技術流派,直接點出當前模型缺乏統一協定而無法跨研究比較的致命缺陷。 常規 3T 磁振造影下視丘次神經核的成像困境 針對下…

原文:Recent Advances in Hypothalamic Segmentation for Neuroimaging: A Comprehensive Review [REVIEW ARTICLE]

arXiv 全文 ★4 2026-04-17

DepCap 免訓練框架動態劃分區塊並偵測運算衝突,為 LLaDA-1.5 模型創下 5.63 倍加速並提升 7.4% 準確率。

擴散語言模型(DLMs)具備全域修改與平行生成的優勢,卻深陷解碼速度與品質的拉扯。來自中國科學技術大學的研究團隊提出免訓練推理框架 DepCap,不僅在 **LLaDA 系列**模型平均達成 **3.57 倍**速度躍升,更在 **MBPP** 程式碼基準測試中,為 **LLaDA-1.5** 帶來 **5.63 倍…

原文:DepCap: Adaptive Block-Wise Parallel Decoding for Efficient Diffusion LM Inference

arXiv 全文 ★4 2026-04-17

導入語音階層先驗的 HiCoDiT 模型,精準還原無聲影片,取得 57% 偏好勝率。

復旦大學與中科院提出 **HiCoDiT** 階層式擴散模型,首度將語音階層先驗引入無聲影片轉語音任務。模型經 **261.5 小時**訓練,有效解決跨模態不對稱,並在盲測中取得 **57.0%** 的壓倒性偏好勝率。 突破影片轉語音的跨模態對齊與 RVQ 階層 傳統的影片轉語音技術(VTS)旨在僅依靠視覺線索合成…

原文:Hierarchical Codec Diffusion for Video-to-Speech Generation

arXiv 全文 ★4 2026-04-17

西北大學提出隨插即用的 Motion-Adapter 模組,利用解耦交叉注意力遮罩引導擴散模型,成功在 484 種複合指令測試中生成極度流暢的雙重物理動作。

讓 AI 生成一段「邊走路邊舉啞鈴」的同時動作序列,成功率往往出乎意料地低。現有文字生成動作(Text-to-Motion)擴散模型在處理這類需求時,常因為特徵過度融合,導致動作相互覆蓋或肢體空間位置混亂。西北大學研究團隊提出的 **Motion-Adapter** 模組,無需成對的複合動作訓練資料,僅靠單一動作庫訓…

原文:Motion-Adapter: A Diffusion Model Adapter for Text-to-Motion Generation of Compound Actions