arXiv
全文
★5
2026-04-17
圖像生成模型在理解複雜指令上取得巨大進展,但面對組合型安全測試時卻顯得不堪一擊。最新研究顯示,當輸入由單純良性詞彙組成的特定提示時,頂尖開源模型 **FLUX.1** 產生不安全圖像的機率高達 **99.52%**。這種由單一安全概念組合而成的隱性風險,正成為生成式人工智慧亟需解決的邊界問題。 拆解 TwoHams…
原文:TwoHamsters: Benchmarking Multi-Concept Compositional Unsafety in Text-to-Image Models
Korean J Radiol
全文
★5
2026-Jan
截至 2023 年 10 月,FDA 已火速核准高達 692 款醫療軟體,且其中 75% 集中在放射科,但真實世界多數機構的常規採用率卻近乎停滯。亞太放射醫學會(AOSR)的跨國共識文件明確指出,導致這個極端斷層的癥結並非單純的演算法準確率,而是在於無解的模型漂移與醫事責任歸屬。若機構未能建立與日常 PACS 隔離的…
原文:Access and Reimbursement for Artificial Intelligence in Radiology: The Asian Oceanian Society of Radiology Perspective.
Korean J Radiol
全文
★5
2026-Mar
雖然 OpenAI 的 o3 在日本放射專科考試中創下 **72%** 的驚人正確率,但最駭人的事實是:它在「完全不看圖」的瞎猜模式下也能拿 **67%**。真正學會看片的其實是 Google 的 Gemini 2.5 Pro,給予影像後正確率從 **59%** 狂飆至 **70%**(**p=0.001**)。 …
原文:Evaluating the Accuracy and Diagnostic Reasoning of Multimodal Large Language Models in Interpreting Neuroradiology Case…
全文
★5
2026-04-02
傳統閾值預測梗塞核心的準確率低得驚人——在完全打通的病患中,常規軟體的 Dice 分數僅有 **15.73%**。這篇 AJNR 最新研究用 3D nnU-Net 打破迷思,證實 AI 能將預測準確度翻倍。我們終於不用再盲信單一血流標準,而是能針對「打通」與「沒打通」兩種情境,預判最終的腦組織生死。 突破單一血流閾…
原文:Multimodal CT Perfusion-Based Deep Learning for Predicting Stroke Lesion Outcomes in Complete and No Recanalization Scen…
arXiv
全文
★4
2026-04-17
利用機器學習預測星系團質量迎來全新突破。天文學家運用 **Uchuu-UniverseMachine** 模擬星表建構帶有視線速度的二維影像,成功讓卷積神經網路(CNN)推斷出絕對中位數殘差小於 **0.01 dex** 的星系團質量。將星系豐度加入網路輸入特徵中,更能讓預測標準差從 **0.133 dex 降至 0…
原文:Inferring Halo Mass and Scale Radius of Galaxy Clusters Using Convolutional Neural Networks and Uchuu-UniverseMachine Ca…
arXiv
全文
★4
2026-04-17
在評估高達 **250 萬筆**表格數據的合成品質時,直接使用模型預設參數可能導致嚴重失真。一項比較 **7 款**主流合成模型的最新研究顯示,經過系統性的超參數優化後,擴散模型 **TabDDPM** 的效能可飆升 **85,797%**。這項針對德國癌症登記等大型健康資料集的研究,為評估合成數據的保真度提供了一套…
原文:Evaluating quality in synthetic data generation for large tabular health datasets
JMIRS
★4
2026-Jan
深度學習正將心血管磁振造影掃描時間縮減 **70% 到 80%**。研究證實,AI 具備 **90%** 的瑕疵辨識準確率,更能將影像結構相似性提升 **56%**,徹底打破傳統心臟造影在時間與品質上的技術雙重限制。 CMR 心臟造影的假影與憋氣挑戰 檢視現代醫療影像技術,`CMR(心血管磁振造影)` 一直是評估心…
原文:The role of AI in optimizing CMR image quality: A scoping review.
全文
★4
2026-03-20
預測胎兒腦室擴大出生後是否需要開刀,切點竟然高達正常值的 11 個標準差(SD)。胎兒磁振造影(MRI)常發現腦室擴大,但多數為良性,僅少數會惡化為水腦症並需要腦脊髓液分流手術。我們常依賴 2D 的心房寬度來評估,卻忽略了 3D 體積的爆發性變化。這項 UCSF 的研究利用自動化 AI 建立常態模型,精準點出這個 1…
原文:Prediction of CSF Intervention in Fetal Ventriculomegaly via Artificial Intelligence-Powered Normative Modeling [ARTIFIC…
arXiv
全文
★4
2026-04-16
傳統知識蒸餾多由強大教師指導小型學生模型以進行參數壓縮,普林斯頓大學團隊最新研究則打破此常規,提出「弱到強(Weak-to-Strong)」的蒸餾加速架構。透過讓較弱的教師模型僅在早期訓練階段提供引導,研究團隊在不損失最終準確率的前提下,成功讓 **ImageNet** 分類任務的訓練速度大幅提升高達 **4.8 倍…
原文:Weak-to-Strong Knowledge Distillation Accelerates Visual Learning
arXiv
全文
★4
2026-04-16
無導數最佳化專攻目標函數導數未知或運算成本高昂的難題。傳統信賴域方法易在代理模型擬合不良時陷入停滯,而直接搜尋法雖然強健但收斂遲緩。研究團隊提出全新的 TR-DS 動態切換演算法,融合兩者優勢,在多目標機器學習任務中展現出色的收斂效率。 無導數最佳化在模擬驅動與機器學習的挑戰 當代許多工程應用高度依賴運算密集的模擬…
原文:Enhancing Model Based Derivative Free Optimization using Direct Search
arXiv
全文
★4
2026-04-16
大型語言模型在企業資料分析常因隨機性,導致產出的情感分數劇烈浮動。最新研究針對三大平台逾 **43 萬** 筆評論進行測試,證實透過分層摘要框架能有效引導模型注意力,並過濾雜訊使預測一致性提升最高達 **30%**。 企業級情感預測面臨的語言模型隨機性難題 在現代商業環境中,基於資料驅動的決策是企業維持競爭優勢的關…
原文:Consistency Analysis of Sentiment Predictions using Syntactic & Semantic Context Assessment Summarization (SSAS)
arXiv
全文
★4
2026-04-16
墨爾本大學針對量子機器學習模型進行 5 種資料集測試,發現單純的數學對稱性無法保證防禦力。當模型依賴「環狀平均強度」特徵時極易遭古典攻擊擊潰,但只要抑制特定的 m=0 傅立葉模態,就能大幅提升強健性。 測試5大資料集:幾何量子模型的對稱性盲區 量子機器學習(QML)在處理具有幾何結構的任務時,經常採用「群等變架構」…
原文:Feature-level analysis and adversarial transfer in rotationally equivariant quantum machine learning
全文
★4
2026-03-20
在標準腦部 MRI 判讀中,眼眶邊緣的微小脈絡膜轉移極易被忽略,但只要靠著先裁切再判讀的兩階段 AI 策略,即使分類網路的訓練資料只有極端的 **66** 筆影像,依然能以演化策略模型達到 **100%** 的敏感度與 **0.93** 的 AUC。這打破了深度神經網路非得依賴巨量標註資料不可的迷思,為放射科揪出周邊…
原文:Two-Step Semiautomated Classification of Choroidal Metastases on MRI: Orbit Localization via Bounding Boxes Followed by …
arXiv
全文
★4
2026-04-16
NASA 的 TESS(凌日系外行星巡天衛星)至今已標記超過 **7,800 個**候選系外行星,卻僅有不到 **720 個**獲得正式確認。面對龐大的數據驗證瓶頸,全新開源的多模態深度學習框架 **ExoNet**,透過融合光變曲線與恆星參數,在兩小時內即可完成模型訓練,成功從未確認清單中揪出 **35 個**高信…
原文:ExoNet: Multimodal Deep Learning for TESS Exoplanet Candidate Identification via Phase-Folded Light Curves, Stellar Para…
arXiv
全文
★4
2026-04-17
一項結合 **10** 層量子殘差塊的新型混合量子殘差網路 (HQRN),在抽樣達到 **1,000,000** 次時,能將量子與經典網路的分類分歧率降至 **3%**。該架構不僅可直接繼承經典模型的優化權重以避開訓練瓶頸,更成功辨識出模仿糾纏特徵的對抗性狀態,展現了超越經典演算法的量子特徵提取能力。 橋接經典與量…
原文:Bridge the Gap between Classical and Quantum Neural Networks with Residual Connections
arXiv
全文
★4
2026-04-17
傳統 3D 視覺語言模型的全微調極易破壞預訓練累積的泛化能力。最新提出的 P3T 架構將可學習參數全數移至輸入端,僅需更新 2M 個參數,較基準模型銳減 91%,即在 ModelNet40 達到 94.0% 準確率,並於跨領域測試中維持卓越的辨識度。 3D 視覺語言模型微調破壞嵌入空間的泛化難題 引進大型預訓練模型…
原文:P3T: Prototypical Point-level Prompt Tuning with Enhanced Generalization for 3D Vision-Language Models
arXiv
全文
★4
2026-04-17
病理影像基礎模型雖具備強大表徵能力,但其龐大參數往往伴隨鉅額運算成本。西北大學與諾丁漢大學聯合提出的 **SSMamba** 框架,僅使用 **25.3M** 的輕量化參數,即在 10 個公開感興趣區域(ROI)資料集上擊敗了包含 **Virchow2** 與 **Prov-GigaPath** 在內的 11 款主流…
原文:SSMamba: A Self-Supervised Hybrid State Space Model for Pathological Image Classification
arXiv
全文
★4
2026-04-17
高能物理實驗每年產生 PB 級巨量數據,傳統模型需耗費數十萬參數與百萬筆數據訓練。最新研究結合量子計算與 LSTM 模型,僅用不到 300 個參數與 2 萬筆數據,便達成與大型模型僅差 1% 的準確率,實現 100 倍資源效率提升。 高能物理 PB 級數據運算瓶頸與量子硬體限制 大型強子對撞機(LHC)等現代高能物…
原文:Federated Learning with Quantum Enhanced LSTM for Applications in High Energy Physics
arXiv
全文
★4
2026-04-17
高光譜影像分類技術長期面臨標註數據稀缺與領域差異的挑戰,使得龐大的深度學習模型容易陷入過度擬合。研究團隊提出全新輕量級光譜-空間融合變換器(SSFT),僅使用 **51.6 萬參數**——不到前代領先方法 **2%** 的體積,便在多領域 HSI-Benchmark 測試中奪下最高總分 **84.87**。更有趣的是…
原文:SSFT: A Lightweight Spectral-Spatial Fusion Transformer for Generic Hyperspectral Classification
全文
★4
2026-03-20
大模型未必完勝。在聽神經瘤 3D 切割中,U-Mamba 模型於外部測試斬獲 0.927 的高分,徹底擊潰通用大模型 MedSAM。這個體積誤差僅 0.08% 的專用 AI,正是解放放射科每天手動測量腫瘤的關鍵。 內聽道聽神經瘤測量與 2692 筆掃描解方 在小腦橋腦角(CPA)與內聽道的擁擠空間中,聽神經瘤的生長…
原文:Comparative Evaluation of Deep Learning Models for 3D Segmentation and Volumetry of Vestibular Schwannomas Using Large H…
Radiology: AI
全文
★4
2026-Jan
拿單一醫學中心的病歷資料去推估整個都會區的疾病盛行率,往往被認為是充滿抽樣偏誤的學術大忌。但這項涵蓋費城都會區 102 萬名兒童的大數據分析打破了這個預設立場:即便院內就診族群的低收入戶比例與特定族裔顯著偏高,當我們實際拿來預測侵襲性肺炎鏈球菌的感染率時,院內推估值為每十萬人 18 例,與真實社區背景值的 10 例相…
原文:US-derived Pediatric Kidney Length and Volume Percentiles by Age: A Big Data Approach.
PubMed
全文
★4
2026-Apr-19
在預測模型開發領域,學界與業界長久以來不斷追求更複雜的機器學習演算法,但最新研究推翻了這項「越複雜越好」的預設前提。針對包含 960 名內部訓練與 504 名外部驗證的年輕成人糖尿病患樣本,使用僅 7 項常規變數進行測試時,傳統的**邏輯迴歸(Logistic regression)**在外部驗證中的 **ROC A…
原文:Clinical Machine Learning Model for Predicting Pathological Complete Response in Patients with Esophageal and Gastroesop…
Radiology: AI
全文
★4
2026-Mar
拿放射科報告直接餵給 AI 當作影像訓練標籤,可能會讓模型學到不精準的特徵——在血管異常與腦軟化症的判讀上,報告標籤與真實影像標籤的預測 AUC 差距高達 0.067。這份涵蓋超過十二萬筆腦部 MRI 的大型研究指出,即便強大的語言模型能在 30 分鐘內讀完十萬份報告並精準分類,若沒有經過「重新看片」的交叉驗證,我們…
原文:Self-Supervised Text-Vision Alignment for Automated Brain MRI Abnormality Detection: A Multicenter Study (ALIGN Study).
Radiology: AI
全文
★4
2026-Mar
集合 11 位重症專家的多數決來訓練 AI 模型,其外部驗證的 F1 micro 分數竟然會慘跌到 0.254。這徹底打破了醫學影像與預測模型高度依賴「多數決即為黃金標準」的迷思。研究數據明確指出,與其盲目統合所有專家的意見,不如先剔除標註邏輯自相矛盾的專家,僅採用具備高「可學習性」的專家標註,能將外部驗證效能大幅翻…
原文:Impact of Label Noise from Large Language Model-generated Annotations on Evaluation of Diagnostic Model Performance.
全文
★4
2026-03-20
視覺評分看似尋常的基底核血管周圍間隙,透過全自動深度學習模型精準計數後,竟暴露出與糖尿病具備極高的病理關聯(β = 11.51)。當大腦額頂葉的間隙數量高達平均 414.9 個時,傳統肉眼分級容易陷入天花板效應而忽略微小變化。這份來自 MESA 世代研究的影像分析證實,放棄半定量量表改用連續數值,是找出小血管疾病與神…
原文:Comparative Analysis of AI-based Quantification vs. Visual Rating of Enlarged Perivascular Spaces in the MESA Cohort [OR…
arXiv
全文
★4
2026-04-17
在語言模型極度依賴自迴歸(Autoregressive)架構的當下,離散擴散模型(Discrete Diffusion)正開闢另一條全新路徑。最新研究提出的 Neural CTMC 模型,在 TinyStories 資料集上以 50 步採樣達成 **≤ 16.36** 的生成困惑度(Perplexity),大幅超越現…
原文:Neural Continuous-Time Markov Chain: Discrete Diffusion via Decoupled Jump Timing and Direction
全文
★4
2026-03-20
下視丘體積僅佔全腦不到 1%,卻主控著人體能量代謝與日夜節律,然而針對兒童族群的高精度自動分割模型數量卻幾乎是 0 個。這篇發表於 AJNR 的最新影像醫學綜述,徹底盤點了下視丘次神經核分割的兩大技術流派,直接點出當前模型缺乏統一協定而無法跨研究比較的致命缺陷。 常規 3T 磁振造影下視丘次神經核的成像困境 針對下…
原文:Recent Advances in Hypothalamic Segmentation for Neuroimaging: A Comprehensive Review [REVIEW ARTICLE]
arXiv
全文
★4
2026-04-17
擴散語言模型(DLMs)具備全域修改與平行生成的優勢,卻深陷解碼速度與品質的拉扯。來自中國科學技術大學的研究團隊提出免訓練推理框架 DepCap,不僅在 **LLaDA 系列**模型平均達成 **3.57 倍**速度躍升,更在 **MBPP** 程式碼基準測試中,為 **LLaDA-1.5** 帶來 **5.63 倍…
原文:DepCap: Adaptive Block-Wise Parallel Decoding for Efficient Diffusion LM Inference
arXiv
全文
★4
2026-04-17
復旦大學與中科院提出 **HiCoDiT** 階層式擴散模型,首度將語音階層先驗引入無聲影片轉語音任務。模型經 **261.5 小時**訓練,有效解決跨模態不對稱,並在盲測中取得 **57.0%** 的壓倒性偏好勝率。 突破影片轉語音的跨模態對齊與 RVQ 階層 傳統的影片轉語音技術(VTS)旨在僅依靠視覺線索合成…
原文:Hierarchical Codec Diffusion for Video-to-Speech Generation
arXiv
全文
★4
2026-04-17
讓 AI 生成一段「邊走路邊舉啞鈴」的同時動作序列,成功率往往出乎意料地低。現有文字生成動作(Text-to-Motion)擴散模型在處理這類需求時,常因為特徵過度融合,導致動作相互覆蓋或肢體空間位置混亂。西北大學研究團隊提出的 **Motion-Adapter** 模組,無需成對的複合動作訓練資料,僅靠單一動作庫訓…
原文:Motion-Adapter: A Diffusion Model Adapter for Text-to-Motion Generation of Compound Actions