日韩综合网-日韩综合网站-日韩综合一区-日韩综合在线视频-色涩网站-色涩网站在线观看

Cloud&AI
`
2025/6/24 09:03
蘋果另辟蹊徑:利用“歸一化流”技術打造 AI 生圖模型
0
0

業界通常使用擴散模型或自回歸模型來研發 AI 生圖模型,蘋果公司近期發布的論文顯示該公司正在選擇一條被“遺忘”的歸一化流(Normalizing Flows)技術路線研發相應模型。

據介紹,這一“歸一化流”技術是一種通過學習數學變換的方式,將真實世界的數據(如圖像)轉換成結構化噪聲,并再將噪聲還原為圖像樣本的生成模型。其最大優勢是能夠精確計算生成圖像的概率,這是擴散模型無法做到的。這一特性使得歸一化流在對概率要求較高的任務中具有獨特吸引力。不過此類模型并不常見,原因在于其研發成本更高,同時早期采用相應技術生成的模型往往相對模糊、缺乏細節

參考蘋果公司《Normalizing Flows are Capable Generative Models》論文,其推出一種名為 TarFlow(Transformer AutoRegressive Flow)的新型歸一化流技術模型,該模型的核心思路是將一張待生成的大圖拆成“小區塊”,再以相應區塊為單位進行生成一系列像素值,每一塊圖像像素值的生成都依賴于前面已生成的部分,繼而形成完整的圖像,因此能夠有效避免圖像被壓縮為固定詞匯表時產生的質量損失與表現僵化的問題。

當然,TarFlow 在生成高分辨率圖像方面仍存在局限,這就引出了第二篇研究《STARFlow: Scaling Latent Normalizing Flows for High-resolution Image Synthesis》。

參考這篇論文,蘋果在 TarFlow 的基礎上進一步提出了增強版本:STARFlow(Scalable Transformer AutoRegressive Flow)

該模型最大的改進在于,它不再直接在像素層面生成圖像,而是在“潛空間”(latent space)中工作,首先生成圖像的壓縮表示,再通過解碼器進行放大還原。因此模型可無須再預測數百萬個像素值,而是先處理圖像的大體結構,細節部分留給解碼器進行補充,從而在不損失質量的前提下提升生成效率

此外,STARFlow 還改進了對文本提示的處理方式。它不再內建專用文本編碼器,而是支持調用現有語言模型(例如谷歌推出的小語言模型 Gemma,理論上可以直接在設備上運行)來處理用戶的語言指令。這樣一來,模型的圖像生成部分可以專注于圖像細節的生成與優化。

免責聲明:本文僅代表作者個人觀點,與C114通信網無關。其原創性以及文中陳述文字和內容未經本站證實,對本文以及其中全部或者部分內容、文字的真實性、完整性、及時性本站不作任何保證或承諾,請讀者僅作參考,并請自行核實相關內容。

給作者點贊
0 VS 0
寫得不太好

C114簡介     聯系我們     網站地圖

Copyright©1999-2025 c114 All Rights Reserved 滬ICP備12002291號-4

C114通信網版權所有 舉報電話:021-54451141 用戶注銷

主站蜘蛛池模板: 欧洲精品一区二区三区在线观看 | 精品欧美亚洲韩国日本久久 | 99视频精品在线 | 久久精品道一区二区三区 | 亚洲第一免费网站 | 亚洲黄色免费网址 | 68久久久久欧美精品观看 | 亚洲精品字幕一区二区三区 | 成人午夜在线观看国产 | 久久小视频 | 成人a毛片手机免费播放 | 九九久久久 | 在线播放国产真实女同事 | 久久久久久久久免费影院 | 亚洲欧美日韩在线线精品 | 成人欧美视频在线观看播放 | 亚洲第一页在线视频 | 国产欧美综合在线一区二区三区 | 国产日韩一区二区三区在线播放 | 看性过程三级视频在线观看 | 欧美日韩一区二区三在线 | 欧洲美女a视频一级毛片 | 国产国产人免费人成成免视频 | 中文字幕一区日韩在线视频 | 国产三区视频在线观看 | selaoban在线视频免费精品 | 久久久久久一级毛片免费无遮挡 | 日本一区二区三区免费视频 | www.欧美成人 | 九九九免费视频 | 亚洲成人黄色在线观看 | 91亚洲国产成人久久精品网址 | 香港全黄一级毛片在线播放 | 久久久久国产精品免费网站 | 色樱桃影院亚洲精品影院 | 国产精品日韩欧美一区二区 | 国产成人免费高清在线观看 | 欧美午夜在线 | 国产精品高清久久久久久久 | 亚洲精品男人天堂 | 在线精品国产三级 |