首页 >>  正文

噪声图

来源:baiyundou.net   日期:2024-09-21

在训练Diffusion模型时,我们可以遵循怎样的阶段?这篇文章里,作者围绕训练Diffusion的过程、应用Diffusion模型阶段等内容做了梳理和讲解,不妨来看一下。

高斯噪声:是一种符合正态分布的随机噪声。

一、训练Diffusion全过程

1. 数据准备

我们准备若干张真实图片作为模型训练和测试的基础数据。这些图片可以是各种类型的图像,如:风景、人物、动物、艺术品等,他们代表了模型需要学习和生成的图像类型。

2. 正向扩散过程

接下来就是对每张真实图片进行“数据扩散处理”,也就是逐渐添加高斯噪声。我们通过一些列连续的时间步(t=1,2,3….T),在每个时间步上向上一步得到的图片添加不同强度的高斯噪声。随着t的增加,噪声强度逐渐增大,图像的细节逐渐被噪声掩盖,知道最终在时间步T时,图像几乎完全被随机噪声覆盖,但仍保留了极其微弱的真实图像痕迹。

时间步具体多少怎么确定?

这个数值一般是一个迭代实验过程得出的,且可能因模型类型、应用场景、可用计算资源等因素有所不同。实践中Diffusion模型可能会使用如:100步、200步、500步等。具体数值会在相关论文、开源代码或实践经验分享中明确给出,实际应用中,我们可以参考这些值在结合自身需求进行适当的调整。

3. 逆向扩散过程 | 学习阶段

在训练过程中,给定一张带有噪声的图像,输入到UNet网络,会生成一个预测噪声图(UNet这块看不太懂可以看下面UNet的介绍),然后用原始噪声图减去预测噪声图,得出减噪后的图像,然后将减噪后的图像在输入到UNet网络,继续做相同的步骤,使其逐步逼近原始图像数据。

总结:

训练Diffusion模型时,首先使用正向扩散过程生成大量带有不同噪声级别的样本对(真实图片与对应时间步的噪声图片),然后使用这些样本对 来训练UNet去噪网络。通过反向传播算法更新网络权重,使网络在给定任何时间步t的图像时,能够准确的预测并去除噪声,逐步逼近真实的图像数据。

二、应用Diffusion模型阶段

逆向扩散过程 | 推理阶段

当模型训练完成后,就可以用来生成新的图像。此时,面对一张模糊的图片,可以直接应用已训练好的逆向扩散过程,即使用模型来预测并逐步去除其上的噪声,以达到增强清晰度的目的。

三、UNet

1. 定义

UNet是一种专门为图像分割任务设计的卷积神经网络,以其U行结构而得名。它包含一个编码器(左半部分),用于特征提取和下采样(缩小图像尺寸),以及一个解码路径(右半部分),用于特征上采样(放大图像尺寸)和重建。在去噪任务中,UNet被用来学习从带有噪声的图像中恢复出原始图像。

2. 作用

在Diffusion模型中,UNet承担着一个特定的任务-预测随机噪声。

UNet被用来逆向估计在给定当前带有噪声的图像的状态下,应该添加或减去什么样的噪声才能更接近原始、无噪声的目标图像。

3. 如何预测噪声?

1)输入有哪些

当前带有噪声的图像:不同阶段可能有所不同,如在Diffusion模型训练阶段,当前带有噪声的图像则是正向扩散后生成的噪声图像;在Diffusion模型使用阶段(图生图情况),当前带有噪声的图像则是用户输入的图片。

时间步信息(可能):可能会接收一个表示当前处于整个去噪过程哪个阶段的额外输入,帮助它勒戒应该去除多少噪声。

2)预测噪声过程

UNet会应用强大的特征提取和重建能力,对输入的带有噪声的图像进行分析。它会通过编码器部分提取图像的多层次特征,这些特征包含了图像的全局结构、局部细节以及噪声分布的线索。接着在解码器部分,UNet会逐步放大特征图,并结合跳跃连接传来的底层细节信息,来预测应该去除的噪声。

3)最终输出什么

UNet的输出是一个与输入图像同样大小的新图,但它不是一张普通的图像,而是一张噪声图,每个像素位置上的值代表了对该位置应该添加或减去的噪声强度(通常为某个范围内的连续数值)。这个噪声图指示了如何调整输入的带噪图像,使其更接近目标的清晰图像。

四、作用/优缺点

1. 作用
  1. 图像修复与增强:模型可以用来去除图像噪声、修复破损部分、甚至提升图像质量。
  2. 图生图
2. 优点
  1. 可以高质量生成:甚至达到难以区分真假的程度。
  2. 灵活性与多样性:可以根据提示词生成各种主题、风格、构图的图像。
  3. 适应多种数据类型:尽管已图像生成而知名,但是也可以应用于音频、视频等其他类型数据的生成
3. 缺点
  1. 计算成本高:去噪过程需要大量的计算资源(CPU、GPU)和内存,对硬件要求高。
  2. 参数调整复杂:模型包含总舵参数,需要精细调整已达到最佳性能,使用者需要有一定的专业知识。
  3. 依赖高质量数据与预处理:模型生成效果的好坏很大程度上取决于训练数据的质量以及预处理方法是否恰当。

本文由 @Luna 原创发布于人人都是产品经理。未经作者许可,禁止转载。

题图来自Unsplash,基于CC0协议。

该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务。

","gnid":"9c07d6b61d4af250e","img_data":[{"flag":2,"img":[{"desc":"","height":"420","title":"","url":"https://p0.ssl.img.360kuai.com/t01b5e8f329d1ecd363.jpg","width":"900"}]}],"original":0,"pat":"art_src_3,fts0,sts0","powerby":"pika","pub_time":1713233100000,"pure":"","rawurl":"http://zm.news.so.com/973cb484d87c79baadc17aa5e7ebd1ec","redirect":0,"rptid":"4c16eae029a9df23","rss_ext":[],"s":"t","src":"人人都是产品经理","tag":[],"title":"深度学习模型——Diffusion

富修徐720如图所示,图甲、图乙是两种声音的波形,从图可知:图甲是______的波形;图乙是______的波形. -
项胜霞19536011693 ______[答案] 结合选项中的声音的波形图可知,甲图中的波形有规律;乙图中的波形没有规律,声音杂乱无章; 故甲图是乐音的波形图;甲图是噪声的波形图. 故答案为:乐音;噪声(或噪音).

富修徐720如图所示,图中A、B、C、D是四种声音的波形图,从图形可知噪声的波形是哪幅图( -
项胜霞19536011693 ______ D 自然界有中各种各样的声音.有的声音听起来优美动人,我们称这类声音为乐音,乐音是由物体做规则振动而产生的;有的声音听起来杂乱刺耳,我们称这类声音为噪声,噪声是由物体做无规则振动产生的.从图形上可以看出,a、b、c三种声音中的振动都是规则的振动,故是乐音;只有d是无规则振动,故是噪声.

富修徐720什么是飞机噪声等值线?
项胜霞19536011693 ______ 飞机噪声等值线是由地面上飞机噪声值相等的各点连成的闭合曲 线.在地形图上于机场周围按规定的递减值(通常 为5dB)描绘一系列飞机噪声等值线,就成为机场飞 机噪声等值线图.有机场飞机噪声现状等值线图和 机场飞机噪声预测等值线图两种.前者通常用声级 计在现场测定;后者则根据预测的飞机机型、各型飞 机的起降架次、飞行程序及飞机噪声距离特性等经 过计算确定.通过这些图可以全面掌握飞机噪声在 机场周围的污染情况,以及拟定治理和控制飞机噪 声污染的措施.

富修徐720初二物理上册声现象第三课时【令人厌烦的噪声】图1 - 18里那些东西分别是什么?
项胜霞19536011693 ______ 空调,鞭炮声,飞机声,吸尘器,电钻,载重车,喷气式发动机,

富修徐720会噪声会严重影响人们的工作和生活,请指出图(5)三幅图片中控制噪声的措施分别属于:甲:______;乙:______;丙:______. -
项胜霞19536011693 ______[答案] 甲图中摩托车的消声器就是在声源处减弱,直接让发出的噪声小一些; 乙图中城市道路的隔音板就是传播过程中让声音反射回去,从而减弱噪声; 丙图中工人用的防噪声耳罩就是从人耳处减弱的,不让或少让声音传入人耳. 故答案为:在声源处减弱...

富修徐720图像噪声的关于噪声 -
项胜霞19536011693 ______ 显示系统的电子噪声会引起显示点亮度与位置两方面的变化. (1)幅值噪声 亮度通道的随机噪声会产生一种“胡椒加盐”效果(即黑白噪声点),在平坦区域中尤其明显可见.前面提到的经验法则指出有效量化级粗略地等于 RMS噪声幅值.如果...

富修徐720噪音NC45什么意思 -
项胜霞19536011693 ______ NC 是是一种噪声评价标准.这个标准主要用于办公室和其他建筑的室内噪声评价.一般用A计权噪声网格图表达. 说得通俗些实际上就是:对噪声进行倍频程的分析,一般取八个频带(63、125、250、500、1000、2000、4000、8000),然...

富修徐720声音是怎样产生的它可以分为几类 -
项胜霞19536011693 ______[答案] 时间以及声音消失直到听不到时需多长时间.所使用的最基本术语有: (一)“上升”:声波从静音达到最大振幅或音量所... 声音的传媒介质有空气.水和固体,它们分别称为空气声、水声和固体声等.噪声监测主要讨论空气声. 人类是生活在一个声音的...

富修徐720声音的噪声 -
项胜霞19536011693 ______ 声音的本质是波动.受作用得空气发生振动,当震动频率在20-20000Hz时,作用于人的耳鼓膜而产生的感觉称为声音.声源可以是固体、也可以是流体(液体和气体)的振动.声音的传媒介质有空气﹑水和固体,它们分别称为空气声、水声和...

富修徐720人们用分贝来划分声音的等级,如图所示,在城市的繁华路段旁常竖有噪声显示装置.图中数字的含义是______.这样的噪声______(填“会”、“不会”)... -
项胜霞19536011693 ______[答案] 据噪声显示装置能看出,此时的噪声是58.6分贝,由于该数值不超过70分贝,故不会影响人们正常的学习和工作. 在深夜时,路上行驶的汽车、摩托车很少,噪声减小,显示装置会减小. 故答案为:58.6分贝;不会;减小.

(编辑:自媒体)
关于我们 | 客户服务 | 服务条款 | 联系我们 | 免责声明 | 网站地图 @ 白云都 2024