计算机毕业设计-基于深度学习的老(旧)照片色彩复原、上色算法模型设计与实现（对抗生成式网络GAN、含Github代码与Web端设计）

图像上色是一个具有挑战性的问题，因为它涉及到多模态不确定性和高度的不确定性。直接训练深度神经网络通常会导致语义色彩错误和低色彩丰富度。尽管基于变压器的方法可以提供更好的结果，但它们通常依赖于手动设计的先验，具有较差的泛化能力，并引入颜色流动效应。为了解决这些问题，本课题设计了一种使用改进的双GAN解码器进行图像着色的端到端方法。本课题的方法包括一个像素解码器和一个基于查询的颜色解码器。前者恢复空间

苯酸氨酰糖化物

2905人浏览 · 2024-05-09 15:04:35

苯酸氨酰糖化物 · 2024-05-09 15:04:35 发布

计算机毕业设计-基于深度学习的老(旧)照片色彩复原、上色算法模型设计与实现（对抗生成式网络GAN、含Github代码与Web端设计）

本篇文章是针对老（旧）照片色彩复原、上色，如果你想对破损图像进行修复，请参考这篇CSDN作品👇

计算机毕业设计–基于深度学习技术（Transformer、GAN）的图像修复算法（含Github代码+GUI与Web端展示界面）

如果要做老照片色彩增强，清晰化，划痕修复，划痕检测，请参考这篇CSDN作品👇

计算机毕业设计–基于深度学习的老照片修复（清晰化+划痕修复+色彩增强）算法设计与实现（含Github代码+GUI+Web端在线体验界面）

✨ Demo_1

在这里插入图片描述

✨ Demo_2

在这里插入图片描述

✨ 网页端效果展示

👇
Web端在线体验地址：✅访问这里进行图像色彩复原算法在线体验✅

在线体验地址已经集成了训练好的模型，您只需点击选择使用的模型即可！

注意：为了节约电费成本：服务器开放时间为每年10月1日到次年7月1日（其余时间上述连接可能不能访问）

📦：在线体验使用方式：
打开连接后，左侧图片输入框需要上传待修复的黑白图。在网页下方提供了六组测试样例，您可点击样例使其自动填充到相应位置后点击提交按钮等待上色结果。

注意： 修复第一张图的时候耗时较长，大约10秒左右。从第二张图开始，速度就会快起来，大约3秒左右一张（这主要是因为第一次启动的时候模型需要加载进显卡中，同时，我服务器端网络速度也对响应有一定影响）
在这里插入图片描述

介绍

图像上色是一个极具挑战的问题，因为它涉及多模态不确定性和高复杂度的不确定性。直接训练深度神经网络往往会导致语义色彩错配和低色彩丰富度。尽管基于 Vision Transformer 的方法能够生成更优质的结果，但它们通常依赖手动设计的先验，表现出较差的泛化能力，并容易引入颜色流动效应。为了解决这些问题，本课题提出了一种基于改进的双GAN解码器的端到端图像上色方法。

该方法包括一个像素级解码器和一个基于色彩还原查询的颜色解码器。像素级解码器恢复图像的空间分辨率，而颜色解码器则利用丰富的视觉特征进行精细的颜色还原，从而避免了对先验知识的依赖。通过交叉注意机制，这两个解码器在颜色与多尺度语义表示上进行协同工作，有效减少了颜色流动效应。此外，本研究还引入了一种简单而有效的颜色损失函数，以增强色彩的丰富度。实验证明，该模型在效果、上色速度和质量方面均优于传统的基于机器学习的模型。

🚀 算法获取

Giuhub链接：老照片色彩复原Github
Gitee链接：老照片色彩复原Gitee

PS：如果通过Github访问项目，请不要通过“加速通道”访问，因为加速通道中的项目版本可能比较老

⚡️开始

环境配置（推荐使用conda安装环境）

# 从github上Clone项目
git clone https://github.com/zxx1218/Image-coloring.git

# 使用conda创建环境
conda create -n py310 python=3.10
conda activate py310

# 安装依赖
pip install -r requirements.txt

方式一：启动Web端交互界面

启动web端（会启动在127.0.0.1:xxxx的本机环回地址下)

#运行基于Gradio框架的前端页面
python gradioDemo.py

回车后会自动启动Web服务，在浏览器打开即可访问，在控制台看到如下信息代表成功启动👇
在这里插入图片描述
注：项目也支持进行基于Python的FastApi后端服务部署（针对Web服务器部署）。如有需要，联系作者，联系方式在文末

方式二：通过控制台（cmd \ 终端）进行批量修复

只需将需要上色复原的的图片全部放在./assets/test_images下，然后运行程序即可

# 命令行命令
python predict.py --img_path=./.....

算法模型使用演示视频（Web前端 & 控制台）

效果同在线体验链接，时间原因，待作者整理后上传

🔧 如何自己训练模型?

训练自己想要的定制化图像修复模型只需要准备好针对需要上色图片的同类型图片数据即可，具体训练方式请咨询作者

⭐️作者联系方式：

VX：Accddvva
QQ：1144968929
Github提供训练好的模型文件以及调用该文件进行上色的测试代码（Github开源代码中不含模型定义源码和训练代码，但提供可供测试的模型文件，拉取Git代码后安装环境可进行修图测试）
该项目完整代码 + 详细环境配置（如有需要可提供模型远程部署）+ Web端 + 训练方式 == 价格300RMB
如果你的电脑没有合适的GPU，或需要自行训练私有数据而自己的GPU显存不够，作者另提供GPU服务器免费使用服务（到当年6月底毕业季结束），免费提供60G显存+256G内存云服务器（可使用Vscode、OpenSSH、PuTTY、Xshell、SecureCRT、MobaXterm等远程工具连接）

一些模型训练可用的公开数据集

人脸（提供训练过的模型文件）公开数据集CelebA-HQ：链接：https://github.com/tkarras/progressive_growing_of_gans
制作机构：Tero Karras, Samuli Laine, Timo Aila 和 NVIDIA 的研究人员制作-内含约4万张训练图片
自然场景（提供训练过的模型文件）公开数据集Places2：链接：http://places2.csail.mit.edu/download.html
制作机构：斯坦福大学和微软研究院共同制作-内含180万张训练图片
街景公开数据集Paris StreetView：链接：http://opendata.paris.fr/explore/dataset/photos-de-rue-a-paris/
制作机构：巴黎市政府
文理公开数据集DTD：链接：http://www.robots.ox.ac.uk/~vgg/data/dtd/。
制作机构：英国牛津大学计算机视觉研究团队
建筑公开数据集Façade：链接：
GitHub上的项目：https://github.com/shannontian/facade-parsing
官方网站：CMP Facade Database
数据集共享平台：https://www.vision.ee.ethz.ch/datasets_extra/facade/
制作机构：Czech Technical University in Prague (捷克技术大学)

作者于浙江某985高校就读人工智能方向研究生(CSDN已认证)，可以定制模型，并提供相应技术文档以及各种需要，只需要描述需求即可
人工智能、深度学习领域，尤其是计算机视觉（Computer vision，CV）方向的模型or毕业设计，只要你想得出，没有做不出

九章云极普惠算力

更多推荐

混合精度训练革命：happy-llm如何用16位浮点数实现效率与精度双赢

在大语言模型训练领域，混合精度训练已经成为提升训练效率的关键技术。通过巧妙结合16位和32位浮点数，happy-llm项目展示了如何在保证模型精度的同时，显著降低显存占用并加速训练过程。## 什么是混合精度训练？混合精度训练是一种结合不同精度浮点数进行深度学习训练的技术。它主要使用16位浮点数（FP16或BF16）进行前向传播和反向传播，同时保留32位浮点数用于关键的权重更新操作。[!

九章云极普惠算力

Zero邮件备份恢复：数据丢失预防与恢复的完整方案

在数字化时代，邮件数据安全已成为企业和个人用户面临的重要挑战。Zero开源邮件应用提供了一套完整的邮件备份恢复方案，通过智能数据保护机制确保您的邮件信息安全无忧。无论您是担心误删重要邮件、系统故障导致数据丢失，还是需要长期归档关键通信记录，Zero的备份恢复功能都能为您提供可靠保障。## 🔒 数据丢失预防：多重保护机制Zero邮件应用内置了**乐观更新机制**，在用户执行操作时立即提供视

九章云极普惠算力

突破推理瓶颈：vLLM多模态时空决策系统重构智慧城市规划流程的完整指南

在当今智慧城市建设的浪潮中，vLLM多模态时空决策系统正以其卓越的高吞吐量和内存效率，彻底重构传统城市规划流程。作为专门为大型语言模型设计的推理和服务引擎，vLLM通过创新的架构设计，解决了传统AI系统在处理复杂时空数据时的性能瓶颈，为城市规划者提供了前所未有的决策支持能力。## 🚀 vLLM多模态时空决策系统的核心优势vLLM多模态时空决策系统采用了分层架构设计，从模型引擎到分布式计算