当前位置：首页 > 人工智能 > 正文内容

InstructIR：按照人类指令进行高质量图像恢复

二向箔2024-02-24 15:17:02人工智能163

你只需要使用文字描述就能修复和改善图片

比如说，如果你有一张因为雨滴而看起来模糊的照片，你可以告诉它：请去掉照片上的雨滴，但保持图片内容不变”，它就能自动帮你操作。

它能够处理包括去噪、去雨、去模糊、去雾以及（低光）图像增强等问题。

主要功能：接收图像和人类书面指令作为输入，根据这些指令对图像进行改善；支持多种图像恢复任务，包括去噪、去雨、去模糊、去雾和图像增强；实现了状态最先进的恢复效果，提供了高质量的图像输出。

工作原理：

InstructIR使用一个文本编码器将人类提供的自然语言指令转换为模型可以理解的向量表示。这些指令明确指导模型关注图像的哪些退化问题，并提供改善的方向。

全能图像恢复模型：采用NAFNet作为图像恢复的核心模型架构，它是一个高效且性能卓越的图像处理网络。NAFNet能够处理多种图像退化类型，为全方位图像恢复提供支持。

指令条件块（ICB）：InstructIR引入了ICB来实现任务特定的转换，根据文本编码器输出的指令向量，ICB能够调整图像模型的处理流程，使模型能够针对具体的退化类型进行专门的恢复处理。

多任务学习与任务路由：通过利用任务路由技术，InstructIR能够在单一模型中学习并执行多种图像恢复任务。模型根据输入的人类指令自动判断需要执行的任务类型，并采取相应的恢复策略。

项目地址：https://mv-lab.github.io/InstructIR/

GitHub：https://github.com/mv-lab/InstructIR/

在线演示：https://huggingface.co/spaces/marcosv/InstructIR

扫描二维码推送至手机访问。

本文链接：http://www.erxbo.com/post/1654.html

分享给朋友：

返回列表

上一篇：基于 OpenAI 的聊天开源框架，同时与多个大模型对话

下一篇：OOTDiffusion - 一个高度可控的 AI 试衣工具

“InstructIR：按照人类指令进行高质量图像恢复” 的相关文章

Stability AI 发布开源视频生成模型「Stable Video Diffusion」

用图片生成视频效果很惊艳SVD 支持文本和图像生成视频，还支持物体从单一视角到多视角的转化；目前最高支持生成 14/25 帧、576 x 1024 分辨率的视频尽管 SVD 还处于基础阶段，但是相信未来一定会成为像 SDXL 一样的顶级开源 AI 模型GitHub地址：https://github....

基于GPT-4 和 DALL-E 3，轻松将网页截图转化成代码

截图转代码该项目基于 GPT-4 Vision 和 DALL-E 3，它可以将网页截图转换为 HTML/Tailwind/JS 代码重点：使用需要自备拥有 GPT-4 Vision 权限的 OpenAI APIGitHub开源地址：https://github.com/abi/scree...

Pika Labs 推出视频生成模型 Pika 1.0

以图片生成视频，未来的重量级选手Pika Labs 推出视频生成模型 Pika 1.0Pika 1.0 整体是个重大产品升级，包括一个新的 AI 模型，能够生成和编辑 3D 动画、动漫、卡通和电影等各种风格的视频。允许用户上传自己的视频来局部编辑与重构场景，比如为画面中的人物更换衣物，为视频中的猩猩...

GPT 学术优化 - 一个专注优化论文的 AI 工具

该工具可以为你的论文提供一键润色、一键中英互译、一键代码解释、生成分析报告、PDF翻译等强大功能；内置 ChatGTP 多版本模型以及 Claude2，功能很强大，还可接入国内众多大模型如图中展示的就是让工具分析一个完整的 Python 项目GitHub地址：https://github.com/...

GPT Crawler - 将网站变成自定义 GPT

运行该项目，输入网址，然后项目会爬取该网站所有内容并生成 Json 文件，然后它会将该文件喂给 ChatGPT，打造个人知识库或者智能助理我感觉非常实用，尤其是面对密密麻麻的英文开发文档之时，可以直接与其对话GitHub地址：https://github.com/BuilderIO/gpt-craw...

Stability AI 推出了新一代实时生成图像模型「Stable Diffusion XL Turbo」

SDXL Turbo 是 SDXL 1.0 的改进版本现在你只需要在文本框中输入你的想法，SDXL Turbo 就能够迅速响应生成图像，快如闪电但是生成人脸还是有点差强人意，而且中文prompt不太行，虽然生成的很快，但是不能真正理解中文的意思，需要使用英文prompt，生成的会准确一些体验地址1：...