MiniGPT-4 | AI看图聊天
美国
AI对话
MiniGPT-4 | AI看图聊天

MiniGPT-4上传图片并用自然语言与他们聊天,Demo开放在线可玩!

在线 Demo:

https://minigpt-4.github.io

开源代码:

https://github.com/Vision-CAIR/MiniGPT-4

论文:

https://github.com/Vision-CAIR/MiniGPT-4/blob/main/MiniGPT_4.pdf

参考链接:

比OpenAI更快一步,开源的MiniGPT-4模型可让开发者提前感受GPT-4识图能力!

https://www.chinaz.com/2023/0419/1516992.shtml

 

拥有和 GPT-4相似的图片解析功能

该研究团队推出的 MiniGPT-4拥有和 GPT-4相似的功能。譬如:

给它一张图,便能生成详细的图像描述:

也能讲出图片中搞笑、有趣的部分:「星期一通常被认为是一周中最令人恐惧的一天」。

还能在进一步交互中发现不寻常的内容,如:虽然仙人掌有可能在寒冷的气候条件下生长,但很少看到仙人掌生长站在冰冻的湖泊中间。此外,水面上形成的大冰晶也不是常见的现象。

于是,MiniGPT-4给出了自己的见解:这张图片很可能是数字创作或操控的。

当然,和 GPT-4演示的一样,MiniGPT-4也能根据手绘草图生成网站:

识别图像中的问题并提供解决方案:

以及创造诗歌或说唱歌曲的灵感:

此外,也能根据图片续写故事,给产品做广告,对图像展现的画面进行评论、检索与图片有关的事实,以及当给定一张准备好的菜肴照片时,该模型可以输出(可能)与之匹配的食谱或者生成一个适合视障人士的图像描述。

相关导航