时间:2023-04-06 09:40:55 | 浏览:369
机器之心报道
机器之心编辑部
今晚实在是有些热闹。
一边英伟达 GTC 正在进行中,一边谷歌正式开放了 Bard 的测试,这里微软必应也不甘寂寞。
今日,微软正式宣布,必应搜索引擎接入了 OpenAI 的 DALL·E 模型,增加了 AI 生成图像的功能。
也就是说,在接入 ChatGPT 之后,必应再次强化,Bing Image Creator 能够让用户用 DALL·E 模型生成图像。
「对于拥有必应预览版权限的用户,Bing Image Creator 将完全集成到必应聊天体验中,首先在创意模式下推出。」微软消费者营销主管 Yusuf Mehdi 解释道。「通过输入图像描述,提供位置或活动等额外语境,选择艺术风格,Image Creator 将根据用户的想象生成图像。」
必应具有三种响应模式:创意模式、平衡(balanced)模式和精确(precise)模式。创意模式下必应生成的结果通常是「原创和富有想象力的」,而精确模式则倾向于准确性和相关性,以获得更真实和简洁的答案。目前 Image Creator 只能在创意模式下使用。
值得一提的是,即使没有必应预览版的使用权限,用户也可以通过直接访问 bing.com/create 单独使用 Image Creator 来尝试其图像生成功能,目前仅支持英文输入。微软表示,随着时间的推移,它将支持更多的语言输入。
此外,微软今天还在必应中推出了新的 AI 支持的视觉故事(visual Stories)和 Knowledge Cards 2.0。
我们简单为大家梳理介绍下 OpenAI 文本生成图像的 DALL·E 系列研究。
2021 年 1 月 6 日,OpenAI 博客发布了两个连接文本与图像的神经网络:DALL・E 和 CLIP。DALL・E 可以基于文本直接生成图像,CLIP 则能够完成图像与文本类别的匹配。这两项研究的发布,引起了社区极大的关注。
据博客介绍,DALL・E 可以将以自然语言形式表达的大量概念转换为恰当的图像,可以说是 GPT-3 的 120 亿参数版本,可基于文本描述生成图像。
DALL・E 示例。给出一句话「牛油果形状的椅子」,就可以获得绿油油、形态各异的牛油果椅子图像。
2 个月后,DALL·E 的论文和代码公开。
项目地址:https://github.com/openai/DALL-E
论文地址:https://arxiv.org/abs/2102.12092
2022 年 4 月 7 日左右,DALL・E 迎来了升级版本 ——DALL・E 2。与 DALL・E 相比,DALL・E 2 在生成用户描述的图像时具有更高的分辨率和更低的延迟。并且,新版本还增添了一些新的功能,比如对原始图像进行编辑。
OpenAI 还公布了 DALL・E 2 的研究论文《Hierarchical Text-Conditional Image Generation with CLIP Latents》。
论文地址:https://cdn.openai.com/papers/dall-e-2.pdf
此次必应接入的 DALL・E 应该是经过更新迭代的。这在一定程度上,弥补了当前 ChatGPT 在跨模态生成方面缺失的体验。不过等到 GPT-4 多模态能力开放后,也许能为我们带来更多新的体验。
最后提一句,今日还有一项生成式 AI 的发布引起了业内人士的关注与讨论。
那就是 Adobe 发布 Firefly。这是一系列用于创意表达的生成式 AI 模型,让用户可以通过键入命令快速修改图像。目前,Firefly 开放了测试版本,感兴趣的读者可以申请体验。
如今看来,生成式 AI 这场游戏有越来越多的玩家涌入,竞争也变得越来越激烈。
参考链接:
https://blogs.microsoft.com/?p=52560769
https://www.theverge.com/2023/3/21/23649943/microsoft-bing-openai-dall-e-image-creator-ai
机器之心报道机器之心编辑部今晚实在是有些热闹。一边英伟达 GTC 正在进行中,一边谷歌正式开放了 Bard 的测试,这里微软必应也不甘寂寞。今日,微软正式宣布,必应搜索引擎接入了 OpenAI 的 DALL·E 模型,增加了 AI 生成图像
今天凌晨,OpenAI 发布了多模态预训练大模型 GPT-4。眼花缭乱的技术迭代和全新功能毫无疑问再次带给我们巨大震撼,但在冷静之后,本次发布的一些细节也让我们感到担忧:这家将“open”写在公司名称里的科技企业,似乎正在朝着close的方
OpenAI是全球最著名的人工智能研究机构,发布了许多著名的人工智能技术和成果,如大语言模型GPT系列、文本生成图片预训练模型DALL·E系列、语音识别模型Whisper系列等。由于这些模型在各自领域都有相当惊艳的表现,引起了全世界广泛的关
机器之心报道编辑:杜伟OpenAI 创建的 Gym 是开源的 Python 库,通过提供一个用于在学习算法和环境之间通信的标准 API 以及一组符合该 API 的标准环境,来开发和比较强化学习(DL)算法。自推出以来,Gym 的 API 已
日前,微软子公司 Nuance Communications(下称 Nuance)推出全自动临床文档应用程序 Dragon Ambient eXperience(DAX)Express,这是第一款由 OpenAI GPT‑4 提供支持的医疗
出品 | 搜狐科技编辑 | 罗涵艺今天是3月15日星期三,昨日今晨,科技圈有哪些大事发生,请关注今日科技早报。今天重要的科技新闻有:1.韩国2月半导体出口额下降41.5%2.马斯克回应“特斯拉叫停与比亚迪合作”3.华为回应成功开发出芯片堆叠
3月13日,熵基科技接受机构调研时表示,公司在与微软的OpenAI的合作,处于合作接洽阶段。有机构提问:“新的机器视觉,人工智能及包括接入OpenAI的功能,什么时候可以看到大致的Demo?”对此,熵基科技表示,目前尚处于技术储备和研究,即
【熵基科技:与微软的OpenAI处于合作接洽阶段】财联社3月13日电,熵基科技接受机构调研时表示,公司在与微软的OpenAI的合作,处于合作接洽阶段。
IT之家 3 月 23 日消息,自 ChatGPT 风靡全球后,AI 版权问题就成为近来国外争论不休的一个焦点。据华尔街日报报道,AI 技术的发展已经引发了新闻出版业的不满,他们认为自己的内容被大型科技公司用于训练 AI 模型而没有得到合理
界面新闻记者 | 程璐界面新闻编辑 | 趁着OpenAI的话题热度仍风靡全球之际,微软火速上线了Azure OpenAI企业级服务,试图再次撬动云计算这一优势战场。3月3日,在2023微软Azure中国年度技术峰会上,微软大中华区首席运营官
观点网讯:据万科周刊官微3月9日消息,万科开始尝试将GPT语言模型应用在业务中。近期万科完成与微软Azure Open AI合作落地,在客户反馈分析平台搭载GPT-3,为行业发展打开广阔空间。据悉,微软Azure是Open AI独家云服务提
IT之家 3 月 22 日消息,IT之家从 Azure 云科技微信公众号获悉,微软今天宣布企业级 Azure OpenAI GPT-4(国际预览版)服务发布。已经使用企业级国际版 Azure OpenAI 服务的客户和合作伙伴可以申请访问
一家不以盈利为目的的公司,该如何长久地运转下去?4 年前,伊隆·马斯克(Elon Musk)等诸多硅谷大亨在成立非营利性组织 OpenAI 时,显然都低估它所需要的人力和资金。微软今天宣布,将向 OpenAI 投资 10 亿美元,以协助其开
萧箫 发自 凹非寺量子位 报道 | 公众号 QbitAI微软获OpenAI GPT-3独家授权,马斯克不高兴了。就在微软官宣GPT-3后一天,马斯克在社交媒体上吐槽此事:“这看起来像是与‘开放’相悖。OpenAI本质上已经被微软‘控制’了。