本文来自作者[巴金揪]投稿,不代表卓思号立场,如若转载,请注明出处:https://www.nc-sczs.cn/wiki/202505-2426.html
文本到图像人工智能程序a and and the and the and the nothing。确实,像DALL-E这样的现有神经网络给我们留下了深刻的印象,它们能够从简...
文本到图像人工智能程序a and and the and the and the nothing。确实 ,像DALL-E这样的现有神经网络给我们留下了深刻的印象,它们能够从简短但描述性句子中产生简单的,逼真的图像 。
但是本周我被介绍给了成像。Imagen由Google Research&Rsquo os rsquo os the开发 ,与DALL-E和LDM相似。但是,Imagen的脑团队的目标是使用相同的简短和描述性句子的方法来创建它们,以更高的准确性和忠诚度生成图像 。
这样的句子的一个例子就是–根据Imagen网站上的演示;“一张模糊的熊猫的照片 ,戴着牛仔帽和黑色皮夹克在山顶上骑自行车。 ”这是一个非常嘴巴的,但是该句子的结构是使AI可以将每个项目识别为自己的标准的方式。
你可能喜欢
什么是Imagen 3:您需要了解的有关Google文本对图像模型的所有信息
我以深刻的形象使涂鸦栩栩如生,就像有魔术画笔
Chatgpt的新AI图像功能真是太神奇了,但是他们非常沮丧 ,以至于我想将笔记本电脑扔到垃圾桶中
然后,AI将句子的每个段分析为一大批信息,并试图产生与该句子尽可能紧密相关的图像 。除非到处都有一些不畅通或奇怪的事物 ,否则影像员可以以惊人的快速和准确的结果来做到这一点。
影像员可以比我绘制更好。(图片来源:Google / Imagen)
有点太健康吗?
如果您为自己检查了成像人或其他神经网络,那么您可能会注意到,您可能会注意到对精选主题的压倒性关注。例如 ,Dall-E喜欢根据日常家居用品(例如时钟或厕所)创建图像 。至少目前,成像人似乎使可爱的动物处于其图像生成能力的最前沿。但是,实际上 ,这是一个很好的理由。
Google的大脑团队并没有回避Imagen保持相对无害的事实 。作为一个相当冗长的免责声明的一部分,该团队非常意识到,神经网络可用于产生有害内容 ,例如种族刻板印象或推动有毒意识形态。Imagen甚至利用已知包含这种不适当内容的数据集。
Brain Team指出:“虽然我们的一部分培训数据被过滤以消除噪音和不良内容,例如色情图像和有毒语言,”我们还利用了Laion-400m数据集,其中已知包含多种不适当的内容 ,包括色情图像,种族主义污垢,种族主义污垢 ,和有害的社交刻板印象 。
获得每日洞察力,灵感和收件箱中的交易
报名报名,以获取新闻 ,评论,意见,顶尖的技术交易等等。与我联系我的新闻和其他品牌的新闻和要约 ,代表我们值得信赖的合作伙伴或赞助人,或赞助您同意您同意条款,条件和隐私政策的信息 ,并享年16岁。
“成像人依赖于经过未经过的网络尺度数据训练的文本编码器,从而继承了大型语言模型的社会偏见和局限性 。”
这是我与成像人一起制作的不太奇怪的照片之一。(图片来源:Google / Imagen)
这也是Google&rsquo's Brain Team没有计划发布图像供公众使用的原因,至少直到可以进一步开发“保障 ”。防止AI用于邪恶目的 。结果,网站上的预览仅限于几个手工挑选变量。
最终 ,这是正确的电话。过去有一个例子,即AI程序被释放到在线公众和地狱中;结果极为不良。您可能还记得Microsoft和Rsquo tay,这是一个大约五年前带到社交媒体平台的AI Twitter帐户 。
Tay是Microsoft的一部分很棒的实验。它的目的是查看AI在社交媒体环境中如何反应并与真实的人互动。但是 ,在几个小时之内,Tay从一个有益健康的聊天机器人转到了反犹太讲话点的分配器 。尽管机器人是“建模,清洁和过滤”的 ,但这是根据Microsoft(感谢The Verge)。
鉴于AI之类的先例,因此很容易看出为什么要统治成像人。显然,即使是大量的过滤也可能还不够 。
还不是完美的
虽然我对成像人留下了深刻的印象 ,并且有很多有趣的混合和匹配句子来创建各种奇怪的图片,但我绝对不是我认为绝对令人信服的东西。至少目前还没有。
Imagen通常会返回一些令人恐惧的结果 。尤其是动物通常以各种古怪的比例出现。看到浣熊头有巨大的头,或者像人一样的围栏手臂 ,是一个很常见的景象。虽然非常有趣,但这些奇特的结果与摄影现实主义融为一体,经常引起令人不安的不可思议的结果 。
生产油画的选择实际上是一个更具说服力的选择,而Imagen能够在这里产生的大部分产品都不会在学校项目中看起来不合时宜。我的意思是以最好的方式。事实证明 ,一只弹奏吉他的波斯猫比逼真的照片更具说服力地翻译成一幅画。
如前所述,我们很有可能很快就会赢得公开发行Imagen 。或者,就此而言。AI程序和神经网络能够产生不愉快内容的风险仍然太大了。但是 ,目前,对于那些希望花费一些时间来产生有趣的牛仔帽子戴着帽子的动物滑板在山上的人来说,我很满意成像是一个有趣的小库里奥 。
赞 (12)
评论列表(4条)
我是卓思号的签约作者“巴金揪”!
希望本篇文章《我尝试了Google的文本对图像AI,对结果感到震惊》能对你有所帮助!
本站[卓思号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育
本文概览: 文本到图像人工智能程序a and and the and the and the nothing。确实,像DALL-E这样的现有神经网络给我们留下了深刻的印象,它们能够从简...