拒绝生成新年加班场景?谷歌 AI 说这是“不安全”和“有风险”的
2024-02-07 17:25
巴比特
2024-02-07 17:25
订阅此专栏
收藏此文章

图片来源:由无界 AI 生成


前两天,谷歌 Gemini 又双叒叕公布了些新动向,给自家的 Bard 聊天机器人更新了文生图功能。


说实话,硅基君是有些失望的,Gemini 一向在对抗 OpenAI 这事上被看做“全村的希望”,可这文生图功能去年 10 月就被整合进 ChatGPT 了。


五个月时间过去,谷歌又慢了一大步。


不过咱们还是先试试效果如何。


相比 ChatGPT 要开会员才能用上的 DALLE-3,Bard 可以免费用。


白嫖当然要第一时间赶到现场,可是没想到出师未捷直接被 Bard 原地拒绝了。


原因是春节加班属于不安全或者有风险的场景。



不能加班,只能帮我生成一个“喜庆”或“中立”的工作环境图片,结果就来了下面这图:



嗯,除了喜庆,其它的关键词那是八竿子打不着。


同样的话术交给 GPT4 试试。



不仅生图质量离谱,拒绝用户的理由还五花八门。


Bard 觉得新年加班工作是不存在的,大家都应该在享受假期…它要努力做一个尊重各种文化和传统的机器人。


来源:微博


所以谷歌到底更新了个啥?


2 月 1 日,谷歌官方博客连发两篇文章,一篇介绍了它们最新的文生图模型 Imagen 2,不仅对生图质量和提示词理解进行了优化,还特别加上了肖像隐私保护和低俗内容限制。


而且针对外媒最近热论的 AI 造假风波,谷歌还特贴心的给自己的生图模型加上了 SynthID 技术。


也就是在不影响人肉眼看图的前提下,给生成的图片加一个数字水印,用来判断图片来源。



另一篇介绍了 Bard 的两大更新:Bard 使用的模型 Gemini Pro 从只支持英语扩展到支持 40 多种语言、Bard 可以用 Imagen 2 生成图片了。



多语言支持终于来了,语言门槛消除。


然而当网友兴冲冲跑去找 Bard 生图时,却发现它听不懂中文的提示词。


来源:小红书


不过这里的原因还真不是敏感词也不是歧视,是因为 Bard 目前只能通过英文的提示词生图…



谷歌这波更新真的迷惑性很强,因为大家看到的重大更新就是支持更多语言(包括中文)和文生图。


但是谁能想到 Bard 的聊天功能是 Gemini Pro 提供的,画图功能是 Imagen 2 提供的,增加多语言支持的只有前者,后者还是只能用英文。


多加一个提示词自动翻译成英文再喂给 Imagen 2 很难吗?非要用这么不顺畅的体验来折磨用户…


有了前车之鉴,我们直接用中文要求 Bard 写英文提示词,然后再复制粘贴测试生图效果。



首先是独自吃年夜饭:李独自坐在餐桌前,周围摆放着本应为家庭盛宴准备的未动过的菜肴,她看着电视上的春节联欢晚会,节日的氛围反而更加凸显了她的孤独。



内容和情绪捕捉的还算到位,把那种不甘的苦闷都刻在了脸上。


但是能看出来文字还是没优化过的,春联上的字跟乱码没区别,而且画风从照片到写实油画到像素风跳跃有点大。


还有右上这位老人家,就算是风吹日晒肤色也太深了…


独自看春晚:王坐在沙发上,周围是空啤酒罐和外卖盒子,他带着勉强的笑容看着春节联欢晚会,试图用这种方式淹没独自度过假期的空虚感。



提示词里性别明明是男,Bard 生成出来两男两女,而且明显有一个人种已经不同了。


开始合理怀疑第一轮里右上的老人家,难道血统不同?


还有奇怪的一点是女性人物的脸部细节明显处理得更好,而男性的两只眼睛总朝着不同的方向看。


独自辞旧迎新:陈站在阳台上,看着烟花点亮夜空,泪水在她的眼中涌动,她渴望与亲人分享这一刻,而她周围的寂静与其他地方正在进行的欢乐庆典形成了鲜明对比。



这次性别倒是都对了,但是等等,怎么出现了陈姓的黑人姐妹?


虽然有可能是中非混血,爸爸是姓陈的中国人…Bard 的内心戏是不是也太多了点。


现在大概实锤了,第一轮里右上肤色异常深的老人家应该是非洲血统。


独自许下新年愿望:晓坐在昏暗的房间里,借着烛光写下她的新年决心,摇曳的火焰在墙上投下跳跃的阴影,这鲜明地提醒着她孤独的状态,但同时也为即将到来的一年提供了一线希望。



看着前三张生成完我们的内心是放松和喜悦的,场景、人物、情绪、氛围都很到位,细节也不错。


直到第四张画风明显不同的黑妹子出现……不得不说 Bard 在让非洲人过上中国年这件事情上,是有点执念的。


reddit 网友同样碰到了 Bard 生图的人种问题,只不过跟上面恰恰相反。



所以说只要明确提到种族就是涉嫌歧视,然而在人家特定文化背景下混入其他种族就是可以的。


这网飞无视历史背景和原著跨种族选角的本领,被 Bard 偷师了。


不过谷歌向来在聊天机器人的言论倾向上格外谨慎,早早在内部设立了“AI 伦理部”,专门用来审核机器人是否会在跟人类沟通时产生歧视性语言或仇恨言论。


谨慎小心可以理解,毕竟机器人要是说错了话,受损的是公司形象和市值。


但是谨慎过头变成功能阉割了就很让用户恼火。


最后忍不住让 Bard 画了一下春运火车站的场景,它还真抓住了“人多”这个精髓。


但是人一多作画就完全崩坏了,所有人的脸都不能看。




不看大图,猛一看小图跟这几天虹桥的盛况也蛮相似。


来源:微博


谷歌也知道自己做的不够好,于是拼命的小步快跑。


2 月 3 日,网友在推特上爆料谷歌将在 2 月 7 日正式把 Bard 改名为 Gemini。


来源:推特


一同传出来的更新还包括:


  • Gemini 将推出一个高级的付费版本 Gemini Advanced


  • 会率先推出 Gemini 安卓 App,跟邮件、地图、YouTube 等应用打通,提供更好的 AI 手机体验

  • 加拿大地区的用户终于也能用上 Gemini 了


推特网友对谷歌把安卓放在第一很激动……然而这摆明了是谷歌给自己亲儿子 Pixel 系列准备的。


来源:推特


reddit 网友则表示谷歌你终于开窍了。


来源:reddit


ChatGPT 虽然算不上什么好名字,但是 ChatGPT 作为应用名称,模型以 GPT-X 格式来命名,大家都比较好懂。


而 Bard 背后的模型已经彻彻底底换过三次:LaMDA、PaLM 2、Gemini。


23 年 2 月谷歌匆匆推出 Bard,首秀时只被问了一个问题:韦伯望远镜有什么新发现吗?



NASA 出面证实它答案中的最后一点“韦伯望远镜拍摄到了第一张系外行星的照片”是错误的。


第一张系外行星照片早在 2004 年就被欧洲南方天文台的超大望远镜捕捉到了,韦伯望远镜 2021 年才发射升空。


有这种黑历史,谷歌想把 Bard 改成 Gemini 也好理解,毕竟谁也不想自家产品永世背着翻车的典故,改头换面重新开始得了。



Bard 只是谷歌看 ChatGPT 杀疯了之后快速推出的竞品,实际上谷歌着手 AI 要早于现在所有能叫的上名字来的玩家。


早在 2015 年谷歌就开始自研用于加速机器学习的张量处理单元(TPU),遥遥领先这周才宣布入局自研芯片的 Meta。


2017 年,谷歌团队捣鼓出来了奠定现在 GPT 底层架构的 Transformer。


随后几年谷歌推出了 BERT、T5-xxl、Transformer-X 几个模型,以及被自家工程师认为拥有了自我意识的聊天机器人 LaMDA。


据内部员工透露,2013 至 2020 年间,谷歌就研发出了类似 ChatGPT 的对话机器人 Meena,但是公司高管多次拒绝了将产品公之于众的提议。


原因是聊天机器人不符合谷歌关于安全和公平的 AI 原则。


所以说底层技术不是不能打,是谷歌端着硅谷巨头小心驶得万年船的谨慎态度,被 Open AI 这种没有历史包袱的初创公司给弯道超车了。


谷歌和 Open AI 的厮杀愈演愈烈,最近谷歌颇有后来者居上的态势。


今年一月底,Bard(Gemini Pro)在 UC 伯克利的 LLM 榜单中一度冲到第二,结束了 GPT-4 系列长期霸榜前三的局面。


来源:推特


但是谷歌在第二的位置还没坐热乎,又很快被 Open AI 连夜更新的新模型给顶下来了。



虽然这次 Bard 更新的生图体验下来平平无奇甚至有点失望,但是谷歌在 AI 应用上明显开始加速了。


如果推特网友的爆料是真的,Gemini Advanced7 号上线以后,能不能顺利冲回榜二呢?





2024 年 1 月 5 日,【智求共赢・中国 AIGC 产业应用峰会暨无界 AI 生态合作伙伴大会】在杭州未来科技城会议中心举行。


大会汇集行业资深专家及领军企业,共同聚焦 AIGC 领域,围绕当下热点话题进行深度延展,探讨行业激烈竞争下的运营新思路、发展新模式!点击文章,回顾精彩内容~










AI 新智界园区开放合作啦!



【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。

巴比特
数据请求中
查看更多

推荐专栏

数据请求中
在 App 打开