芊芊551 发表于 2023-4-14 03:31:42

阿里云大模子“通义千问”上线,能写会夸,与“文心一言”有何区别 ...

在谈天呆板人ChatGPT、谷歌Bard和百度“文心一言”之后,阿里云也发布人工智能大模子 “通义千问”。
4月7日,阿里云推出自研大模子“通义千问”,并开始约请用户测试体验。阿里云称,现阶段该模子重要定向约请企业用户举行体验测试,用户可通过官网申请(tongyi.aliyun.com),符合条件后可到场体验。

泉源:通义千问

在官网中,通义千问被界说为“专门相应人类指令的大模子”。用户若想体验测试,必要举行预约报名。填写手机、邮箱、主体和用途等信息。
7日下战书,汹涌消息记者乐成登录并访问通义千问,其页面正中心具有一个对话框,表现输入上限为1000字。对话框的下方展示了通义千问具备的部门功能,包罗影戏脚本、职场助理、撰写短文、写封邮件。

泉源:通义千问

别的,页面的最下方还具著名为“百宝袋”的通道,展示了通义千问搭载的9种应用,这些应用被分为3类,分别为服从类、生存类和娱乐类。

泉源:通义千问

通义千问是国内第二款类ChatGPT产物。此前3月16日,百度正式发布谈天呆板人“文心一言”,并公布其具有文学创作、贸易文案创作、数理逻辑推算、中文明白、多模态天生五大本领。
为测试通义千问的本领,记者同时向它和文心一言举行提问,对比二者天生的复兴有何差别。
通义千问自称练习数据来自2021年,难以获取及时信息
起首,记者向两款谈天呆板人扣问通识性题目,请它先容作家莫言及其文学作品。
通义千问可以或许正确地先容莫言的原名、出生日期、身份等信息,并夸大莫言是第一个得到诺贝尔文学奖的中国作家。别的,它枚举了莫言的三部代表作,不但附上了发表时间,还对作品举行了扼要概括。

泉源:通义千问

文心一言同样提到了莫言本人的底子信息和作品,别的还列出了莫言得到的多项奖项。不外它并没有指出莫言是首位中国籍诺贝尔文学奖得到者。

泉源:文心一言

随后,记者实验向两款呆板人提问最新发生的变乱。遗憾的是,它们好像都无法获取及时信息。
在被问及2023年的奥斯卡获奖影片时,通义千问表现“无法猜测将来的奥斯卡获奖影片……发起您关注官方的奥斯卡奖项公告,以获取最新的信息。”

泉源:通义千问

文心一言则“不苟言笑”地给出了错误的答复,称2023年的奥斯卡获奖影片为《寄生虫》。但究竟上,《寄生虫》于2019年上映,并于2020年得到奥斯卡最佳影片、最佳国际影片、最佳原创脚本和最佳导演四项大奖。

泉源:文心一言

无法获取最新信息,或意味着练习数据有限。通义千问告诉记者,本身的练习数据来自2021年,因此无法获取有关将来的信息。文心一言则表现,没有明白的数据停止日期。
相比之下,谈天呆板人ChatGPT的数据库更新至2021年,上个月刚刚推出的多模态模子GPT-4的练习数据可追踪到2021年9月。

泉源:通义千问

可写邮件、列提要、提供菜谱
除了答应用户随机提问,通义千问还提供了多种应勤奋能。
记者起首进入“写封邮件”应用,要求其为刚结业的大门生撰写一封求职邮件。通义千问所撰写的邮件格式较为尺度,在开篇举行自我先容并阐明求职目标,还表达了对公司的向往和认同。

泉源:通义千问

文心一言提供的邮件也较为尺度。别的,它在复兴中特殊指出这是一个“符合规范的样例,你可以参考一下举行修改和调解”,还在名字落款处提示用户要写本身的名字。

泉源:文心一言

在“服从类”类应用中,通义千问具有写提要、SWOT、商品形貌天生三种功能。
记者起首测试了商品形貌生乐成能,分别要求通义千问和文心一言帮忙机店给最新上市的折叠手机写一篇宣传文案,限定字数在100字以内,盼望能突出折叠手机的上风和特点,吸引顾客购买。
这两款呆板人均捉住了关键词“折叠手机”。通义千问突出了折叠手机在空间使用率方面的上风,写到“相比传统的直板手机,它可以有用地淘汰屏幕占用空间,方便携带”。文心一言则指出“它接纳最新的折叠技能,可以在一款手机中实现智能手机宁静板电脑的双重功能”。
但是,这两款呆板人都未满意“100字以内”这一要求,字数远远超标。

泉源:通义千问


泉源:文心一言

随后,记者又测试了通义千问的“写提要”应用。在被要求撰写一份关于“煤矿污染文章”的提要时,它从煤矿污染的概念和影响、汗青和近况、造成污染的缘故原由、探究对情况和人类的危害、管理方法和掩护步伐 、总结及预测等方面的内容,较为全面。

泉源:通义千问

在“服从类”类应用中,通义千问具有彩虹屁专家、写情书、为你写诗三种应勤奋能。
记者要求两款呆板人分别以“春雨、落花、伤感”为关键词作一首诗。通义千问撰写了一首七言诗,末端较为押韵。

泉源:通义千问

文心一言所写的诗较长,它在第一句里直接将关键词“春雨、落花、伤感”拼接在了一起,且厥后的每一段中,不绝地让关键词重复出现。

泉源:文心一言

通义千问写的诗敷衍了事,它写的情书靠谱吗?记者实验随机输入姓名,得到了一封略显浮夸的情书,如许看来情书照旧本人亲身撰写更有诚意。

泉源:通义千问

不会夸人怎么办,通义千问具有“吹彩虹屁”的功能。记者实验让它夸奖别人文章写得好,通义千问再次浮夸了起来,“你的文章简直是天赐之作,犹如一缕东风,轻轻拂过我的心灵。”

泉源:通义千问

假如让通义千问自诩,它更是极尽称赞之词,“让我们一起来称赞通义千问,称赞它所转达的聪明之光,称赞它所传承的文化精华!”

泉源:通义千问

在生存类应用中,通义千问可以或许提供菜谱、写小门生作文、续写故事。记者测试了最实用的菜谱功能,向其扣问蔓越莓曲奇的做法。通义千问提供了所需的质料,并具体先容了操纵步调。

泉源:通义千问

在测试的过程中记者留意到,通义千问的复兴页面表现“仅展示近来10条对话”。在页面的最下方,另有一条关于复兴内容的阐明,“测试天生的全部内容均由人工智能模子天生,其天生内容的正确性和完备性无法包管,不代表我们的态度或观点。”
别的,记者发现假如脱离通义千问一段时间后再次返回,页面会出现一条弹窗,提示用户太久没有操纵,必要革新页面重新开始。假如脱离的时间更久,它还会主动返回登录页面,要求用户重新登录账号。

泉源:通义千问

在末了,记者要求通义千问和文心一言相互举行评价,并指出对方的长处和不敷。
通义千问表现,百度推出的谈天呆板人“文心一言”(英文名:ERNIE Bot)是一款可以或许与人类举行天然语言对话的人工智能谈天呆板人,其语言明白本领强、可以与用户举行多样化的交互、支持天然语言天生;但其对话深度有限、难以处置惩罚多义性和含糊性且大概存在bug和安全风险。
故意思的是,在此前的复兴中,通义千问表现本身的练习数据来自2021年,而文心一言于2023年才问世,它却可以或许正确地说出文心一言的英文名以及优缺点等信息。

泉源:通义千问

文心一言则表现,阿里推出的谈天呆板人“通义千问”是一种新型的人工智能谈天助手,它可以通过天然语言处置惩罚技能和深度学习算法来明白和答复用户的题目和提问。它指出通义千问在智能化、多语言支持和主动答复;不敷之处在于其语言明白本领、知识库有限以及技能存在限定。

泉源:文心一言
页: [1]
查看完整版本: 阿里云大模子“通义千问”上线,能写会夸,与“文心一言”有何区别 ...