13
2025
04

欧洲杯体育用它生成的实践具有不细目性-开云(中国)kaiyun网页版登录入口

发布日期:2025-04-13 14:35    点击次数:116

欧洲杯体育用它生成的实践具有不细目性-开云(中国)kaiyun网页版登录入口

智能体是什么? 欧洲杯体育

几个月前,咱们粗略会否认地认为,它是一种AI大模子赋能应用场景的新形态。今天,对看法作念进一步的阐释彰着不那么进犯了,径直上手作念就行。

2024年的百度宇宙大会上,文心智能体平台(AgentBuilder)展区的责任主说念主员,正勇猛呼叫每一位途经的不雅众来搭一个智能体(又叫“Agent”),“咱们已经极猛进度减少作念一个智能体所用的代码了”。的确,不雅众不到1分钟就能“手搓”一个智能体,然后欣忭离开。

侵略的智能体展区丨百度宇宙大会2024

与市面上已有的对智能体的形貌不同,百度创举东说念主李彦宏说,智能体就像出动时间的自媒体账号——最初它的开拓门槛富有低,东说念主东说念主都能上手;另外,它可能会造成AI原生时间里,实践、信息和就业的新载体。

一切齐可智能体

智能体不错作念什么?

展区内,你不错向“农民院士智能体”请问怎样播撒旱地稻;你会接到“销售客服智能体”的电话,在对方耐性全面的解答下,心甘原意续费车险;或者写一段“大圣穿越到当代”的故事,用“文生图智能体”将它创作成漫画。

利用智能体文生图制作的漫画丨百度宇宙大会2024

当今,文心智能体平台上已有散播在各个行业的15万家企业和80万名开拓者。

凭证应用的地点,李彦宏将智能体分红了4类:公司类(尽头于传统的官网、公众号、企业号等)、变装类(数字东说念主直播)、器具类(AI写稿、一键生成PPT等)、行业类(用于招聘、金融、客服等垂直领域)。

他要点先容了一款器具类智能体,“摆脱画布”。

它真的很摆脱。这款智能体买通了百度文库上的公域贵寓,以及百度网盘上的私域数据,让找贵寓、剪辑、生成、共享这照旧由愈加丝滑。

“摆脱”的另一个体现是,素材不被着手、面貌、式样为止。不论是灌音的通话、图文集结的行业评释,如故发布会的视频,都不错被“拖拽”到这块画布上,按照用户需求生成一个全新的富媒体实践。

“摆脱画布”太摆脱了,以至于很难一句话先容,不错等着体验一下丨百度宇宙大会2024

“门槛低,东说念主东说念主可用”是一个前提,“天花板得富有高,多个智能体合作,才能处分愈加复杂的问题”又是另一个前提。对此,百度官宣了秒哒,一个零代码应用开拓平台(将于来岁第一季度上线)。

李彦宏以“为萝卜快跑发布会搭建行径报名系统”为例。

输入需求后,一个细腻策动的智能体最初出现,将任务拆解成需求细目、实践坐蓐、工程开拓3个才智,况兼分歧“召集”了“策动”“案牍”“圭臬员”“质检员”等智能体分头开展责任。

“圭臬员”在敲代码时,李彦宏说,“它写什么你完全不需要看懂,只消知说念它在写就行”,因为写完之后会有“质检员”来查验代码能不成跑得通。

正在制作电子邀请函的秒哒丨百度宇宙大会2024

无代码编程、基于文心大模子的想考和策动能力对多智能体改造和编排、大模子对iRAG/舆图API等多器具调用——这些能力将会让“秒哒”成为迄今为止最复杂的多智能体合作器具。

图片幻觉“散失术”

“亏本界各地打卡”,这是生图器具出现之后,巨匠最可爱的应用之一,哪怕是在百度宇宙大会现场,“AI合照”依然是最侵略的展台。

但怕生怕在,让AI生成一张打卡北京天坛的像片,后果把原来3层的祈年殿画成了4层,闹了见笑。

昔时的AI生成了4层的祈年殿像片丨百度宇宙大会2024

这是因为,大模子是个概率模子,用它生成的实践具有不细目性。为了处分大模子自身的“幻觉”问题,这里需要提到一个时间——RAG。当大模子“常识储备”有限时,不错通过一些工程化技能(比如联网检索、常识库搜索等),先把相关信息找出来,再诱骗大模子进行回答,从而大大栽种修起质地。

昔时的RAG主要作念在文本层面,但在图像等多模态方面还集结得不够,导致AI绘制通常也有“幻觉”的问题。因此百度开拓了iRAG(image based RAG),也即是检索增强的文生图时间,将百度搜索累积的亿级图片资源和大模子能力相集结。

百度CTO王海峰简要先容了iRAG时间:

最初,大模子对用户的需求进行分析相识,自动策动精准或泛化决策,比如对哪些实体进行增强;

接着,对需要增强的实体检索并礼聘相应的参考图;

临了,在生成阶段利用自研的多模可控生图大模子,一方面通过局部重观点规画,在保捏实体特征不变的情况下,终显然图像的高泛化生成,另一方面通过举座重观点规画进行高精准的图像生成。

在用户的视角里,咱们看到在iRAG时间下生成的“爱因斯坦打卡照”,少了“机器味儿”,“爱因斯坦”也更像本东说念主——不错联想,在“特定布景中的特定东说念主物拿着特假寓品”这么的刻画下,生成图像的质地和精准度一定会栽种不少。李彦宏玩笑说,“要是巨匠的海报生成的车型长得像丰田,那可就糟心了”。

用iRAG时间生成的“巨匠揽巡飞越长城”的写实作风像片,细节都很的确丨百度宇宙大会2024

放大看车型和车标,都莫得虚伪丨百度宇宙大会2024

无幻觉、超的确、没资本、立等可取——具备了这些身分,AI生图就能代替以往为品牌拍一幅海报所破耗的东说念主力和财力资本,AI图片驱动有了生意价值。

AI眼镜,让智能助理随身捎带

不少东说念主认为,要是大模子和智能体不成与物理宇宙产生链接,那么就等于莫得价值。代表传统发布会的“实感”被留到了临了公布。这一次,搭载小度的不是智能音箱,而是一款AI眼镜。

发布会上,小度科技CEO李莹戴的即是它丨百度宇宙大会2024

动作“全球首款搭载汉文大模子的原生AI眼镜”,它主打6个功能。

第一视角拍摄。

看到稍纵则逝、来不足掏动手机拍照的时刻,是不是尽头但愿眼睛有截图功能?有第一视角拍摄功能的眼镜就能作念到——拍照、摄像,都不错通过语音抑止。眼镜毕竟轻(小度AI眼镜自爱45g),东说念主也可能在怒放中,因此这款眼镜搭载了AI防抖算法,据小度科技CEO李莹先容,防抖作念到了“圆善”;在镜头性能上,这个豆子大小的镜头用到了1600万像素的超广角——像素级别比刚出的iPhone 16前置摄像头高点儿。

妥贴在怒放时间拍摄第一视角像片、视频丨百度宇宙大会2024

边走边问。

这个功能哄骗场景大多在室外。比如走在路上看见漂亮的历史建筑,请它来说说背后的故事,尽头于雇了个“戳一下蹦跶一下”的AI导游。需要说一下的是,AI的回答是通过眼镜腿上的麦克风传出的。

“边走边问”的导游功能丨百度宇宙大会2024

识物百科。

有点近似于“边走边问”,但使用场景更平庸,包括但不限于识别花鸟虫鱼,致使不错识别你眼前一桌饭菜里粗略含若干卡路里。这个功能确乎是把百度的数据库上状况尽其用了。

识物百科在看展时间的应用丨百度宇宙大会2024

视听翻译。

发布会先容未几,不太显然这个翻译能作念到什么进度,是只可翻译眼前的外文笔墨,如故能作念到同声传译?咱们姑且保捏期待。

发布会的先容视频里只好阅读外文笔墨的翻译款式丨百度宇宙大会2024

智能备忘。

李莹在发布会中举的例子是,“阅读的时间用手点一下,点的实践就能智能备忘了”,至于怎样点、精准度怎样样,还尚不得知。除此除外,应该也不错像同类型居品一样,连通手机端、平板端的备忘录,在眼镜上进行语音教唆。

氛围歌单。

看起来似乎能集结你咫尺的悠然,礼聘妥贴氛围的音乐给你听。不外,我个东说念主认为这个功能不太联结——靠近不异的悠然,有的东说念主喜悦的有的东说念主伤感,更别提巨匠千奇百怪的音乐审好意思了。

个性推歌这个功能,你怎样看?丨百度宇宙大会2024

展会现场,样品被框在了玻璃罩里。要比及来岁上半年才上市,价钱神话是“十足很有赤忱”。更多对于舒限度、使用体验、近视/远视友好等细节问题也待回答。

不外这场磋商“有价值的AI应用”的发布会,的确从线上蔓延到了物理宇宙,从编造渗入到了现实。

作家:沈知涵,李小葵

剪辑:Rex 欧洲杯体育



相关资讯
热点资讯


Powered by 开云(中国)kaiyun网页版登录入口 @2013-2022 RSS地图 HTML地图