热门文章
- GPT-4技术报告(附中、英文PDF下载,...
- Meta开源对标神经网络GPT-3的大规模...
- 图解网信办《生成式人工智能服务管理...
- 《哈工大-ChatGPT 调研报告 (仅供内部...
- 《ChatGPT的技术发展路径和带来的影响...
- 《AIGC行业深度报告(7)-ChatGPT:三大...
- 元宇宙“由虚向实”背后:生成式AI技术...
- 《AIGC深度报告:新一轮内容生产力革命...
- 《中国人工智能产业研究报告(Ⅴ):道阻...
- 《兴业证券-AIGC全方位解析与展望》(附...
- 科技公司史上第一次:Meta开源与GPT3...
- 《中国信通院-人工智能生成内容(AIGC)...
- 用全球最快 AI 超算秀肌肉后,黄仁勋...
- 元宇宙的最大变量AI注入后的化学反应
- 《增长黑盒&黑盒点评-2023中国AIGC应...
- 《ChatGPT:开启AI新纪元》(附PDF下载)
- 为元宇宙「打地基」,Meta 开发世界最快...
- AI+元宇宙!Meta离梦想更进一步?
- 微美全息战略投资海百川,AI-Star构建...
- 逐浪AIGC⑤丨大模型狂飙
逐浪AIGC⑩丨AI热潮下的惊喜、失落与期待
编者按:1956年,人工智能(AI,Artificial Intelligence)的概念首次提出,迄今已逾六十载。60年来,AI历经了从爆发到寒冬、再到野蛮生长的历程,伴随着人机交互、机器学习等技术的提升,AI成为了技术时代的新趋势。
2022年,AI行业再度迎来新的节点,人工智能生成内容(AIGC,AI Generated Content)后来居上,以超出人们预期的速度成为科技革命历史上的重大事件。无论是“AI画师”DALL-E2,还是“万能陪聊”对话机器人ChatGPT,生成式AI正在迅速催生全新的科技革命系统、格局与生态。
时针转至2023年,由AIGC引发的热度不减反增,而全新的智能创作时代在带来深刻生产力变革的同时,也将进而改变人类的思想演进模式。就此,21世纪经济报道数字经济课题组策划了“逐浪AIGC”系列报道,多维解读AIGC带来的技术可能和商业图景。
21世纪经济报道记者李强 北京报道
AI热度连续几日强势霸榜。
从3月15日开始,GPT-4发布、文心一言亮相、GPT-4接入Office全家桶,几乎每天都有新的话题。
其中比较有戏剧性的一幕是,百度在发布国内首个生成式语言大模型“文心一言”后,明明是国内最有潜力追赶AIGC浪潮的选手,台下却是一片调侃和喝倒彩。
“在文心一言内测过程中的体验来说并不完美,因为市场有需求才选择在今天发布。”不管是百度创始人兼CEO李彦宏,还是百度CTO王海峰,在发布会上的态度都拘谨而谦逊。
在GPT-4吊足人们胃口的情况下,尽管也都明白百度仍处在追赶阶段,但百度的真诚却没能换来市场的客观看待。一个更加挑动人情绪的细节是,发布会现场并没有直接调用文心一言看实际效果,而是用PPT和录屏的方式演示,市场直接理解为对于产品的信心不足,大量调侃文心一言远远不如GPT-4的恶搞图在社交媒体上转发,百度(09888.HK)的港股股价也一度暴跌10%。
不过,随着百度逐渐开放测试,人们发现文心一言的表现并没有调侃中的那么糟糕,同时在国内其它大厂尚未给出时间表的时候,百度敢于以落后的姿态“先上桌”,颇体现出几分破釜沉舟的决心。
“一个是典型的美式英雄主义,一出场就是王炸,完全的颠覆式创新,魔法级的技能让全球瞠目结;一个是典型的中式实用主义,没有英雄,没有浪漫,很务实的市场需求理解,把十多年的积累组合升级,一点都不酷,还显得有点生涩。”在发布会现场,一名不愿具名的资深行业观察人士发了这样一条朋友圈。
情绪趋于冷静之后,市场对于百度的信心也在回归,截至3月17日收盘,百度港股股价大涨13.67%。继16日先跌后涨之后,17日百度美股也再收涨逾6%。
追赶
OpenAI之前,由于训练成本高昂,以及投入后的实际效果未知,导致海内外大厂几乎没人敢押宝在大语言模型上。
因此,尽管许多高校以及大厂研究团队也早早开始探路大参数模型,但基本以项目和论文为导向,没有持续迭代,像谷歌的PaLM等参数量级比ChatGPT相近甚至大得多的模型,最终都没有被广泛应用。
OpenAI的与众不同之处在于,它不仅是个科研团队,还是个创业公司。OpenAI将大模型作为产品,在GPT-3 API开放后,根据用户实际使用数据,不断迭代打磨优化。
之所以能成功推出ChatGPT,并不是OpenAI在算法上实现了实质性创新,而是工程化上的长久积累:把模型当产品迭代,投入几百个工程师做“脏活累活”,包括数据清洗、模型后续的微调和基于人类反馈的强化学习(RLHF),并在这个过程中,形成了一个高效的“模型训练流水线”。例如,ChatGPT的问世,RLHF发挥了非常重要的作用,GPT-3.5底层模型实际只用了6万条数据优化,但是优化的效果非常明显。
问题在于,工程化的细节对于外界始终是个黑盒。论文只公布了数据处理有哪些环节和每个环节使用的数据量,但什么数据用在哪个环节、强化学习奖励模型是怎么做的,需要其它试图跟进的厂商自己一步步摸索尝试和积累,这也是OpenAI与其他玩家真正拉开差距的地方。即使现在ChatGPT为大模型指明了发展方向,要真的把工程化做好,把这种高效运转的“流水线”建起来,也仍然需要时间。
“大模型的训练并不是集中几千张GPU训练几个月之后就结束了。数据在不断变化,用户与模型交互提出的问题也在不断变化,数据的供给和需求两端的变化推动着大模型必须不断升级迭代。如果不更新,很快就会被竞争对手超过,失去价值。这是一个非常重资本、算力、人才投入的业务,因此必须是规模很大的公司来做,最核心比拼的是谁能建立起一套模型生产体系,以最高的效率更新迭代模型。”Atom Capital分析指出。
“全球的大厂当中,百度是第一个发布的,微软是直接调用OpenAI,而Google和Facebook等大厂都没有发布同类型、同级别的产品。”李彦宏在发布会上表示。
但值得注意的是,OpenAI在发布最新的GPT-4时,并没有像之前一样挂出技术文档或论文,解释技术如何实现,而是以一种更加封闭的状态展示着自家的产品力。与曾经致力于推动造福人类AI的非营利性研究机构相反,估值达到三百亿美元的OpenAI正迅速成长为拥有垄断地位的大厂之一。
“国内的公司此前在生成式语言大模型已经有一些探索了,如果要达到类似ChatGPT的效果,还需要更多资源和时间的投入。当然像芯片等方面可能会面临一些阻碍,但是应该也会有一些其他的解决方法。科技大厂在训练上取得了一些初步优势后可能通过开源的方式去降维打击,创业公司如何更好地利用开源的模型,能否构建出属于自己垂直领域、更精细化的小模型也值得期待。”CMC资本董事总经理易然分析道。
激活
“想到可以帮助更多人一起应对AI的大潮,我就兴奋得不行。”百姓网CEO王建硕很早开始便开始摩拳擦掌。
百姓网成立于2005年,是中国最早的分类信息服务网站之一。2016年3月14日,百姓网在新三板挂牌。2022年,百姓网利用其数据和技术优势,结合大语言模型,拓展人工智能服务,成立BaixingAI业务。在消费市场方面,推出智能聊天机器人;在企业级市场方面,推出对话式人工智能支持中台,赋能不同行业搭建自己的对话式人工智能方案。
作为AI的坚实拥趸,王建硕带领百姓网在第一时间接入了文心一言,成为首批生态合作伙伴,并随后宣布百姓网将进入AI教育领域,从零开始构建课程,并用未来的几年的时间帮助上千万普通人进入AI的新世界。
“普通的对话效果,好于我的预期,高级的prompt engineering(直译为‘提示工程’,指设计输入数据,使用户能够清楚地描述任务,引导AI给出正确合理的输出,进而完成更为复杂的任务)编程能力,还没有支持。作为一个开端,相当不错。我一直认为百度明天底做出一个相当不错的模型是大概率事件,在3月份就出来一个不错的产品是小概率事件,现在的体验是基本可用。”对于文心一言的表现,王建硕还是给予了肯定。
“大模型很强大,但它不懂我公司具体的年假政策,不了解我的客户的历史情况,不被群里面宝妈相信,不能解决所有的问题。这就使得未来不仅仅会出现生产机器人的能力,同样也会出现大量对特定场景机器人的需求。”王建硕补充道。
未来会有多少机器人,在王建硕看来,这个数字可能是数千万个,人们日常的查询、购物、工作等动作都将会演化为调动特定机器人去执行,这也意味着人们需要学会如何与机器人交互。
“千万不要以为这项新的技能不需要学习,一旦新世界的大门打开了,用简单的句子就可以完成以前复杂的任务,一定会催生用复杂的句子,完成以前几乎不可能完成复杂的任务。”王建硕补充道。
根据介绍,百姓网会提供免费课程和付费课程以及高阶的开发课程。其中,免费课程会邀请已经在ChatGPT领域有积累的先行者们分享技术使用方法,付费课程则是探讨ChatGPT的技术如何在企业里面应用,将企业文档系统,客服系统,员工培训,社区管理等大量任务交由AI;更高阶的开发课程则是帮助程序员顺利从写Python等“高级语言”转换到用“Prompt Engineering”等方式跟大语言模型互动,更加高效地创建APP。
“这一轮的文心一言最大的关注度并不在C端,普通用户并没有深刻直观的理解,更加重要的是AI下的产业互联网,尤其是我们看到各个下沉的细分行业,它们对于AI的诉求已经被激发出来了。”前述不愿具名观察人士向21世纪经济报道记者分析道。
根据百度提供的数据,自2月7日发布,已有650家企业宣布加入文心一言生态,参与特定场景化下的训练和推理。而在文心一言发布会后一小时内,排队申请文心一言企业版API调用服务的企业用户已达3万多家,首日有6.5万家企业申请调用,市场的反响非常热烈。
“我们回看20年前的百度,很多东西搜不出来,使用体验也很差,但你难道说这个场景不成立吗?肯定不是。生态不是一天繁荣起来的,技术上的不足可以迭代优化,只要模式验证了,抓住先发优势才是关键。”前述不愿具名观察人士表示。
冲刺
仅仅四个月时间,AIGC便从ChatGPT初出茅庐,延伸至生产力端,让人惊呼“又快又好”。
近日,Linkedin联合创始人Reid Hoffman宣布,其完成GPT-4合作撰写的书籍《Impromptu:通过A放大我们的人性》,成为“Prompt Engineering”的吃螃蟹者,微软也宣布将GPT-4植入Office全家桶,用户可以直接将Word转化为PPT……
尽管跟风中的科技公司们纷纷宣布在大模型技术上有所积累,但大模型注定是巨头的的牌桌,除了行业“鲶鱼”,众多厂商重新投入再造“文心四五六七八言”的意义也会越来越小。同时,应用层如何落地也是大模型浪潮中最值得关注,以及声浪最大的“军备竞赛”。
“未来可能会出现两类创业公司,一类是以现有业务为主的AI+,大幅度提升效率和体验;另一类是充分发挥大语言模型的技术突破,完全颠覆现有业务、带来新的用户群体或开启全新的应用场景。”Atom Capital表示。
目前,大厂已经开始了效率之战。
3月15日,谷歌向开发人员和企业公开了PaLM API,用户能通过谷歌云和AI建构工具MakerSuite来构建AI模型,或是将聊天机器人功能编程到自己的应用程序中,谷歌还在谷歌企业级线上协作平台Google Workspace中引入了生成式AI功能,可以实现自动撰写电子邮件或生成文档摘要等功能,覆盖Gmail、Google Docs、Sheets等组件。
微软也在3月16日发布Microsoft 365 Copilot,通过将Copilot嵌入至Office全家桶中,协助用户完成创作、分析等工作,同时能够以聊天对话框的形式展示给用户,通过汇集全家桶数据,协助用户完成总结聊天、撰写邮件、编写计划等工作。
“如果我们用工业性思维去看,AI是能够完成很多的劳动力替代的。举个例子,除了大家讨论最多的新闻和设计,像律师、金融这些工作每天也要审核大量资料,基本也都是技术水平不高的重复性劳动。而这些AI未来可能延伸到的场景现在都还是蛮荒阶段,大家目前还是尝鲜的状态,象征性地聊个天,至于大家觉得恐慌也好,关注也罢,只能说我们对于AI的认识仍然有待挖掘。”老王对记者表示。
正如AI发展历程,技术突破引发人们的狂欢与畅想,激起一波波浪潮,潮起又潮落,如今,随着OpenAI将大模型推到台前,新一场大戏的台幕也正徐徐拉开。
(作者:李强 编辑:陶力)
元宇宙神评
相关主题
-
《AIGC行业深度报告(7)-ChatGPT:三大主线,AI算力需求井喷!》(附PDF下载)
内容概要:政策端与产业端持续发力,算力建设持续提速;大模型引爆海量算力需求,AI产业量价齐升;全球算力市场持续火热,AI芯片群星闪耀。
-
《兴业证券-AIGC全方位解析与展望》(附PDF下载)
内容概要:Gartner 预计,2022 年 AIGC 占全球数字数据量为1%,到 2025 年,这一比例将提升至10%。
-
《增长黑盒&黑盒点评-2023中国AIGC应用研究报告》(附PDF下载)
-
图解网信办《生成式人工智能服务管理办法(征求意见稿)》V1.0.0(附PDF下载)
内容概要:2023年4月11日,国家互联网信息办公室发布《生成式人工智能服务管理办法(征求意见稿)》,面向社会公开征求意见,旨在促进生成式人工智能技术健康发展和规范应用。
-
逐浪AIGC⑱丨迈入混战时代:科技公司竞速AI大模型
内容概要:目前AI大模型处于百花齐放的状态。
-
逐浪AIGC⑰丨AI迈入群雄逐鹿时代 阿里巴巴全方位迎战
内容概要:张勇的新开始,也是阿里云的新征程。
-
【元宇宙之约】第019期:AIGC能快速构建元宇宙行业的基础设施
内容概要:在雷涛看来,大模型只是解决基础能力,真正到每一个领域应用还是需要去做自己的数据训练;基础模型需要真正去理解用户,因为用户的问题是千差万别,答案也会千差万别。
-
逐浪AIGC⑯|Meta入局来势汹涌 “生成式AI”引发技术争鸣
-
逐浪AIGC⑮ | AI伦理之惑:马斯克等科技大佬为何拦停GPT-5
内容概要:如今,我们的社会已经暂停其他可能造成灾难性影响的技术,对于人工智能也应该如此,“让我们享受一个漫长的‘AI之夏’,而不是毫无准备地进入秋天”。
-
逐浪AIGC⑭|黄仁勋对话OpenAI创始人 现代AI和ChatGPT如何诞生
内容概要:它还是那个神经网络,只是变得更强大。
-
逐浪AIGC⑬丨英伟达新GPU“炸场”,未来人人都可以是程序员?
内容概要:AIGC算力成本有望大降?
-
逐浪AIGC⑫|制造“iPhone时刻”,英伟达再塑AI算力上限
-
逐浪AIGC⑪|半百微软,扎进AI变局
-
《黑镜》里“自制”AI男友成真,GPT让普通人轻松构建元宇宙
-
逐浪AIGC⑨丨文心一言实测体验:语文满分、数学学渣、画画水平一般般
内容概要:目前大概是个偏科严重的文科生吧。
-
逐浪AIGC⑥丨文心一言开放测试 百度股价逆风翻盘
内容概要:AI大模型时代降临,本土大厂机会来了。
-
逐浪AIGC⑧丨GPT-4诞生次日,微软Office重生
内容概要:这其实是一场产业叠加的爆发。
-
逐浪AIGC⑦丨在新一轮AI全球竞赛中,中国企业要抓住产业场景优势
内容概要:在AI领域,中国企业也能够走出中国特色。
-
逐浪AIGC⑤丨大模型狂飙
-
逐浪AIGC④丨新的AI浪潮来临,创业者该做什么?
内容概要:ChatGPT正掀起一场新的AI浪潮。
-
《AIGC行业深度报告(6)-ChatGPT:存算一体,算力的下一极》(附PDF下载)
内容概要:ChatGPT开启大模型“军备赛”,算力呈现明显缺口。存算一体,后摩尔时代的必然发展,存算一体为人工智能发展的必然选择。
-
AI+元宇宙!Meta离梦想更进一步?
-
【元宇宙之约】第018期:AIGC将为元宇宙解决两个技术难题
-
放弃元宇宙,转型AI?Meta:不,两个我都要
-
《中国人工智能产业研究报告(Ⅴ):道阻且长,行而不辍》(附PDF下载)
内容概要:AI成为企业数字化、智能化改革的重要抓手,也是各行业领军企业打造营收护城河的重要方向。落地AI应用对企业业务运营的商业价值与战略意义越来越明确。
-
加速元宇宙创新生态,阿里云和伙伴一起探寻奇点
-
《AIGC行业深度报告(5)-ChatGPT:加速计算服务器时代到来》(附PDF下载)
内容概要:ChatGPT的竞争本质即大模型储备竞赛,大模型出现带动AI服务器呈现加速状态,服务器架构随负载量扩张而不断优化,数字经济时代,服务器应用前景广阔。
-
中国 AIGC 与元宇宙创新创业创作大赛即将启动
内容概要:在实现元宇宙的过程中,会不断出现像AIGC这样的爆点,而我们将通过大赛的方式去追踪,用大赛去覆盖元宇宙成长过程中的每一个关键技术突破。
-
AIGC挑战广告狂人!Meta推出AI生成广告服务,已填补公司百亿损失
内容概要:在竞争激烈的广告营销市场中,大数据和AI作用下的精准化打击能起到增益,也能大大降低内容制作成本,但创意、内容以及对目标客户的理解程度才是永恒的核心竞争力。
-
各大企业巨亏裁员,元宇宙会是又一个泡沫吗?
-
ChatGPT,将元宇宙拍在沙滩上?
内容概要:“长江后浪推前浪,ChatGPT将元宇宙拍在沙滩上。”在ChatGPT火爆出圈的同时,近年“新贵”元宇宙则显落寞。
-
《AIGC行业深度报告(2)-ChatGPT,重新定义搜索“入口”》(附PDF下载)
-
“魔珐科技”获1.3亿美元融资 元宇宙离《终极玩家》还有多远?
内容概要:元宇宙是当下创投市场当之无愧的风口,虚拟人作为入场券其热度也随之攀升,有望成为元宇宙中最先盈利的板块,因此也吸引了众多投资机构、互联网巨头的争相布局。
-
元宇宙“由虚向实”背后:生成式AI技术持续发展升级
内容概要:具备沉浸感、低延时、多元化、随时随地、身份属性明确的多模态内容既是元宇宙的基本单位,也是通往元宇宙的关键路径。
-
魔珐科技创始人柴金祥:虚拟人产业迎来井喷 推进商业复制时机已到
-
《2023年AIGC应用与实践展望报告-甲子光年》(附PDF下载)
内容概要:甲子光年智库特此展开AIGC应用与实践研究,输出《AIGC应用与实践研究报告》,期待与各方共同见证AIGC行业的星辰大海。
-
平台押注资本追捧 视听产业成元宇宙场景应用第一战场
内容概要:报告显示,元宇宙是一个需要长期才能实现的目标,在实现元宇宙的旅程之中会不断地出现像AIGC这样的爆点。有了AIGC支持后,人类至少一只脚已经开始在往真正的元宇宙时代迈进。
-
一文详解AIGC:推动元宇宙发展的加速器
内容概要:AIGC的出现意味着创作者将从繁冗的基础性工作中解脱出来,把更多的精力放到创意表达上,这是未来内容创作行业,甚至是人类工作方式的整体趋势。
-
一文读懂AIGC,万亿新赛道为何今年获得爆发?
-
从AI画画到“用声音做视频”,全球掘金AIGC
内容概要:登台的新宠儿名为“AIGC”,又称“生成式AI”(Generative AI)。这一领域正以令人侧目的速度发展,将创新和技术再度拉回到世界舞台的焦点。
-
红杉资本:生成式人工智能,一个充满创造性的新世界
-
《中国信通院-人工智能生成内容(AIGC)白皮书(2022年)》(附PDF下载)
-
元宇宙是互联网3.0最有可能候选,5年后才是起点
-
Meta开源对标神经网络GPT-3的大规模语言模型OPT
-
科技公司史上第一次:Meta开源与GPT3参数相当的大语言模型OPT
内容概要:Meta此次以这样的程度开源其大型语言模型是一个非常大胆的举措,可能会产生当下想象不到的风险。这也是OpenAI对于不发布GPT-3的前身GPT-2给出的原因。
-
GPT-4技术报告(附中、英文PDF下载,含GPT-4 System Card_中文)
内容概要:这份技术报告介绍了 GPT-4,一种能处理图像和文本输入并生成文本输出的大型多模态模型。这类模型非常重要,因为它们有潜力被广泛应用于对话系统、文本摘要和机器翻译等领域。
-
《ChatGPT的技术发展路径和带来的影响》(附PDF下载)
内容概要:InstructGPT/ChatGPT的效果非常亮眼,引入了人工标注之后,让模型的“价值观”和的正确程度和人类行为模式的“真实性”上都大幅的提升。
-
《哈工大-ChatGPT 调研报告 (仅供内部参考)》(附PDF下载)
内容概要:哈工大自然语言处理研究所组织多位老师和同学撰写了本调研报告,从 技术原理、应用场景、未来发展等方面对 ChatGPT 进行了尽量详尽的介绍 及总结。 本报告仅供内部参考。
-
Unity中国亮相2023全球人工智能开发者先锋大会
-
ChatGPT火了,元宇宙凉了?
-
元宇宙没失宠,XR也没凉
内容概要:元宇宙本身是长期建设的过程,在不断沉淀与发展中,会有很多的机遇与挑战,元宇宙新基建必然会迎来发展高潮,未来可期。
-
中国计算机行业协会罗军:ChatGPT的出现,将元宇宙实现至少提前了10年
-
《ChatGPT:开启AI新纪元》(附PDF下载)
内容概要:近日,财通证券发布研报《ChatGPT:开启AI新纪元》指出,ChatGPT加速应用场景落地,带动AI产业上游需求。
-
微软元宇宙大撤退!
内容概要:2023年开年第一波大裁员,微软重创手下VR/AR团队。有了「新宠」ChatGPT,手中的「元宇宙」真不香了。
-
如何推进人工智能与元宇宙的协同发展?