OpenAI CEO Sam Altman：巨型 AI 模型时代即将终结！

2023-04-19 11:30:21 来源 : 商业新知网

转自 | AI科技大本营

整理 |苏宓

出品 | CSDN

【资料图】

「巨型 AI 模型时代即将终结」，当这句话最新出自 OpenAI CEO Sam Altman 之口时，业界哗然。

毕竟在过去一段时间中，因为 GPT-4 以及 ChatGPT 会话式 AI 的到来，引发 AIGC、大模型的狂欢潮，众人有目共睹。这也引得多家科技大厂、创业公司纷纷入局 AI 赛道，推出各种大模型应用与产品。

现如今，在上周 MIT 视频发言中，Sam Altman 警告称：诞生 ChatGPT 的研究策略已经结束。目前尚不清楚未来会在哪些方面出现进展。

这番言论的背后究竟意味着什么？

Sam Altman：我们正处于巨型模型时代的尽头

近年来，OpenAI 通过采用现有的机器学习算法并将其扩大到以前无法想象的规模，在与语言相关的人工智能方面取得了一系列令人印象深刻的进展。

今年最新推出的 GPT-4 可以视为是 OpenAI 乃至全行业中最为先进的模型之一，据 Wired 报道，GPT-4 可能是使用数万亿个文本单词和数千个强大的计算机芯片训练而成，这一过程耗资超过 1 亿美元。

在这一点上，微软此前在官方博客上也曾分享过内幕：

微软将上万颗英伟达 A100 芯片连接到一起，并重新设计了服务架构，这使得 OpenAI 能够训练出越来越强大的 AI 模型，同时，也帮助自家解锁了 Bing、Edge 等工具的 AI 功能。这个项目已经花费微软数亿美元。

不过，当下 Sam Altman 表示，AI 技术进一步的进展将不会来自于将模型做大。"我认为我们正处于巨型模型时代的尽头，最终我们将以其他方式使它们变得更好。"

事实上，自从 OpenAI 在 11 月推出 ChatGPT 以来，微软已经使用底层技术为其必应搜索引擎添加了一个聊天机器人，Google 也推出了一个名为 Bard 的大模型，以及百度推出了「文心一言」、阿里内测了「通义千问」等等。

与此同时，包括 Anthropic、AI21、Cohere 和 Character.AI 在内的众多资金雄厚的初创公司，正在投入巨大的资源来构建越来越大的算法，希望努力追赶上 OpenAI 的技术。

Sam Altman 的最新声明表明，GPT-4 可能是 OpenAI 将模型做大并向其提供更多数据的战略中出现的最后一个重大进展。

在最新分享中，他也并没有说什么样的研究策略或技术可能取代它。不过，在此前 GPT-4 技术细节的论文中，OpenAI 研究团队倒是说过，根据预估，扩大模型规模的回报将会越来越少。Sam Altman 也曾表示，OpenAI 能够建造多少个数据中心以及建造这些中心的速度也有物理限制。

扩大模型的规模并不能永远奏效

其实回看 GPT 系列模型，参数真的是一个比一个大：

2019 年发布的 GPT-2，有 15 亿参数；

2020 年发布的 GPT-3，有高达 1750 亿个参数；

GPT-3.5 模型的参数量为 2000 亿；

在考虑到竞争格局和大型模型的安全影响之际，OpenAI 宣布不再对外公开最新的 GPT-4 模型参数，不过，通过上文提及到的训练 GPT-4 花费超过 1 亿美元的金额，也不难猜测出其规模之庞大了。

不过，模型并非参数越大越好，也并非一味地关注模型参数就是一件好事。对于这样的观点，其实也有不少专家持以赞同的态度。

据 Wired 报道，曾在谷歌从事人工智能工作的 Cohere 公司联合创始人 Nick Frosst 表示，Altman 的扩大规模并不能永远奏效的观点听起来是对的。他也认为，Transformer（GPT-4 及其竞争对手的核心机器学习模型类型）的进展超出了扩展范围。在 Nick Frosst 看来，「有很多方法可以让 Transformer 变得更好、更有用，而且很多方法不涉及向模型添加参数。新的人工智能模型设计或架构，以及基于人类反馈的进一步微调，是许多研究人员已经在探索的有希望的方向。」

其实，针对模型参数规模，此前百度创始人、董事长兼首席执行官李彦宏在接受 CSDN 采访时也说过，千亿量级是一个门槛，然而一直讨论大模型参数规模意义不大：

仅仅三年前，我们所说的大模型是参数亿量级的大模型，今天当我们说大模型的时候，大家大多数理解参数是千亿量级的大模型，这种进化和技术迭代的速度其实超过了像摩尔定律这样大家熟悉的演化速度，这还是很神奇的。

百度通用大模型肯定是千亿量级的。因为这是一个门槛，如果不过千亿是不会出现智能涌现，这是过去实验都证明过的。但是具体是多少参数，公布意义不大，过了千亿之后，不是万亿量级参数一定比千亿效果要好。GPT-4 出来之前，我看好多媒体猜测是万亿量级参数，十万亿量级，方向就错了。大模型不是靠提升参数规模，是在其他方面进行提升，不用太纠结。

贾扬清早期在接受 CSDN 采访时，也曾表示：

以 2012 年参加 ImageNet 大规模视觉识别挑战赛中大获成功的卷积神经网络 AlexNet 为例，该模型的总参数数量为 6000 万。它的崛起让不少 AI 从业人员产生一个比较简单的想法，即模型越大越深或模型参数越多，效果就越好。

但是到了 2014 年，基于 Inception 模块的深度神经网络模型 GoogLeNet 在具备 600 万模型参数基础上也能达到同样甚至更好的效果。因此，在超大模型领域，很多人为了追求推广效果，营造出参数规模越大模拟效果越好的现象。随着时间推移，当用户对模型规模审美疲劳之后，会发现模型的结构以及模型的可解释性等细节问题变得更加重要。

不过，这一现象也是科研领域技术迭代很典型的发展过程，即爆火的技术吸引无数人蜂拥而至，而当大家发现此方向过于片面之后又会重回原来的位置。

或也是深谙此理，Altman 在上周也回应称，OpenAI 目前没有，而且在一段时间内也不会有开发 GPT-5 的计划。最后，对于追求参数量的大模型即将接近尾声，你怎么看？

标签：

推荐文章

焦点速读：日本政府考虑取消重要人物街头演讲改为室内进行

OpenAI CEO Sam Altman：巨型 AI 模型时代即将终结！

股权转让变更登记流程_天天微动态

NBA战报：凯尔特人119-106力克老鹰,塔图姆29+10+6,D-穆雷29+6+6

首发丨「微新生物」完成数千万元天使轮融资，打造数据驱动微生物组工程平台

当前关注：人人贷网贷逾期42年拖欠多久会上征信系统

全球观察：国联证券给予卫宁健康买入评级，当期业绩承压，行业复苏值得期待

吕梁市水利局2023年度农林水利类校园招聘面试岗位体检及考察递补公告

英国经济下行压力加大（经济透视）

世界热消息：“五一”返程火车票今起开售这些线路车票或紧张

世界快看：苹果版“余额宝”来了！年利率4.15% 10倍高收益！半月前刚推出“花呗”

他来听我的演唱会吉他谱_他来听我的演唱会

【欧冠】“你罗（德里戈）”梅开，皇马2比0双杀切尔西|当前通讯

天天播报:警惕！上海多家三甲医院周围被这类人“蹲守”，已有多人上当！网友怒了

世界聚焦：台媒：世卫称台湾能否出席世卫大会由194会员国决定

Henchman：2023年法律技术趋势_环球速看

北京长峰医院发生火灾北京市：当务之急是全力以赴救治伤员-快资讯

吉安市气象台更新暴雨黄色预警信号【III级/较重】【2023-04-18】

今日讯！微星科技X99AGAMING9ACK电竞主机板荣获COMPUTEX2015BestChoice年度最佳产品金奖

世界报道:专访看度新闻负责人：深化融合之下 “看视界见温度”的融媒之路

2022北京地铁10号线时刻表_地铁10号线时刻表世界聚焦

2023东莞南城街道cbd北部学校_全球热文

世界速看：2023青岛海军舰艇开放知识竞答活动时间

每日热讯!巧课psvip_巧课ps官网

要闻：steam《Teravit》进不去、卡顿掉线延迟高问题解决方法

环球观焦点：门户网站有哪些安全风险_门户网站有哪些

机箱风扇接口种类_机箱风扇接口

泡疹需要怎么治疗（泡疹自己怎么治疗）

沧州贷款需要满足哪些条件？_天天要闻

【全球时快讯】手机充电充到多少拔掉（手机充电充到多少最好）

焦点速读：日本政府考虑取消重要人物街头演讲改为室内进行

OpenAI CEO Sam Altman：巨型 AI 模型时代即将终结！

屏幕前干起“新农活” 江西全南县“华农兄弟”电商助农带动乡村致富

每日热门：苏丹武装部队与快速支援部队同意临时停火24小时

2023上海国际车展为新产品新技术提供平台推动汽车消费_环球热资讯

《2022年中国互联网保险消费者洞察报告》：商业养老险最受“80后”关注

贝尼特斯：切尔西请兰帕德是冒险赌博，利物浦很快会回胜利轨道

【天天播资讯】菲律宾空军又订购六架NC212运输机

世界关注：建信优享稳健养老目标一年持有期混合型基金中基金（FOF）分红公告

信息：裳的拼音和组词_汉字裳怎么组词

体检查出结节的人，为啥越来越多了？

天天日报丨AI绘画下的城市 10秒钟带你看从未见过的滨州

一季度个税下降4.4%，房产税增长23.1% 财政部解释原因_天天观速讯

光丽科技(06036)：托管人根据限制性股份奖励计划购买合共238万股

为什么不建议公积金买二手房？贷款可以提前还吗？

权威发布丨金融服务实体经济如何“质效提升”？这套“组合拳”很精准！全球观速讯

全球看热讯：本田副社长：2027年后在中国市场不再投放新的纯燃油车型

当日快讯：中信证券：未来陷入流动性陷阱与通缩的可能性并不高最新

济南童康儿童医院案例：抽动症延误诊断的原因有哪些？|环球热点

环球通讯！市博物馆有奖征文本月底截止

库里：我们有能力但问题在于能否执行这将决定我们系列赛命运|重点聚焦

怎么找回最近卸载的软件怎样恢复电脑上删除的文件

天天通讯！宁安：春风送暖稻田间税惠古城千万家

胡家园街道佳美苑社区：踏青采摘挖野菜田间地头品悠悠乡愁

布莱德索家人们我被禁赛没打这场篮协罚单出炉后上海队前外援比斯利躺枪被禁赛的布莱德索也发文撇清关系(今日/头条)-环球头条

概率计算公式c怎么算的_概率公式c怎么计算全球时讯

X 关闭

最新资讯

【快播报】司太立(603520)：原材料成本、商誉影响业绩看好今年困境反转

《幽灵线：东京》XSX版的表现比PS5更差_今日最新

天津居住证线上在哪里申领？

焦点关注：空头遭受考验之际这些股票会出现反弹吗?

罔顾事实真相，睁眼说瞎话（望海楼）——污蔑中国抗疫，美方何其荒唐 ①

香飘飘2023年第一季度净利584.63万销售商品收入增加

如何系项链绳_14岁女孩生日送什么礼物好一些当前速看

全球看点：邓为回忆和陈都灵初见场景，谈适应演员身份后自己“超爱”

每日视点！中国国贸：4月17日获融资买入226.08万元，占当日流入资金比例10.16%

减肥时期可以吃杏吗_减肥期间可以吃杏吗

天天消息！学生意外险哪家好意外险哪家好

对话：信创不只是国产替代，更是新技术突破

彩色玻璃蚀刻

三国最牛女将，丈夫是赵云，哥哥是五虎上将，如今少人清楚！-世界球精选

geek打不开怎么办_geektyper打不了字

太平附加福利全佑重大疾病保险是消费险吗？怎么样？

三顾“办公软件”，快手能否后来居上？

沿着长江领略三峡风光！300名游客乘坐旅游专列从上海出发|当前信息

全球观点：武功来了罕见侠客有哪些武功来了罕见侠客一览

自制海洋生物服装创意

淄博烧烤凭什么？世界滚动

三国群英传m2阶兵符_三国群英传兵符出处

西宁到南昌自驾游路线(西宁到南昌怎么走最方便)

海油发展：公司持续深入开展提质降本增效行动，推动降本增效管控向一线经营主体延伸，公司资产质量和盈利能力进一步提升

饼肥如何发酵腐熟？饼肥是氮肥还是钾肥？世界快看

仙乐健康（300791）盘中异动股价振幅达7.99% 上涨6.98%（04-17）

第一年退保险要扣百分之多少？业务员要返佣金吗？

乘高铁去春游2.0版！这些城市上海出发2小时就能到-最新资讯

《马里奥兄弟大电影》马里奥亲属形象由任天堂设计

新动态：本年度黄河流域转入枯水年宁夏、内蒙古等地用水指标紧缺

世界实时：元朝行使宰相职权的政府机构是哪里_元朝行使宰相职权的政府机构是

恭喜老查留学收获埃默里大学录取_全球观察

智通数创创投周报丨AI、元宇宙项目融资持续落地，宜宾锂宝完成25.78亿B轮融资

牛顿环实验_牛顿环-全球快讯

人物传记《当今奇人周兴和》三十四再婚夫妻生芥蒂_环球简讯

new padfone infinity_new pad 世界热点评

天天信息:仙剑5配置参数（仙剑5配置）

【环球报资讯】云南景谷：水灯点亮星夜似满天星河

热点在线丨Android 13 市场份额快速增加，三星功不可没

田亮夫妇为女儿庆生，十五岁森碟穿露肩礼服，画淡妆五官变化大

南航航空公司招标网_南航cz3739

含有反义词的四字词语大全1_含有反义词的四字词语大全

男士生日送什么礼物合适-环球观速讯

省属企业经济运行实现一季度“开门红”_今日精选

全球视点！gy3z.com/cw_tdlz_ht_http www 10010 com

天天速看：人寿盛世尊享20年收益计算？保障什么？

养分归还学说_养分

中注协提示持续经营能力存在重大不确定性的上市公司年报审计风险_天天信息

永清集团、赣锋锂业等四方签约联合打造新能源产业链

当前速读：Remedy Entertainment 启用新LOGO，今年将推《心灵杀手2》游戏

X 关闭

精彩图文

NBA战报：凯尔特人119-106力克老鹰,塔图姆29+10+6,D-穆雷29+6+6

首发丨「微新生物」完成数千万元天使轮融资，打造数据驱动微生物组工程平台

当前关注：人人贷网贷逾期42年拖欠多久会上征信系统

全球观察：国联证券给予卫宁健康买入评级，当期业绩承压，行业复苏值得期待