《自然》杂志:AI模型并不是“越大型越好”
,随着 AI 模型体积越来越臃肿,一些研究团队开始提倡效率更高、体积更小的专用模型来取代“大型 LLM 语言模型”。
据《自然》杂志报道,当下 OpenAI 的 ChatGPT 是技术界的新宠,但是当 ChatGPT 遇到一些需要推导的数学问题时,它便会常常犯错,《自然》杂志同时举出一道代数题展示 ChatGPT 的局限性:
一条直线与 y=4x+6 平行且经过 。它和 y 轴的交点的纵坐标是多少?
《自然》杂志表示,虽然 ChatGPT 有时候能给出正确答案,但该模型依然有极高概率回答错误。而在杂志官方进行的早期推导能力测试中,ChatGPT 面对美国中学水平的数学题集时,只答对了 26%。
《自然》杂志同时表示,在 2022 年 6 月,谷歌一款名为 Minerva 的专用数学计算模型突破了业界“大语言模型计算数学不行”观点,据悉,Minerva 在数学题集中答对了 50%,这一结论让 AI 领域的研究者们大为吃惊。
微软研究院的机器学习专家 Sébastien Bubeck 彼时对此表示:“在 AI 圈子里,这还真是个新奇事。”
《自然》杂志据此声称,Minerva 模型的结果佐证了研究团队们长时间以来的怀疑:训练更大型的 AI 模型并不是解决“逻辑问题”的正道。
不过,《自然》杂志也对这一观点保留一定意见。他们注意到,有些研究团队的实例表示“更大的模型只是在碰巧与训练集相关的问题上回答得更为出色,而没有获得回答全新问题的能力 ”。
《自然》杂志同时给出了一系列表格,展示了当下大型 AI 模型的参数对比:
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
郑重声明:此文内容为本网站转载企业宣传资讯,目的在于传播更多信息,与本站立场无关。仅供读者参考,并请自行核实相关内容。
标签:
- TP-Link日本推出新款ArcherAX1800路由器:立式设计,体积
- 深蓝S7车型获DeepalOS1.3版本OTA升级:新增后台App管理,
- 小鹏汽车二季度营收50.6亿元同比下滑32%
- 天津市批复京津冀同城商务区建设总体方案
- 199元,雷神十合一拓展坞开启预售:兼容苹果M1/M2芯片
- LGStanbyMEGo“旅行箱智能屏”上市:27英寸FHD,1000美
- 谷歌Chrome116浏览器稳定版发布:推进PrivacySandbox
- Setapp计划明年在欧洲推出替代苹果AppStore的应用商店
- 吉利汽车机器人品牌“极越”由集度更名而来,已获生产资质
- 英特尔部分锐炫A770/A750显卡存在安全漏洞,去年第四季度售出产品受