来源: 36氪 北京
文 | 周鑫雨 编辑 | 邓咏仪 “GPT-3.5(ChatGPT) API将在某个时刻退役——只是不确定在何时。”在The Verge的采访中,OpenAI API平台负责人Olivier Godement如此总结。 而如今,ChatGPT的缔造者——OpenAI,率先“终结”了好大儿ChatGPT。 太平洋时间2024年7月18日,OpenAI推出了新款模型GPT-4o mini。这款新模型,是被业界称作“做接近《Her》”的多模态模型GPT-4o的“子弹版”:尺寸更小、价格更低,但性能强劲。OpenAI在官宣中将其称为:
OpenAI最具性价比的轻量级模型。
OpenAI X。 OpenAI创始人兼CEO Sam Altman激动得刚开场就大开香槟:
我们认为,人们会非常、非常喜欢使用新模型。
Sam Altman X。 目前,ChatGPT的非企业用户(包括未订阅者、ChatGPT Plus和团队版本订阅者)即日起就能尝鲜到这款新模型,而GPT-4o mini在下周也将对ChatGPT企业用户开放。 OpenAI预告,在未来几天内,支持GPT-4o mini微调的API版本也将推出。 比GPT-3.5便宜60%,比GPT-4更会聊天 在信奉“大”的Scaling Law(规模定律)成为模型训练第一性原理的当下,贵,一直是大模型落地的痛点:API贵,使用过程中产生的推理成本更贵。 能让Altman连吹“彩虹屁”,GPT-4o mini最关键的卖点,就是将奢侈品做到了地摊货的价格:
输入:15美分/百万Tokens;输出:60美分/百万Tokens。
相对地,打响OpenAI内部模型价格战的GPT-3.5 Turbo,价格为:
输入:50美分/百万Tokens;输出:150美分/百万Tokens。
这意味着,GPT-4o mini,比上一代的GPT-3.5 Turbo便宜了60%多。 在性能的硬指标上,GPT-4o mini在文本理解和多模态推理维度的学术基准测试中,已经超越了GPT-3.5 Turbo和主流的轻量模型,且支持GPT-4o同等多的语种。
GPT-4o mini的性能测评结果。图源:OoenAI 与此同时,GPT-4o mini(上下文窗口为128K)不仅在长文本处理性能上优于GPT-3.5 Turbo(上下文窗口为16K),也有出色的函数调用能力,这意味着开发者可以基于这个底座,构建性能更优异的AI Agent应用。 据OpenAI介绍,在与金融科技公司Ramp的合作测试过程中,基于GPT-4o mini开发的收据费用数据提取应用,无需文本数据,只根据上传的收据图片,就能为用户进行收据分类。 视听,一直被认为是比文本和图像更有可能颠覆现有人机交互方式的两种模态。 脱胎于可以实时处理音频、视频和文本的GPT-4o,多模态理解能力也成了GPT-4o mini的杀手锏。在大模型测评机构 LMSYS的聊天机器人竞技场排行榜中,GPT-4o mini的排名超过了GPT-4。 目前,GPT-4o mini提供的API服务,支持文本和视觉两种模态的处理,在未来,其支持的模态还将扩展到图像和音频。 通往AGI的奥义是,AI要更便宜 自2023年下半年起,“落地”就成了AI圈内最常提及的话题。 一个明显的趋势是,为了加快AI的落地,模型尺寸在变小,更轻量、更垂的模型不断推出,模型变得越来也便宜—— |