来源: 华尔街见闻官方 上海
作者 | 刘宝丹 编辑 | 周智宇 近一周,资本市场再度刮起AI大模型热潮,“豆包概念股”迎来普遍上涨。对此,字节十分罕见地出面回应。 12月19日晚,字节发布风险提示称,资本市场出现炒作“豆包概念股”现象,流传着众多夸大其词甚至是虚构的内容,涉及字节资本开支、数据中心花费、AI硬件、应用合作等多方面。“请投资者切勿轻信市场传言,以免遭受不必要的投资损失。” 资本热捧背后,字节用两年时间在AI大模型领域实现逆袭,打了一场漂亮的翻身仗。 亮剑 今年初,抖音CEO张楠辞职, 这位抖音核心骨干决定转战AI应用战场。经过一年的蛰伏,她带着最新产品即梦AI现身火山引擎Force冬季大会。 12月18日,如今已是剪映业务负责人的张楠公开表示,借助GenAI的技术,可以把每个人脑子里的奇思妙想快速视觉化,像做梦一样,这也是‘即梦’名字的由来。 作为字节旗下剪映业务的一个板块,即梦AI2024年5月上线,定位是AI内容平台,支持通过自然语言及图片输入,生成高质量的图像及视频,即梦AI还在业内首创了“一句话P图”“一键海报”和“动态海报”能力,大幅提升了图片中文字生成的准确率。 目前,创作者已经开始在即梦创作短片,今年7月,抖音上线了通过即梦创作的科幻短剧《觉醒》,这也是抖音上首部单日点赞破40万的AI短剧。 这只是字节重投AI的一个侧面。过去一年,字节一直在疯狂赶进度,从斥资购买GPU芯片到组建以Flow为核心的AI架构,再到从阿里等大厂高薪挖人,字节努力补齐此前因技术判断失误而拖慢的AI大模型进度。 如今看来,字节不仅推出包括多模态在内的豆包大模型家族,还通过降价等方式加速豆包大模型在应用端的使用。而随着应用不断深入,字节预计很快会展现出商业化方面的潜力。 会上,字节一口气晒出了最新成果,重头戏是豆包视觉理解模型的发布,这是一款具备内容识别、理解和推理、视觉描述和创作等能力的模型,标志着公司向多模态迈出关键一步。 与大模型同时发布的还有价格。谭待表示,视觉理解模型的定价模式依然基于Tokens,模型会把图像编码转成tokens,和文本tokens一同计费。 他进一步表示,“Claude是每千tokens2.1分钱,GPT-4o是每千Tokens 1.7分钱,阿里千问是每千tokens 2分钱。豆包视觉理解的定价是每千tokens 3厘钱,比行业平均价格降低85%。” 豆包·通用模型pro也迎来升级,同时,字节还透露了多个垂直领域模型的进展。 火山引擎总裁谭待表示,12月通用模型pro完成了新版本的迭代,相比过去又有了大幅提升。“豆包pro已经全面对齐GPT-4o 能力,甚至在部分复杂场景复杂任务中,效果表现更好。而且使用价格只有GPT-4o 的八分之一。” 追赶 在经过两年多的发展后,AI大模型的发展重心已经从技术迭代向应用侧转移,这也是外界关注的焦点。 据谭待介绍,豆包大模型5月发布以来,日均调用量呈现高速增长。“5月模型日均tokens 1200亿;到7月份涨到了5000亿,到9月份1.3万亿;而截至12月15日,豆包大模型的日均tokens数已经突破了4万亿,在7个月的时间里增长超过33倍。” 字节大模型正在加速行业渗透。谭待表示,大模型在各种场景中都在全面开花,尤其是和企业生产力相关的场景,比如信息处理场景,最近3个月豆包的调用量增长了39倍,在硬件终端场景,豆包增长了13倍。 有市场消息称,苹果正在和字节等多家公司洽谈,意在将后者的人工智能模型整合到中国版iPhone中,谈判仍处于早期阶段。对此,字节暂未回应。 一些细节也彰显了字节在应用方面的决心和力度。今年中秋,字节一款给客户的玩具“显眼包”悄然走热,它主打聊天式情感陪伴,目前处于奇货可居状态,这也让字节内部颇感意外,可以确定的是,这个案例加快了字节AI在更多场景落地的速度。 |