香颂资本董事沈萌也提到,从技术架构来看,Sora其实并没有脱离大语言模型本质,仍是基于深度学习的框架。 马千里解释称,从底层架构级技术角度看,Sora的确没有很多创新,DIT技术中Diffusion和Transformer都是几年前的技术了。但Sora的特殊之处在于,它率先实现了大规模的工程化,也就是说把原本应用于文本领域的Transformer技术大规模、成熟地应用在了文生视频模型当中。此外,它还进行了很多工程层面的创新,比如视频时空块Patch技术等。 郑譞也提到,虽然Sora的效果非常惊艳,但还不能称为理论基础上从无到有的颠覆,但这并不意味着工程上的颠覆就不是颠覆。“当工程量呈现指数级的上升时,一定会出现各种见都没见过的问题,解决这些问题本身可能就是一种颠覆。” Sora另一种层面的“颠覆”,集中体现在外界对Sora取代影视行业从业人员的担心上,一如当年ChatGPT所引发的行业替代焦虑。 不过在沈萌看来,目前Sora只是公开了一些官方视频,很少有人实际应用,所以其效果到底如何是没有定论的。而OpenAI CEO阿尔特曼又是一个极度擅长营销的人,他一定想通过这样的方式最大程度地放大OpenAI的估值。 由此,Sora也同步进入了被“祛魅”的过程。广发证券分析称,Sora的主题意义更为显著,商业化进程仍需观察,一方面,技术文档提到的当前局限性需逐步解决;另一方面,版权合规、内容伦理等课题仍是AIGC类应用需要克服的挑战,文生视频也不例外。 上述业内人士也提到,Sora生成效果堪称惊艳,开启了世界模拟器的进步,但还说不上颠覆性。 Sora不是AI的终点 判断一件事情火不火,一个关键的“指标”就是有没有人卖课。 Sora发布不到一周,尚未对公众开放测试权限,卖课视频就已经先一步泛滥于闲鱼、小红书等平台。北京商报记者以“Sora文生视频”为关键词在闲鱼上搜索,共呈现59条相关内容,价格从9.9元到169元不等。 这些“教程”广告中,一张以“Sora一键文生视频”为标题的海报被广泛使用。海报内容显示,资料包包含“你的Sora专属提示词库”“Sora专属提示词教程”和“30个Sora专用提示词技巧”三方面。 而透过卖课的“割韭菜”,或许不难摸索国内科技产业发展的乱象和虚火。沈萌称,国内产业的生命周期,大多以抄概念为起点,然后大举跟上,进而衍生一些浅层的应用,进行融资、套项目,最后上市或进行各种程度的资本变现,至此这股风就算过去了。 “整个环节认真、踏实做事的比例很小,这反映出的问题,其实就是不知道自己在干什么。”沈萌说,越是可替代,越是价值低,这就是国内AI产业的现状。 沈萌总结称,投资者或者机构都觉得AI是风口,疯狂砸钱,但没有人去分析砸钱的最后能砸出什么东西,“如果最后的结果是要进行价格的红海竞争,这种项目是铁亏无疑的”。 有消息称,2023年12月至今三个月内,已有包括万兴科技、博汇科技、易点天下、数码视讯、汉王科技、当虹科技、东方国信等在内的十余家A股公司,在投资者互动平台上披露过视频生成模型领域的业务情况。 郑譞认为,大模型里面到底能装多少现实世界的知识,目前还没有特别明确的判断,也就是说Sora并不是AI的终点,未来还有很大的发展空间,最后是谁领先都还不好说。 “所以面对Sora带来的挑战,不妨让子弹再飞一会儿”。郑譞说。 北京商报记者 杨月涵 |