![]()
来源: 网易科技报道
6月3日消息,近期,美国对华芯片出口管制持续收紧,迫使像DeepSeek等中国AI开发者在有限的算力资源下,探索更高效的模型训练方法。两位中国投资人和一位初创企业创始人表示,尽管面临这种困境,但中国AI行业的创新势头仍将持续。 AI初创企业ReOrc的创始人兼CEO Tony Ren表示:“当看到DeepSeek V3模型的表现时,我们意识到,可以基于该模型在中国本土开发出新的AI功能。”蓝驰创投的管理合伙人谭锐(曾投资月之暗面等多家AI模型公司)也指出,应用开发者正在尝试混合调用DeepSeek V3、阿里通义千问等多个大模型,而不再依赖单一技术,这加剧了各大模型开发商之间的竞争。 然而,由于中美关系紧张以及高端AI芯片禁售的影响,中国AI产业的发展仍然存在不确定性。伯恩斯坦资深半导体分析师林庆元认为,美国的芯片出口管制实际影响可能并不像外界预期的那样严重:“监管漏洞削弱了政策效果,同时中国企业在国产AI芯片研发方面已取得显著进展。” 同时,这些出口管制措施也为华为等本土AI芯片厂商创造了赶超英伟达的机会。林庆元指出,尽管目前中国大多数AI开发者仍然偏好英伟达的CUDA软件,但出口管制正促使他们逐渐转向并依赖本地软件生态系统。 DeepSeek的崛起也刺激了华为等芯片设计商增加对AI技术的投资。林庆元提到,华为最初在扩展AI芯片开发方面保持谨慎态度,但在DeepSeek证明其能够在较低性能的英伟达芯片上完成模型训练后,华为随即调整了策略,积极加大投入。 鉴于获取AI系统所需的高端芯片面临严格限制,许多初创企业被迫采取“双轨战略”,即同时针对中美两大市场进行布局。 以下是针对Tony Ren、谭锐以及林庆元的访谈摘要: 问:你们的应用基于哪些基础模型构建?DeepSeek跻身全球顶级模型行列是否改变了你们的选择策略,比如开源与闭源? Tony Ren:我们采取全球化布局,中国团队服务本土市场,海外团队覆盖亚太及其他地区。去年,当DeepSeek尚未崛起时,我们面临着找不到合适的基础模型来开发符合中国市场合规要求的应用。最初,我们选择了性价比突出、适合开发的DeepSeek V2,这个版本虽然在token成本上没有太大压力,但性能与OpenAI和Anthropic等顶尖模型相比仍有一定差距。 然而,DeepSeek V3的崛起彻底改变了局面。现在,我们能够基于该模型在中国部署智能体,并在数据平台上提供各种AI功能。目前,我们的中国业务主要依赖DeepSeek V3和阿里Qwen 3,而海外智能体功能则基于Claude 3.7构建。如果未来工程资源充足,我们也会考虑整合Claude Sonnet 4,但目前模型迭代速度实在太快。 问:阿里Qwen 3在某些方面可能优于DeepSeek,这是否会挤压月之暗面等企业的生存空间?中国“六小龙”及独立大模型开发商在激烈竞争中前景如何? 谭锐:月之暗面等公司必须不断提升大模型的质量,并且要构建生态系统,吸引更多合作伙伴来使用他们的模型。作为投资人,我认为行业的发展不应仅仅局限于单一模型的竞争。事实上,整个AI领域正在向智能体应用转型。例如,我们投资的智能体公司GenSpark就采取了“模型中立”策略,即根据客户的不同需求调用多个模型和智能体的组合。最终,客户关注的仅仅是结果,而不是具体使用了哪些模型,因此开发者在选择工具时必然会趋向多元化。 问:美国芯片出口管制是否仍将继续成为中国在AI领域创新的制约因素? 林庆元:美国的芯片出口管制确实带来了很大挑战,尤其是在获取先进计算能力方面,但其效果并不像外界预期的那样有效。中国实际上已经在加速7纳米半导体的生产能力,预计今年本土7纳米芯片产能将翻倍。如果每月增加10,000片先进逻辑生产晶圆,这意味着每年可以生产大约200万颗AI芯片。此外,我们预计今年中国还可能再增加每月20,000片晶圆的产量。这些来自中国本土的额外供应将在为国内AI产业提供计算资源方面发挥重要作用。而且,出口管制反而催生了国产AI芯片市场的崛起,逐步替代了英伟达的市场份额。 |