胡厚崑还提到,华为一方面要持续提升通用大模型能力,另一方面还要建好行业模型,行业大模型能在通用大模型的基础上给出更精准的答案。 华为推出了三层大模型结构,最底层称之为“读万卷书”,对标的是通用大模型,再上一层是做好海量基础知识学习,最上一层是打造行业模型和场景模型,被称为“行万里路”。 胡厚崑谈道,从读万卷书到行万里路还有很多挑战需要克服,最关键的一点是要把各行各业的知识与大模型进行匹配、融合。 当前,华为盘古大模型围绕金融、电力等10多个行业,支撑400多个场景AI应用业务落地。 在AI服务于科学研究方面,盘古科学计算大模型包括药物分子、海浪、气象大模型,如气象研究领域,盘古大模型可以在几秒内完成全球一个小时到七天的七项情况预报。AI将为科学工作者带来更多新思路、新方法,为人类社会发展带来新动能。 四、Meta首席AI科学家杨立昆:我不喜欢AGI这个提法 2018年图灵奖得主、Meta AI基础人工智能研究(FAIR)团队首席AI科学家杨立昆(Yann LeCun)和地平线创始人兼CEO余凯进行了线上交流。
▲右为Meta AI基础人工智能研究(FAIR)团队首席AI科学家杨立昆(Yann LeCun)、左为地平线创始人兼CEO余凯 在过去十年里,AI最让人激动的进展是,自主监督运行创造了一场革命。杨立昆认为,自然语言处理如语言模型、语音模型等符号或者本质上和符号序列有关的技术正在创造一场革命。现在要做的就是在图像和视频领域上推动同样的革命。 杨立昆曾发表过ChatGPT不是AGI终局的观点,这次他也谈到了自己的实际判断基准。 他并不喜欢AGI这个词,他认为每一个智能都是专项的,人类的智能也都是非常专业、专项的。 ChatGPT使用文本训练,无法用图像、视频训练,它可以试图预测文本中缺失的单词、长文中最后一个单词,但这样的问题是它不可能准确预测文本中缺少的单词,而是必须预测所有单词的分布。 在视频中,下一帧和上一帧有可能类似,但模型无法耦合视频帧中出现的所有细节,使用不同的非生成式架构,联合构建预测架构,而不是在像素空间中做预测,问题就是你应该怎么训练他。 大模型并不满足于一个目标,它们通过设计提示,使得你训练的统计数据足够优质来达到目标,但基本上这一目标都无法被控制。 大模型一个接一个生成tokens,但它们不理解物理世界,没办法规划、推理就没办法实现目标,这也意味着智能系统缺少非常重要的组件,在律师考试中,大模型可以发挥强大的检索能力获得很好的成绩,但它没有足够智能的系统,去把碗碟放到洗碗机中。 而世界模型就是要让模型像人类了解世界的方式一样了解世界,通过观察和少量交互的方式来训练。 谈及人类对AI安全的干预时,杨立昆谈道,达到人类水平的AI最好办法就是做更大的自回归LLM,而让它变智能也是让它更可控的途径。 人们通过目标驱动人工智能的理念,就可以设置其它目标作为其安全护栏,如让这些系统不会出现欺骗、支配人类的行为、迫使AI诚实的目标、屈从于人类的目标,而需要小心那些让模型好奇的目标等。 杨立昆不同意有些人害怕AI就希望AI受到严格监管,他认为从长远来看,要让AI平台安全、良善、实用的唯一办法就是让它开源。 想象一下,未来每个人都可以通过AI助手和数字世界进行互动,如果技术只被少数公司控制的话并不是好事,未来的AI系统应该保护人类所有知识,其训练的方式也应该基于公开源头。 五、微软侯阳:大模型的“涌现”爆发绝非偶然 AI作为科研项目,最早出现在1956年,至今已发展将近70年。去年年底ChatGPT一夜爆红,使得生成式AI瞬间爆发,很多科技从业者对其突然涌现感到惊诧不已。 微软全球资深副总裁、微软大中华区董事长兼首席执行官侯阳博士谈道,在微软看来,所谓的涌现绝非偶然,这是无数优秀科研人员数十年如一日的研究积累、海量计算资源的投入,才造就了这样的创新成果。 |