专栏采访: 瑞泊控股董事长,人工智能发展的中国范式(超长全文)发表时间:2024-05-06 11:29 “英国作家塞缪尔·约翰逊有一句名言:我可以给你一个观点,但我不能给你一种理解。大模型技术很新,距离实质性突破即OpenAI发布GPT3.5不过一年多的时间。全球都在热议,各种观点满天飞:有人说这是最好的时代,也有人说人类可能因此面临严重的生存危机;有的人盲目自信,豪言壮语说要用多长时间赶超GPT,而有的人说我们跟美国的差距越拉越大,AI领域我们已经被国际主流边缘化了。众说纷纭中有不少高价值的观点,这样的观点大多来自对这项技术有深入了解的科学家、企业家,但确也不乏不明就里、人云亦云者,和为了吸引流量、增加粉丝,凭空臆想、胡编乱造、满嘴跑火车的诸君。作为较早进入这一领域的从业者,我可以跟大家分享一些我们的观点,但往往深度的东西确实很难表述,有很多我们自己也在持续地研究中,譬如:大模型为什么会能力涌现?正如维特根斯坦说:世界是事实的总和而不是事物的总和;凡是能够说的事物,都能够说清楚,而凡是不能说的事物,就应该沉默。”近日,北京瑞泊控股(集团)有限公司(以下简称“瑞泊”或“瑞泊技术控股”)创始人、董事长乙壤月博士在接受记者专访时如是说。 瑞泊是中国最早一批进入预训练大模型技术领域的团队之一,自2018年起与OpenAI等国际主流AI实验室同步开始预训练大模型的研发,而瑞泊团队在自然语言处理技术上已有超过十年的技术积累。瑞泊是领先的人工智能国家高新技术企业、「北京市通用人工智能产业创新伙伴计划成员」大模型伙伴成员企业、国家科研机构科技成果转移转化基地及科技成果转移转化一等奖获得者,中国AI金雁奖“技术创新大奖”获得者。2023年瑞泊在大模型领域更是获得了国家十大大模型案例、中国生产力促进中心特色产业集群赋能特色案例(瑞泊金融超脑)等重要荣誉。在创立瑞泊之前,乙壤月博士曾在华为、京东等高科技集团担任高层管理职务,拥有丰富的大型IT企业管理及创业项目运作经验。 在采访中,乙壤月博士向记者表示:“2023年有很多统计数据称国内做大模型的科研院所、企业加起来超过200家,截至现在已开放的通用大模型就有20多家了,但实际的情况却是:真正有能力训练模型的机构非常少,有能力训练千亿以上参数大模型的机构就更是屈指可数,而这个数量其实与美国已经公布的大模型数量与机构数量是相当,甚至是更多的。”在最近一年多的时间里,瑞泊密集接待了来自政府部门、企业界等诸多机构的访问、调研与合作洽谈,“我一年来,基本上就没怎么在办公室呆过,大部分时间都是在会议室接待,有时候一天三四场交流。”,真切感受到大模型技术的火爆“出圈”,与瑞泊创办之初——大模型还只是计算机科学范畴内的三级甚至四级分支技术且非常冷门的状态形成了鲜明对比。大模型是否是通往AGI(通用人工智能)的终极密码?目前业界仍众说纷纭,莫衷一是。当被问及如何看待以大模型为代表的新一轮AI热潮时,乙壤月博士则给出了一个颇为坚定的回答,他认为“大模型技术的突破,至少是文明级的技术突破”。 从“偏门”走向“大火”的预训练大模型技术 人工智能科学从20世纪中叶诞生至今,经历了几波冷热交替的发展浪潮,其间机器学习、数据挖掘、知识图谱、专家系统、图像识别、语音识别、自然语言处理等细分领域技术轮番登场。如果回溯预训练大模型的开端,业界往往会将时钟拨至2017年。这一年,谷歌提出了Transformer架构,这是一种利用多头自注意力机制来提高模型训练效率的架构,适用于并行化计算,相较以往的自然语言处理模型在精度和性能上具有大幅地提升,因而迅速占据主流地位,并且催生出多个“变种”。其中,谷歌2018年推出的BERT模型,第一次在阅读理解上超越了人类专家水平的人工智能。2022年11月30日,OpenAI公布了其“大力出奇迹”的工程成果ChatGPT——这是一个在预训练大型语言模型GPT-3.5基础之上,再集成了监督微调、人类反馈强化学习等多种方法之后的一个“用户友好型”的聊天助手,在这之后大语言模型便以迅雷不及掩耳之势加速奔跑,以大参数、大算力、强算法为显著特征的“规模效应”(Scaling Law)被大模型厂商奉为圭臬。 记者:您为什么认为“大模型至少是文明级的技术突破”? 乙壤月:人类的发展是一个漫长的历史过程,科学技术的发展对人类文明的形成与演进,起着至关重要的作用,科技的发展是叠加性进步且不断加速的。上一次人类文明级的技术突破是蒸汽机,蒸汽机技术把热能转换成动能,使人类第一次完成了在生产劳动中以“热力”代替人的“体力”的革命性飞跃;而这一次大模型技术的突破,是将“电能”转换成了“智能”,增加了脑力劳动的不断输出,是机器智能对人类智能(或者叫智力)赋能及替代的开端。 说大模型至少是文明级的技术突破,也是因为大模型的“能力涌现”,机器开始能够理解人类的语言并且开始“会说人话”了。要知道人与其他动物最本质的区别,既是在于人类具有高度发达的语言能力,至于其他人类有别于其他动物的假设——譬如是否会直立行走、是否会用火、是否会制造和使用工具、是否有镜像认知等等,都已经被科学研究所推翻。语言被认为是人类智能的标志性能力,当人类没有语言的时候,我们其实无法去广泛认知这个世界,语言的边界其实就是世界的边界。就如《人类简史》中所描述——‘智人之所以能够成为这个星球唯一霸主,一个重要的原因是他们发展出了虚拟的语言。’我们要时刻记得,现在我们通常所说的大模型的全称是“预训练大语言模型”,随着大模型技术的突破,人类独有的语言能力被打破,人机关系呈现新的特征,因为机器带来的语言边界的扩大将导致我们认知的世界边界的扩大。机器掌握了语言,强人工智能时代就到来了。大模型技术将带领人类迈向通用人工智能(AGI)的未来,开启新的人类文明。未来的到来,不会是像科幻大片那样,一觉醒来你就突然穿越到了一个机器人满地跑,汽车满天飞的新世界,实现AGI这一过程一定是渐进的、不断叠加迭代的,身处其中的人们大多无感,但如果李白穿越到了今天,他会不会认为咱们都是上神? 记者:瑞泊创立之初,国内外的大模型领域是一个什么样的状态? 乙壤月:大模型技术属于人工智能科学中自然语言处理的子领域,很长时间以来都是是比较冷门的,因为难度大、门槛高,譬如对于算力、技术、数据的要求都很高,更关键的是它还走了与其他门派大相径庭的技术路线——历史上大部分机构的人工智能研究都非常依赖人类的直觉和经验,试图通过精心设计的规则和算法来模拟人类的智能,但这种方法的问题在于人类知识的有限性以及对特定领域的偏见。相反,大模型是利用海量的算力和数据,通过让模型自监督学习的方法来取得了让人惊讶的成果。强化学习之父、加拿大计算机科学家理查德·萨顿在其著述的《苦涩的教训》中指出:“过去七十年来,AI 研究走过的最大弯路,就是过于重视人类既有经验和知识”,所以大模型门派一直是“孤勇者”。 正因如此,一般机构下不了决心做这种投入很大、很少人选择、且前景很不明确的领域,因为算不过来账。所以我说,真正的技术公司是要有信仰的,大模型的能力涌现不是常规事件,而是小概率事件,推动人类重要发展的往往是小概率事件,伟大往往不能被计划。瑞泊开始进行投入预训练大模型技术的时点,跟国际主流的AI实验室基本是同步的,当时国内也就大概七八个机构是明确有团队在跟踪这项技术的,美国的情况也差不多,但是美国的投入确实要比我们大很多很多,差着好几个数量级。我们的感受是这个过程很孤独,特别是在三年疫情期间,这个过程像在茫茫大海中寻找新大陆,又像是在茫茫黑夜中带着队伍前行,朝着心中的圣殿走,又黑又冷,路上也没几个同伴,没有信仰是不可能坚持下来的。 记者:对于ChatGPT的突然火爆,您和瑞泊团队当时是一个什么感受? 乙壤月:我们当然很兴奋,非常明确地知道这应该是我们此生遇到的最大机遇了,从2022年12月份开始,我们大家基本没休过假,天天自觉自愿地加班到半夜。如我前面所说,因为这个领域门槛高,投入的机构很少,专业技术人员也很少,大家的方向是一致的,都在茫茫大海中寻找新大陆。OpenAI通过“暴力美学”第一个喊出来“我找到了”, 展示出了大模型实质性的突破,这比我们预想得要来得快得多,OpenAI给包括瑞泊在内的全球大模型的探索者都指明了前进的道路,但要知道,我们是差不多一起出发的,在新大陆周围都不远,他喊了一嗓子,我们很快也就都过去了。在大模型瞄向AGI的道路上,我们作为国内的先行者要做的就是加速前进的同时保持清醒认识,坚守技术信仰,走自己的路,做好自己的事,“你打你的,我打我的”,中国近代战争史一再证明了飞机大炮不一定能战胜小米加步枪,更何况咱们中国也早已不是小米加步枪了,我们有很多自己独特的优势,做出咱们的特色,在我们的优势领域保持技术领先,这一点我们有信心! 记者:与AI技术进步相伴而生的是对于AI取代的担忧,尤其是大模型火爆之后,职业焦虑情绪充斥在社交媒体中,您怎么看待这种焦虑? 乙壤月:我想起《反脆弱:从不确定性中获益》的作者,也是“黑天鹅”的提出者纳西姆·尼古拉斯·塔勒布说:“在任何职业中,90%的人都是无知的,而是通过情境模仿,狭隘的模仿和半意识的角色扮演来工作的。除了社会“科学”和新闻业——这两者分别为99%和100%。”这句话其实可以更好地帮助大家理解大模型的颠覆性。AI会从先赋能人类的工作,即先打造各种岗位的“Copilot”开始,一直到逐步取代绝大多数之前由人所承担的工作,是大势所趋。当人类迎来工业革命时,我们拥有了强大的机器,很多原来由人所从事的体力劳动的工作岗位消失了;目前在人类从事的用脑工作领域,很多岗位也将会消失,譬如翻译、客服、美工设计师、剧作家这样的岗位消失的速度非常快,2024年开始,营销领域的很多岗位会开始被取代,取而代之的是比我们聪明得多、能干得多的AI。很多人担心人工智能会超越人类的智能,但是别忘了我们人类也同样是在进化的,我们的进化速度也很快,人工智能的群体进化还没开始,目前只是单个智能体的进化速度快。许多人也会焦虑:人工智能是否会像电影《终结者》中描述的一样,AI毁灭人类?我个人认为是不会,但AI取代大多数人类的岗位是大概率的事件。 从人类发展和进步的历史来看,机器的应用所起的作用都是在不断地解放人,推动社会生产力的跨越式发展。人工智能的涌现,无论是各种实体形态的机器人(顺便提一句:大模型技术的突破可以说拯救了机器人行业),还是未来丰富多样的AI智能体、软件,同样也是在不断地解放人类生产力,将人类从沉重、繁杂、重复、艰难、无趣的各类工作中解放出来,人机关系不断迭代、升级、进化,如果人类作为工具性、事务性的职业在未来逐步被AI所取代,那么人类能够有更多的自由与时间用来创意与思考,更认真地体验与享受生活,何乐而不为呢?更何况,这大趋势并不会以人的意志为转移,拥抱变化、正视未来、拥抱AI、善用AI是我们唯一能做的正确的事。 说到善用AI,我还有一个观点:从科技发展史和科技实践来看,技术本身一直都是中性的,它可能造福人类,也可能伤害人类,譬如核能技术,它可以用来发电,也可以用来制造原子弹,关键还是看人怎么用,这是一方面;另一方面,对于AI的风险防控,我们是要加大力度研究,制定和出台相关法规,但这跟交流电发明了之后,要注意用电安全,要制定用电法规有什么区别吗?电不是也能起火、也能电死人吗?一味强化AI的风险,而忽略的AI可以为人类创造的巨大价值,我是反对的。 在行业落地方面,中美起步差不多,有些领域我们甚至领先 今年2月,OpenAI凭借文生视频模型Sora使火热了一年的大模型进一步升温,引发了全社会的关注与讨论。尤其是中国人工智能发展的实际水平如何?跟美国相比差距是在拉大还是缩小?中国人工智能发展有哪些优势?这些问题引发了全社会的讨论,同时也是对AI从业者的拷问。乙壤月博士在接受本报记者采访中也分享了自己的看法,他认为在通用大模型领域,中国与美国确实存在一定的差距,随着以OpenAI为代表的美国科技企业的技术不断迭代升级,且中国面临一系列芯片、算力等被“卡脖子”的情况,这差距暂时很难减小,但是在比拼另一个关键战场是:行业,大模型在这个领域中的应用落地,中美差不多,而且中国具有很多独特优势,我们有信心在这一领域不落后,甚至保持领先。 记者:您提到此前从事大模型研发的专业技术人员非常少,那为什么OpenAI率先能实现技术突破? 乙壤月:从GPT1,GPT2,GPT3,一直到GPT-4、GPT-4 Turbo,再到今年初的文本生成视频模型Sora,OpenAI一次又一次地验证了自己的“大力出奇迹”理念。为什么率先实现从0到1突破的又是OpenAI?为什么OpenAI没有诞生在中国?没错,这是瑞泊在过去一年多来最常被问到的问题。显然,OpenAI的成功由多方面的因素促成,涉及科研的机制、体制、市场环境差异、人才、资金等各方面,都值得我们去反思。 单从商业层面来看,大模型投入巨大,对资金的依赖程度非常高,这也是OpenAI在2017~2019年里围绕是否坚持非营利组织的最初定位、与埃隆·马斯克“分手”的原因。更为重要的是,即使投入了巨大的资金,产出的效果可能还不如其他技术的应用呈现。OpenAI在做“大”模型上“烧”了很多钱,依赖外部微软等科技巨头的投资来维持运转,而盈利却遥遥无期。这种模式创新背后的代价,实际是国内大多数企业组织和投资机构所难以承受的。 总体来说,问题还是出在前沿技术研究的机制上,以及对于技术投入的风险承受能力、评价机制等方面。受中美关系、疫情等复杂因素的综合影响,相对于十年前,中国企业部门以及科研机构的风险偏好确实是持续降低的,就连一级市场也一样,风险偏好降到了大家都在怀疑他们究竟还是不是风险投资。国家审时度势,持续出台了一列提振经济,提升企业家信心的政策措施,效果正在显现,在人工智能及大模型相关的政策、法规制定方面,我们瑞泊技术控股也提出了很多建议。 记者:从ChatGPT到Sora,您觉得中国和美国在AI特别是大模型技术领域的差距总体还在拉大吗? 乙壤月:您提到Sora,我们就先谈谈Sora,这次Sora生成的视频说明它可以很好地理解空间与时间之间的关系,实现了对现实世界的理解和对世界的模拟两层能力。举例说:东京街头的视频中,水洼中的倒影跟随镜头移动发生变化,而这个变化是符合物理规律的,但之前的视频做不到这么精细。Sora的火爆出圈,背后其实还是“暴力美学”,是“规模法则”。在技术上,Sora可能采用了结合Transformer主干的扩散模型。 Transformer模型(主要用于自然语言处理等领域)和扩散模型(主要用于图像和视频生成方面),都是当前人工智能研究中特别受重视的技术。Sora的独特之处可能在于它如何将这些技术结合起来,并在此基础上进行创新和优化,以及它如何利用大规模的数据和计算资源来训练和运行模型,我们推断OpenAI应该是找到了一种独特的方法。 关于Sora是OpenAI的暴力美学的再次胜利,我个人是赞同这个观点的。什么是"暴力美学"?这个词通常用来形容通过大量投入来达成目标的方法,譬如在大模型领域投入巨大的算力、数据、金钱等。这种方法的胜利在于它展示了在当前技术和硬件条件下,通过大规模投入来推动人工智能发展的可行性和有效性。Sora的火爆出圈再次证明了在很多情况下,特别在人工智能领域,"大力出奇迹"的策略是可以取得显著成果的。 所以,结合上个问题我们所谈到的,不论是从ChatGPT还是从Sora来看,在通用人工智能大模型的基础研发方面,中国与美国是客观存在差距的,且这个差距短期还有可能进一步拉大,从人才教育培养,算力、芯片、深度学习框架等核心技术攻关层面,都有较大的追赶空间。 但在承认并正视差距的同时,我们也要对中国人工智能的发展要保持信心。 今年2月,国务院国资委召开了“AI赋能 产业焕新”中央企业人工智能专题推进会,会议指出“加快推动人工智能发展,是国资央企发挥功能使命,抢抓战略机遇,培育新质生产力,推进高质量发展的必然要求”,提出“发挥需求规模大、产业配套全、应用场景多的优势,带头抢抓人工智能赋能传统产业”。很明显,中国在发展人工智能方面拥有独特的优势,正如专题推进会所总结的——需求规模大、产业配套全、应用场景多。 所以,我一直强调,要把通用大模型与垂类(行业/企业)大模型分开看,在后者,我们并不落后,甚至是领先的。 记者:在这一波的AI大模型浪潮中,瑞泊的定位是什么?你们着重解决的问题是什么? 乙壤月:瑞泊凭借自主研发的「VIDYA智慧认知大模型」,在2023年中就已成为十七家「北京市通用人工智能产业创新伙伴计划成员」大模型伙伴成员企业之一,并已通过国家网信办的深度合成服务算法备案。不同于OpenAI的GPT、百度的文心一言、阿里的通义千问、科大讯飞的星火等通用大模型,瑞泊「VIDYA智慧认知大模型」专注垂直行业领域,并且我们的目标是以VIDYA大模型为核心打造关键行业的“超脑”,瑞泊的定位是关键行业的“超脑构建者”。 为什么是“超脑”而不是大模型,超脑是什么?超脑是:智能化的数据治理平台+行业大模型+特有行业专业模型群+生成式搜索引擎+AI应用集群。因为单靠大模型自己是不能完成那么多智能化的行业应用需求的,尺有所短、寸有所长,这就好比打仗,我们需要的是一支能打胜仗的部队,而不能只依靠一个厉害的将军,大模型其实就是这个将军。瑞泊行业超脑已成功在金融、工业、航运、IT运维等关键行业落地生根,我们可能是国内最早商业化的,以大模型为核心的超脑研发企业。瑞泊也是中国目前在行业领域中获得商业合同数量、订单金额、以及与各大行业头部企业成立联合实验室数量领先的公司。我们提供的是嵌入式的服务,通过联合实验室,甚至股权合作的方式完全跟客户绑定,为企业集团、政府机构、城市建设“量身定制”注重降本增效及价值创造的数字化建设及转型解决方案,跟瑞泊合作的客户基本都是基于长期主义的,都是奔着未来十年、二十年一直合作下去的。 大模型正在重塑生产力和生产关系 今年《政府工作报告》中提出:大力推进现代产业体系建设,加快发展新质生产力。强调要深化大数据、人工智能等研发应用,开展“人工智能+”行动。这是“人工智能+”首次被写入政府工作报告。人工智能正在成为新质生产力的核心引擎,成为整个经济社会发展变革的基础性力量。不难想象,几乎所有产业都在或者即将因为人工智能系统及技术的应用而发生深刻的变化,与此同时,将会创造出全新的服务产业形态和模式。 针对大模型在行业产业中的落地应用与实际价值,瑞泊自身发展的战略规划,乙壤月博士在采访中一一做出了回答,同时就中国AI发展现状给出了自己的建议与思考。 记者:今年两会之后,大家都在热议《政府报告中》提出的新质生产力和“人工智能+”行动,能不能谈一谈您的心得和看法? 乙壤月:中央这次提出的“新质生产力”,概括地说,其实就是通过创新主导,深化改革,提升全要素生产率,促进先进生产力,实现高质量发展。它由技术革命性突破、生产要素创新性配置、产业深度转型升级而催生,以劳动者、劳动资料、劳动对象及其优化组合的跃升为基本内涵,以全要素生产率大幅提升为核心标志,特点是创新,关键在质优,本质是先进生产力。 大模型是典型的“技术革命性突破”,并且正在重塑整个生产力和生产关系。这可以被视为进入了一个新的技术和经济发展阶段的明确标志。这些模型通过利用大数据、机器学习和人工智能技术,不仅极大提升了决策的速度和质量,而且还增强了生产过程的自动化和智能化水平,从而提高了生产效率并促进了资源的更加高效分配。例如,它们在制造业和IT运维行业中通过预测维护减少停机时间,在金融服务中通过算法交易优化投资策略,在医疗保健中通过精准诊断改善患者治疗效果。 同时,大模型对生产关系的影响也同样深远。它们正在改变劳动市场的结构,引入了新的职业角色,同时也使得某些传统职业面临重新评估甚至是消失的风险。这种转变不仅仅局限于技术领域内部,更广泛地影响到了所有利用这些技术的行业。随着智能化水平的提高,对高技能和高知识水平的劳动力需求增加,而对简单劳动的需求则相对减少,这促使教育和培训体系必须适应新的技能需求。我认为人工智能正在提升全要素生产率。 在这个过程中,大模型不仅是推动技术进步的动力,也是经济和社会变革的催化剂。它们促进了新业务模式的产生,如基于订阅的服务、个性化产品和服务以及通过算法优化的供应链管理。同时,这些模型也对个人和企业如何工作、交流和创造价值产生了深远的影响,推动着社会向更加互联、数据驱动和智能化的方向发展。因此,我们不仅需要关注大模型带来的技术创新,更要深入理解它们如何重塑我们的经济结构、工作方式和社会生活,以及这一切对教育、政策制定和道德伦理等方面的深远意义。 我注意到今年两会期间,习近平总书记在参加江苏代表团审议时强调:“人工智能是推动新一轮科技革命和产业变革的战略性技术,人工智能与行业深度融合,将有力推动制造业高端化、智能化、绿色化、融合化。” 这也映证了中央与我们的观点是一致的:必须高度重视行业人工智能技术的落地、重视行业大模型的建设和发展。 记者:大模型有许多概念和表述,其中一种会有通用大模型与行业大模型的区分,这里的通用与行业有什么区别? 乙壤月:这是一个看似讨论非常多,但至今还在让绝大多数企业非常困扰的问题,这个问题搞不清楚,很多企业的投入就下不去,总是会被质疑:我们为什么需要自己的专属大模型,而不是去用免费的通用模型? 大模型的底层技术原理实际是一样的,无论是哪一类模型,它们的共同目标都是利用大数据和复杂算法来模拟、理解以及生成人类语言和知识,进而在各自的应用场景中发挥作用。 通用大模型是以广泛的、跨领域的数据为基础构建的。它们的训练资料来自互联网、书籍、报纸等多种多样的来源,这就使得它们能够掌握和生成包含广泛知识和语言表达的内容。想象一下,它就像一个百科全书或是一个世界旅行家,拥有丰富的知识和见识,能够流畅地在不同的话题和领域之间切换。这种模型特别适合于需要广泛知识支持的应用,比如日常的生活和学习的问答、父母亲为孩子的教育提供辅助等。 而对于行业大模型,这就像是专门业务领域的专家。它们通过深入学习特定行业或领域的数据,比如金融、工业、医疗健康、法律等,掌握了该领域内的专业知识和术语。这种模型能够在其专业领域内提供更加精确、深入的分析和解决方案。例如,在金融行业的财富管理领域,当我们谈及到为高净值个体提供深度定制化的投资策略时,行业大模型的价值就显现出来了。这类模型被训练于特定于财富管理领域的大量数据,包括市场分析、风险评估和投资组合优化等,因此能够提供更为精准的个性化投资建议。它们就像是领域内的顶尖专家,不仅了解市场的宏观趋势,还能够根据客户的具体需求和风险偏好,制定出量身定制的投资方案。在财富管理这样一个要求具备非常高的专业知识和个性化服务的行业中,通用大模型显然不能满足工作的需要。 简而言之,就是它们的专业深度和应用范围有较大的区别。就如通识教育很重要,但工作中往往不够,到了本科的三四年级开始就要往专业方向上走,变成一个专才,才能被用人单位所录取。通用大模型擅长处理广泛的问题,拥有宽广的知识面,但在特定领域的深度和精准度上远远不及专门训练的行业大模型,行业大模型则专注于深入挖掘特定领域的知识,提供更专业、更精确的服务和解决方案。一个企业部署大模型,不能简单看成是部署了一套软件系统,未来大模型会成长为企业中各个岗位的数字员工,以前我们说哪个企业多牛会去说这家企业有多少员工、有多少大楼、有多少土地等等,未来我们说一个企业多牛会去说这个企业有多少数据资产、有多少专业的大模型和数字员工。 专业性是一个方面,另一个方面是涉及到企业的信息和数据安全,很多企业的数据规定是不出门的,那么就必须本地化部署自己的专属大模型。 记者:大模型对于行业的变革影响,您能结合某个场景具体谈一下吗? 乙壤月:瑞泊服务了包括金融、工业、能源、航运、医疗、教育等国家重点行业的头部企业,在我们服务的行业中,金融行业无疑是其中最受关注的领域之一。金融行业的稳定和发展不仅是国家经济安全的基石,也是国际竞争力的重要体现。根据全球研究机构的分析,金融领域是首批经历大模型技术革命的行业。 大模型技术的引入,尤其是在风险管理与合规、算法交易、信贷评估、市场分析、资产管理和客户服务等业务场景中,预示着金融服务的深刻变革。这些技术能够处理和分析庞大的数据集,提供基于深度学习的见解,进而大幅提升决策的质量和速度。特别是在需要大量数据分析、复杂金融逻辑推理、综合知识理解和专业内容生成的环节,大模型技术展现出其独特的价值。 我们注意到我们有一些客户刚开始在尝试采用简单微调的模型,这些模型在专业度和定制化方面往往难以满足金融业务的具体需求。而专属的金融行业大模型,通过对金融行业的深入理解和专门的训练,能够更精准地捕捉行业特有的数据特征和业务逻辑,从而在专业性、效率和准确度上远超微调模型。 以保险行业为例:中国保险行业面临的一大挑战是持续高昂的营销成本。传统的营销方法依赖于人力密集型的销售和推广活动,这不仅成本高昂,而且效率低下,服务质量也难以保证。而保险行业的大模型技术能够发挥巨大作用。通过深度学习和大数据分析,这些模型可以精确识别并预测潜在客户的需求和行为模式,使得保险产品的推广更加精准和个性化。例如,大模型可以分析大量的用户数据,包括社交媒体活动、在线行为习惯、购物偏好等,从而预测特定用户群体可能感兴趣的保险产品类型,并定制营销信息,大大提高转化率,同时显著降低营销成本。此外,专属保险行业大模型还能通过自然语言处理技术,自动生成吸引人的营销文案和客户交流脚本,进一步降低人力成本并提升客户服务体验。这些技术的应用不仅仅是减少开支,更重要的是能够提供更加个性化和高效的客户服务,这在当下竞争激烈的保险市场中尤为关键。其实,以大模型为基础的数字人直接售卖保险已经在路上了。 当然,要充分发挥专属行业大模型在保险营销中的潜力,我们还面临着诸多挑战,包括如何确保数据的准确性和全面性、保护客户的隐私和数据安全、以及如何使模型的决策过程更加透明和可解释。 从这些分析可以看出,大模型技术对金融行业的变革性影响是深远的。但要充分发挥这些技术的潜力,就必须开发和部署针对具体行业特点和业务需求定制的专属大模型。这样的模型不仅能提升业务操作的效率和准确性,还能帮助企业在日益激烈的全球竞争中保持领先。 扩展到其他行业看,情况也是类似的。 记者:从瑞泊的业务感知来看,客户现在对于大模型的认知与理解跟去年相比有变化吗?当使用大模型时,您有提醒他们需要避开哪些“坑”吗? 乙壤月:变化很明显,不管是政、产、研哪个类别的客户或合作伙伴,都对大模型保持着极高的热情。去年,我们在与客户的沟通中经常需要进行技术科普,解释大模型的基本概念和原理。而今年,很多客户更关注的是如何将大模型应用到具体的业务场景中,以实现成本降低和效率提升。这一转变反映出社会对新技术的快速适应和渴望通过技术创新促进企业成长的共识。 面对企业对大模型技术的热情,我们确实有几点建议和提醒: 第一、选择大模型产品时的谨慎:目前市场上的大模型产品众多,但真正有自己东西,具备自主可控能力的有限。企业在选择时应重视产品的质量、安全性和可控性,避免因技术选型不当而带来潜在的法律风险和安全隐患。尤其对于涉及国家核心产业和关键领域的企业,使用不可控的开源大模型和API接口存在较大风险。在当前的国际环境下,确保技术的安全性和数据的主权尤为重要,故建议优先考虑国产、可信赖的技术解决方案。 第二、避免盲目追求新技术:虽然大模型技术具有巨大的潜力,但并不意味着适用于所有业务场景。企业在决定采用前,应深入分析自身的业务需求和痛点,以确保技术的应用能够带来实际的商业价值和社会价值。避免因追求技术而忽略了技术应用的实际效益和合理性。 第三、数据隐私和安全性:在使用大模型技术时,企业必须重视数据隐私保护和安全性问题。一方面,确保在数据处理和模型训练过程中符合相关法律法规,尤其是涉及个人隐私数据时。另一方面,加强数据安全管理,防止数据泄露,特别是在使用云服务或第三方API时,要选择信誉好、安全措施严格的服务商。 第四、技术的适配性与集成问题:技术集成是实现大模型技术落地的关键步骤。企业需要考虑大模型技术与现有系统的兼容性,确保新技术的引入不会干扰原有业务流程的正常运行。此外,技术适配不仅限于软件层面,还应关注硬件资源、存储和计算能力是否满足大模型运行的需求。 第五、专业人才的培养与引进:成功应用大模型技术不仅需要先进的技术和工具,还需要有能力的人才来操作和管理。企业应重视AI和数据科学领域专业人才的培养与引进,建立专业团队,提升企业在大数据分析、机器学习和人工智能方面的内在能力。 第六、预期管理与成本控制:虽然大模型技术带来了许多重要价值,但企业在投入使用前应进行充分的成本效益分析。确保技术投资与预期回报相匹配,避免因过度投资新技术而影响企业的财务健康。同时,合理设定技术应用的目标和期望,管理内外部的预期,避免过高期望带来的失望和挫败感。 记者:今年瑞泊将重点在哪些方面发力? 乙壤月:2024年,中国在大模型和人工智能领域的发展势头强劲,展现出前所未有的活力与潜力。国家层面的战略部署,特别是“人工智能+”行动的提出,标志着中国正将人工智能作为推动经济社会转型和升级的核心动力。在这一过程中,中国政府不仅在政策制定上展现出前瞻性和决心,还在实际行动中给予了有力支持。从中央到地方,各级政府纷纷出台具体措施,设定明确的产业发展目标,并通过资金投入、税收优惠、人才培养等手段,为人工智能产业的发展营造了良好的环境。这些政策的实施,为瑞泊这样的人工智能企业的成长提供了肥沃的土壤,也为传统产业的转型升级提供了新的动力。在这重大的历史发展机遇面前,我们一定是勇往直前并且精心布局的,总体来说,瑞泊技术控股今年重点发力的方面有以下三个方面: 第一、深化关键行业超脑的建设,强化与行业头部企业的合作:瑞泊的定位为关键行业“超脑的构建者”,2024年,瑞泊要进一步深化在金融、IT运维等行业超脑的研发与应用,并可能扩展到更多国家关键行业,如工业、航运、医疗等。但我们不会盲目扩张,“贪多嚼不烂”,瑞泊一定是有选择地狠抓重点行业,我们认为人工智能的竞赛是一场长跑,沉静下来聚焦比跑马圈地更重要。结合通过加强智能化的数据治理平台、特有行业专业模型群的研发,进一步提升瑞泊解决方案和服务的竞争力。继续加强与行业头部企业的合作,加强通过建立联合实验室、股权合作等方式深化合作关系。这种深度绑定的合作模式不仅能够促进瑞泊技术的实际落地,也有助于根据行业特点和企业需求定制化解决方案,进一步扩大我们在关键行业的影响力。 第二、强化技术迭代与创新:技术迭代和创新是瑞泊保持竞争力的关键。对于瑞泊而言,2024年的技术迭代与创新将聚焦于以下几个核心领域,以强化我们在AI大模型技术及行业超脑领域的领先地位: 1.继续打造更大、更强的VIDYA大模型:随着计算能力的提升和算法的优化,瑞泊VIDYA大模型正在变得更大,模型参数的数量从数百亿增加到数千亿甚至可能超过万亿,这使得VIDYA能够存储更多的信息,提供更加准确和细致的输出,我们的大型模型在处理复杂任务时表现出更高的效率和更好的性能。除了“大”之外,更重要的是“强”。技术上,瑞泊将聚焦于优化和创新模型架构,如改进Transformer模型,以及更深入探索大视频、多模态、跨模态模型的研发。数据方面,将致力于构建更大规模、更高质量的数据集建设,以增强模型的泛化能力和准确性。此外,加强与开源模型的协作和推动行业标准化也是我们今年的一项重要技术工作,从而实现人工智能在多个领域的深入融合和应用创新。 2.强化瑞泊行业超脑的Agent能力:这项技术工作涵盖了对数据的智能治理、加工和应用,还包括对行业知识和专业流程的深入理解与执行能力。这意味着瑞泊行业超脑将不再仅仅是一个数据和信息处理的工具,而是能够在特定行业背景下,主动提出解决方案、自动执行任务并优化流程的智能代理。这种能力的提升,将使得瑞泊能在更加复杂和动态的行业环境中,为客户提供高效和定制化的服务。 3.打造关键行业多岗位专用的“Copilot”:这些“Copilot”系统将作为专业人士的强大助手和辅助工具,不仅能够提供信息检索、数据分析等支持,还能够根据具体工作内容和需要,提供决策建议、自动化工作流程等服务。通过“Copilot”,瑞泊旨在提升行业工作人员的工作效率和决策质量,进而推动整个行业的数字化和智能化升级。 第三、加强地方合作,建设区域总部或行业总部,考虑国际化战略布局:2024年两会之后,各省市地方政府都在发布新一轮人工智能发展规划、产业创新中心建设规划、人才培养计划等。瑞泊在2024年要充分利用这些支持政策,加强与大湾区、长三角、成渝等区域的重要省市合作,结合当地的产业特点,在核心城市建设区域总部或行业总部,吸引当地人才,本地化嵌入式服务,共同推动人工智能及大模型技术在各地关键行业的商业化进程和产业升级。另外,2024年可能也是瑞泊进行国际化布局的重要时期,包括与国际上的技术企业、研究机构进行合作,参与技术标准的制定,以及将瑞泊解决方案推广到海外市场,特别是“一带一路”沿线国家和地区,以响应中国政府的国际化战略,瑞泊也要争取能为全球人工智能技术的进步和应用贡献中国智慧和中国方案。 记者:您对于当前中国人工智能的发展有哪些洞察与建议? 乙壤月:中国的发展离不开世界,人工智能领域的发展也是如此,我们应该密切关注国内外高可信度的专家和机构的观点。OpenAI首席执行官山姆·奥特曼提出了AI时代的摩尔定律,即人类的智能数量每18个月翻一番,有人称其为“奥特曼定律”。这一预测不仅凸显了AI技术的发展速度,也暗示了未来技术创新的无限可能性。在这样的背景下,中国AI的发展正处于一个关键的转折点。 在全球范围内,真正实现通用人工智能的愿景还需参考人类智能的进化过程,未来的AI变革将依赖于AI Agent的发展。这意味着,未来的AI系统需要能够在多智能体的环境中互相学习和进化,形成一个能够相互协作和验证的智能社会。这一点对于中国AI的发展尤为关键,因为它为中国在创建更加动态和互联的AI应用方面提供了方向。 英伟达创始人黄仁勋的最新预测:未来10年深度学习的计算能力将提高100万倍,这为持续学习和应用提供了硬件基础。另外,吴恩达和李飞飞对大视觉模型的强烈关注,再次强调了在一些特定领域深化AI应用的重要性。 针对这些观察和分析,结合瑞泊技术控股这些年来的实践,我对中国人工智能发展的建议可以概括为以下八点: 第一、重视数据质量与预处理:中国在数据预处理上的投入和创新,是实现AI技术“反超”的关键。通过提高数据预处理的效率和质量,可以大大提升AI模型的性能和应用范围。 第二、推动AI Agent的发展和应用:鼓励中国的企业和研究机构深入研究AI Agent技术,探索多智能体之间的交互和协作机制,推动AI技术在复杂应用场景中的深入应用。 第三、加大在细分领域的投入:依托中国庞大的市场和数据资源,聚焦AI在医疗、教育、城市管理等细分领域的应用,打造具有国际竞争力的解决方案。 第四、强化AI伦理和法规建设:随着AI技术的深入发展,加强对AI伦理和法律框架的建设变得尤为重要。这不仅关系到个人数据的隐私保护,也关系到AI技术应用过程中的道德规范和社会责任。中国应在全球AI伦理讨论中发挥积极作用,制定并实施符合国际标准的法律法规,确保AI技术的健康发展和应用。 第五、培养跨界AI人才:未来的AI发展需要跨学科的人才,包括技术专家、认知科学家、伦理学家等。中国应加大在教育体系内对AI及相关学科的投入,鼓励跨学科学习和研究,为AI的未来发展培养更多具有国际视野和创新能力的人才。 第六、推动产学研深度融合:加强企业与高等院校、科研机构之间的合作,促进AI技术的快速转化和落地。通过建立产学研用相结合的创新体系,既能加速AI技术的实际应用,也能为AI研究提供更多来自实践的问题和挑战。 第七、构建开放的AI技术平台:鼓励中国的企业和研究机构构建和共享开放的AI技术平台,促进技术的交流和共享。通过降低技术应用的门槛,使得更多的小微企业和开发者能够参与到AI技术的创新和应用中来,共同推动中国AI技术的进步。 第八、加强国际合作:在全球化背景下,中国的AI发展不能孤立进行。通过加强与国际社会的交流合作,不仅可以引进先进的技术和理念,还能将中国的研究成果和实践经验分享给世界,共同推动全球AI技术的健康发展。 通过上述措施,结合中国独特的市场优势和技术积累,有望使我们中国在全球AI发展的大潮中占据有利地位,实现从追随者到领跑者的转变。这不仅是技术层面的突破,更是对全社会创新能力和综合国力的全面提升。 记者:您还有对中国的企业家们想说的话吗? 乙壤月:在19世纪初,英国的纺织工业经历了一场由机械化驱动的革命,这不仅彻底改变了纺织产业的面貌,也为整个社会的进步奠定了基石。这场革命之所以能够成功,不仅因为技术的突破,更因为当时的企业家们敢于拥抱变化,勇于应对挑战,最终实现了产业的腾飞。这一历史时刻与我们今天面临的人工智能时代颇有几分相似。我们应该认识到,人工智能技术的发展并不是孤立发生的,它需要与企业的核心业务深度融合,才能发挥出真正的商业价值。这就要求企业家不仅要关注技术本身,更要深刻理解自己的业务和市场,从而引领企业在正确的方向上进行技术创新和应用。在这个意义上,中国企业家面临的不仅是技术革新的挑战,更是对商业模式、企业文化乃至整个产业生态的深刻思考和创新。这需要我们每个人都能够站在更高的视角,以更宽广的胸怀,面对未来的不确定性和变化,不断探索、学习和进步。 2016年,我们就曾经见识了AlphaGo在围棋领域打败了人类所有最厉害的棋手,它的“稳健”它的“闲庭信步”给我们留下了深刻的印象。我们要知道,AI技术的潜力远超过单一的技术突破,它的真正价值在于能够被应用于解决现实世界的复杂问题中。AlphaGo的这种“稳健”和“闲庭信步”是经过强大的计算、庞大数据处理和深度学习后所得到的自信。 我很欣赏美团创始人王兴对于企业经营的一个总结:“我们吃了很多亏,交了很多学费,才明白这个世界没有神话,只有一些很朴素的道理。便宜的打败贵的、质量好的打败质量差的、认真的打败轻率的、耐心的打败浮躁的、勤奋的打败懒惰的、有信誉的打败没信誉的。”对于中国的企业家来说,建设人工智能和大模型、搞数字化转型,这些道理其实就是:数据的质量胜于数量、耐心和细致的研究胜过浮躁和急躁、持续的学习和适应能力胜过一成不变的模式。 我们要有信心,结合自己的优势,打造出人工智能和大模型技术发展的中国范式。 最后,我想把我喜欢的理查德·费曼写的一句话分享给大家——“凡是我还不能创造的,就是我还没有理解”。 这就是此时此刻我想对中国的企业家们说的,谢谢您的采访! 关于瑞泊 瑞泊技术控股(XrayBot),领先的人工智能国家高新技术企业、国家双软认证企业、科研成果转移转化基地、「北京市通用人工智能产业创新伙伴计划成员」大模型伙伴成员企业、北京市科委认证的科技企业,2021年科技成果转移转化一等奖获得者,2022 GAIE Awards人工智能年度权威AI大奖获得者,2022中国AI金雁奖“技术创新大奖”获得者。在全中国全力推动数字经济的大背景下,瑞泊坚守人工智能核心技术多年,2018年起即与国际主流的AI实验室同步开始了大模型技术的研发,而对于自然语言处理技术领域的研究更可追溯到十年前,瑞泊AI团队是中国最早进入这一领域的团队之一。瑞泊「VIDYA」智慧认知大模型专注垂直行业领域,服务金融、政务、医疗、教育、交通、安防、IT运维等众多行业,为企业集团、政府机构、城市建设“量身定制”注重降本增效及价值创造的数字化建设及转型解决方案。面向各垂直行业关键业务流程,瑞泊“嵌入式”的合作模式长期陪同客户逐步实现“一切业务数据化,一切数据业务化”的真正数字化转型。瑞泊核心团队的成员均来耶鲁大学、宾夕法尼亚大学、清华大学、北京大学、中国科学院大学、中国科学技术大学等著名高校相关领域的教授或博士,他们或曾担任世界五百强高科技企业的核心高管,或曾为国家级科研机构的学术领导者及技术专家;同时,瑞泊联合国家顶尖科研机构成立了联合试验室,确保了所交付项目理念的前瞻性与技术的先进性。瑞泊是中国目前在行业大模型领域中进入行业数量、获得商业合同数量、订单金额及与各大行业头部企业成立联合实验室数量领先的AI专业公司。瑞泊所有的产品均基于完全自主知识产权的核心技术,注重复杂业务逻辑与人工智能技术深度融合,善于将人类智能与机器智能无缝衔接,共生互补。伴随着全球范围内预训练大语言模型等关键技术的突破以及瑞泊「VIDYA」智慧认知大模型的大规模商用,通用人工智能(AGI)及激动人心的全数字化世界正加速到来,瑞泊始终与您相伴,拥抱未来! 北京市大模型伙伴成员企业 科研成果转移转化基地 “数字化转型”深度合作伙伴 |