官方服务微信:dat818 购买与出租对接

十大创业投资,创业投资企业,创业投资基金

2万

主题

2

回帖

8万

积分

管理员

积分
85143
发表于 3 小时前 | 显示全部楼层 |阅读模式
    其三,需要解决应用场景层面的问题,找到适合生成式 AI 应用的具体场景和领域。

    未来一两年,生成式 AI 存在巨大的成本下降空间。在这期间,成本有很大可能会下降到 1/1000。模型使用成本会降低。成本越低,AI 技术落地就越容易。

    提升大模型的效果。大模型存在幻觉问题且不可避免,还有另外两个效果方面的问题较为重要:其一,当用户向某一语言模型或产品提出误导性问题时,模型应如何进行回答;其二,大模型在具体场景下生成的回答或内容,对于该场景而言是否准确且合适。

    增强用户的留存率。第一波生成式 AI 应用的留存率处于相对较低的状态,与互联网的头部应用相比存在差距。如何让大家切实地将生成式 AI 产品融入生活或工作之中,无论是节省时间还是消磨时间,都是接下来发展需要重点关注的重要问题。

    启明创投进行了统计分析,生成式 AI 在三个“C 领域”中获得了大量用户的喜爱。这三个“C 领域”分别是生产力工具、创意以及陪伴。生成式 AI 正在经历从提高效率类应用向获得愉悦类应用的转变,就如同当年互联网应用的发展轨迹一样。

    去年启明创投对当前处于发展阶段的生成式 AI 产业脉络进行了梳理,到现在这个三层架构都没有发生太大的改变。并且在今天,依然能够顺着这样的脉络去继续进行投资。

    启明创投去年对两百多家中国生成式 AI 企业进行了深度交流,之后进行了统计。当时这些企业主要以生产力工具为主,其中 46%的企业都在做 Save Time 类应用。

    这符合技术发展的趋势,技术不成熟时,会先诞生开发工具,供比较专业的用户使用。其他领域如智能助手、娱乐应用等,占比都不大。在基础架构方面,去年的创企主要有研发基础模型的企业和做大模型分布式训练平台的企业。

    今年上半年,启明创投对深度交流过的 400 余家 AI 创业企业进行了统计。统计结果显示,多模态应用的比例呈上升趋势,出现了许多基于 AI 大模型技术的新应用类别。与此同时,更多创业企业在深耕某个垂直行业和场景。并且,基础设施层的技术创业方向也更加多元化。

    2024 年生成式 AI 有十大展望。其中之一是多智能体技术将取得飞跃。另外,视频生成将会全面爆发。

    2024 年,周志峰觉得生成式 AI 的技术底座正处于高速动态的发展进程里。视觉语言模型在快速发展,MoE 在快速发展,Agent 在快速发展,RAG 也在快速发展。启明创投现今提出了新的生成式 AI 的十个展望。

    当前生成式 AI 的两大核心技术,即 GPT 和扩散模型,将会逐渐融合在一起,从而激发全新的模型能力。

    高质量数据的获取以及组织,会对新一代模型产生显著的影响。同时,合成数据在预训练里的占比将会大幅度提升。

    多智能体技术将会实现飞跃。它能够通过对协作进行优化以及对分工进行调整,从而显著提升生成式 AI 的效率和效果。

    会出现图像和文本的统一且连续的表示,基于此的图文联合扩散模型能够达到 GPT-4o 级别的能力。

    图像的隐空间表示压缩率提升五倍以上,这使得生成速度提升五倍以上;视频的隐空间表示压缩率提升五倍以上,也使得生成速度提升五倍以上。

    3 年内视频生成会全面爆发。它结合 3D 能力后,可控的视频生成将会给影视、动画、短片的生产模式带来变革。

    我们将见证能够压缩更多模态信息的超级多模态大模型,其中包含文本,还有图像,以及语音,再有音乐,包括 3D 内容,以及传感器数据,像控制信号、眼动信号、手势信息、雷达信号等。

    生成式 AI 让人类语言与机器语言的转换通道得以打通,这会使命令机器去完成复杂任务的成本明显降低,进而带来极为巨大的生产力变革。

    端侧推理将会有巨大的增长,这种增长来自三个因素的叠加。其一,推理优化算法;其二,端侧推理芯片;其三,端侧大模型。

    AI 会在多个数字化程度较高的行业里占据主导地位,并且会对绝大部分企业软件进行重塑。

    03.热钱投向生成式AI应用

    从创业和投资的视角来看,AI 领域存在着很大的机会。摩根士丹利的数据以及启明创投科技团队的分析和评估表明,仅仅在 2023 年,全球一级市场在 AI 领域的投资金额达到了 224 亿美元,这个金额超过了过去十年的投资总和。

   


    224 亿美元当中,超过三分之二的钱被投向了从事基础设施或模型研发的企业,大概 20%的钱投向了生成式 AI 应用企业。周志峰预测,在今年以及未来的两三年时间里,这两者的比例会发生显著的转变,会有越来越多的资金投向应用企业。

    去年在世界人工智能大会上提及的生成式 AI 的典型应用主要有以下三个:.ai 以及(此处应有第三个应用,但原文未给出)。然而到了今年,AI 应用已经呈现出种类繁多的态势。

    启明创投在 AI 领域的投资策略有所演变。过去是将 AI 当作一个技术或一个垂直领域来进行投资,如今转变为把它视为基础能力,去寻觅它在千行百业落地的巨大潜能。从今年开始,重点关注 7 类生成式 AI 应用,分别是垂直行业 AI、企业 AI、AI 交互平台、AI 内容平台、AI 工具、AI 游戏、AI 硬件。

    从投资数量方面来看,未来我们所投资的企业当中,有 80%都将是生成式 AI 的应用公司。周志峰表示。

    他认为生成式 AI 仍处于其发展周期的初期。与互联网浪潮中应用落地的时间点相比,当前 AI 浪潮中应用的爆发预计会提前很多。

    AI 的应用与互联网时代不同,它不需要等待 5 到 8 年才迎来大规模爆发。过去几十年,互联网、移动互联网、大数据、云计算等技术飞速发展,为整个生态系统奠定了坚实基础。所以,AI 应用会与底层技术同步发展,我们现在既处于类似互联网 90 年代的基础设施建设阶段,又接近于 2000 年左右的应用发展水平。

    生成式 AI 应用企业从无到有开始成长所需的时间比其他领域要长。它需要同时去应对两大挑战,一是技术 - 产品契合度(TPF),二是产品 - 市场契合度(PMF)。

    创始团队需要有更大的耐心,要理解技术,包括技术的边际;需要有更大的决心,要理解产品,包含原生 AI 产品的新特点和新分发机制;还需要理解世界,也就是全球化发展的机会。

    周志峰把生成式 AI 创业者划分成三类典型画像。一类是 AI 科学家,他们来自研究机构或者科技大厂的 AI 研发部门。另一类是产业专家,这类人对某个行业格外了解,或者是在产品、运营等方面很擅长。还有一类是新锐创业者,其中有越来越多的 95 后乃至 00 后的创业者。

    在技术尚未成熟之际找到适宜的产品形态。三类创始人各自具有明显的长处与短处。当下来看,AI 科学家创始人约占 1/3,这表明技术浪潮尚处于发展的初期阶段,这类人群对技术底座的边界把握得更为精准,对技术发展的感知也更为迅速。周志峰觉得在接下来的两三年里,第二类、第三类创始人的占比会持续大幅上升,并会成为主流。

    04.AI原生应用落地遇难点,AGI发展需要多种方法融合

    多家 AI 创企在本月推出新品。无问芯穹推出了全球首个能够支持单任务千卡规模异构芯片混合训练的平台;阶跃星辰推出了三款 Step 系列的通用大模型新品,对通用大模型底座能力进行了全面升级;无限光年推出了光语大模型,该模型具有灰盒可信的特点,其百亿参数模型要优于超大规模模型 GPT-4 Turbo。

    大模型的训练需要强大的算力资源支撑,大模型的推理也需要强大的算力资源支撑。在无问芯穹联合创始人、CEO 夏立雪看来,AI 应用落地面临 4 个关键的基础设施问题:一是激活“沉睡芯片”并促使异构算力进行整合;二是提升多种计算卡在大模型方面的计算性能;三是为大规模训练集群的稳定训练和推理夯实基础;四是更高效地利用有限的端侧计算资源。

    阶跃星辰的创始人兼 CEO 姜大昕觉得,在探索 AGI 路径的过程中,“Law”与“多模态”相互配合、不可或缺,这两个方向要一同前进,最终才能抵达 AGI。他坚信 Law 依旧能够发挥作用,模型的性能依然会随着参数量、数据量以及计算量的增多而呈幂次方增长。

    他认为多模态是构建世界模型的基础能力,同时也是通向 AGI 的必经之路。从算法角度来看,可分为三个阶段:其一,模拟世界;其二,探索世界,把大模型与具身智能相融合;最后的阶段是大模型要对物理世界的规律进行归纳和总结,去发现人类尚未发现的规律。这三个阶段并非依次进行,而是能够并行发展,不过进化速度或许有所不同。

    复旦大学浩清特聘教授漆远认为,Law 不会直接引领达到 AGI。AGI 的目标是去发现复杂世界中那些未知的规律。而当前的大模型都高度依赖数据,然而未知规律可能缺乏海量数据的支撑。上海科学智能研究院院长漆远持有此观点。无限光年创始人漆远也秉持这样的看法。

    他分析认为,目前大模型主要属于联结学派的“黑盒”概率预测。若把符号计算和大模型相融合,便可同时拥有慢思考的“白盒”逻辑能力。这两种方法的融合是 AGI 发展的重要方向,能实现“灰盒”可信。深度学习能够实现数据拟合,并且能够延展到数据未涉及的领域。当知识规则与关键数据产生矛盾时,它能够调整知识规则,摆脱对数据的依赖。“灰盒”能够将符号计算与神经网络相结合,以此来应对大模型所存在的幻觉问题以及垂直领域的专业问题。

    05.AI超级应用何时出现?面临哪些挑战?

    周志峰分享了他很喜欢的一个西方乐队的一句经典歌词,这句歌词是关于 AI 超级应用何时出现的,歌词内容为:“我们只需要一点点耐心。”

    超级应用的来临,不会像贝多芬的《命运交响曲》那样,一开始就呈现强烈的节奏,给人一种命运在敲门的感觉。应用的孕育是逐渐进行的,更类似于《梁祝》,先是能听到隐隐约约的鼓声,接着一支长笛逐渐增强地引入,然后到后面出现小提琴的主题段落。他说,我们如今已经能够听到 AI 应用的鼓点从远方隐隐约约地传来。让我们都保持一些耐心,一起期待那些卓越的应用诞生。

    1、未来生成式AI产业有望诞生哪些超级应用?

    智谱 AI 的首席运营官张帆觉得,大模型的关键之处在于使人机交互的带宽得以提升,每一次交互带宽提升之后,都会对用户需求以及应用方式进行重构。企业以及开发者能够借助 MaaS 平台来降低使用和训练模型的成本,也能够更加轻易地去探索以及构建超级应用。

    他认为,未来几年内或许会有颠覆性的超级应用出现。然而,这些应用通常难以提前进行设计,而是在不断地迭代过程中逐渐显现。在 AI 时代,会有许多超乎想象的应用涌现出来。这一过程既需要算力、网络、硬件水平的提升,也需要用户习惯的改变,并且要遵循从小规模应用开始逐步发展的原则。

    米粿 AI 的目标是在 AI 漫画和动漫平台领域处于领先地位,它致力于将 AI 技术与内容生产相结合。米粿 AI 的创始人、CEO 丁黎预测,在未来几年内,绘图领域、漫画领域以及 2D 动画领域等将会有颠覆性的超级应用出现。

    悉之智能致力于 AI 教育。悉之智能的创始人、CEO 孙一乔做出预测,未来的超级应用应当以需求为起始点,进行垂直方向的问题解决。教育是一个极具潜力的领域,因为在教育领域中,其频次较高,需求具有刚性,容易出现 AI 超级应用。

    无限光年的首席运营官朱剑雄觉得,在接下来的几年当中,超级应用将会在诸多领域不断涌现出来。从 PC 互联网的那个时代过渡到移动互联网的这个时代,流量入口发生了转变,这为人们提供了可以参考的依据。而在大模型的时代,也会出现与之类似的发展趋势,那些在场景服务能力方面较为深厚的公司,有很大可能会成长为超级应用。

   


    2、生成式AI超级应用需克服哪些挑战?

    谈及挑战时,丁黎觉得与行业从业者构建起友好的生态系统是很重要的。当前 AI 创业具备高资本以及高技术的门槛,团队需要做到团结合作,一起去应对挑战,这样才能够在激烈的市场竞争里崭露头角。

    朱剑雄提及产品经理的角色与要求有所改变。如今的产品经理不但要对场景和需求进行定义,并且要把这些信息传达给大模型,接着进行评测与验证。在目前的市场上,既懂得模型又懂得客户的产品经理比较稀少,不过随着时间的不断推进,这个问题将会逐步得以改善。

    衔远科技的首席算法科学家丁宁分享了两个惯性陷阱,分别是资源惯性和技术惯性。他提到了数据缺失的问题,尤其在负信号比例高的场景中,缺乏高质量数据,这将是未来的一个关键挑战。

    06.探路具身智能:途径、难点与终局

    具身智能是产学界共同关注的热点。在技术路径方面,有很多不同的声音;在落地方向方面,有很多不同的声音;在通用机器人的终极形态等问题上,也有很多不同的声音。

    清华大学的助理教授陈建宇同时也是星动纪元的创始人,他相信人形机器人将会成为通用机器人的终极形态。这是因为双足与双手的纯人形形态,与现有的环境兼容性更为良好。并且在训练数据的获取方面,也更容易从人类世界进行迁移。他认为,在未来,机器人有望在各类任务上都达到极致的性能。

    在技术范式方面,端到端大脑小脑融合方案在未来会是很重要的研究方向。仅用人类语言作为大小脑之间的传输界面,其效果是有限的。我们可以借鉴目前自动驾驶中的端到端联合训练方式,让物理层面的数据直接反馈给图文大模型,这样能更好地提升整体模型的效果。

    陈建宇提出,在不远的将来,或许能够设计出一种机器人的图灵测试。在这个测试中,会有一个机器人与人进行交互,其背后可能是智能的自主控制,也可能是人类的遥操作。当技术发展到难以分辨机器人的背后究竟是人工智能还是人类遥操作的时候,或许就是机器人真正实现智能与通用的那一天。

    上海交通大学的教授卢策吾,同时也是穹彻智能的联合创始人。他是世界范围内首个让机器人给自己刮胡子的人类。他觉得具身智能的最终结局需要把技术的迭代与商业的需求综合起来进行考量。具身智能作为承载硬件的软件算法,对各种类型的机器人形态都是欢迎的。

    具身智能算法对于具体的技术路径需要两个核心要素。其一,要有能够感知和理解世界的世界模型;其二,要有具有强鲁棒性的技能操作模型。

    在操作模型里,力反馈机制很重要。它不仅在图像维度之外增添了一个交互维度,还能减少对世界模型毫秒级别决策的依赖。穹彻智能所展示的削黄瓜技能和叠衣服技能等,都表明操作模型具有鲁棒性之后,能够大大拓展潜在的应用空间。

    银河通用在前段时间发布了首代具备泛化性的具身大模型机器人。北京大学有一位助理教授,他同时也是北大 - 银河通用联合实验室的主任,名叫王鹤。王鹤认为,人形机器人将会是未来整个通用机器人市场的最大公约数。然而,在朝着这个终极目标前进的过程中,每一步都需要有健康的商业模式,这样才能让机器人真正进入各种场景。其中,上半身拟人而下半身底盘的方案,在三年内最有可能落地成为实际的方案。

    从技术角度来看,银河通用对小脑层面的技能控制模型如何达成足够的泛化和通用这一问题非常关注。对于小脑技能,银河通用自行研发并合成了千万级的场景数据以及十亿级的抓取数据。在合成数据的训练作用下,银河通用的机器人已经能够实现抓取那些随机放置的透明物体、高光物体等的成功率在 95%以上。

    具身智能机器人究竟在何时才能够真正步入严肃场景呢?又要怎样才能进行商业化量产落地呢?在这个过程中需要克服哪些挑战呢?

    王鹤谈到落地的机器人需具备足够低的成本以及足够高的耐用性。这些方面都需要技术公司持续地打磨硬件和提升供应链能力。并且国内的创企具备天然的优势。

    卢策吾补充道,需要迅速进行 POC。只有具备开箱即用的特性,才能够实现快速规模化。对于成本硬件的驾驭能力以及灵活组装能力,是降低成本的关键所在。“大脑”必须足够通用,这样落地的成本才会足够低。

    陈建宇对国内发展具身智能的前景持乐观态度。他认为每个创业公司都应当思考怎样利用中国市场的优势,要最大化地撬动国内供应链的优势,从而打造出具有全球化竞争力的硬件产品。

    07.结语:AI计算新浪潮,看中国

    周志峰认为,评判一项技术能否成为最大的科技浪潮,关键在于能否将边际成本降至接近零的维度。过去五十年的科技发展史中,最大的三个浪潮分别是微处理器、互联网和人工智能。

    微处理器能把计算的边际成本降得很低。互联网把分发成本降到了零。生成式 AI 的核心是几乎把数字化内容创作的边际成本降为零。由此可以看出,AI 技术一定会释放出巨大的价值。

    AI 属于第三次计算革命,中国是其最佳的孵化之地。中国具有显著优势,即拥有庞大的市场。每当出现重大的科技变革以及范式转移之时,中国都能成为孕育新一代伟大企业的最适宜温床。

    斯坦福大学 HAI 研究院发布了《2024 年人工智能指数报告》。2022 年,中国在 AI 领域的专利数占全球的比例为 61.1%。同时,美国在 AI 领域的专利数占全球的比例为 20.9%。中国的专利数大幅超过了美国的专利数。

    美国保尔森基金会 Marco Polo 智库的全球 AI 人才报告表明,2019 年时中国在全球顶尖 AI 学者中所占比例为 29%,到 2022 年上升到了 47%,并且中国是人才最为丰富的区域。

    中国在应用领域经验丰富。在移动互联网时代,成功打造了众多被广泛应用的明星应用。这些应用为中国引领新一波 AI 原生应用的浪潮奠定了坚实基础。

    启明创投科技投资团队统计显示,2010 年之后成立的应用,若至今月活跃用户数超过 5000 万,就会被其定义为“超级应用”。中国团队或企业打造了 30 余个这样的应用。而美国团队或企业一共打造了 7 个。

    在互联网和移动互联网的时代,中国孕育出了很多科技巨头。在生成式 AI 时代,这种现象肯定会再次出现。我认为,中国新一代伟大的科技公司正在形成之中。周志峰表示。

更多帖子推荐

您需要登录后才可以回帖 登录 | 立即注册

Archiver|手机版|小黑屋|关于我们

Copyright © 2001-2025, Tencent Cloud.    Powered by Discuz! X3.5    京ICP备20013102号-30

违法和不良信息举报电话:86-13718795856 举报邮箱:hwtx2020@163.com

GMT+8, 2025-4-21 22:39 , Processed in 0.089880 second(s), 18 queries .