hwyzw 发表于 2025-1-12 13:12:15

王轩泽在机器之心AI科技年会分享:从虹软科技到敏视科技的AI创业之路

    以下为王选泽在机器之心人工智能技术年会上的演讲内容,经编辑整理,不改变原意:

    大家下午好!非常感谢机器之心的邀请。很高兴入选《机器之心》2021年度“最具潜力创业公司TOP 10”榜单。首先,我先简单介绍一下自己。我通过计算机物理竞赛考入上海交通大学,攻读学士和硕士学位,专业是人工智能。毕业后去了虹软科技,科创板第一只AI股。主要专注于图像领域的人工智能算法,帮助国内外领先厂商实现相机内置的图像算法。离职后,他创办了敏视科技,主要从事工业检测项目,取得了一些小成绩。后来我参与了一个AI+小分子药物的创业项目,具体的算法框架是我开发的。现致力于AI+基础材料的研发。我是一名企业家,也是一名比较资深的算法工程师。因此,我多年来在一线从事这些AI实施项目的过程中,也看到了AI实施的一些问题。今天的分享也希望与大家分享我遇到或看到的问题,以及为什么我们最终选择AI+金属材料领域进行深入研究。

    AI实施过程中可能遇到的问题

    不知道您在实施AI的过程中是否遇到过以下问题。

    首先,准确性陷阱。因为算法发展非常快,在某些领域,算法公司的投入和算法效果的提升之间的关系实际上并不是线性函数,而是有些类似于函数。算法发展到一定程度后,提高其性能需要投入大量的时间、人力、精力。这些算法突破上限的难度越来越大。同时,随着算法开源程度的不断提高,算法的门槛在降低,使得一些独立的算法工作者可以利用开源网络来做一些项目。一些小型算法公司针对专门的需求点做了一些参数调整、模型优化等工作后,可以进一步提高算法的效果。但如果想要提升效果或者追求最终的效果,就需要投入大量的成本,而且投资成本呈几何级数增加。而且投入了非常大的成本之后,效果也仅仅从95%提升到了97%。很多最终用户并不能明显感受到算法的改进。因此,对于一家好的算法公司来说,其算法产品不会比同行更好,也不会比行业平均水平更好。卖得更贵。导致这些顶级算法公司在计算毛利时还算不错,但一旦计算净利润数据就非常糟糕,多年无法盈利。

    其次,算法带来的技术壁垒不断缩小。因为它的下限越来越大,所以突破上限虽然范围越来越窄,但难度却越来越大。在一些领域,传统的壁垒仍然是这个领域的一些壁垒,比如供应链、渠道、品牌、成本等,这些壁垒仍然是这个领域的核心壁垒。与此同时,该领域的一些大厂商存在这些壁垒,他们也在转型自己,应用新技术、AI技术赋能自己,实现产业化升级。这将使它们对人工智能初创公司更具吸引力。灾难。我之前在做图像算法的时候也遇到过这个问题。现在显卡比较好的手机厂商都有一些自研团队。很久以前,我们都会认为这些团队很脆弱,但是越来越多的我们发现他们的成长速度越来越快,他们的竞争力也越来越强。这或许也是行业内的一个问题。

    第三,对于一些to B领域。看来任何商业模式都存在一些问题,比如平台公司。最大的问题是,试图实现每一个市场细分场景时,很难做到尽善尽美。一些平台公司使用通用检测网络,可以覆盖非常有限的场景点。即使覆盖了这个场景点,如果在专门的场景中构建专门的网络并调整参数和细节,性能也远远高于通用平台和通用网络性能。这可能是平台公司某些领域的问题。

    服务型公司最大的问题是,其增长模式不如平台型公司或产品型公司,可能类似于线性增长。虽然收到的订单中的核心算法比较相似,但在大多数领域,每个订单之间的差异仍然很大。服务型企业要想扩大规模、扩大销量,或者获得更大的市场份额,就必须拿下大量的订单,投入大量的成本。一旦接不到后续订单,公司整个发展可能会面临一定的运营压力。同时,这些服务型企业,尤其是国内工业领域的一些客户,很难向这些服务型企业提供自己的核心技术、核心数据和需求。毕竟,它们是核心秘密,这将导致服务型公司永远积累。非常核心的数据和产品不包括在内。听说有些创业者有先做服务公司起家的想法,接一些订单,从订单中获取需求,制作一个产品,然后销售。听起来很美好,但实际上会遇到很多困难。

    如今,不少企业正在进行产业化转型。这有点像用科技制造出矿铲,然后用矿铲去采矿。这比平台型、服务型的公司要好,但也会面临一些挑战。关键是每个领域都存在核心差异,从而带来额外的挑战。在产业转型过程中,选择一些更好的领域更为关键。

    第四,黑匣子性质严重,客户不认可,关键人员短期内无法更换。人工智能,尤其是深度学习,具有严重的黑箱性质。很多顾客不接受也不认可。尤其是在安全相关领域,例如化学品安全。化工安全一旦发生安全事故,后果十分严重,甚至一次安全事故就可能导致数十亿化工企业消失。化学品安全必须落实,责任追究。如果用黑盒人工智能网络来代替整个专家系统或者人的判断标准,或者一套逻辑判断标准,就会出现问题。最后,一旦出现问题,有人追究责任,才发现这是一个黑匣子网络,没有人知道结论是如何得出的。这是完全不能接受的。

    那么,大多数字段是做什么的呢?在人类原有系统的基础上构建冗余的基于神经网络的系统也会带来一些问题。例如,它不能节省劳动力或降低成本。相反,它会增加成本,因为系统需要重建。同时,在其他一些领域比如智能驾驶、远程医疗等,即使我们的安全系数达到了可用的水平,但教育客户的成本是非常昂贵的。例如,智能驾驶已经推广多年。即使几年后让这些司机把手松开,把自己从方向盘上解放出来,睡在驾驶室里,也很少有人能做到这一点。

    https://img2.baidu.com/it/u=1603667822,1084745768&fm=253&fmt=JPEG&app=138&f=JPEG?w=903&h=500

    第五,算法效果惊人,但实现难度大。例如,联邦学习很难构建跨场景的生态环境。比如前段时间流行的认知智能,很难获得一些高质量的标注数据。数据也是人工智能在某些领域落地的难题。比如工业测试。对于一些钢板缺陷,生产线不断运行,一年只能生产几个甚至十几个缺陷。如何收集其数据是困难的。我们只能通过半监督的方法来判断,或者传统算法的基于逻辑的识别能力,但这肯定不如使用大数据训练,表现和效果会相差很大。而且,很难想象如何才能合规地实施。

    AI+金属材料更适合人工智能实现的应用场景

    如果你遇到这些问题,不妨将目光转向AI+金属材料领域。为什么我认为AI金属材料更适合人工智能实现场景?因为它有一些特点,最重要的特点就是它的研发周期很长,但是验证周期很短。传统金属材料的研发往往需要几年、十几年、甚至几十年的时间。与国外高端金属材料企业类似,都是一战、二战时期的老企业。可能需要几十年、上百年的积累才能沉淀下来。研发技术。一旦金属材料的性能达到标准,就可以快速进入生产销售阶段,可以给公司带来比较大的利润。因此,金属材料的核心痛点在于研发,而人工智能在这其中的作用就是利用人工智能技术在整个金属研发阶段创造出颠覆性的新模式,解决长期存在的难题。长期研究和开发。一旦用AI+金属材料解决研发问题,后续的一些问题其实就比较简单了。

    中国也有很多案例。例如,很多公司将原有的技术分离出来,成立了企业。这种企业自己生产、销售,从而上市,取得比较好的业绩,如钢研高纳、西部超导、铂金科技等。所以这条路是非常可行的。同时,我们最终提供给最终用户的不是一套算法和解决方案,而是最终的产品、零件或者材料,能够有效解决人工智能黑箱和客户的不满。认可问题。

    近年来,一些新的制备技术和先进的金属技术也将使实际应用更加方便。比如,有了3D打印技术,可以说不需要建立数百人的工厂流水线。几十个人就可以负责几十台3D打印设备,实现数十亿的产值,而且不会有排放或污染问题。这是一个比较好的实现场景。

    在数据方面,这几年的数据积累可以支撑我们人工智能的加速研发。主要是从2011年开始,中国和美国相继提出材料基因工程。这些AI技术当时可能还没有,但大家已经意识到数据非常有价值,无论是企业还是研究机构都在不断积累数据。

    近一两年,金属高通量制备技术发展迅速,已进入成熟阶段,可以让金属获取变得更容易、成本更低,足以支撑人工智能技术在金属领域取得一定突破。

    今年上半年我们会建立一个高通量实验室,然后我们会继续生产高质量的金属数据并进行自己的研发。

    在市场层面,也存在非常大的市场需求。金属领域是一个经常被忽视的市场。说到金属领域,大家都会想到是低端产能、白菜涨价、利润率低、控制成本、降低成本等等,确实,对于一些低端金属材料来说是这样的。但很多高端金属材料仍然被国外卡得很紧。高端金属材料市场非常巨大,市场价值超过10万亿美元。由于国内无法制备,中国每年还进口大量高端金属材料。同时,当前本土化替代的需求也非常旺盛。政府甚至明确要求在一些核心领域必须有本地化替代率,而且还在逐年提高。在政府的政策和国家规划中,我们可以明显感觉到政策正在向这方面倾斜。比如,2021年科技部6+1重大专项中,“1”是材料信息学,即人工智能+金属材料,这可能是需求方。

    https://img2.baidu.com/it/u=1104785206,1753872948&fm=253&fmt=JPEG&app=120&f=JPEG?w=500&h=807

    对于供给端来说,AI+金属材料的几项核心技术在这段时间刚刚进入成熟阶段,包括人工智能技术、金属高通量实验制备技术、3D打印技术等,这些技术才刚刚到来。技术高点是能源向工业化转型的高峰。

    在人才方面,今年首批博士生。材料信息学专业的学生将在中国毕业,数百名博士将在中国毕业。硕士学位将在大约两到三年内颁发。 AI+金属材料是目前材料领域最热门的研究方向。因此,现在是AI+金属材料最好的时机。

    创造材料深造,AI赋能金属新材料研发

    下面我们就来介绍一下人工智能如何赋能新材料研发,如何创造先进材料。

    一般来说,金属材料的研发模式分为四个阶段。第一阶段是经验学科,试错遭遇方法。第二阶段是在第一阶段的基础上,通过大量的实验,总结出一些物理模型和物理定律来指导我们的实验。第三阶段是计算机兴起后,这些物理模型被放入计算机中,利用计算机进行迭代模拟计算,进一步提高研发速度。第四阶段,第四范式,是目前使用的材料信息学,利用大数据来揭示材料更本质的方面。为什么第四阶段可以做到前三阶段做不到的事情?因为前三个阶段都是基于物理模型的模拟。这个物理模型从哪里来?正是通过一些科学家的长期积累,抽象出了一个近似的物理模型,因为金属材料与其他材料的不同之处在于,金属材料需要宏观性质,在制备过程中不可避免地会引入一些扰动。例如,当两个或三个氧分子进入时,包括温度场分布不均匀,这是不可避免的。因此,这些公式无法以高冗余度来拟合实际的物理现象,因此误差非常大且不可接受。 。第四阶段采用超高冗余神经网络来拟合物理模型和过程,误差小得多,现已进入实用阶段。

    我们通过组织图像发现的是成分和过程之间的对应关系。当然,我们不仅仅使用人工智能算法来做到这一点。我们是一个系统项目。我们还使用DFT算法和材料计算方法来计算相对准确的特征量。输入网络作为网络输入参数,以提高效果。大致的逻辑是这样的。

    材料将对人类社会形态产生巨大影响。材料已经发展了数千年,但我们实际探索的领域却非常非常有限。

    以三元合金为例。我们探索的90%以上都是低熵合金。该元素可能占整个合金的80~90%以上,所有其他元素加起来可能只占10%以下。中熵和高熵合金的探索非常有限。高熵合金的概念在2004年才被提出,到2010年才有科学家对这个领域进行探索,所以我们有更广泛的未知领域可供我们探索。为什么高熵合金这么久都没有被探索出来?原因在于,探索这一高熵合金范围的传统方式波动很大,而且成本远高于低熵合金。如果用传统方法探索高熵合金,估计需要很多科学家积累几代人的经验,才能勉强提炼出一个相对有限的物理模型。但现在使用第四范式的人工智能方法来研究,我们只需要积累大量的数据,利用人工智能找到配料技术与性能之间的对应关系。找到对应关系后,科学家或许能够通过AI算法得到的结果提取出更高级的材料科学原理。然而材料科学未来的发展很可能会变成这样的模式。

    关联
页: [1]
查看完整版本: 王轩泽在机器之心AI科技年会分享:从虹软科技到敏视科技的AI创业之路