官方服务微信:dat818 购买与出租对接

达晨财智窦勇分享大数据投资逻辑,燧石星火公开课在京成功举办

4万

主题

2

回帖

12万

积分

管理员

积分
120677
发表于 2025-1-3 03:20:37 | 显示全部楼层 |阅读模式
    窦勇 大辰财智业务合伙人

    7月25日,“‘火石星火’投资公开课(第三期)——大数据产业”在北京中关村上市培育基地成功举办。本次活动在深交所指导下,邀请了深交所中关村基地主任朱海鹏、中关村大数据产业联盟秘书长赵国栋、东方国信董事长兼总经理关连平、大辰财智业务合伙人窦勇等嘉宾就资本市场最新政策动向、数字经济投资机会、东方国信在大数据领域的实践、投资等方面进行了系统实用的课程。大数据项目的逻辑。训练。本次活动受到市场广泛关注,吸引了近300名股权投资者报名参加。

    其中,大辰创投业务合伙人、大数据行业负责人、中国首席数据官联盟专家组成员窦勇分享了《数据、信息、知识、智慧——一个大数据产业投资浅析》。演讲内容包括四个方面:

    1、大数据行业投资趋势分析

    2、大数据项目投资逻辑及估值方法

    3、大数据项目尽职调查常见问题及风险防范

    4、投资案例分析

    以下为窦勇在“‘燧石星火’投资公开课(第三期)大数据行业”活动演讲实录(部分):

    大辰在大数据产业的布局

    大家好!感谢主办方的邀请,今天我给大家分享一下我四年来考察大辰在大数据领域投资的1500家数据公司的经历。

    大晨财智是一家比较传统的VC机构。自2000年成立以来,大辰累计投资企业467家,资本管理规模250亿元,IPO 75起,新三板挂牌91起。

    如图所示,我们团队在大数据行业布局了六大领域:数据规划、数据来源、数据存储、数据应用、可视化和数据安全。项目共30个,总投资额约10亿元。幸运的是,经过我们的投资,这些公司的第二轮融资金额和规模都出现了大幅增长。当然,这只是账面价值。

    云计算、大数据、人工智能

    我们开始今天的第一个话题:简单分析一下大数据、云计算、人工智能的区别。

    2.1

    云计算

    根据定义,云计算只解决一个问题——资源管理。什么样的资源?三方面,一是计算资源,二是存储,三是网络资源。

    我们都知道,物理机刚出现的时候,就像给家里买一台服务器一样。你肯定会关注三件事:CPU、内存和网络。那么,有没有可能把很多物理机聚集在一起,组成一个IDC中心呢?这里需要用到国外的一个虚拟软件,叫.它将多台物理机通过网络连接在一起,形成IDC中心。下一步是云计算。今天的云计算非常简单。我只需要一个帐户。我需要多少网络计算资源、存储资源,包括网络通信资源,随时给你。充分实现了资源的弹性,也就是所谓时间的灵活性。性别和空间灵活性。但虚拟软件刚出来的时候,虽然解决了时间灵活性的问题,却没有解决空间灵活性的问题。这是什么概念?虽然我们都知道虚拟机可以解决数据中心的数据部署,但当时了解其脚本的人却很少。所以通过算法,也叫调度,用计算机本身的算法来分配我的数据中心里的成百上千台服务器在什么时间共享它们的共享资源,从而解决了云计算的空间问题。问题。这个领域比较知名的公司是非常赚钱的。因为您不再需要进行客户销售,所以您需要计算资源。如果你来找我,我就给你一个帐号。但世界上科技巨头太多,不可能实现完全的技术领先。那么你闭源,我就做开源的事情,所以后来就出现了闭源的解决方案,也就是所谓的云计算的底层——IaaS层,也就是计算资源的管理结构。所谓IaaS层,就是说我需要管理所有我需要的服务器和计算资源。

    云资源不仅可以管理计算资源,还可以管理其上运行的应用程序。通过在计算资源接口上增加PaaS层,可以达到两个目的:一是对计算资源进行管理;二是对计算资源进行管理。其次,管理上面的应用部分。 PaaS层是管理物理世界的机器,管理上面的应用程序。

    现在云有多种形式:私有云、公共云和混合云。简单来说,我有钱的话,我把服务器建在自己家里,是私有云,不对外开放。如果像亚马逊、微软这样的运营平台把服务器建在自己的中心,那么这就是公有云;现在很多企业都在使用混合云。这是什么概念?有些核心数据资产可能需要自建服务器,但OA、门户之类的东西可以放在公有云上,这样可以降低成本。

    许多人认为亚马逊是一个电子商务平台。但如果你看它2017年的财报,其125亿美元的云销售平台业务,其中31亿美元是净利润,这意味着它实际上是一家大型云平台制造商。它的开源开发了虚拟软件技术,但它的闭源则锁定基于云的东西作为其核心技术。对此该怎么办?美国还有一家公司,起步比较晚,位居行业第二。他与NASA合作,共同开发开源云计算管理平台项目。随着后续所有软件厂商纷纷加入公有云平台,它逐渐成为行业技术标准。充分实现公有云资源的时间和空间灵活性,实现计算、存储、网络资源的弹性。

   


    通俗地说,云计算就是利用一定的技术,让所有闲置的服务器在任何时间点、任何空间都能获得你需要的云计算费用。

    2.2

    大数据

    让我们回到今天的主题——大数据。它与云计算有什么关系?我们先来说说什么是大数据。

    我个人认为数据本身没有价值。它只能获取信息。信息整理后可以成为知识,知识应用后可以诞生智慧。所以“大数据”这个概念很新,但其实里面有这么一个逻辑。这里我们谈谈两个因素。 “驱动大数据技术”这个词最近很流行。它包括两个方面:一是计算性能的提升,二是存储成本的降低。这两个因素驱动整个行业不断更新迭代。

    我们先看看国外。在21世纪的互联网经济之前,当时没有承载这些数据的载体,也没有存储和收集这些数据的工具,当时的信息化还不完善,数据量也很小。直到2005年,雅虎成立了一个研究团队来解决网络搜索问题。小组项目最终失败了,但积累了两项核心技术,一是高性能计算,二是分布式存储。这两项技术出来后,因为行业没有继续前进而沉寂了一段时间。真正引起轰动的是2009年上市的时候,当天的股价溢价高达39%,一下子轰动了整个投资界。美国最著名的事件之一就是这一事件。这有什么疯狂的?一家未上市的公司估值高达200亿美元。事实上这并不神秘。一开始是一家被CIA,即美国中央情报局指定支持的公司,帮助CIA抓人。一个更具标志性的事件是本拉登所在位置的线索。他提供一些算法,或者说是看不见的数据分析。这次事件对整个国家大数据的发展起到了非常有力的推动作用。

    那么我们再回头看看国内的情况。 2013年之前,大数据仍处于起步阶段。中国人喜欢以五年为一个周期。 2013年-2017年12月9日,为什么是这个时间点?我稍后告诉你。这一次,我们称之为“数据1.0时代”。我们认为这个时代仍然是一个市场意识的时代。现阶段,由于部分资本的参与,行业存在泡沫,出现了所谓大数据的公司。因为资本的注入和带动,当时整个行业技术出现了很多创新,所以这个时代是一个比较混乱的时代。从2016年下半年到2017年12月9日,整个大数据行业都比较低迷。为什么是12月9日?这一天,习近平召集七部委常委,梅虹院士发表论文。当天,习近平明确提出要以数据治国,这个场景就提到了数据的应用。目前,政府对大数据有非常明确的导向。在这样的情况下,整个行业逐渐复苏。如果从那个时间点来定义,那就是数据2.0时代。如今,市场上提及“大数据”的企业并不多。你提到什么?来到“人工智能”和“深度学习”方面。从技术角度来看,大数据并不复杂。大数据庞大,分散的数据需要通过采集、传输、存储、处理、分析、检索、挖掘、应用等一系列环节进行专业处理。用一句话来解释,大数据的本质就是一台机器做不到的事情可以用多台机器同时完成。大数据需要云计算提供平台支撑和计算能力,云计算需要大数据进行实际应用。所以两者的关系就是你中有我,我中有你。

    2.3

    人工智能

    接下来,我们来谈谈人工智能。

    “人工智能”这个词也很流行,现在也有很多公司标榜AI。事实上,人工智能并不复杂。很多年前,人们总是想变得更加舒适和懒惰,所以他们发表了很多想法。最初的技术路径是教机器,也就是类人脑的机器。像机器一样是什么意思?必须将人类思维传授给机器。怎么教?首先,教授一些知识和算法。这里有一个非常有趣的故事,它是什么?它最初被称为推理能力、数据推理、逻辑推理,因为它具有很强的规律性,易于机器学习。反过来,自然语言出现了。有一个非常有趣的例子。如果你的女朋友对你说:“如果你来早了,我不来,你就等着。” “如果我来得早,你不来,你就等着吧。”机器。我傻眼了,不知道你要做什么。这就是所谓的NLP(自然语言处理)解析问题。美国有很多NLP初创公司,但在中国却很少。为什么?这很难。第二个是机器学会了逻辑之后还要教知识,但是有一个很大的问题。可以使用书面语言,例如“赵先生,请您今天下午去某某地方。”如果有规则和定制,那么机器就非常容易学习。但你不能每次拿着手机都说“你好,赵先生!……”。这对大家来说不是很尴尬吗?所以,过去几十年已经证明,这条路,所谓的人工智能,是行不通的,在技术路线上也是行不通的。

    嗯,大家都很聪明,那么该怎么办呢?神经网络、神经元诞生了。什么是神经网络?想象一下,有一个非常神奇的功能。我不知道这个函数是什么样的,但是当我们每天输入一个固定值时,它就能输出我想要的结果。如果结果与我输入的期望不同,可以进行定制和调整。这是美国的几个哥们开始的,他们做得很好,也实现了。但你有没有想象过人脑中有多少个神经元?太多了。那么当这些神经元想要达到我的预期值时,它们离不开什么呢?离不开数据。那么为什么现在的人工智能在行业落地时非常麻烦呢?就是因为缺乏高精度的数据。可能有人觉得AI提到最多的应用是在医疗领域,但坦白讲,如果你去看医生,给医生看CT扫描,他只能让人工医疗替代30%-40%他的劳动力。是的,这是可能的。完全交给机器处理。我想没有哪个医生敢担保,就让它看看吧。没问题,会过去的。他不敢。为什么?准确度还不够。这是医生的责任。他不敢把这一切完全交给机器,必须承担责任。机器人的类人大脑缩短了机器拥有人类心脏的时间。许多神经元需要大量的数据作为计算支持。未来再经过两三年的迭代,随着我们更多的数据源开放和流通,这个事情就会变得不那么复杂。

    过去一段时间,我给大家分析了三个词:云计算、大数据、人工智能。这三者之间,有你中有我,我中有你。没有人可以离开对方而生存。所以你会看到一些云计算厂商也有大数据平台。有一些大数据平台公司在做,他们也认为我会用云计算。一些私有云或公有云厂商与我合作;人工智能,为什么现在不提呢?现在资本市场的热点不是大数据本身,而是人工智能。

    投资逻辑与估值体系

    之前先讲一些概念。接下来我们来说说投资逻辑和估值体系。

    3.1

    数据1.0:英雄时代

    让我们回到定义。数据1.0时代是英雄辈出的时代。从产业角度来看,数据1.0时代实现了数据格式的多样化:结构化数据、异构数据和半结构化数据。这三种形式的存在,导致大量信息被挖掘、规则被总结、行业应用变得越来越简单。从投资的角度来看,可以分为三种:

    1. 传统IT/系统集成商。传统IT技术厂商贴近客户,能够了解客户的需求。然而,他们作为系统集成供应商的长期背景意味着他们往往拥有强大的IT背景。现在转为DT公司时,形式往往大于内容。传统IT集成整体估值在转为DT后并没有3到5倍的溢价。这些初创公司本身都不好意思从投资者那里筹集资金。我们已经见过很多这样的案例。后面还有案例跟大家分享。如果真的解剖了他,就真的什么都没有了。

    2、数据资源稀缺的厂商。为什么它会存在于数据1.0时代?中国是一个人类社会。一些企业,或者一些个人,有一定的渠道获得政府授权的一些​​公共数据,比如企查查、天眼查、工商数据等。当然,他们是怎么得到的呢?这些数据是通过合规、合法的方式获得的。并不是这些人做不到。数据1.0时代,拥有数据者为王。在过去的五年里,我想我有几个PB或10PB的数据,这真的很惊人。因为它是我的一种。我有这个我的。我想如何以及何时挖掘它是稍后的事情。

    3、有技术的创业团队。这在我们周围随处可见。从中国大数据产业分布来看,70%在北京,北京70%在中关村周边。为什么?这里有北大、清华,有很多大学的创业人才。

    3.2

    数据1.0:差异化时代

   


    在数据1.0时代,这三类企业并存。二是分化出现的时代。

    1.大数据消费。大数据是巨大的。如果按类别来看,我认为消费大数据是最快的。为什么?因为这个领域非常简单,运营商数据和互联网数据都比较容易获得。当时,爬虫还是一项比较新的技术。数十个爬虫在互联网上进行爬行,抓取了全网的所有数据。然后用精准营销的方式向客户进行推广。消费大数据中诞生了一些伟大的公司。这个领域是最快的、创业者最多的,因为它有完整的数据变现渠道,以及完整的对整个数据的收集、汇总、组织,到数据约简。完整的产业链已经形成。

    2.机器大数据。我们来谈谈一个真实的例子。所有企业都有信息系统,但信息系统由谁来管理?原来,在没有云的时候,就有所谓的服务器。服务器在管理这些算子的同时,也会产生自己的数据,即机器数据。它是刚刚在美国上市的第一家公司。它进行机器数据分析。中国也有一家标杆公司,而且做得还不错。不过,这个行业也有大买家,比如银行和政府机构,可以购买。大多数企业主不知道如何去做。如果它是坏的,那就是坏的。服务提供商可以为我提供。就是这样。

    3.工业大数据。 2016年之前它还处于起步阶段,这几年从事这个领域的人很少。为什么?有两个问题。第一,产业领域非常分散,每个行业都有所不同;二是人员短缺。缺少什么样的人?懂IT的人不懂行业,懂行业的人不懂IT、不懂大数据。因为大家都专注于消费大数据,为什么呢?通过银行和金融系统兑现很容易。它高端且快速。数据也很容易获得。每个人都在争夺的是技术。在工业界,谁愿意去最底层的工厂或者高温设备制造商呢?如果你去那里一看,高温、潮湿、噪音都来了,所以那里的人很少。其次,有一个很致命的问题就是它的数据并发量不亚于“双11”。当越来越多的工业大数据设备连接起来时,它是24/7可用的,所以这里的一个难点就是所谓的时空数据库。 ,如何解决这个问题,现在市场上还没有更好的成熟案例。但现在国家都提这个了,所以这个热点可能会在今年开始,主要是工业互联网的上市。这几年可能比较沉寂。说实话,买账的人不多,因为你要做数据平台公司,你这个行业的产能可能要在100亿以上,这样的央企还有很多。如果不是12月9日的命令下达,想一想,这个领域的沉默会比较长。但这是值得做的,而且市场空间巨大,因为涉及的东西很多。首先,如何从这些分散在市场空间中的物理设备收集数据?第一个问题已经难倒了很多人。对于设备制造商来说,应该通过无线WiFi还是4G网络进行传输?有很多技术手段需要一点一滴解决,而工业大数据只是产业链末端皇冠上的明珠。它需要将数据反馈到现实世界的应用程序中,而不是仅仅获取一些无用的数据。

    3.3

    行业市场

    再说说大家都比较关心的市场。为什么?因为数据1.0时代是有泡沫的,而且泡沫不小。可能在2014年7月、8月之前,国内投资大数据的投资机构并不多,大概也不会像今天这么多,而且还比较少。为什么?当时整个行业、整个市场都是这样。直到2015年,更好的事情发生了——新三板。新三板需要有标的,而此时的数据公司未来有很大的想象空间,资本需要题材。如此大量的资金在那个时间点瞬间注入,所以对于整个行业的企业来说,迅速火上浇油。那么这个泡沫是什么时候破灭的呢? 2016年6月1日《网络安全法》涉及公民个人隐私和身份。这部网络安全法有多严格?以前我们的手机号码不被认为是你的隐私,也是当时定义的。 《网络安全法》的颁布是必要的,因为在《网络安全法》之前,市场上确实存在大量的非法数据,而且也更加猖獗。当然,这条法律通过后,一些企业纷纷踩雷,这当然很正常。但可能并不像媒体报道的那样,因为这个行业是非常新的,在它的发展过程中,作为投资者,我们可能还是要抱有客观的态度去看待它。有些所谓的信息必须经过大家的筛选。有些公司不可能达到一定的高度。这是解释问题的唯一方法。整个行业正在迅速衰退。为什么?连政府也不知道该不该花钱买。 2017年12月9日,习主席召开常委会会议,明确提出大数据值得发展。怎么做呢?我们不能只谈数据交易和数据资产流通。我们必须将这些数据运用到智慧中。在应用中。

    我总结了这个过程中的三个因素:1、政府是数据最大的拥有者; 2. 政府也是数据库的最大购买者。这是他并不回避的事情,因为他有数据,但他不知道如何使用它。现在这些企业都以服务的形式给他。当然,刚才有朋友问,应收账款会不会更长一些?但你可以放心,政府不会依赖你。这是正常现象,可能只是资金周转的问题; 3、资本加速产业泡沫的产生和破灭。整个过程中,这里的资本有时也没有做好事。这也很正常,因为没有泡沫你就赚不到钱。有了泡沫,每个人都可以赚到这笔钱。这是一个非常现实的问题。 。

    3.4

    投资逻辑

    接下来我们来说说大数据行业的投资逻辑。

    投资数据,首先要有数据资源。在数据资源层面,我们在数据获取、组织、流通、清洗四个方面部署了一些企业。我们已经围绕整个数据源以及交易平台撰写了一些文章。有了这些数据之后,我们还需要有一个数据库。国内数据库有四大吧?新的所谓分布式数据库并不是一刀切的。新的数据库不断迭代,这肯定有一定的机会。第二个是数据检索和数据调用,包括数据工具。这里面有一些机会,我们也投入了很多。包括虚拟技术,你都要投资。投资的时候,不能只投资一个点。你必须围绕数据逻辑构建自己的数据生态系统。有了这个数据之后,发布的问题就解决了。我想将数据货币化。我不能在那里放一堆地雷。不开采就成不了“富二代”。我必须开采它才能成为“富二代”。好的,我可以投资哪个行业?比如数据运营、数据支撑、数据应用、行业应用,我们有幸在公安、军事、交通、金融、旅游、智慧城市等13个领域投资了一些不错的标的,所以这里面都是我们重点关注的行业。那么数据有了之后,因为数据是看不见的,怎么能看到一堆干数字呢?让数据可见是一个大问题。这件事做起来容易,但做好却很难。什么是容易做的事?使用Excel,你可以轻松地展示数据,但是很难做好,因为每个人都有不同的想法,而且行业可能需要大量的定制。到目前为止,它仍处于开发阶段。但如果加上人工智能,就有很大的想象空间。如果人工智能能够输入它,根据性格调整它,灵活地展示它,那将是非常强大的。这时候对你的技术要求就会非常高。

    3.5

    估价体系

    轻资产、重视人力投入是大数据公司的显着特征。在投资过程中,几乎所有的企业主都会告诉我们,这是大数据,是最好的行业,我有最可靠的团队、领先的技术和稀缺的资源。也就是说,你要给我一个很高的评价。那么我们如何看待它呢?如果按照PE/PB/DCF通用财务模型来估算,是没有办法估算的。为什么?它没有收入,或者收入很少。从利润上来说,过去基本上是很小的。或许1000万的利润,放在市场上就是600-7亿,甚至更高。但你做什么呢?你不投票吗?那么这个时候问题就出现了,这个企业的本质是什么?一群人,一堆电脑,什么都没有。该怎么办?我觉得可以从三点来看:

    1.退出市场的情况。当你投资大数据公司时,可能会出现很高的估值溢价。大家想一想,谁是我的继承者呢?传导效应,PE后面VC,那么谁连接呢?如果市场上没有,谁来接?如果没有人接的话就结束了,那我就进去了。所以这个逻辑需要好好思考一下。

    2、产品应用场景。就问这家公司,你的产品解决什么场景和实际问题?我在想一个问题,我的场景是否可以复制。如果可以复制的话,我可以给它比较高的溢价;如果无法复制,那么我给出的价格必须打折扣。

    3、考虑基金的整体布局。我到底是想抢占这个制高点,还是我只是个傻子?如果我想抢占制高点,有可能这个项目已经到了行业的B轮或者C轮,我就得投资,所以这个时候我对价格的敏感度会稍微弱一些。如果我宣布了,虽然我想投资,但是我承担不起这个价格。这个时候我就得考虑你的基金组合的问题了。

    如何估值?我们投资的30多家公司中,大部分都是通过撮合的方式。听起来很神秘,到底什么是牵线搭桥呢?你要10元,8元怎么样?不。 8元5?不,我要9元;差别是 50 美分。你看,我有这个那个资源,大家慢慢的把它整合起来。这是第一个。第二个是参考目标。对于这一类企业来说,比如这个企业有18人、30人。当时他的收入只有500万,损失了三四百万。该怎么办?我一开始投资了1亿,后来类似的公司也来了,可能也就1亿到1.5亿之间。你不能说你比别人更好。其实每个人都是一样的。你说你出生在IBM,没问题,我同意,但是我得看整个行业,因为现在是数据2.0时代,1.0时代有泡沫,我就进去了。 2.0时代,一定有产品应用,所以有参考指标。

    这还取决于它的产品成熟度和投资者的起点。有的创业团队的产品还只是demo,什么都没有。当时你能给他们一个高的估值吗?因此,对于轻资产、重人力资源的大数据公司来说,在估值层面应用市场上成熟的商业模式,早期基本不存在。中后期怎么办?估值最大的问题就是大家都指PB。现在证监会发布了其他类型公司的上市标准,对营收有要求,但对利润没有要求。所以很多人做PE给公司定价都是参考你的营收×PBS。这样就会挤压它的空间,这当然是合适的,因为PB的倍数是可以改变的,10-15倍,加上销售收入的规模也可以改变。公司提供的是销售收入,机构提供的是PB的倍数,10倍或者15倍,所以双方都有浮动空间,就是双方的价差。如果在早期,坦白说,这只是一次握手交易。如果我认可你,看到你漂亮,那么我就会给你投资。 1亿和1.5亿没有区别。

    由于时间关系,今天就跟大家分享这么多。谢谢!
您需要登录后才可以回帖 登录 | 立即注册

Archiver|手机版|小黑屋|关于我们

Copyright © 2001-2025, Tencent Cloud.    Powered by Discuz! X3.5    京ICP备20013102号-30

违法和不良信息举报电话:86-13718795856 举报邮箱:hwtx2020@163.com

GMT+8, 2025-7-10 06:17 , Processed in 0.097465 second(s), 18 queries .