AI技术还能这样用?风投借助它寻找优秀创业公司
AnyDesk的三位联合创始人
网易科技讯 6月26日消息,据国外媒体FastCompany报道,瑞典风投公司EQT Ventures打造了一个名为Motherbrain的人工智能系统,利用机器学习技术来发现不为人知但潜力巨大的初创公司。
德国初创企业AnyDesk在创始团队打开斯德哥尔摩的EQT Ventures发来的电子邮件时,就已经实现正现金流了。Anydesk的创始人并不是在寻找外部投资,但却被引起了兴趣。EQT Ventures成立两年的基金有逾6.5亿美元可投资,其合伙人并不是以往那些通常管理欧洲风投基金的银行家。相反,他们都是来自欧洲科技公司(如Spotify、Huddle和Rebtel)的公司创始人或高管。
在柏林与风险投资主管阿什利·伦德斯特罗姆(Ashley Lundstrom)的一次会面上,AnyDesk的联合创始人菲利普·威瑟(Philipp Weiser)了解到Motherbrain,它是EQT Ventures开发来发现不为人知的初创公司的一个机器学习系统。“她告诉我们,我们是最早被这种软件发现的公司之一。”威瑟说。AnyDesk致力于销售由一专有压缩系统驱动的远程桌面软件。今年5月,它完成了由EQT Ventures领投的一轮760万美元融资。
EQT Ventures向AnyDesk投入的资金是否会成为一个成功的投资案例,还有待观察。但该公司已经将Motherbrain算法应用到历史数据中,并证明它会在当下的一些最红火的科技公司还没有崭露头角之前将它们列为前景广阔的投资候选者。例如,该系统会在Airbnb、Snapchat和Stripe仅仅获得天使资金和种子资金的时候就看中它们,将它们标记出来。
数据驱动的投资
在加入EQT Ventures之前,亨里克·兰德格林(Henrik Landgren)是Spotify的分析副总裁。“外面有数百万家公司,”他说,“你怎么知道该找谁呢?过去的方法是和那些通过你的关系网络找到你的人交谈,但更现代的方法是使用最新的技术、数据和算法,主动接触那些最有可能成为好投资的人。”
EQT Ventures高管亨里克·兰德格林
Motherbrain利用融资等金融数据、网站排名和应用排名数据、社交网络活动等等,来对数百万家公司进行监控。EQT Ventures会持续不断地增加自己对那些公司的评估数据,以训练Motherbrain聚焦好的投资机会的能力。
该软件被用于投资过程的每一个阶段,但它最重要的功能是给你提供优先次序:建议基金现在应该关注哪些公司。“AnyDesk早早被发现,是因为它们在各项数据中所表现出来的进展。”兰德格林说,“他们之前并不是经验丰富的融资人。他们是一个非常机智、非常聪明的团队,他们开发的产品具有令人惊叹的进展。”
一旦有公司进入基金的观察范围,Motherbrain也会加速对它的评估。即使推荐投资该公司的并不是Motherbrain本身,Motherbrain系统也会使用它的排名,系统还会包含一些有用的信息,比如竞争对手和市场规模。它甚至可以给EQT Ventures投资的公司提供帮助,因为它包含了大量关于投资者、竞争对手、新兴技术和市场趋势的数据。“例如,对于B2B公司,我们可以利用Motherbrain来帮助他们寻找销售线索来获得新客户。”兰德格林说道。
EQT Ventures并不是唯一一家使用数据分析的风险投资基金。大多数基金都至少收集基本的公司数据,并基于这些数据创建过滤器、规则或趋势警报。投资早期阶段欧洲科技公司的InReach Ventures也利用机器学习来发现好的投资标的。自2013年以来,旧金山公司SignalFire一直在使用数据驱动的投资模式。但是Motherbrain的出众之处在于,它的系统非常先进,而且它帮助分配的资金规模也很大。
Motherbrain是如何运作的
Motherbrain结合使用非监督式和监督式深度学习算法。非监督式学习算法是在没有任何外部指导的情况下发现数据中的重要模式。监督式学习算法需要有标记的训练数据。例如,如果训练数据包含被标记为“猫”或“不是猫”的动物的例子,算法就会试图了解猫的特征,从而判断呈现在它面前的新动物是否是猫。
在风险投资中,数据可以用来对公司进行市场行业归类,这是任何风投公司都要进行的一项基本任务。创业公司用来描述自己的文本和其他人对它的行业归类可以在这个过程带来帮助,但那些数据往往是杂乱且相互矛盾的,尤其是对于新兴的技术和行业。Motherbrain利用非监督式学习的方法来发现公司的类别。然后,EQT Ventures的员工给每个类别中的公司贴上标签——例如,鉴别一个包含区块链公司的类别——然后带标签的数据被用来训练监督式学习算法。之后,Motherbrain会自动对新公司进行行业分类。
“这实际上是一种从非常嘈杂的数据中获得一些有意义的信息的方法。”兰德格林说,“如果你根据嘈杂的数据对模型进行训练,你可以建立更少的类别,从而拥有更好的预测能力。”
公司随着时间推移的演变——以及相关数据指标如何随之发生变化——也是评估过程中的一个重要因素。时间序列是一组编入索引的数据点,捕捉了公司的演变过程。Motherbrain可以从时间序列数据中学习,根据具有类似指标的公司的表现,预测公司未来将会如何演变。“例如,他们融资的速度是快还是慢?”兰德格林指出,“当你将时间序列纳入考虑范围时,网络趋势、应用排名以及所有那些不同的东西实际上会更加有趣。”
兰德格林还为EQT Ventures专门为Motherbrain开发的最先进的数据基础设施感到自豪。他有个由5人组成的专门开发团队与谷歌密切合作,采用Kafka、Kubernetes、Google BigQuery和BigTable等技术。
“开发人员在工作时,会不断地发现自己遇到些还没有人问过的问题。”兰德格林称,“然后你会觉得坐立不安。我们正在构建一个人工智能决策平台,用于帮助作出涉及人类和大量数据集的决策。我认为这种结合相当新颖。我们正走在前沿位置。”
大数据,大问题
Motherbrain远非完美无缺。就像任何的机器学习系统一样,它的预测好坏完全取决于训练数据的好坏,而且数据总是不完整的,有时甚至完全不准确。兰德格林说,“我们确实有看到一些没有数据记录的公司——它们处于‘隐身’模式——即使是Motherbrain也看不到它们,所以这将会是一个问题。”
通过将多个数据源拼接在一起,EQT Ventures试图增加系统的覆盖范围和不同数据源之间的重叠。由于该公司的投资者每天都在使用Motherbrain,他们可以在发现数据源之间的差异时纠正它们。
兰德格林也热衷于强调,Motherbrain离做出最后的投资决定还有很长的路要走。“打造让你能够找到优秀公司的模型当然是好事,但这并不意味着你只需按下一个按钮就能知道该投资谁。”兰德格林表示,“这需要做更多别的工作,其中很大一部分就是像传统投资者那样去建立关系。关键是要知道建立什么样的关系以及何时建立。这就是我们使用Motherbrain的目的。”