海外new things | 计算机视觉技术公司「Visual Layer」种子轮融资700万美元,帮助企业管理构建AI模型所需的可视化数据集

据外媒TechCrunch报道,计算机视觉技术公司「Visual Layer」近期宣布筹集700万美元的种子资金,由Madrona和Insight Partners领投。

为计算机视觉应用训练机器学习模型需要用到大量的图像。如果这些图像被错误地标记、损坏或重复,则训练出来的模型性能也很难达到理想状态。但是,要人工预先处理数以百万计的图像几乎是不可能的。

「Visual Layer」是一家位于特拉维夫的初创公司,帮助企业管理建立AI模型所需的海量可视化数据集,使数据科学家和机器学习工程师能及时发现输入数据集的问题,并相应地做出调整。

海外new things | 计算机视觉技术公司「Visual Layer」种子轮融资700万美元,帮助企业管理构建AI模型所需的可视化数据集

图片截自企业官网

该公司开发了一套系统,在不依赖成本高昂的图形处理器的情况下,可以分析数以亿计的图像,并自动发现这些数据集中的潜在问题。「Visual Layer」的核心技术栈是开源的fastdub项目。

这家初创公司由Danny Bickson(首席执行官)和Amir Alush(首席技术官)联合创办,两人根据自己在苹果公司的经验开发了fastdub。爱苹果公司收购人工智能初创公司Turi后,作为后者联合创始人的Bickson曾担任高级数据科学经理。Alush此前曾与他人联合创办了Brodmann17。此外,前Turi首席执行官兼联合创始人Carlos Guestrin也加入了「Visual Layer」团队。

目前,Fastdup已推出1.0版本,帮助工程师找到图像数据集中的潜在问题,并对其进行聚类和可视化。该团队在研究中发现,市场上最主流的ImageNet-21K预训练数据集的超过1400万张图像中有超过一百万对重复的图像。大多数数据集中还包括了不完整或标签错误的图像。换言之,有数以千计的图像被误标,然后被用来训练错误的模型。

“全球的公司和组织都在经历着一场数据爆炸,而视觉数据的管理是最复杂、最具挑战性的一环。理解、规划、管理视觉数据对各行各业来说都至关重要,尤其是对零售业、制造业、自动驾驶汽车等公司。公司正在与这些海量的数据作斗争,但他们往往不清楚数据库中具体有什么。企业通常会开发自己的数据管理工具,但缺乏一套通用标准。”Bickson表示。

该公司的早期客户之一是印度社交商务平台Meesho,该平台使用fastdup来优化其2亿件产品的图片库。此外,fastdup还服务于John Deere、Honeywell、Winnow和Nuvilab等公司。

Madrona合伙人Jon Turow表示:“尽管人们普遍认为更大的数据集能训练出更好的模型,但在涉及到图像和视频时,混乱的基础数据集只会导致次优模型和错误的结果。随着大规模人工智能模型成为现实,我们必须解决数据问题。我们很高兴能与「Visual Layer」团队和fastdup社区合作,构建一款新的人工智能应用堆栈的基础组件。”

本文地址:https://www.cknow.cn/archives/23885

以上内容源自互联网,由百科助手整理汇总,其目的在于收集传播生活技巧,行业技能,本网站不对其真实性、可靠性承担任何法律责任。特此声明!

如发现本站文章存在版权问题,烦请提供版权疑问、侵权链接、联系方式等信息发邮件至candieraddenipc92@gmail.com,我们将及时沟通与处理。