导航菜单

这是一个AI数据集在线市场

导读 领先的人工智能数据提供者DefinedCrowd宣布推出 DefinedData,这是一项新产品,可让客户通过购买预先收集的,从在线目录中批注并验证了AI
2020-11-23 18:01:15

领先的人工智能数据提供者DefinedCrowd宣布推出 DefinedData,这是一项新产品,可让客户通过购买预先收集的,从在线目录中批注并验证了AI培训数据。

该产品发布是在最近完成了5050 万美元的B 轮融资并增加了新的投资商Balderton Capital之后。这一轮融资使DefinedCrowd能够继续为AI行业推出新的创新数据解决方案。

“建立AI模型的机器学习团队一直面临着一个特别紧迫的问题,那就是持续访问高度准确的数据。当专注于技术的公司想要将他们的AI计划迅速推向市场时,他们根本没有时间去做。收集并验证这样做所需的数据。” DefinedCrowd的创始人兼首席执行官Daniela Braga说道。

Braga表示,DefinedData旨在通过为时间紧迫的客户提供高质量的,预先收集的数据集来解决此问题,该数据集已经被全球超过30万名贡献者进行注释和验证。通常,创建如此高质量的数据集将需要一个机器学习(ML)团队三到六个月的时间。但是,DefinedData使访问AI的高质量数据变得更加容易。

客户可以简单地浏览多种语言,域和记录类型的预先收集的AI数据集,然后索取样品或请求购买。客户还可以选择一次性购买或年度订购,以提供对所有新数据集的访问。到2021年5月,该目录预计将增长,包括超过25,000小时的语音和自然语言数据。

“随着对高质量数据的需求不断增长,培训数据市场将越来越模块化。培训数据存储库和市场将成为价值链的关键特征,使团队既可以利用现有数据集也可以利用货币化来源新的数据时间和具有成本效益的方式。我们非常高兴能与Daniela和她的团队一起为他们在这个领域铺平道路,” Balderton Capital负责人Laura Connell说。

DefinedData将保持对DefinedCrowd众所周知的质量的承诺。为了确保最高级别的准确性和真实性,将使用多个关键绩效指标(KPI),包括字错误率,性别分布水平,年龄分布,环境噪声水平,本地性(母语使用者的准确性)和域准确性。

“无论您是要构建原型产品还是最低限度可行的产品,测试内部模型还是对第三方认知服务进行基准测试,我们不断更新的数据集库都将帮助您快速实现AI目标。” Braga总结道。

免责声明:本文由用户上传,如有侵权请联系删除!

猜你喜欢:

最新文章: