容联AI实现「数据自动化打标」和「测试集自动提取」

吴飞 • 2021年3月8日 11:55 • 行业资讯

尊敬的用户：

本周迎来容联AI Call产品又一次更新，本次更新重点丰富自学习平台的功能，旨在让运营更智能，提高运营整体工作效率，实现【数据自动打标】，自动将原始数据进行数据清洗、数据标注、数据分类，有效缩短了数据标注工期。同时，打破传统测试集数据手动拆分方式，实现【测试集数据自动提取】，数据提取更科学，评测结果更真实。

如下为V5.1.1本次更新内容：

升级说明

1、打通线上「数据集」一体化流程

数据集上传、模型训练、模型评测、模型发布和解绑，都可以在自学习平台完成，打通线上数据集管理、模型训练、模型评测、模型发布一体化流程。

2、数据自动打标功能

针对海量数据，通过人工对数据进行标注，无法保证高效的完成数据清洗标注以及数据分类。本次自学习平台新增数据自动打标动能，仅需上传原始数据集文件，系统按照配置策略，自动将原始数据进行数据清洗、数据标注、数据分类，人工仅需完成简单的复检，即可将数据用于模型训练，有效缩短了数据标注工期。

3、模型训练更灵活

本次在模型训练任务上增加了任务排队机制，支持取消训练，在面对大量模型训练任务时，可以更好的承载超大并发量的模型训练任务，从而提升模型训练的效率。

4、测试集数据自动提取

过去的测试集数据是在训练集数据中通过手动的方式进行拆分，耗时耗力，如果数据拆分不均匀，还可能导致最终模型效果不佳、评测结果存在偏差。本次迭代打破传统方式，仅需在模型训练时，选择所需训练集文件，系统自动按照训练集标签数量提取一定比率的测试集数据出来，数据提取更科学，评测结果更真实。

5、支持意图、多意图、情感、句式识别模型评测

在模型评测方面，本次新增单意图、多意图、情感、句式识别的模型评测结果输出，同时我们还对模型评测的指标计算方式进行调优处理，使模型结果数据评测更加精准有效。

6、内置通用模型数据，全平台可使用

结合容联在数据上的沉淀积累，容联将百万级数据通过清洗整理，并训练成行业场景的通用模型，尽可能实现开箱即用，减低冷启环节的耗时。本次更新容联将这些模型开放出来，可供全平台的租户使用。

7、数据安全升级

本次数据安全升级主要从两个方面进行了全新升级，一方面对数据本身的安全加密，采用符合绝大部分客户要求的密码算法对数据进行主动保护，另一方面对数据防护的安全，采用信息存储手段对数据进行主动防护。所有训练平台数据统一放入NAS目录进行存储。

赞 (0)

0

“她力量”影响持续扩大，多燕瘦为广大女性朋友注入健康力

上一篇 2021年3月8日 11:46

飞猪夸克95后Z世代女性报告：年均旅行4次，超6成旅行度假“她”主导

下一篇 2021年3月8日 11:55