图表内容
表55:海天瑞声产品服务矩阵及训练数据成品结构
公司通过设计训练数据集结构、组织原料数据采集、对取得的原料数据进行加工,最终形成
可供算法模型训练使用的专业数据集。
人工标注、检查
语音
视频
A产
大型料枝公司
原料数据
技术辅助
A算法模型可
Microsoft
用的训练数据
图:训练数据生产过程示意图
来源:海天瑞声2022中报,东方财富证券研究所
研究报告节选:
高精度语音识别技术满足细分领域的定制化需求。海天瑞声自然语言理解数据服务支持全球 190 余种语言及方言,具备医疗、客服、金融、交通等数十个行业细分领域语料设计、采集、标注服务能力,以帮助客户构建多领域场景的文本聊天机器人、搜索相关性、情绪分析、内容审核等。