百搜数据标注资源库

会员登录
首页 > 语音标注
预识别普通话项目

预识别普通话项目

发布时间:2023-05-17

渠道商: 本内容只会员可见,请去登录

项目周期:详谈

手机: 本内容只会员可见,请去登录

微信: 本内容只会员可见,请去登录

项目介绍

预识别普通话项目,需要人力50-80人左右,数据体量大,隔月25号结算,有语音项目经验的团队优先,有需要的可以抢单对接。

预识别普通话项目标注要求:

最好来有经验的团队,统一管理高效组织开展

1. 数字大写,切勿使用阿拉伯数字,注意区分  “一”“幺”“二”“两”“俩”。

2. 英文字母大写字母之间需要加空格,OK  CEO 等专有名词除外边不需要加空格。单词小写,单词与单词之间加空格,单词与汉字质检不需要加空格。

3. 每截取的音频片段字数坚决不可以超过二十个字,超过二十个字的分开截取。

4. 每截取的音频片段超过50%听不清的删除掉,不超过50%的音频个别字听不清或者不确定的用*代替,一个*可代替多个字并且同一句话可用多个*。

5. 明显可以听清的儿化音正常标注,不明显的或者不确定有没有儿化音的不需要标注。

6. 句尾根据句意用“。”“?”句号结束。

7. 1后面需要加一个空格之后进行转写。

8. 机器人说话不用截取和转写。