项目介绍
预识别普通话项目,需要人力50-80人左右,数据体量大,隔月25号结算,有语音项目经验的团队优先,有需要的可以抢单对接。
预识别普通话项目标注要求:
最好来有经验的团队,统一管理高效组织开展
1. 数字大写,切勿使用阿拉伯数字,注意区分 “一”“幺”“二”“两”“俩”。
2. 英文字母大写字母之间需要加空格,OK CEO 等专有名词除外边不需要加空格。单词小写,单词与单词之间加空格,单词与汉字质检不需要加空格。
3. 每截取的音频片段字数坚决不可以超过二十个字,超过二十个字的分开截取。
4. 每截取的音频片段超过50%听不清的删除掉,不超过50%的音频个别字听不清或者不确定的用*代替,一个*可代替多个字并且同一句话可用多个*。
5. 明显可以听清的儿化音正常标注,不明显的或者不确定有没有儿化音的不需要标注。
6. 句尾根据句意用“。”“?”句号结束。
7. 1后面需要加一个空格之后进行转写。
8. 机器人说话不用截取和转写。