评测试题需要符合一定的格式,汉语试题和英语试题有所不同,同语种的不同题型也有差异。
评测题型参数名称
read_syllable
试卷格式
支持两种试卷格式:
- 拼音标注试卷 。 以 <customizer:interphonic>开头,字单独一行,紧接着的一行为字的拼音。
(1)用拼音后加数字代表声调, 1-4 分别代表一到四声, 5 表示轻声。
(2)ü除了lü和nü用lv和nv表示(如:女:nv3)其他用u表示,如局(ju2)。
(3)üe用ue表示,如:略(lue4)。 - 纯文本试卷。每个字间用逗号隔开;
不建议超过400字节,且单行汉字个数不要超过100个。
试卷示例
评测题型参数名称
read_word
试卷格式
支持两种试卷格式:
- 拼音标注试卷。与字的拼音标注试卷一样,只不过将字换成词语;
- 纯文本试卷。每个词间用逗号隔开;
不建议超过400字节,且单行汉字个数不要超过100个。
试卷示例
评测题型参数名称
read_sentence
试卷格式
支持两种试卷格式:
- 拼音标注试卷。与词组的拼音标注试卷一样,只不过将词组换成句子;
- 纯文本试卷。
不建议超过2000字节,且单行汉字个数不要超过100个。
试卷示例
注意事项
- 拼音标注格式下,拼音个数要与汉字个数一致,并且一行汉字不能超过100字。
- 建议每份试卷字数不超过200字,字数太多,朗读语音过长,响应时间较长。
评测题型参数名称
read_chapter
试卷格式
支持两种试卷格式:
- 拼音标注试卷。与句子的拼音标注试卷一样,只不过篇章是由多个句子组成;
- 纯文本试卷。
文本不建议超过2000字节,且单行汉字个数不要超过100个。
试卷示例
注意事项
- 请按照语文写作文的格式,需要有准确的标点符号分句,如:分句,逗号,问号,句号,感叹号等。
- 每句话(由分隔号分割)不超过100字。
- 拼音标注格式下,拼音个数要与汉字个数一致,并且一行汉字不能超过100字。
- 建议每份试卷字数不超过200字,字数太多,朗读语音过长,响应时间较长。
评测题型参数名称
read_word
试卷格式
- 一个单词占一行,首行必须用[word]标记,单个单词长度应不大于32字节。
- 数字读法标注试卷:
(1)在数字下一行必须用[number_replace]标记。
(2)在[number_replace]的下一行,以“数字/读法/”这种格式标注,注意符号/个数必须为2,且//中内容不可以加符号。
不建议超过700字节。
试卷示例
注意事项
- 单个单词可支持标点符号,仅支持英文半角字符.-'(即点号、连字符、上单引号),如p.m和year-old可支持,hello,world不支持。
- 单个单词不支持标点符号两端都是空格(即标点符号单独作为一个单词会报错)。
- 每个单词字节数不可超过31。
- 单词数量不超过100个。
评测题型参数名称
read_sentence
试卷格式
普通英文文本,首行必须用[content]标记,单个单词长度应不大于32字节。
- 数字读法标注试卷:
(1)在数字下一行必须用[number_replace]标记。
(2)在[number_replace]的下一行,以“数字/读法/”这种格式标注,注意符号/个数必须为2,且//中内容不可以加符号。
不建议超过2000字节。
试卷示例
注意事项
- 不支持字符占整个content节点内容字节数的大小不能超过10%。支持字符见下方附录“引擎可支持英文半角字符”。
- 每个单词字节数不可超过31。
- 每句单词数不能超过100个,每句字节数不能超过1024个字节(分句符号也算作一个字节)
- 所有单词数不超过1000个。
评测题型参数名称
read_chapter
试卷格式
- 普通英文文本,首行必须用[content]标记,采用英文半角字符.!?;四个进行分句。
- 文本总单词个数不超过1000个。
- 数字读法标注试卷格式请参照句子题型。
试卷示例
注意事项
- 不支持字符占整个content节点内容字节数的大小不能超过10%。支持字符见下方附录“引擎可支持英文半角字符”。
- 每个单词字节数不可超过31。
- 每句单词数不能超过100个,每句字节数不能超过1024个字节(分句符号也算作一个字节)。
序号 | 英文半角字符 | 含义 | 序号 | 英文半角字符 | 含义 |
1 | 英文字母 | 26个英文字母 | 9 | 空格 | 空格 |
2 | 数字 | 0-9数字 | 10 | : | 冒号 |
3 | " | 双引号 | 11 | ; | 分号 |
4 | ' | 单引号 | 12 | - | 减号(连字符) |
5 | , | 逗号 | 13 | ¦ | 竖线(停顿标记) |
6 | . | 句号 | 14 | x0D |
|
7 | ! | 感叹号 | 15 | x0A |
换行 |
8 | ? | 问号 | 16 | | TAB |
- SDK 返回 XML 格式的评测结果,可以分成两种: 一种是十分精简的结果; 另一种是详细结果。
- WebAPI 返回 JSON 格式的评测结果。
在英语评测中,将 result_level 设置成 plain 将返回精简结果(注:汉语评测返回的都是详细结果),格式如下:
结果中包含一个返回值 ret(0 表示评测正常) 和总分 total_score。
SDK:当 result_level 设置为 complete 或不设置时,返回详细的 XML 评测结果,结果中包含的主要标签如下
WebAPI:当result_level 设置为 entirety 或不设置时,返回详细的 JSON 评测结果,结果中包含的主要标签如下
标签 | 说明 |
rec_paper | 该标签中间的内容即为评测结果,是开发者需要关心的部分。 |
rec_paper.read_syllable | 表明这是单字朗读评测(中文评测专有)结果。 |
rec_paper.read_word | 表明这是单词朗读评测结果。 |
rec_paper.read_sentence | 表明这是句子朗读评测结果。 |
rec_paper.read_chapter | 表明这是段落朗读评测结果。 |
rec_paper.read_[xxx].sentence | 句子。 |
rec_paper.read_[xxx].sentence.word | 单词,句子的组成部分。 |
rec_paper.read_[xxx].sentence.word.syll | 音节,单词发音的组成部分。对于中文,一个音节对应一个字的发音。 |
rec_paper.read_[xxx].sentence.word.syll.phone | 音素,基本发音元素,音节的组成部分。 |
rec_tree | 该标签中的内容请忽略,预留字段,不需要关心 |
read_syllable、 read_word 、 read_sentence 、 read_chapter 标签中的属性记录了本次评测的各项得分、 整体时长等信息。 sentence、 word、 syllable 和 phone 标签记录的是云端引擎对评测语音的分析结果,如哪些是静音,静音时长多少,哪些是有效发音,每个字、词的音节发音是否正确等等。
中文评测
以下为中文评测结果的属性说明
中文字(read_syllable)
以下是各个层级的字段说明。
read_syllable
属性 | 含义 |
total_score | 总分 |
phone_score | 声韵分(需使用 全维度 权限) |
fluency_score | 流畅度分(保留字段,值为0) |
tone_score | 调型分(需使用 全维度 权限) |
integrity_score | 完整度分(保留字段,值为0) |
except_info | 异常信息,详细请见 except_info列表 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
time_len | 朗读时长,单位:帧(10ms) |
sentence
属性 | 含义 |
time_len | 朗读时长,单位:帧(10ms) |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
word
属性 | 含义 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容 |
time_len | 时长,单位:帧(10ms) |
syll
属性 | 含义 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
time_len | 时长,单位:帧(10ms) |
phone
属性 | 含义 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
is_yun | 是否是韵母,1表示“是”,0表示“否” |
mono_tone | 文本调型信息:TONE1(一声)TONE2(二声) TONE3(三声)TONE4(四声) |
time_len | 时长,单位:帧(10ms) |
perr_level_msg | 预留字段,请忽略 |
中文词(read_word)
以下是各个层级的字段说明。
read_word
属性 | 含义 |
total_score | 总分 |
phone_score | 声韵分(需使用 全维度 功能) |
fluency_score | 流畅度分(保留字段,值为0) |
tone_score | 调型分(需使用 全维度 功能) |
integrity_score | 完整度分(保留字段,值为0) |
except_info | 异常信息,详细请见 except_info列表 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
time_len | 朗读时长,单位:帧(10ms) |
sentence
属性 | 含义 |
time_len | 朗读时长,单位:帧(10ms) |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
word
属性 | 含义 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容 |
time_len | 时长,单位:帧(10ms) |
syll
属性 | 含义 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
time_len | 时长,单位:帧(10ms) |
phone
属性 | 含义 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
is_yun | 是否是韵母,1表示“是”,0表示“否” |
mono_tone | 文本调型信息:TONE1(一声)TONE2(二声) TONE3(三声)TONE4(四声) |
time_len | 时长,单位:帧(10ms) |
perr_level_msg | 预留字段,请忽略 |
中文句子(read_sentence)
以下是各个层级的字段说明。
read_sentence
属性 | 含义 |
total_score | 总分 |
phone_score | 声韵分(需使用 全维度 功能) |
fluency_score | 流畅度分(需使用 全维度 功能) |
tone_score | 调型分(需使用 全维度 功能) |
integrity_score | 完整度分(需使用 全维度 功能) |
except_info | 异常信息,详细请见 except_info列表 |
is_rejected | 是否被拒 true:被拒,表明引擎检测到乱读 false:正常 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
time_len | 朗读时长,单位:帧(10ms) |
sentence
属性 | 含义 |
total_score | 总分 |
phone_score | 声韵分(需使用 全维度 功能) |
fluency_score | 流畅度分(需使用 全维度 功能) |
tone_score | 调型分(需使用 全维度 功能) |
time_len | 朗读时长,单位:帧(10ms) |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
word
属性 | 含义 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容 |
time_len | 时长,单位:帧(10ms) |
syll
属性 | 含义 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
time_len | 时长,单位:帧(10ms) |
phone
属性 | 含义 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
is_yun | 是否是韵母,1表示“是”,0表示“否” |
mono_tone | 文本调型信息:TONE1(一声)TONE2(二声) TONE3(三声)TONE4(四声) |
time_len | 时长,单位:帧(10ms) |
perr_level_msg | 预留字段,请忽略 |
中文篇章(read_chapter)
以下是各个层级的字段说明。
read_chapter
属性 | 含义 |
total_score | 总分 |
phone_score | 声韵分(需使用 全维度 功能) |
fluency_score | 流畅度分(需使用 全维度 功能) |
tone_score | 调型分(需使用 全维度 功能) |
integrity_score | 完整度分(需使用 全维度 功能) |
except_info | 异常信息,详细请见 except_info列表 |
is_rejected | 是否被拒 true:被拒,表明引擎检测到乱读 false:正常 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
time_len | 朗读时长,单位:帧(10ms) |
sentence
属性 | 含义 |
total_score | 总分 |
phone_score | 声韵分(需使用 全维度 功能) |
fluency_score | 流畅度分(需使用 全维度 功能) |
tone_score | 调型分(需使用 全维度 功能) |
time_len | 朗读时长,单位:帧(10ms) |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
content | 试卷内容 |
word
属性 | 含义 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容 |
time_len | 时长,单位:帧(10ms) |
syll
属性 | 含义 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
symbol | 拼音:数字代表声调, 5 和 5 以上表示轻声 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
time_len | 时长,单位:帧(10ms) |
phone
属性 | 含义 |
beg_pos/end_pos | 始/末位置,单位:帧(10ms) |
dp_message | 增漏读信息,详细请见 dp_message列表 |
content | 试卷内容(sil、 silv 表示静音, fil 表示噪音) |
rec_node_type | paper(试卷内容),sil(非试卷内容) |
is_yun | 是否是韵母,1表示“是”,0表示“否” |
mono_tone | 文本调型信息:TONE1(一声)TONE2(二声) TONE3(三声)TONE4(四声) |
time_len | 时长,单位:帧(10ms) |
perr_level_msg | 预留字段,请忽略 |
英文评测
以下为英语评测结果的属性说明(注:一帧长度为 10ms)
#####英文单词(read_word)
以下是各个层级的字段说明。
read_word
属性 | 含义 |
beg_pos/end_pos | 多个单词开始/结束时间 |
content | 多个单词内容 |
except_info | 异常信息,详细请见 except_info列表 |
is_rejected | 是否被拒 true:被拒,表明引擎检测到乱读 false:正常 |
total_score | 总分 |
accuracy_socre | 准确度评分(需使用 全维度 功能) |
standard_score | (预留字段,暂不生效)标准度评分,评测发音地不地道 |
sentence
属性 | 含义 |
beg_pos/end_pos | 句子开始/结束时间 |
content | 句子内容 |
index | 句子索引 |
word
属性 | 含义 |
beg_pos/end_pos | 单词开始/结束时间 |
content | 单词内容 |
dp_message | 增漏读信息,详细请见 dp_message列表 |
global_index | 单词在全篇章索引 |
index | 单词在句子中的索引 |
property | 单词属性信息,详细请见 property列表 |
total_score | 单词总分 |
syll
属性 | 含义 |
beg_pos/end_pos | 音节开始/结束时间 |
content | 音节内容(sil、 silv 表示静音, fil 表示噪音) 详见 音标对照表 |
syll_score | 音节得分 |
syll_accent | 音节重读标记,标志是否需要重读 (0:非重读,1:重读,2:半重读) |
phone
属性 | 含义 |
beg_pos/end_pos | 音素开始/结束时间 |
content | 音素内容(sil、 silv 表示静音, fil 表示噪音) 详见 音标对照表 |
dp_message | 增漏读信息,详细请见 dp_message列表 |
英文句子(read_sentence)
以下是各个层级的字段说明。
read_sentence
属性 | 含义 |
beg_pos/end_pos | 篇章开始/结束时间 |
content | 篇章内容 |
except_info | 异常信息,详细请见 except_info列表 |
is_rejected | 是否被拒 true:被拒,表明引擎检测到乱读 false:正常 |
word_count | 篇章中全部单词数量 |
total_score | 总分 |
accuracy_score | 准确度评分(需使用 全维度 功能) |
fluency_score | 流畅度评分(需使用 全维度 功能) |
integrity_score | 完整度评分(需使用 全维度 功能) |
standard_score | (预留字段,暂不生效)标准度评分,评测发音地不地道 |
sentence
属性 | 含义 |
beg_pos/end_pos | 句子开始/结束时间 |
content | 句子内容 |
index | 句子索引 |
total_score | 句子评分 |
accuracy_score | 准确度评分(需使用 全维度 功能) |
fluency_score | 流畅度评分(需使用 全维度 功能) |
standard_score | (预留字段,暂不生效)标准度评分,评测发音地不地道 |
word_count | 句子中全部单词数量 |
word
属性 | 含义 |
beg_pos/end_pos | 单词开始/结束时间 |
content | 单词内容 |
dp_message | 增漏读信息,详细请见 dp_message列表 |
global_index | 单词在全篇章索引 |
index | 单词在句子中的索引 |
property | 单词属性信息,详细请见 property列表 |
total_score | 单词总分 |
syll
属性 | 含义 |
beg_pos/end_pos | 音节开始/结束时间 |
content | 音节内容(sil、 silv 表示静音, fil 表示噪音) 详见 音标对照表 |
syll_score | 音节得分 |
syll_accent | 音节重读标记,标志是否需要重读 (0:非重读,1:重读,2:半重读) |
phone
属性 | 含义 |
beg_pos/end_pos | 音素开始/结束时间 |
content | 音素内容(sil、 silv 表示静音, fil 表示噪音) 详见 音标对照表 |
dp_message | 增漏读信息,详细请见 dp_message列表 |
英文篇章(read_chapter)
以下是各个层级的字段说明。
read_chapter
属性 | 含义 |
beg_pos/end_pos | 篇章开始/结束时间 |
content | 篇章内容 |
except_info | 异常信息,详细请见 except_info列表 |
is_rejected | 是否被拒 true:被拒,表明引擎检测到乱读 false:正常 |
word_count | 篇章中全部单词数量 |
total_score | 总分 |
accuracy_score | 准确度评分(需使用 全维度 功能) |
fluency_score | 流畅度评分(需使用 全维度 功能) |
integrity_score | 完整度评分(需使用 全维度 功能) |
standard_score | (预留字段,暂不生效)标准度评分,评测发音地不地道 |
sentence
属性 | 含义 |
beg_pos/end_pos | 句子开始/结束时间 |
content | 句子内容 |
index | 句子索引 |
total_score | 句子评分 |
accuracy_score | 准确度评分(需使用 全维度 功能) |
fluency_score | 流畅度评分(需使用 全维度 功能) |
standard_score | (预留字段,暂不生效)标准度评分,评测发音地不地道 |
word_count | 句子中全部单词数量 |
word
属性 | 含义 |
beg_pos/end_pos | 单词开始/结束时间 |
content | 单词内容 |
dp_message | 增漏读信息,详细请见 dp_message列表 |
global_index | 单词在全篇章索引 |
index | 单词在句子中的索引 |
property | 单词属性信息,详细请见 property列表 |
total_score | 单词总分 |
syll
属性 | 含义 |
beg_pos/end_pos | 音节开始/结束时间 |
content | 音节内容(sil、 silv 表示静音, fil 表示噪音) 详见 音标对照表 |
syll_score | 音节得分 |
syll_accent | 音节重读标记,标志是否需要重读 (0:非重读,1:重读,2:半重读) |
phone
属性 | 含义 |
beg_pos/end_pos | 音素开始/结束时间 |
content | 音素内容(sil、 silv 表示静音,fil 表示噪音) 详见 音标对照表 |
音标对照表