分享好友 最新动态首页 最新动态分类 切换频道
# 语音评测试题格式及结果说明
2024-12-25 18:18

评测试题需要符合一定的格式,汉语试题和英语试题有所不同,同语种的不同题型也有差异。

# 语音评测试题格式及结果说明

评测题型参数名称

read_syllable

试卷格式

支持两种试卷格式:

  • 拼音标注试卷 。 以 <customizer:interphonic>开头,字单独一行,紧接着的一行为字的拼音。
    (1)用拼音后加数字代表声调, 1-4 分别代表一到四声, 5 表示轻声。
    (2)ü除了lü和nü用lv和nv表示(如:女:nv3)其他用u表示,如局(ju2)。
    (3)üe用ue表示,如:略(lue4)。
  • 纯文本试卷。每个字间用逗号隔开;

不建议超过400字节,且单行汉字个数不要超过100个。

试卷示例

  • 拼音标注示例:
  • 纯文本示例:

评测题型参数名称

read_word

试卷格式

支持两种试卷格式:

  • 拼音标注试卷。与字的拼音标注试卷一样,只不过将字换成词语;
  • 纯文本试卷。每个词间用逗号隔开;

不建议超过400字节,且单行汉字个数不要超过100个。

试卷示例

  • 拼音标注示例:
  • 纯文本示例:

评测题型参数名称

read_sentence

试卷格式

支持两种试卷格式:

  • 拼音标注试卷。与词组的拼音标注试卷一样,只不过将词组换成句子;
  • 纯文本试卷。

不建议超过2000字节,且单行汉字个数不要超过100个。

试卷示例

  • 拼音标注示例:
  • 纯文本示例:

注意事项

  • 拼音标注格式下,拼音个数要与汉字个数一致,并且一行汉字不能超过100字。
  • 建议每份试卷字数不超过200字,字数太多,朗读语音过长,响应时间较长。

评测题型参数名称

read_chapter

试卷格式

支持两种试卷格式:

  • 拼音标注试卷。与句子的拼音标注试卷一样,只不过篇章是由多个句子组成;
  • 纯文本试卷。

文本不建议超过2000字节,且单行汉字个数不要超过100个。

试卷示例

  • 拼音标注示例:
  • 纯文本示例:

注意事项

  • 请按照语文写作文的格式,需要有准确的标点符号分句,如:分句,逗号,问号,句号,感叹号等。
  • 每句话(由分隔号分割)不超过100字。
  • 拼音标注格式下,拼音个数要与汉字个数一致,并且一行汉字不能超过100字。
  • 建议每份试卷字数不超过200字,字数太多,朗读语音过长,响应时间较长。

评测题型参数名称

read_word

试卷格式

  • 一个单词占一行,首行必须用[word]标记,单个单词长度应不大于32字节。
  • 数字读法标注试卷:
    (1)在数字下一行必须用[number_replace]标记。
    (2)在[number_replace]的下一行,以“数字/读法/”这种格式标注,注意符号/个数必须为2,且//中内容不可以加符号。

不建议超过700字节。

试卷示例

  • 普通文本
  • 数字读法标注:

注意事项

  • 单个单词可支持标点符号,仅支持英文半角字符.-'(即点号、连字符、上单引号),如p.m和year-old可支持,hello,world不支持。
  • 单个单词不支持标点符号两端都是空格(即标点符号单独作为一个单词会报错)。
  • 每个单词字节数不可超过31。
  • 单词数量不超过100个。

评测题型参数名称

read_sentence

试卷格式

普通英文文本,首行必须用[content]标记,单个单词长度应不大于32字节。

  • 数字读法标注试卷:
    (1)在数字下一行必须用[number_replace]标记。
    (2)在[number_replace]的下一行,以“数字/读法/”这种格式标注,注意符号/个数必须为2,且//中内容不可以加符号。

不建议超过2000字节。

试卷示例

  • 普通文本:
  • 带可支持英文半角字符:
  • 数字读法标注:

注意事项

  • 不支持字符占整个content节点内容字节数的大小不能超过10%。支持字符见下方附录“引擎可支持英文半角字符”。
  • 每个单词字节数不可超过31。
  • 每句单词数不能超过100个,每句字节数不能超过1024个字节(分句符号也算作一个字节)
  • 所有单词数不超过1000个。

评测题型参数名称

read_chapter

试卷格式

  • 普通英文文本,首行必须用[content]标记,采用英文半角字符.!?;四个进行分句。
  • 文本总单词个数不超过1000个。
  • 数字读法标注试卷格式请参照句子题型。

试卷示例

注意事项

  • 不支持字符占整个content节点内容字节数的大小不能超过10%。支持字符见下方附录“引擎可支持英文半角字符”。
  • 每个单词字节数不可超过31。
  • 每句单词数不能超过100个,每句字节数不能超过1024个字节(分句符号也算作一个字节)。
序号 英文半角字符 含义 序号 英文半角字符 含义 1 英文字母 26个英文字母 9 空格 空格 2 数字 0-9数字 10 : 冒号 3 " 双引号 11 ; 分号 4 ' 单引号 12 - 减号(连字符) 5 , 逗号 13 ¦ 竖线(停顿标记) 6 . 句号 14 x0D 7 ! 感叹号 15 x0A 换行 8 ? 问号 16 TAB
  • SDK 返回 XML 格式的评测结果,可以分成两种: 一种是十分精简的结果; 另一种是详细结果。
  • WebAPI 返回 JSON 格式的评测结果。

在英语评测中,将 result_level 设置成 plain 将返回精简结果(注:汉语评测返回的都是详细结果),格式如下:

结果中包含一个返回值 ret(0 表示评测正常) 和总分 total_score。

SDK:当 result_level 设置为 complete 或不设置时,返回详细的 XML 评测结果,结果中包含的主要标签如下
WebAPI:当result_level 设置为 entirety 或不设置时,返回详细的 JSON 评测结果,结果中包含的主要标签如下

标签 说明 rec_paper 该标签中间的内容即为评测结果,是开发者需要关心的部分。 rec_paper.read_syllable 表明这是单字朗读评测(中文评测专有)结果。 rec_paper.read_word 表明这是单词朗读评测结果。 rec_paper.read_sentence 表明这是句子朗读评测结果。 rec_paper.read_chapter 表明这是段落朗读评测结果。 rec_paper.read_[xxx].sentence 句子。 rec_paper.read_[xxx].sentence.word 单词,句子的组成部分。 rec_paper.read_[xxx].sentence.word.syll 音节,单词发音的组成部分。对于中文,一个音节对应一个字的发音。 rec_paper.read_[xxx].sentence.word.syll.phone 音素,基本发音元素,音节的组成部分。 rec_tree 该标签中的内容请忽略,预留字段,不需要关心

read_syllable、 read_word 、 read_sentence 、 read_chapter 标签中的属性记录了本次评测的各项得分、 整体时长等信息。 sentence、 word、 syllable 和 phone 标签记录的是云端引擎对评测语音的分析结果,如哪些是静音,静音时长多少,哪些是有效发音,每个字、词的音节发音是否正确等等。

中文评测

以下为中文评测结果的属性说明

中文字(read_syllable)

以下是各个层级的字段说明。

read_syllable

属性 含义 total_score 总分 phone_score 声韵分(需使用 全维度 权限) fluency_score 流畅度分(保留字段,值为0) tone_score 调型分(需使用 全维度 权限) integrity_score 完整度分(保留字段,值为0) except_info 异常信息,详细请见 except_info列表 beg_pos/end_pos 始/末位置,单位:帧(10ms) content 试卷内容 time_len 朗读时长,单位:帧(10ms)

sentence

属性 含义 time_len 朗读时长,单位:帧(10ms) beg_pos/end_pos 始/末位置,单位:帧(10ms) content 试卷内容

word

属性 含义 beg_pos/end_pos 始/末位置,单位:帧(10ms) symbol 拼音:数字代表声调, 5 和 5 以上表示轻声 content 试卷内容 time_len 时长,单位:帧(10ms)

syll

属性 含义 beg_pos/end_pos 始/末位置,单位:帧(10ms) dp_message 增漏读信息,详细请见 dp_message列表 symbol 拼音:数字代表声调, 5 和 5 以上表示轻声 content 试卷内容(sil、 silv 表示静音, fil 表示噪音) rec_node_type paper(试卷内容),sil(非试卷内容) time_len 时长,单位:帧(10ms)

phone

属性 含义 beg_pos/end_pos 始/末位置,单位:帧(10ms) dp_message 增漏读信息,详细请见 dp_message列表 content 试卷内容(sil、 silv 表示静音, fil 表示噪音) rec_node_type paper(试卷内容),sil(非试卷内容) is_yun 是否是韵母,1表示“是”,0表示“否” mono_tone 文本调型信息:TONE1(一声)TONE2(二声)
TONE3(三声)TONE4(四声) time_len 时长,单位:帧(10ms) perr_level_msg 预留字段,请忽略
中文词(read_word)

以下是各个层级的字段说明。

read_word

属性 含义 total_score 总分 phone_score 声韵分(需使用 全维度 功能) fluency_score 流畅度分(保留字段,值为0) tone_score 调型分(需使用 全维度 功能) integrity_score 完整度分(保留字段,值为0) except_info 异常信息,详细请见 except_info列表 beg_pos/end_pos 始/末位置,单位:帧(10ms) content 试卷内容 time_len 朗读时长,单位:帧(10ms)

sentence

属性 含义 time_len 朗读时长,单位:帧(10ms) beg_pos/end_pos 始/末位置,单位:帧(10ms) content 试卷内容

word

属性 含义 beg_pos/end_pos 始/末位置,单位:帧(10ms) symbol 拼音:数字代表声调, 5 和 5 以上表示轻声 content 试卷内容 time_len 时长,单位:帧(10ms)

syll

属性 含义 beg_pos/end_pos 始/末位置,单位:帧(10ms) dp_message 增漏读信息,详细请见 dp_message列表 symbol 拼音:数字代表声调, 5 和 5 以上表示轻声 content 试卷内容(sil、 silv 表示静音, fil 表示噪音) rec_node_type paper(试卷内容),sil(非试卷内容) time_len 时长,单位:帧(10ms)

phone

属性 含义 beg_pos/end_pos 始/末位置,单位:帧(10ms) dp_message 增漏读信息,详细请见 dp_message列表 content 试卷内容(sil、 silv 表示静音, fil 表示噪音) rec_node_type paper(试卷内容),sil(非试卷内容) is_yun 是否是韵母,1表示“是”,0表示“否” mono_tone 文本调型信息:TONE1(一声)TONE2(二声)
TONE3(三声)TONE4(四声) time_len 时长,单位:帧(10ms) perr_level_msg 预留字段,请忽略
中文句子(read_sentence)

以下是各个层级的字段说明。

read_sentence

属性 含义 total_score 总分 phone_score 声韵分(需使用 全维度 功能) fluency_score 流畅度分(需使用 全维度 功能) tone_score 调型分(需使用 全维度 功能) integrity_score 完整度分(需使用 全维度 功能) except_info 异常信息,详细请见 except_info列表 is_rejected 是否被拒
true:被拒,表明引擎检测到乱读
false:正常 beg_pos/end_pos 始/末位置,单位:帧(10ms) content 试卷内容 time_len 朗读时长,单位:帧(10ms)

sentence

属性 含义 total_score 总分 phone_score 声韵分(需使用 全维度 功能) fluency_score 流畅度分(需使用 全维度 功能) tone_score 调型分(需使用 全维度 功能) time_len 朗读时长,单位:帧(10ms) beg_pos/end_pos 始/末位置,单位:帧(10ms) content 试卷内容

word

属性 含义 beg_pos/end_pos 始/末位置,单位:帧(10ms) symbol 拼音:数字代表声调, 5 和 5 以上表示轻声 content 试卷内容 time_len 时长,单位:帧(10ms)

syll

属性 含义 beg_pos/end_pos 始/末位置,单位:帧(10ms) dp_message 增漏读信息,详细请见 dp_message列表 symbol 拼音:数字代表声调, 5 和 5 以上表示轻声 content 试卷内容(sil、 silv 表示静音, fil 表示噪音) rec_node_type paper(试卷内容),sil(非试卷内容) time_len 时长,单位:帧(10ms)

phone

属性 含义 beg_pos/end_pos 始/末位置,单位:帧(10ms) dp_message 增漏读信息,详细请见 dp_message列表 content 试卷内容(sil、 silv 表示静音, fil 表示噪音) rec_node_type paper(试卷内容),sil(非试卷内容) is_yun 是否是韵母,1表示“是”,0表示“否” mono_tone 文本调型信息:TONE1(一声)TONE2(二声)
TONE3(三声)TONE4(四声) time_len 时长,单位:帧(10ms) perr_level_msg 预留字段,请忽略
中文篇章(read_chapter)

以下是各个层级的字段说明。

read_chapter

属性 含义 total_score 总分 phone_score 声韵分(需使用 全维度 功能) fluency_score 流畅度分(需使用 全维度 功能) tone_score 调型分(需使用 全维度 功能) integrity_score 完整度分(需使用 全维度 功能) except_info 异常信息,详细请见 except_info列表 is_rejected 是否被拒
true:被拒,表明引擎检测到乱读
false:正常 beg_pos/end_pos 始/末位置,单位:帧(10ms) content 试卷内容 time_len 朗读时长,单位:帧(10ms)

sentence

属性 含义 total_score 总分 phone_score 声韵分(需使用 全维度 功能) fluency_score 流畅度分(需使用 全维度 功能) tone_score 调型分(需使用 全维度 功能) time_len 朗读时长,单位:帧(10ms) beg_pos/end_pos 始/末位置,单位:帧(10ms) content 试卷内容

word

属性 含义 beg_pos/end_pos 始/末位置,单位:帧(10ms) symbol 拼音:数字代表声调, 5 和 5 以上表示轻声 content 试卷内容 time_len 时长,单位:帧(10ms)

syll

属性 含义 beg_pos/end_pos 始/末位置,单位:帧(10ms) dp_message 增漏读信息,详细请见 dp_message列表 symbol 拼音:数字代表声调, 5 和 5 以上表示轻声 content 试卷内容(sil、 silv 表示静音, fil 表示噪音) rec_node_type paper(试卷内容),sil(非试卷内容) time_len 时长,单位:帧(10ms)

phone

属性 含义 beg_pos/end_pos 始/末位置,单位:帧(10ms) dp_message 增漏读信息,详细请见 dp_message列表 content 试卷内容(sil、 silv 表示静音, fil 表示噪音) rec_node_type paper(试卷内容),sil(非试卷内容) is_yun 是否是韵母,1表示“是”,0表示“否” mono_tone 文本调型信息:TONE1(一声)TONE2(二声)
TONE3(三声)TONE4(四声) time_len 时长,单位:帧(10ms) perr_level_msg 预留字段,请忽略

英文评测

以下为英语评测结果的属性说明(注:一帧长度为 10ms)

#####英文单词(read_word)

以下是各个层级的字段说明。

read_word

属性 含义 beg_pos/end_pos 多个单词开始/结束时间 content 多个单词内容 except_info 异常信息,详细请见 except_info列表 is_rejected 是否被拒
true:被拒,表明引擎检测到乱读
false:正常 total_score 总分 accuracy_socre 准确度评分(需使用 全维度 功能) standard_score (预留字段,暂不生效)标准度评分,评测发音地不地道

sentence

属性 含义 beg_pos/end_pos 句子开始/结束时间 content 句子内容 index 句子索引

word

属性 含义 beg_pos/end_pos 单词开始/结束时间 content 单词内容 dp_message 增漏读信息,详细请见 dp_message列表 global_index 单词在全篇章索引 index 单词在句子中的索引 property 单词属性信息,详细请见 property列表 total_score 单词总分

syll

属性 含义 beg_pos/end_pos 音节开始/结束时间 content 音节内容(sil、 silv 表示静音, fil 表示噪音)
详见 音标对照表 syll_score 音节得分 syll_accent 音节重读标记,标志是否需要重读
(0:非重读,1:重读,2:半重读)

phone

属性 含义 beg_pos/end_pos 音素开始/结束时间 content 音素内容(sil、 silv 表示静音, fil 表示噪音)
详见 音标对照表 dp_message 增漏读信息,详细请见 dp_message列表
英文句子(read_sentence)

以下是各个层级的字段说明。

read_sentence

属性 含义 beg_pos/end_pos 篇章开始/结束时间 content 篇章内容 except_info 异常信息,详细请见 except_info列表 is_rejected 是否被拒
true:被拒,表明引擎检测到乱读
false:正常 word_count 篇章中全部单词数量 total_score 总分 accuracy_score 准确度评分(需使用 全维度 功能) fluency_score 流畅度评分(需使用 全维度 功能) integrity_score 完整度评分(需使用 全维度 功能) standard_score (预留字段,暂不生效)标准度评分,评测发音地不地道

sentence

属性 含义 beg_pos/end_pos 句子开始/结束时间 content 句子内容 index 句子索引 total_score 句子评分 accuracy_score 准确度评分(需使用 全维度 功能) fluency_score 流畅度评分(需使用 全维度 功能) standard_score (预留字段,暂不生效)标准度评分,评测发音地不地道 word_count 句子中全部单词数量

word

属性 含义 beg_pos/end_pos 单词开始/结束时间 content 单词内容 dp_message 增漏读信息,详细请见 dp_message列表 global_index 单词在全篇章索引 index 单词在句子中的索引 property 单词属性信息,详细请见 property列表 total_score 单词总分

syll

属性 含义 beg_pos/end_pos 音节开始/结束时间 content 音节内容(sil、 silv 表示静音, fil 表示噪音)
详见 音标对照表 syll_score 音节得分 syll_accent 音节重读标记,标志是否需要重读
(0:非重读,1:重读,2:半重读)

phone

属性 含义 beg_pos/end_pos 音素开始/结束时间 content 音素内容(sil、 silv 表示静音, fil 表示噪音)
详见 音标对照表 dp_message 增漏读信息,详细请见 dp_message列表
英文篇章(read_chapter)

以下是各个层级的字段说明。

read_chapter

属性 含义 beg_pos/end_pos 篇章开始/结束时间 content 篇章内容 except_info 异常信息,详细请见 except_info列表 is_rejected 是否被拒
true:被拒,表明引擎检测到乱读
false:正常 word_count 篇章中全部单词数量 total_score 总分 accuracy_score 准确度评分(需使用 全维度 功能) fluency_score 流畅度评分(需使用 全维度 功能) integrity_score 完整度评分(需使用 全维度 功能) standard_score (预留字段,暂不生效)标准度评分,评测发音地不地道

sentence

属性 含义 beg_pos/end_pos 句子开始/结束时间 content 句子内容 index 句子索引 total_score 句子评分 accuracy_score 准确度评分(需使用 全维度 功能) fluency_score 流畅度评分(需使用 全维度 功能) standard_score (预留字段,暂不生效)标准度评分,评测发音地不地道 word_count 句子中全部单词数量

word

属性 含义 beg_pos/end_pos 单词开始/结束时间 content 单词内容 dp_message 增漏读信息,详细请见 dp_message列表 global_index 单词在全篇章索引 index 单词在句子中的索引 property 单词属性信息,详细请见 property列表 total_score 单词总分

syll

属性 含义 beg_pos/end_pos 音节开始/结束时间 content 音节内容(sil、 silv 表示静音, fil 表示噪音)
详见 音标对照表 syll_score 音节得分 syll_accent 音节重读标记,标志是否需要重读
(0:非重读,1:重读,2:半重读)

phone

属性 含义 beg_pos/end_pos 音素开始/结束时间 content 音素内容(sil、 silv 表示静音,fil 表示噪音)
详见 音标对照表

音标对照表

最新文章
如何让百度快速收录网站内容?
还是那句话,只要坚持,总会被青睐的。做搜索引擎推广,不可能做完马上见效的,seo是需要时间的,可能你前几天做的事情,过几天百度才会知道。1、网站内部做好。怎么做好?这个问题问的深奥啊,我怎么知道你的网站有没有做好,你的网站我又
虚拟偶像影视动画制作软件(虚拟偶像影视动画制作软件哪个好)
摘要:虚拟偶像影视动画制作软件,虚拟偶像影视动画制作软件现如今,随着科技的迅猛发展,人们对于数字化、虚拟化、智能化工具的需求日益增加。在影视动画行业,虚拟偶像已经成为了一种趋势,不少影视公司纷纷尝试推出自己的虚拟偶像,同时
漫蛙漫画官网入口最新版软件亮点
漫蛙漫画官网入口最新版下载是一款专为漫画爱好者打造的阅读软件。它汇集了丰富的漫画资源,包括各种题材和风格的作品,满足用户的多样化需求。软件界面简洁友好,操作便捷,支持离线下载,让用户随时随地畅享漫画世界。同时,漫蛙漫画还提
一款具有创新性和趣味性的 AI 换脸应用,可让用户体验到摸胸的感觉
AI 换脸技术是近年来计算机视觉和人工智能领域的热门话题,它可以将一个人的脸替换到另一个人的身上,从而实现换脸的效果。而今天我要向大家介绍的是一款具有创新性和趣味性的 AI 换脸应用,它不仅可以让用户体验到换脸的乐趣,还可以让用
【现身】传苹果将推10.8英寸OLED iPad Air;Vision Pro现身中国监管数据库;美格纳中国区总部开业,专注OLED显示驱动芯片等领域
1.美格纳中国区总部在合肥开业,专注OLED显示驱动芯片等领域2.南京高端软件及信息服务产业融合集群专项资金项目,芯视界、芯行纪等上榜3.苹果Vision Pro设备已现身中国监管数据库4.传苹果将推10.8英寸OLED iPad Air5.日本住友重工将推出SiC
全球十大搜索引擎排名,Google高居榜首
【全球十大搜索引擎排名】Google全球市场份额为68%,高居榜首。雅虎第二,市场份额为7%,百度第三,市场份额为6.5%,微软第四,市场份额为 3%,其它依次为eBay、NHN、Yandex、Facebook、Ask和阿里巴巴。另:中国是全球第二大搜索市场,所占
Python爬虫实战,完整的思路和步骤(附源码)
小的时候心中总有十万个为什么类似的问题,今天带大家爬取一个问答类的网站。 本堂课使用正则表达式对文本类的数据进行提取,正则表达式是数据提取的通用方法。 环境介绍: python 3.6 pycharm requests re json 爬虫的
搭建你的网站:Wordpress网站建设指南 – 外贸网站建设,Wordpress网站建设,外贸建站公司,外贸独立站,Wordpress成品网站
在这个数字化时代,拥有一个具有吸引力和易用性的网站对于个人和企业而言变得越来越重要。而WordPress作为一个流行的网站建设工具,无疑是许多人首选的选择。今天,我们将向您介绍如何搭建属于您自己的网站,让您在网上展示自己的独特风采
【8735(移动版)腾讯手机管家下载】酷派8735 移动版腾讯手机管家16.1.19免费下载
腾讯手机管家专注手机骚扰拦截,动态守护手机安全,深度清理微信、QQ缓存,让手机体积减半,拒绝卡慢。---认真服务---【骚扰拦截】智能拦截骚扰电话,过滤诈骗垃圾短信【清理加速】清理加速能力升级,释放空间告别卡慢【微信清理】个性清理
哪些因素会影响车价计算器的结果?
车价计算器的结果会受到多种因素影响。 贷款金额由车辆价格和首付款比例决定,首付款高贷款金额就低。 贷款利率很关键,不同金融机构和贷款方案利率有差异,利率高还款总额大。 贷款期限也重要,长的每月还款额低但总利息多,短的每月还款
相关文章
推荐文章
发表评论
0评