外国人说中文语音数据库
面议暂无描述
语言:普通话
数据类型:语音识别
数据量:200小时
更多信息
字段4:是
字段6:309
字段7:包含 309 个非汉语人士根据提供的句子录制的中文,每个中文句子都有其拼音。单人录制 1 小时左右(500句),每句 3-10 秒之间。录音在非常安静的环境下进行。该数据库包含来自 25 个国家的外国人。男女比例:0.366
字段8:低背景噪音(家庭/办公室)
字段9:移动电话
价格:
面议
联系咨询
推荐数据产品
查看更多 >数据
中文版权图书
100万册电子图书和期刊等资源,图书类别涉及哲学 社会科学 政治 军师 经济 文学 历史 工业 综合性图书等各大类,具体见图书数据列表
1.正版出版社印刷电子图书,按照国家出版规则经过三审三校,专业知识质量极高;
2.数据库授权交付,PDF EPUB TXT 格式6:3:1,PDF都是原版图书排版文字格式,可以通过PDF提取工具直接提取内容
3.出版社授权,来源合规,交付做正版授权,授权大模型训练场景使用
数据
中文顶刊(核心A类)文献
版权:有合规版权
语料介绍:筛选的核心A类期刊文献,支持交付详细书目元数据+PDF原文或XML原文,按领域详细分类,支持筛选交付
数据
多领域标签-多轮对话
领域:100大分类,1250小分类,覆盖全领域
对话量级:每通对话5轮,每通250-500字;
数据
电视多轮对话
LLM
数据
问答类-指令集
LLM|指令运用
