普什图(阿富汗)广播录音数据库
面议暂无描述
语言:普什图语
数据类型:语音识别
数据量:51小时
更多信息
字段4:是
字段7:该数据库包含广播数据的转录和音频。文件数量为204个文件(每个音频和转录),音频持续时间总计约为50小时。
数据包含各种主题和音频风格的内容,包括:政治、 广播片段中的全球和区域事件。由主要人物创作的广泛分布的音频
、新闻片段也可能包括发表自己意见的人其他内容:大学/其他讲座(与政治和时事相关,包括政治史讲座)、非广播性质的地方/地区电视节目(访谈、脱口秀、讨论/辩论、演讲)
字段8:低背景噪音(录音棚)
字段9:麦克风
价格:
面议
联系咨询
推荐数据产品
查看更多 >数据
中文版权图书
100万册电子图书和期刊等资源,图书类别涉及哲学 社会科学 政治 军师 经济 文学 历史 工业 综合性图书等各大类,具体见图书数据列表
1.正版出版社印刷电子图书,按照国家出版规则经过三审三校,专业知识质量极高;
2.数据库授权交付,PDF EPUB TXT 格式6:3:1,PDF都是原版图书排版文字格式,可以通过PDF提取工具直接提取内容
3.出版社授权,来源合规,交付做正版授权,授权大模型训练场景使用
数据
中文顶刊(核心A类)文献
版权:有合规版权
语料介绍:筛选的核心A类期刊文献,支持交付详细书目元数据+PDF原文或XML原文,按领域详细分类,支持筛选交付
数据
多领域标签-多轮对话
领域:100大分类,1250小分类,覆盖全领域
对话量级:每通对话5轮,每通250-500字;
数据
电视多轮对话
LLM
数据
问答类-指令集
LLM|指令运用
