科情头条数据
面议科情头条数据是2019年10月8日至今; 信息来源六大类: 专业科技媒体25%(MIT科技评论,PNAS.刀、新智元、亿欧网...... ScienceDaily、Nature、 Science,AlphaGalileo) 科技领先国家科技部门及高校院所40%(美国:美国能源部、美国总统科技政策办公室;英国:英国商业、创新与科技部、英国政府科学办公室;德国:德国联邦经济与技术部;法国:法国科学院;日本:日本文部科学省;韩国:韩国科技部) 科技智库16%(巴斯德研究所、 兰德公司、斯坦福国际咨询研究所、布鲁金斯学会、哈佛大学国际事务中心) 主要金砖国家科技部门及高校院所8%(中国科技部、印度国家科学院、巴西国家科技部) 大型企业咨询机构5%(IBM、微软、毕马威、波士顿咨询、德勤,普华永道、埃森哲、麦肯锡) 国际组织6%(欧盟、世界经合组织、联合国教科文化组织、世界银行、第三世界科学院组织)"
语言:中文
数据类型:预训练基础语料
(持续在更新)
数据量:十万级别
交付格式
ftp库交付
价格:
面议
联系咨询
推荐数据产品
查看更多 >数据
中文版权图书
100万册电子图书和期刊等资源,图书类别涉及哲学 社会科学 政治 军师 经济 文学 历史 工业 综合性图书等各大类,具体见图书数据列表
1.正版出版社印刷电子图书,按照国家出版规则经过三审三校,专业知识质量极高;
2.数据库授权交付,PDF EPUB TXT 格式6:3:1,PDF都是原版图书排版文字格式,可以通过PDF提取工具直接提取内容
3.出版社授权,来源合规,交付做正版授权,授权大模型训练场景使用
数据
中文顶刊(核心A类)文献
版权:有合规版权
语料介绍:筛选的核心A类期刊文献,支持交付详细书目元数据+PDF原文或XML原文,按领域详细分类,支持筛选交付
数据
多领域标签-多轮对话
领域:100大分类,1250小分类,覆盖全领域
对话量级:每通对话5轮,每通250-500字;
数据
电视多轮对话
LLM
数据
问答类-指令集
LLM|指令运用
