加载中...
加载中...
100万册电子图书和期刊等资源,图书类别涉及哲学 社会科学 政治 军师 经济 文学 历史 工业 综合性图书等各大类,具体见图书数据列表 1.正版出版社印刷电子图书,按照国家出版规则经过三审三校,专业知识质量极高; 2.数据库授权交付,PDF EPUB TXT 格式6:3:1,PDF都是原版图书排版文字格式,可以通过PDF提取工具直接提取内容 3.出版社授权,来源合规,交付做正版授权,授权大模型训练场景使用
科情头条数据是2019年10月8日至今; 信息来源六大类: 专业科技媒体25%(MIT科技评论,PNAS.刀、新智元、亿欧网...... ScienceDaily、Nature、 Science,AlphaGalileo) 科技领先国家科技部门及高校院所40%(美国:美国能源部、美国总统科技政策办公室;英国:英国商业、创新与科技部、英国政府科学办公室;德国:德国联邦经济与技术部;法国:法国科学院;日本:日本文部科学省;韩国:韩国科技部) 科技智库16%(巴斯德研究所、 兰德公司、斯坦福国际咨询研究所、布鲁金斯学会、哈佛大学国际事务中心) 主要金砖国家科技部门及高校院所8%(中国科技部、印度国家科学院、巴西国家科技部) 大型企业咨询机构5%(IBM、微软、毕马威、波士顿咨询、德勤,普华永道、埃森哲、麦肯锡) 国际组织6%(欧盟、世界经合组织、联合国教科文化组织、世界银行、第三世界科学院组织)"
产品优势: 1.经网信办专家经过论证及分析后形成的90+个细分维度,如专家以发展的角度论证了科技政治学细分类别的准确性,另外政治体系也从中国政治体系、政府与公共关系、中国特色、国际的政治体系等角度出发将其划分出60多个细分类别,符合社会主义核心价值观要求 2.包含了近1万条经过心理、政治、法律领域专家论证后的人工标注高质量调优数据 产品描述: 1.数据内容:中文价值观类数据 2.数据规模:58109条(持续增加中,其中1万条为高质量调优数据) 3.标注内容:涵盖心理健康21个细分维度、政治敏感60个细分维度、法律法规14个细分维度 4.存储格式:以json格式存储 5.语言:中文 6.数据类别:权威期刊、杂志等 适用场景: 基于构建的三元组数据,训练大模型,提升模型在政治敏感类的回答能力(现在很多大模型敏感问题都不回答);心理健康类问题回答的更符合中国国情;在法律法规类的问题回答的更准确。
产品优势: 跟进国际时事热点相关的新闻报道,定期更新并增加数据量 产品描述: 1.数据内容:中文实时热点类数据 2.数据规模:20413条(持续增加中) 3.标注内容:涵盖近期国际热点新闻 4.存储格式:以json格式存储 5.语言:中文 6.数据类别:权威期刊、杂志、新闻等 适用场景: 基于构建的三元组数据,训练大模型,提升模型在时事热点类事件的回答更符合中国国情
收录了1885至今的中国专利数据库,包括发明专利和实用新型 中国专利 :全部可以提供全文 数据,查个数。23年前个人的专利没有,企业有全量。 国外专利 :23年6月之后 可以全文数据,2千万, 23年6月之前,结构化数据,但是缺少全文字段 查数,5千万
数据来源:不限GITHUB,多渠道来源,专门为大模型训练整理 包含了超过 30 亿个来自 600 余种编程与标记语言的文件,全量数据为 67.5TB,超过 6TB 的许可源代码文件,涵盖 358 种编程语言。
数据内容 : 政务类相关数据,包含政策文件,政策解读;政务名词;办事类;通知公告和新闻;问答类5个类别 数据来源:各地政务网站 存储格式 : json 语言:中文
海量高质量创意图片,覆盖各类别(照片、插画、模版、元素、图标),包含大量独家内容,满足不同项目的创意设计与配图需求 图片分类:城市风光、科技、房地产、运输、美容美妆、自然风光、医疗、设计素材、野生动物、家居、生活方式、教育、艺术、宠物、大数据、静物、通讯、抽象、金融、旅行、美食、广告背景、工业、肖像、传统文化等 数据质量:所有图片数据带配套标题、多维度标签、描述 数据来源:来源合规,正式版权授权交付
数据分类和量级:人物/商品/制造等各风格类别的3D模型数据,数据类型为主流的3D模型风格,支持输出3D图片数据和模型数据; 数据质量:所有数据带配套标题、多维度标签、描述 数据来源:来源合规,正式版权授权交付
全球头部服装品牌线上服装产品数据,包括图片及描述数据,高质量150万条记录,大约500万图片,图片大多在2000px及以上;稍微低质量图片大概1000px级别数据更多。图片数据经过模型打标,可以区分平拍、模特(正背侧等)、细节等维度,也有平拍图上身图等图片对数据。
海量高质量视频,覆盖各类型(航拍、延时、慢镜、背景、3D等),包含大量独家内容,满足不同项目的创意设计与配图需求 数据质量:所有视频数据带配套标题、多维度标签、描述 数据来源:来源合规,正式版权授权交付
1. 帧率:1080p及以上,画质清晰 2. 不低于1000dps 3. 帧速率:24fps及以上 4. 无后期特效 7. 无后期快慢速 8. 无后期剪辑 9. 真人非动画 10. 年龄5岁以上 10. 无LOGO,无字幕 11. 背景为实拍背景
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
覆盖范围:小学数学、小学语文、小 学英语、小学科数学、初中物理、初中化学、初中生物、初中地理初中英语、初中语文、初中历史、初中道 德与法治:初中科学、初中信息技术、化 学、高中生物、高中地理、高中英语、高中语文、技术、信息技术。 题型覆盖:选择题、作图题、填空题、解答题判断题、改错题、问答题、 探究题简答题、:书写、其他、实验探究题单选题、多选题、单项选择题、阅读理解、单词拼写、分析说明题、翻译、材料解析题、句型转默写、语言表达、信息匹配、 辨析题现代文阅读、双选题、辨析改错题论述题、读图说史题、完形填动多项选择题、短文改错、书面表选词填空、完成句子、 补全对达、料题、名句默写、单词拼 写、单句语法填空、选词填空、句子单词拼写、综合性学习、名著阅读、不定项选择题、单项选择、看图题、修改病句、古诗阅读、字词书写、单空题、文学类文本阅读等; 数据说明:试题属性包含学科、章节、知识点、题型、难度系类来源(所属地区)、能力、分值、解析等十余类;试卷属性包含试卷类型、来源、分值、难度系数、考试时间、命题人等十余类所有学科考点
1.数据来源:大学题库来源于全国各大中专院校专业课程教材的配套试题,覆盖了2万多个专业课程;职业题库来源于各种职业资格考试,如会计类(会计师、税务师等),法律类(司法考试、律师资格考试等)、医学类(医师资格证、执业医师等)、工程类(造价工程师等)、公务员考试等。 2.数据分类:分类有两级,一级分类主要按照金融、法律、医学、计算机、工程等,二级分类主要是按照大学专业课程或职业考试类型,如《会计学原理》,《2021级建筑专业限选课-建筑CAD》,“会计师资格证”等。 3.题型类别:选择题、填空题、应用题、问答题、判断题等 4.存储格式:json 5.语言:中文 6.数据字段: md5(每条数据的唯一编号ID)、title(题目内容)、option(题目选项)、answer(题目答案)、 parse(解析,如知识点分析,解题思路分析等,部分题目带解析)、type(试题类型)、category(一级分类)、subject(二级分类)
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式要⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式要⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式要⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
1.完整性标准:90%以上试题要有“题文、答案、解析”;2.准确性标准:95%以上试题答案正确。 2.数据格式是jsonl格式,每⾏是⼀道题,内容包含: 问题、答案、解析、学科、难度、教育等级、语⾔,所有交付的内容的格式要⼀致。 3.字段内容如下表:学段/教育等级/年级/学科/二级学科/语言/id/题干/答案/解析/题目难度/知识点/题型
覆盖学科:art_and_design、business、education、health_and_medicine、history、humanities、math、science、social_sciences、tech_and_engineering 数据字段(全部有解析):question(问题)、answer(题目答案)、category(一级分类)、sub_category(二级分类)、hint(解析)、option(题目选项)
L1级产品可分为单片影像产品、立体影像产品,也可分为全色影像产品、多光谱影像产品。其中,北京系列三代卫星具备同轨双立体或多角度立体成像能力,所形成的L1级立体像对产品是1:2000-1:10000比例尺高精度立体测绘的数据源。
数字正射影像(Digital Orthophoto Map,简称DOM),结合地面控制资料、高程、参考影像等,经正射、融合、镶嵌、裁切等处理形成的正射影像数据产品。可按照标准分幅、行政区划或者需求范围裁切。数据精度方面:0.8米分辨率满足1:10000比例尺精度要求;0.5米分辨率:满足1:5000比例尺精度要求;0.3米分辨率:满足1:2000比例尺精度要求。
数字表面模型(Digital Surface Model,缩写DSM),最真实的反映地球表面的情况,包含了地表建筑物、桥梁和树木等高度的地面高程模型。数据精度方面满足《CH/T9022-2014 基础地理信息数字成果1:500 1:1000 1:2000 1:5 0001:10 000数字表面模型》当中要求的三级精度等级。
基于北京系列卫星遥感影像数据制作的全国一张图产品,已通过部地图审查中心审核并取得审图号,支持在线发布。数据精度可达0.5米分辨率,支持按照按省、市、区/县、需求范围等裁切。
利用卫星高精度立体成像技术,生成的能可视化反映地理要素的位置、几何形态、表面纹理的三维可视化产品; Mesh 产品按修编程度分为 I 级:自动化生成Mesh产品,无人工干预;II 级:对于云雾、水体和道路(桥梁)等进行修编;III 级:根据需求确定
表达建筑物的空间位置、几何形态及外观效果的三维模型,同时关联实体属性信息。按表现细节层次的不同分为 LOD1 、 LOD2 和LOD3。
遥感解译AI训练样本由统一规格,一般不超过1024像素*1024像素的影像和标注块组成,可根据任务类型细分为语义分割、目标检测、变化检测等多种样本类别。