文库搜索
切换导航
首页
频道
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
首页
联系我们
国家标准目录
国际ISO标准目录
行业标准目录
地方标准目录
批量下载
ICS 35.240.70 GB L 67 中华人民共和国国家标准 GB/T326302016 非结构化数据管理系统技术要求 Technical requirements for unstructured data management system 2016-04-25 发布 2016-11-01实施 中华人民共和国国家质量监督检验检疫总局 发布 中国国家标准化管理委员会 GB/T 32630--2016 目 次 前言 1范围 符合性 3规范性引用文件 :术语和定义 5 : 缩略语 功能性要求 6.1. 总体要求 6.2: 存储与计算设施 6.3 存储管理 6.4 特征抽取 6.5 索引管理 6.6 查询处理 6.7. 访问接口 6.8. 管理工具 6.9 转换加载 6.10 分析挖掘。 6.11 可视展现: 6.12 统计信息 质量要求 7.1 信息安全性 7.2. .易用性 7.3. 维护性 7.4. 兼容性 GB/T 32630-2016 前言 本标准按照GB/T1.1-2009给出的规则起草 请注意本文件的某些内容可能涉及专利:本文件的发布机构不承担识别这些专利的责任。 本标准由全国信息技术标准化技术委员会(SAC/TC28)提出并归口。 本标准起草单位:浙江大学、中国电子技术标准化研究院、清华大学、中国人民大学、北京航空航天 大学。 本标准主要起草人:庄越挺、陈岭、邵健、孙建伶、高林、吴新松、刘贤刚、李莹、卫凤林、王建民、 王朝坤、陈俊、杜小勇、陈晋川、马殿富、郎波。 GB/T 32630--2016 非结构化数据管理系统技术要求 1范围 本标准规定了非结构化数据管理系统的功能性要求和质量要求 本标准适用于非结构化数据管理系统产品的研制、开发和测试。 2 符合性 对于非结构化数据管理系统是否符合本标准的规定如下 a):非结构化数据管理系统若满足本标准基本要求中的所有要求,则称其满足本标准的基本要求; b) 非结构化数据管理系统在满足所有基本要求的前提下,若满足某部分扩展要求,则称其满足本 标准的基本要求和该部分扩展要求; 非结构化数据管理系统若满足本标准基本要求和扩展要求中的所有要求,则称其满足本标准 的所有要求。 3 : 规范性引用文件 下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文 件:凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。 GB180302005信息技术:中文编码字符集 GB/T32908—2016非结构化数据访问接口规范 :术语和定义 下列术语和定义适用于本文件。 4.1 非结构化数据 :unstructured data 没有明确结构约束的数据,如文本、图像、音频、视频等。 4.2 非结构化数据管理系统 unstructured data management system 对非结构化数据进行管理、操作的大型基础软件,提供非结构化数据存储、特征抽取、索引、查询等 管理功能。 5缩略语 下列缩略语适用于本文件。 IDF:逆向文件频率(Inverse Document Frequency) MFCC:梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient) PB:千万亿字节(Peta Byte) GB/T 32630--2016 SIFT:尺度不变特征转换(Scale-invariant Feature Transform) TF:词频(Term Frequency) 6功能性要求 6.11 总体要求 非结构化数据管理系统的总体要求如下: a): 应包括存储与计算设施、存储管理、特征抽取、索引管理、查询处理、访问接口、管理工具七个基 本组成部分; b) 宜包括转换加载、分析挖掘、可视展现三个扩展组成部分。 6.2存储与计算设施 6.2.1 基本要求 存储与计算设施基本要求如下 a) 应支持磁盘、磁盘阵列、内存存储、键值存储、关系型存储、分布式文件系统等种或多种存储 设施: b)应支持单机、并行计算集群、分布式计算集群等种或多种计算设施。 6.2.2扩展要求 无。 6.3存储管理 6.3.1 基本要求 存储管理基本要求如下: a): 应提供涵盖原始数据、基本属性、底层特征、语义特征的概念层存储建模功能: b): 应提供逻辑层的存储建模功能; c): 支持整型、浮点型、布尔型、字符串、日期、日期时间、二进制块等基本数据类型; d): 支持向量、矩阵、关联等数据类型: e) 应支持根据建好的逻辑层存储模型创建存储实例; f) 应支持在创建好的存储实例上插入、修改、删除非结构化数据: g): 应支持删除存储实例; h): 应支持非结构化数据操作的原子性。 6.3.2扩展要求 存储管理扩展要求如下: a): 应支持全局事务的定义并保证事务的原子性、一致性、隔离性和持久性; 应支持数据类型的多值结构和层次结构; c): 应支持在不同的存储设施上创建存储实例并实现自动映射: d) 应支持PB级数据存储。 2 GB/T 32630--2016 6.4:特征抽取 6.4.1 基本要求 6.4.1.1 特征抽取总体要求 特征抽取基本要求的总体要求如下: a): 应支持从非结构化数据中抽取名称、类型、创建者和创建时间等基本属性; 应支持文本、图像、音频、视频中至少种非结构化数据特征的抽取。 6.4.1.2 文本特征抽取 文本特征抽取基本要求如下. 应支持从文本中抽取词; b) 应支持从文本中抽取停用词 c) 应支持从文本中抽取TF-IDF特征: d): 应支持从文本中抽取关键词。 6.4.1.3 图像特征抽取 图像特征抽取基本要求如下 a): 应支持从图像中抽取颜色空间、主导颜色、色彩内容、颜色结构、颜色布局等颜色特征; b) 应支持从图像中抽取均匀纹理、边缘直方图等纹理特征; c): 应支持从图像中抽取区域形状、轮廓形状等形状特征。 6.4.1.4 音频特征抽取 音频特征抽取基本要求如下 a): 应支持从音频中按静音抽取片段 b) 应支持从音频中抽取音频波谱特征; c): 应支持从音频中抽取MFCC特征。 6.4.1.5 视频特征抽取 视频特征抽取基本要求如下 a) 应支持从视频中按镜头抽取片段; 应支持从视频中抽取关键顿。 6.4.2 扩展要求 6.4.2.1 特征抽取总体要求 应支持文本、图像、音频、视频中两种及以上非结构化数据特征的抽取。 6.4.2.2 文本特征抽取 文本特征抽取扩展要求如下: a):应支持从文本中抽取人名、地名、机构名、时间等内容: b) 应支持从文本中捕取主题词: c). 应支持从文本中抽取摘要: 3. GB/T 32630--2016 应支持从文本中抽取语义特征。 6.4.2.3 图像特征抽取 图像特征抽取扩展要求如下: a) 应支持从图像中抽取SIFT局部区域描述特征; b) 应支持从图像中抽取语义特征。 6.4.2.4 音频特征抽取 音频特征抽取扩展要求如下: a) 应支持从音频中抽取音频指纹特征: b) 应支持从音频中抽取旋律特征: c) 应支持从音频中抽取音色和响度特征; d): 应支持从音频中抽取语义特征。 6.4.2.5 视频特征抽取 视频特征抽取扩展要求如下: a): 应支持从视频中抽取运动特征; 应支持从视频中抽取语义特征。 6.5索引管理 6.5.1 基本要求 应提供索引建立、维护和删除功能。 6.5.2扩展要求 索引管理扩展要求如下: a)J 应支持B十树索引、倒排索引、全文索引和高维索引多种索引类型; b)应支持PB级数据索引。 6.6 查询处理 6.6.1 基本要求 查询处理基本要求如下 a)应支持范围查询、全文查询、样例查询、语义查询和跨媒体查询多种查询方式: b)应提供查询结果排序和批量返回功能。 6.6.2·扩展要求 查询处理扩展要求如下 a): 应提供查询相关性反馈功能: b)应支持PB级数据查询。 6.7 访问接口 6.7.1 基本要求 访问接口基本要求如下: 4 GB/T 32630--2016 a):应依从GB/T32908——2016中第4章规定的查询语言访问接口要求; b)应依从GB/T32908--2016中第5章规定的应用程序访问接口要求。 6.7.2 扩展要求 应依从GB/T32908-2016中第6章规定的Web服务访问接口要求。 6.8 管理工具 6.8.1 基本要求 管理工具基本要求如下: a): 应提供安装部署工具 b) 应提供逻辑层模型定义工具: c) 应提供查询分析工具。 6.8.2 扩展要求 应提供任务管理工具。 6.9 转换加载 6.9.1 基本要求 转换加载基本要求如下 应支持常用格式的文本数据转换加载; b): 应支持常用格式的图像数据转换加载; c) 应支持常用格式的音频数据转换加载; d). 应支持常用格式的视频数据转换加载。 6.9.2扩展要求 应提供面向医疗、工业控制、金融等特定应用领域的非结构化数据转换加载工具集。 6.10 分析挖掘 6.10.1 基本要求 分析挖掘基本要求如下: a): 应支持分析模型定义; b): 应支持分析模型执行; c) 应支持挖掘模型定义; d) 应支持挖掘模型执行。 6.10.2 扩展要求 应提供数据挖掘工具集。 6.11. 可视展现 6.11:1 基本要求 可视展现基本要求如下: L
GB-T 32630-2016 非结构化数据管理系统技术要求
文档预览
中文文档
12 页
50 下载
1000 浏览
0 评论
0 收藏
3.0分
赞助2元下载(无需注册)
温馨提示:本文档共12页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
下载文档到电脑,方便使用
赞助2元下载
本文档由 思安 于
2023-01-15 17:30:14
上传分享
举报
下载
原文档
(864.5 KB)
分享
友情链接
GB-T 8905-2012 六氟化硫电气设备中气体管理和检测导则.pdf
GB-T 41554-2022 地理空间观测平台及传感器资源元数据.pdf
GA-T 1212-2014 安防人脸识别应用 防假体攻击测试方法.pdf
YD-T 4075-2022 以太网交换机多机虚拟化系统技术要求.pdf
GB-T 22240-2018 信息安全技术 网络安全等级保护定级指南.pdf
GB-T 34960.5-2018信息技术服务治理第5部分:数据治理规范标准文件.pdf
T-CI 153—2023 人工智能驱动的制造业产品生命周期价值链管理优化技术规范.pdf
GB-T 13910-2008 石英砂 粉 厂、滑石粉厂防尘技术规程.pdf
GB-T 5155-2022 镁及镁合金热挤压棒材.pdf
GB-T 40778.3-2022 物联网 面向Web开放服务的系统实现 第3部分:物体发现方法.pdf
T-CAPE 11002—2019 铁路工程施工质量安全信息化监控系统规范.pdf
T-CI 047—2021 医用镥[177Lu]及其放射性药物的 质量标准.pdf
GB-T 38186-2019 商用车辆自动紧急制动系统 AEBS 性能要求及试验方法.pdf
GB-T 40364-2021 人类生物样本库基础术语.pdf
GB-T 42717-2023 电化学储能电站并网性能评价方法.pdf
GB-T 36630.5-2018 信息安全技术 信息技术产品安全可控评价指标 第5部分:通用计算机.pdf
DB34-T 4102-2022 废旧锂离子动力蓄电池贮存安全技术条件 安徽省.pdf
信息安全技术 网络安全等级保护基本要求 第1部分: 安全通用要求 标准征求意见稿.pdf
T-QGCML 1684—2023 LED大型广告牌制作工艺.pdf
GB-T 14049-2008 额定电压10kV架空绝缘电缆.pdf
1
/
3
12
评价文档
赞助2元 点击下载(864.5 KB)
回到顶部
×
微信扫码支付
2
元 自动下载
点击进入官方售后微信群
支付 完成后 如未跳转 点击这里下载
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们
微信(点击查看客服)
,我们将及时删除相关资源。