ICS35.240.30 CCS L 67 中华人民共和国国家标准 GB/T 20092.1—2022 部分代替GB/T20092—2013 中文新闻信息内容 第1部分:概念模型 Chinese news information content- Part 1:Concept model 2022-10-12实施 2022-10-12发布 国家市场监督管理总局 发布 国家标准化管理委员会 GB/T20092.1—2022 目 次 前言 引言 IV 1 范围 2 规范性引用文件 3 术语和定义 概念模型 4 4.1 总体结构 4.2 文档层模型 4.3 稿件层模型 4.4 内容项层模型 4.5 元数据组描述机制 4.6 关系机制 4.7 受控词表机制 GB/T20092.1—2022 前言 起草。 本文件是GB/T20092《中文新闻信息内容》的第1部分。GB/T20092已经发布了以下部分: 一第1部分:概念模型; 一第2部分:新闻元数据; 一第3部分:数据交换的XML格式。 本文件代替GBT20092一2013《中文新闻信息置标语言》中的第6章“CNML体系结构”,与 GB/T20092一2013相比,除结构调整和编辑性改动外,主要技术变化如下: —删除了原则(见2013年版的6.1); 一将“CNML体系结构”更改为“概念模型”,并将2013年版的有关内容更改后纳人(见第4章, 2013年版的8.1和9.1)。 请注意本文件的某些内容可能涉及专利。本文件的发布机构不承担识别专利的责任。 本文件由全国中文新闻信息标准化技术委员会(SAC/TC352)提出并归口。 本文件起草单位:新华通讯社、清华大学、国家应用软件产品质量检验检测中心、北京中联合超高清 协同技术中心有限公司、北京北大方正电子有限公司、中国科学院计算机网络信息中心、北京智途云天 科技有限公司、视觉(中国)文化发展股份有限公司、北京北科光大信息技术股份有限公司、中国人民大 学、中国传媒大学、中国大百科全书出版社有限公司、杭州前方信息技术有限公司、东南大学、新华网股 份有限公司、中国互联网新闻中心、南方报业传媒集团、重庆日报报业集团、青苹果数据中心有限公司、 北京中科大洋科技发展股份有限公司。 本文件主要起草人:武国卫、黄菁、张鹏、王威、王付生、朱建波、朱艳华、丁峰、王骏清、王垫越、 许向东、陈锐、张弛、曹学军、刘万福、杨鹏、杨、王建平、何昆、张晓伟、张晴、付蓉、路海燕、张贤良。 本文件所代替文件的历次版本发布情况为: —2006年首次发布为GB/T20092一2006,2013年第一次修订; ——本次为第二次修订。 II GB/T 20092.1—2022 引言 实施过程中不断涌现一些新的应用场景,产生一些新的应用需求。新闻媒体的部分应用系统也逐渐不 再使用XML格式,使用JSON格式传输稿件的应用越来越多。因为GB/T20092一2013定义的技术内 容主要是基于XML格式定义的,已经逐渐不适应新闻媒体的应用需求,所以本次修订的主要目的是避 免将标准的内容局限于某一种技术,把中文新闻信息内容的概念模式和新闻元数据独立出来,并将新闻 信息内容的XML格式和JSON格式单独进行规范和定义,从而使标准的范围更加明确,定义更加 清晰。 GB/T20092旨在定义普遍适用于中文新闻信息内容采集、编辑、生成、发布、交换、存储、检索、评 估反馈等新闻信息生命周期的各个环节的描述规范,为适应最新技术在新闻媒体中的实际需要,使标准 更具有可用性,将标准名称改为《中文新闻信息内容》,拟由四个部分构成, 第1部分:概念模型。目的在于建立新闻行业中文新闻信息的抽象概念模型,规范中文新闻信 息文档的总体结构和描述方式,为新闻内容使用者提供指导 第2部分:新闻元数据。目的在于规范描述中文新闻信息内容的各类元数据,便于在新闻媒体 行业信息系统中实现信息内容的统一表达,一致描述。 第3部分:数据交换的XML格式。目的在于规定基于XML的中文新闻信息数据交换格式, 为新闻媒体信息系统的建设提供技术支持。 第4部分:数据交换的JSON格式。目的在于规定基于JSON的中文新闻信息数据交换格式, 为新闻媒体信息系统的建设提供技术支持。 IV GB/T20092.1—2022 中文新闻信息内容 第1部分:概念模型 1范围 本文件规定了新闻行业中文新闻信息的抽象概念模型,包括文档层模型、稿件层模型和内容项层模 型,以及元数据组描述机制、关系机制和受控词表机制。 本文件适用于新闻信息内容的采集、编辑、生成、发布、交换、存储、检索、评估反馈等新闻信息生命 周期的各个环节。也适用于报刊、广播、电视、通讯社、新闻网站、社交媒体等新闻内容提供商及媒体应 用与研究机构。 规范性引用文件 2 本文件没有规范性引用文件。 3 术语和定义 下列术语和定义适用于本文件。 3.1 元元数据 metametadata 定义和描述元数据的数据。 3.2 受控词表 controlledvocabulary 从专业的角度将同一范畴的主题进行归类后形成的词表,并允许以受控的方式进行词条修改和 扩展。 3.3 文档document 符合本概念模型的一篇或者若干篇新闻信息内容数据的集合。 3.4 稿件item 文档中包含的可管理业务对象,一般有完整的元数据和内容,表示一个完整的新闻信息或其他定义 信息。 3.5 内容项 5contentitem 实体稿件类型包含的单一内容,可以包含任意一种文字、图片、图形、音频、视音频、多媒体、应用文 档等不同类型的数据内容及其元数据。 3.6 信封 envelop 完成新闻信息交换功能的组件结构。 1 GB/T20092.1—2022 3.7 产品 product 新闻提供商按照特定的目的分类组织新闻的一种形式,以便提供给新闻消费者订购,一般与订购它 的一组特定的新闻用户对应。 3.8 栏目 column 对产品内容的一种细分方式。 注:栏目可以是稿件的一种内容属性,也可以是展示属性 4 概念模型 4.1 总体结构 本文件定义了中文新闻信息的概念模型,包括文档层模型、稿件层模型、内容项层模型、元数据组描 述机制、关系机制以及受控词表机制 概念模型总体架构如图1所示。 2 GB/T20092.1-—2022 文档 讨衣编日 信封 税件 稿件元数据 可扩展元数据组 描述型元数据组 管理型元数据组 权利型元数据组 (*) 内容项 内容项元数据 可扩展型元数据组 捕述型元数据组 物理元数据组 权利型元数据组 (*) 数据内容 内容项关系集合 内容项关系(*) 内容项关系(*) 内容项 内容项 内容项 内容项 稿件关系集合 稿件关系(*) 稿件关系(*) 橱件 稿件 稿件 稿件 注:“(*)"指可重复。 图1概念模型总体架构 本文件规定了对新闻信息文档的描述方式,一个新闻信息文档包含了文档层、稿件层和内容项层的 三层结构。一个新闻信息文档可以包含一个或多个稿件,一个稿件可以由一个或多个内容项组成。属 于同一文档的不同稿件组成一个稿件序列,稿件之间的关系描述与稿件的内容描述分离。属于同一内 容项层的内容组成一个序列,内容项之间的关系描述与内容项的描述分离 在文档层中定义了用于文档通讯控制过程中的信息即信封结构。在稿件层和内容项层的描述中, 定义了稿件层和内容项层的元数据组。同时,稿件还定义了关系描述、受控词表的定义和引用机制。 3 GB/T20092.1—2022 4.2 文档层模型 具体定义如下。 a) 词表编目:用简化的别名描述文档中使用的受控词表。 b) 信封:新闻信息交换功能的组件结构,描述了如下信息: 1) 传输标识:文档传输的标识符; 2) 系统标识:生成发布文档的系统名称; 3) 发送时间:稿件的实际发送时间; 4) 定时发布时间:稿件的计划发送时间; 5) 发送方:发送稿件的人或机构; 6) 送达方:一个或多个稿件接受者和机构; 7) 发稿优先级:稿件的优先级; 8) 服务信息:新闻单位提供的新闻服务; (6 产品信息:从新闻内容的角度出发,按照特定的分类方法具备相同内容特征的新闻数据 稿件集合:包含一个或多个稿件的内容集合。 c) d) 稿件关系集合:包含对各个稿件之间关系的描述集合 文档 词表编目 信封 稿件集合 新闻稿件 新阅硫件 新闻稿件 (稿件实例1) (件实例2) (稿件实例3) 稿件关系集合 派牛关系 相关关系 (稿件关系实例1) (稿件关系实例2) 稿件引用 稿件引用 稿件引用 稿件引用 图2文档层模型示意图 词表编自结构提供了简化受控词表使用的可选机制。在文档开始位置通过词表编自提供了对使用 的受控词表进行简短的别名定义和外部引用的机制。 4.3 3稿件层模型 稿件层模型由三部分组成,即稿件元数据集合、稿件内容集合、稿件内容项关系集合。如图3所示, 4 GB/T20092.1—2022 具体定义如下: a) 稿件元数据集合:包含一个稿件管理型元数据组,一个可选的描述型元数据组、一个可选的权 利型元数据组;还可以包含多个可扩展的其他元数据组实例; 稿件内容集合:包含一个或多个具体内容项,不同类型的稿件拥有不同类型的内容; 稿件内容项关系集合:包含一到多个组成稿件的多个内容项之间的关系 ) 稀件 元数据 管理型元数据组 描述型元数据组 权利型元数据组 可扩展元数据组(*) 内容集合 内容项 内容项 内容项 内容项关系集合 内容项关系组 关系 关系 关系 图3稿件层模型示意图 稿件是文档中包含的可管理业务对象。本文件将稿件定义为描述型稿件和管理型稿件,描述型稿 件指具有实际内容项的稿件,管理型稿件用于描述对应稿

pdf文档 GB-T 20092.1-2022 中文新闻信息内容 第1部分:概念模型

文档预览
中文文档 13 页 50 下载 1000 浏览 0 评论 0 收藏 3.0分
温馨提示:本文档共13页,可预览 3 页,如浏览全部内容或当前文档出现乱码,可开通会员下载原始文档
GB-T 20092.1-2022 中文新闻信息内容  第1部分:概念模型 第 1 页 GB-T 20092.1-2022 中文新闻信息内容  第1部分:概念模型 第 2 页 GB-T 20092.1-2022 中文新闻信息内容  第1部分:概念模型 第 3 页
下载文档到电脑,方便使用
本文档由 思安 于 2023-01-18 17:30:18上传分享
站内资源均来自网友分享或网络收集整理,若无意中侵犯到您的权利,敬请联系我们微信(点击查看客服),我们将及时删除相关资源。