飞雪团队

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 2055|回复: 0

资源描述框架RDF

[复制链接]

4137

主题

4225

帖子

1万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
14711
发表于 2022-2-7 22:05:20 | 显示全部楼层 |阅读模式
在图书馆里,每一本书都要被编目,这样才能方便查找和利用。于是,很早就有人想到,网上所有的资源也需要"编目"。
                                                                                                                如果要对网络资源编目,首先就必须有一套"编目规则"。资源描述框架(Resource Description Framework ,简称RDF),就是一套W3C提出的描述网络资源的方法。
RDF的基本思想很简单,就是说任何网络资源都可以唯一地用URI(统一资源标识符,Uniform Resource Identifier)来表示。在这里,可以简化地将URI理解成网址URL。
比如,世界第一大网站Yahoo!首页的网址是http://www.yahoo.com/,那么它的首页就可以用这个网址来唯一代表。
有了这个识别符以后,网络资源的其他特性都用"属性(Property)"="属性值(Property value)"这样的形式来表示。

请看上图,最顶部的方框表示网络资源http://www.yahoo.com/,下面的两个方框表示两个属性关系,一个是"资源作者=Yahoo!公司",另一个是"资源名称=Yahoo!首页"。
根据RDF的定义,资源本身是主语subject,属性名称是谓语predicate,属性指是宾语object。对网络资源的描述就采用主-谓-宾的形式。
RDF本身用xml文件的形式表示,比如上图写成xml文件就是:


  
    Yahoo!公司
    Yahoo!首页
  


这个xml文件不是很规范,主要是为了说明问题。
RDF强大的地方在于,它只规定了主-谓-宾这种描述形式,至于谓语和宾语到底是什么,完全可以根据不同需要自由选用。因此,RDF才能定义为"资源描述框架",而不是"资源描述方法"。
用于RDF的最常见谓语和宾语,是都柏林核心(Dublin Core),简称DC。它是一套用于描述信息的元数据,一共有15个标签,也就是15个谓语和宾语的组合,其中常见的标签包括Title,Creator,Subject等等。
采用了都柏林核心以后,基本上所有的网络资源都可以用RDF描述出来,因此初步实现了对网络资源进行编目的目的,为下一步机器化处理和最终语义网的实现打下了基础。
以下我举一个实例。
2年前的今天,2006年2月25日,我写了一篇网志《学科和采矿》,用RDF对这篇网志进行编目,就是下面的结果:





这是一个规范的xml文件,可以实际使用。请注意标成黑体的那几行。首行"rdf:Description",这是RDF规定使用的标签,表示主语subject,后来的"rdf:about"属性用来表示资源的标识符,也就是url,它唯一地确定了一个网络资源。其他属性中的dc:title、dc:identifier、dc:subject、dc:description、dc:creator和dc:date,分别表示题目、标识符、主题、简介、创造者、日期,这几项都属于都柏林核心,等号后面是相应的值。至于trackback:ping属性,这一项在都柏林核心中没有规定,但是也可以加上去,从中可以看到RDF资源描述框架的灵活和强大。
[延伸阅读]
1. RDF Tutorial
2. W3C: RDF Primer
(完)
回复

使用道具 举报

懒得打字嘛,点击右侧快捷回复 【右侧内容,后台自定义】
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|飞雪团队

GMT+8, 2024-4-28 19:32 , Processed in 0.065535 second(s), 21 queries , Gzip On.

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表