关注我们: 2023年6月6日 English version
 
 
 新闻动态
 其他国家、地区和多边机制
 IASB
 XBRL国际组织
 港澳台
 中国内地
 
xbrl > 新闻动态 > 其他国家、地区和多边机制 >
XBRL与语义技术
2009-06-23 来源:HITACHI 编辑:XBRL 浏览量:

Kurt Cagle是XML Today(今日XML)网的主编,同时也是O’Reilly Media公司、DevX网和TechNewsWorld网的特约编辑。目前,他正与Diane Mueller合作,为O’Reilly Media公司编写一本全面介绍XBRL的书,该书计划于2010年初出版。此外,Cagle还经营着一家名叫Metaphorical Web的咨询公司,解决未来的技术问题,如XML、分布式计算等。

2009年语义技术大会日前在美国加利福尼亚州圣何塞市落下帷幕。大会盛况空前,正逐渐发展成为探讨今日网络发展的前沿舞台。与往年教授带领众多博士生参会的场面形成鲜明对比,今年出席大会的多为西装革履的商务人士。语义网正在变革,走向成熟,其发展已不再局限于实验室里的研究,而正迈向现实世界里的解决方案。

Andy Greener和Ashu Bhatnagar已在博客中详细探讨了语义网和XBRL方面的问题,在此,我想为其添砖加瓦,比较一下各种不同的语义技术。

XBRL似乎是为语义网,特别是RDF、RDFa和OWL等技术量身定做的。为那些不熟悉这些术语的人们解释一下,RDF是资源描述框架的简称,用最简单的话说,它提供了一种描述资源(指任何可以清楚地描述成数据模型的东西,如季报、一组文档或一张发票)和资源与资源间关系(或关联)的方法。回顾历史,由于在引用给定内容时存在固有的困难,XLink(链接库构建的基础)早已被语义网业界抛弃,而RDF顺理成章地接替了它的位置。

RDF语法始于XML,并仍旧以XML的形式呈现。而其他一些简洁的记法也逐渐开始出现,如N3记法和Turtle记法(N3记法的超集)等。XML和Turtle记法本质相同,而实现RDF/XML与RDF/Turtle间互换的翻译程序也唾手可得。还有一种记法(很可能用于XBRL)是RDFa格式,Mark Birbeck在万维网联盟(W3C)上对其倍加推崇。RDFa提供相同的关系结构(如,给定的文本块是一个日期或应税总额),该结构能够在正常的RDF内进行编码,但必须在HTML或其他相关的XML内容中使用属性(attribute)才能完成编码。这就意味着XBRL“报告”可以用正常的HTML标记编写,而且具备经过元素属性(attribute)编码后的关键属性(property),从而可以为外部处理器提供详细的信息。

OWL这个名字可能不太常见。其全称为网络本体语言(Web Ontology Language),其简称中头两个字母的顺序与其全称中前两个词语首字母的顺序颠倒,方便识记。OWL是一种用来描述类别、类别属性及类别中单个实例的语言,听上去有点像XML模式定义语言(或现在常称的XSD),因为XSD也可用来描述实体。而它们的不同之处在于,OWL可以描述非常庞大的关系阵列,而这些阵列可以包含比XML更复杂的“图表”(在XML中,图表被视为数据结构的基础),因为建模的对象是知识,而非简单的物体。OWL的这一特性使在完成类别关系断言后进行推理成为可能。OWL支持一种叫SPARQL(是“SPARQL协议和RDF查询语言”的递归缩略命名)的查询语言,可以用来搜索此类断言,并将查询结果以XML文件的形式传回。

OWL的另一个、也许是更重要的特性是,与XML模式语言不同,RDF和OWL采用的是开放式的断言模型。也就是说,如果有新情况或其他需求出现,模型可以做动态更改。这一点与XML模型不同,在XML模型下,各种属性(property)被安排在一种比较封闭的层次结构中(这种结构比关系数据库模型灵活,但远不如RDF/OWL)。当然,要想获得这种灵活性,就必须付出一定的代价。RDF/OWL查询的速度比XQuery或关系数据库查询慢,但从实际的使用情况来看,这算不上是一种很大的局限。

这听起来与XBRL模式的创建差不多,那是因为事实的确如此。XBRL模式是一组典型的断言,这些断言可能是如公司的总资产值是一个确切的数值这样的属性(property)断言,也可能是资产价值属性(property)与2009年第三季度收入的上下文相关联这样的断言。同样,该资产冗长的英文标签可以与总资产值属性(property)绑定。这些断言都以三元组的形式呈现,而RDF/OWL本体可以十分轻松地容纳这些信息,然后按照需要以各种格式输出结果。

此外,这种断言链可以进行十分复杂的自动分析。例如,通过一系列的OWL断言,你可以得到一份公司及其收入的清单,这里的公司指的是所有位于太平洋西北部、市盈率超过25倍的航空公司,而这里的收入指的是2009年第三季度因资本投资而获得的收入。类似于这样的查询使用SQL来做将变得极其复杂,甚至无法完成,使用XML数据库来做也不简单,而如果使用RDF/OWL来做就相对比较容易了。

更重要的是,通过关联数据技术,RDF三元组存储(又叫做断言数据库)对XBRL范围外的信息也起作用。例如,一个三元组存储可以包含一份世界1000强公司决策层管理者的简历清单(内容包含他们之前工作过的公司)。这种语义数据库运用了一种通用的基础传输语言(RDF),所以SPARQL查询可以结合这两组数据对一个给定的个体进行搜索,查看其工作过的公司的盈利历史记录,以此判断他对于公司来说是一个人才还是一个累赘。

如果能够用这种方法展示XBRL文档,特别是如果能够通过RDFa从年报或其他报告文件中提取这些信息,使用RDF形式来呈现XBRL将拥有与生俱来且令人信服的优势。事实上,XBRL国际组织理事会成员Diane Mueller和万维网联盟会员、HTML规范开发者、语义网领域的关键人物Dave Raggett目前正在为XBRL国际组织准备这方面的提案(不瞒您说,我目前正与Diane合作,为O’Reilly Media公司编写一本介绍XBRL的书)。另外,万维网联盟在其内部设立了一个XBRL/语义活动小组,探索这些可能性。小组成员将于2009年6月在法国巴黎召开XBRL国际组织年会上进行第一次面对面的接触。

语义网脱离单纯的研究已有数载,某种程度上得益于人们对这一理念理解的不断加深,工具的不断成熟和将其付诸实践的机会的出现。当我们逐渐向分布式云数据技术和所有随之而来的新技术挺进的时候,XBRL可能成为语义网技术最重大的应用。

 
 
关于XBRL-cn.org | 联系我们 | 欢迎投稿 | 官方微博 | 友情链接 | 网站地图 | 法律声明
XBRL地区组织 版权所有 power by 上海国家会计学院 中国会计视野 沪ICP备05013522号