|
我为我自己编写的《美国各州简介》原型增加了一个数据集。该数据集代码为08,内容为2000至2009年间,美国各州及哥伦比亚特区人口结构和数量变化趋势。
本文将介绍该数据集增补的全过程,希望让您对XBRL(和其他XML语法)的功能有一个正确的认识。如果您能够抽空读完本文,您就会对XBRL强大的表格功能有所领悟。
我使用美国人口普查局网站提供的人口评估信息。我使用了“国家人口数据集”。此处的PDF文件(文件格式)解释了该数据集包含的内容。这里是实际提供的数据文件(CSV文件)。
首先需要注意的是,描述数据(如PDF文件)的信息与数据本身无关。当人们称XML是“自描述”的时候,他们是指XML既包含了数据,又对该数据进行了描述。XBRL也是如此。XBRL实例是数据,而XBRL分类标准描述该数据。
另一个需要注意的地方是,数据是“平面”的。CSV可以显示行和列,但无法真正建立起复杂的关联。您可以将一个数据文件与另一个数据文件联系起来。但如果没有验证两个不同CSV文件关联的工具,您将无法判断这种关联正确与否。XML和XBRL能够将数据和描述数据的信息(元数据)联系起来。
拿到CSV,把它输入微软Excel,这很容易做到,然后再将Excel输入微软Aess,这也非常容易。我把数据输入Aess,因为Aess能够更加轻松地实现我想做的事。什么?Aess比Excel使用起来更加方便?没错。我需要Aess的关系数据库功能。同样的工作在Excel里也能够完成,但是您得自己建立关联。既然Aess能够完成地更加出色,何必自己动手呢?
过去,我使用Aess生成XHTML、XML和XBRL格式的数据。现在,所有格式都为“XML”。他们只是不同句法的XML。每一种都表达语义,但每一种都用不同的方法表达语义,有时明确直白,有时含蓄。
CSV、XML或HTML未能清楚表达的一个意思是,数据应该被加总起来。所有州和哥伦比亚特区的数据加起来就是美国的总人口数。XBRL可以表达上述语义。包含定义链接库和公式链接库的人口结构和数量变化趋势XBRL分类标准信息表达上述信息。上述两个链接库和《美国各州简介》中使用的XBRL分类标准经过XBRL公式处理器的加工就生成了这份报告。该报告显示,信息汇总正确。您可以在任何一个XBRL应用程序中使用XBRL,并得出相同的结果,因为全球标准XBRL规定了XBRL的运作法则,不同的软件供应商都使用上述法则。
正 如这篇博文所阐述的,验证数据相加有两个方面的意义。首先,它记录下了应该被汇总的信息。其次,它证明了数据确实被加总了起来。许多人一开始并不理解这样 做有什么意义。他们认为“我确实在应用中进行了验证,以检查数据是否被加总了起来。”您得自己建立验证,而且也不能与他人分享,因为它是个人的。有了XBRL,验证法则可以被分享,他们以法则引擎为基础,可以多次使用,而不仅仅在您的系统里使用一次。
我想要陈述的最后一点是,人口结构和数量变化趋势信息、总体介绍信息和财经信息可以被轻松地联系起来。上述三个数据集使用的是相同的XBRL分类标准基础元数据。提取索引页上的XBRL信息(标注“XBRL”字样的蓝色图标),试试下面的操作:
■ 将财经信息和人口信息联系起来。
■ 将人口信息按照支持共和党、支持民主党和投票结果无法确定的州进行分类。
■ 创建您自己的数据集,并将其与上述数据集中的一个联系起来。
您可以通过XML、XBRL和RDF完成上述操作。每一种语法都有自己的利与弊。我将在随后的博文中探讨这些利与弊。 |