发表于: 2005.11.02 18:03
分类: 研究
出处: http://junsheng.itpub.net/post/860/44675
---------------------------------------------------------------
前段时间看到一篇文章介绍用XML或者SGML格式来表示有格式的文档。估计PDF和Word等文件格式也是XML或者SGML的一种变形。
今天发现了一个写个人日志的文件,比较小巧,只有一个文件OfficeDiary.exe;能够生成类似Mybase的一些基本功能。虽然软件自己规定了一个格式,但我感觉是它修改了微软的Access数据库,因为每次访问时候都会出现一个access数据库访问锁定的图标。所以,这种资料库也未必能够经住破解软件,阻挡外行是足够用了。
但是我发现一个问题就是用这个文件生成的资料库文件一般一直会增大,即使你加入资料后又删除,可能资料库的大小并没有改变,甚至更多。
这使我想到,可能这种格式也是一种类似的XML格式,当资料被删除时候,只不过加入了一个<delete>之类的标签,我预测,未经证实,呵呵。
word文件可能在一定时期内也会出现删除内容却总量不变的情况,这也许才是真正体现出Word等所见即所得的软件和Latex等纯文本编辑软件的不同之处。也证实了一句话,没有各个方面都好的,都是在几个方面进行平衡,运行速度和空间、方便性,从来就没有各方面都是赢家的软件。作为个人管理或者规模不大的单位进行资料管理,这是没有什么的,因为现在的存储器越来越便宜,人们完全可以用空间去换时间。但对一个有很多文档内容需要维护的单位来说,维护文档是很重要的,繁多的、容量巨大的资料会让所有人都头疼,这样最好的选择就是存储最核心的文本比如tex,然后根据不同的形式转换为Html或者pdf等等。














