===========================================================
语义Web概述
===========================================================
现有互联网的飞速发展使它的缺陷逐渐暴露了出来,如网页功能单调、搜索引擎智能化程度低等,这是因为大部分Web上的内容是设计给人阅读的,而不是让计算机程序按其意义进行操作的。计算机能熟练地解析网页的版面,知道哪里是标题,哪里有与其他页面的链接。但是,它分辨不出个人主页和天气预报的区别,因为没有可靠的方法来处理其中的语义,没有办法智能地理解网页内容和进行操作。
语义Web就是想弥补这方面的不足,为网页扩展了计算机可处理的语义信息。语义Web中,各种资源被人为地赋予了各种明确的语义信息,计算机可以分辨和识别这些语义信息,并对其自动进行解释、交换和处理。但是语义Web与人工智能中的语义网络是两个不同的概念,它的研究对象和所采用的方法与传统自然语言处理也是不同的,它对现有的Web进行了语义扩展,从而使其能被计算机做一定的理解和处理,从功能上看它将是一个能够“理解”人类信息的智能网络。将语义Web融入现在Web结构的初步努力已经在进行中了。不久的将来,当机器有更强的能力去处理和“理解”数据时,我们将看到很多重要的新功能。例如,某人想报名参加一个研讨会,计算机就可自动地为其制定最佳日程和路线以及预定酒店等。
互联网的创始人Tim Berners-Lee在2000年提出了语义Web的概念和体系结构。
在其体系结构中,第一层是Unicode和URI,它是整个语义Web的基础,Unicode(统一编码)处理资源的编码,URI(统一资源定位器)负责标识资源;第二层是XML+名空间+XML模式,用于表示数据的内容和结构;第三层是RDF+RDF模式,用于描述资源及其类型;第四层是本体词汇,用于描述各种资源之间的联系;第五层是逻辑,在下面四层的基础上进行逻辑推理操作;第六层是验证,根据逻辑陈述进行验证以得出结论;第七层是信任,在用户间建立信任关系。
第二、三、四层是语义Web的关键层,用于表示Web信息的语义,也是现在语义Web研究的热点所在。可扩展标记语言XML (eXtensible Markup Language)让每个人都能创建自己的标签,来对网页或页面的部分文字进行注释。 脚本,或者说是程序,可以将这些标签运用到复杂的应用中,不过程序编写者必须知道网页作者是如何使用每一个标签的。简而言之,XML允许用户在文档中加入任意的结构。资源描述框架RDF (Resource Description Framework )的基本结构是对象-属性-值三元组,也就相当于句子中的主语、动词和宾语。这些三元组可以用XML语法来表示。用这种结构描述由机器处理的大量数据,是非常自然的方法。RDF模式是一个描述RDF资源的属性(Property)和类(Class)的词汇表,提供了关于这些属性和类的层次结构的语义。
因为两个系统可能采用不同的标识符表示同一概念,也可能用一个标识符表示不同的含义,程序若要在两个数据库之间进行信息的比较和合并,就必须了解某些标识符表示的是否是同一事物。对该问题的一个解决方法就是本体论(Ontology)。本体是概念化的显式说明,包括分类和一套推理规则。分类定义对象的类别及其之间的关系,使我们能够表达实体之间的大量关系,而根据推理规则,程序可以进行自动推理。简单地说,就是在不同的系统间定义一本字典或者度量表,使它们对实体及其之间的关系达成共识,以便交流和共享。
语义Web需要能够对Web文档中的术语含义进行形式化描述。DAML+OIL(即DARPA代理标记语言+本体推论语言),OWL(Web本体语言),它们是W3C规范的重要扩充和改进,都是建立在人工智能知识表示基础之上的本体语言,提供了一种自然方式来描述在Web词间的类与子类之间的关系,以及在类与类之间(或子类与子类之间)关系上的限制。它们比RDF模式添加了更多的用于描述属性和类的词汇,例如类之间的不相交性(Disjointness)、等价性、更丰富的属性类型、属性特征等。
当然,要实现语义Web是远远不够的,更主要的技术难题还在于要让电脑可以进行更多的“思考”和“推断”。为使语义Web工作,计算机必须能访问结构化的信息集合以及一套推理规则,据此进行自动推理。增加逻辑性——使用规则去推理,选择行动的方式以及回答问题的方法——是语义Web组织面临的一个任务。
有了大量富含语义信息的网页,就好像有了一个巨大的全球互联的数据库。有了语义信息的帮助,人们开发出的软件代理Agent程序的智能和自动化将大大提高,它们从不同的资源中收集网页内容,搜索和处理信息并和其他程序交换信息,真正发挥语义Web的力量。当出现更多的机器可处理的网页内容和服务(包括更多的代理)时,通过代理之间的信息交换和协同工作,信息处理的效率将呈指数级增长,能更好地满足用户的需求。
网 格
网格是一种新兴的技术,正处在不断发展和变化当中。简单地说,网格是一种信息社会的网络基础设施,是利用互联网把分散在不同地理位置上的多个资源,包括计算资源、存储资源、通信资源、软件资源、信息资源、知识资源等全面连通和统一分配、管理及协调起来,通过逻辑关系组成一台“虚拟的超级计算机”。这台机器把每一台参与其中的、包括个人电脑在内的计算机都作为自己的一个“节点”,成千上万个这样的“节点”并联起来,就组成了“一张有超级计算能力的网格”。而每一位将自己的计算机连接到网格上
基于Ontology的信息检索的基本思想有:
在领域专家的帮助下,建立相关领域的Ontology;
收集信息源中的数据,并参照已建立的Ontology把收集来的数据按规定格式存储在元数据库(RDB,KDB等)中;
对用户检索界面获取的查询请求,查询转换器按照Ontology把查询请求转换成规定的格式,在Ontology的帮助下从元数据库中匹配出符合条件的数据集合;
检索的结果经过定制处理返回给用户。
junsheng
发表于:2006.05.31 15:32
::分类:
(
研究
)
::阅读:(557次)
::
评论
(0)
===========================================================
Latex简单笔记
===========================================================
每个文件必须要用一些这样的格式包含:
documentstyle{ article } %也可以采用documentclass命令,文档风格,article, book, report, or letter。
usepackage{ CJK } %使用CJK宏包,使得可以处理汉字。
begin{ CJK }{ GBK }{ song } %字体可以选择song, kai, hei, you, li。
begin{ document }
...
... %这里是内容。 查看全文
junsheng
发表于:2006.02.09 15:25
::分类:
(
研究
)
::阅读:(2436次)
::
评论
(0)
===========================================================
数据仓库常见名词浅释
===========================================================
Data Warehouse
本世纪80年代中期,"数据仓库之父"William H.Inmon先生在其《建立数据仓库》一书中定义了数据仓库的概念,随后又给出了更为精确的定义:数据仓库是在企业管理和决策中面向主题的、集成的、与时间相关的、不可修改的数据集合。与其他数据库应用不同的是,数据仓库更像一种过程,对分布在企业内部各处的业务数据的整合、加工和分析的过程。而不是一种可以购买的产品。
查看全文
junsheng
发表于:2005.11.20 15:29
::分类:
(
研究
)
::阅读:(681次)
::
评论
(0)
===========================================================
WEB超链分析算法纵览
===========================================================
WEB超链分析算法纵览
1.引言
万维网WWW(World Wide Web)是一个巨大的,分布全球的信息服务中心,正在以飞快的速度扩展。1998年WWW上拥有约3.5亿个文档,每天增加约1百万的文档,不到9个月的时间文档总数就会翻一番。WEB上的文档和传统的文档比较,有很多新的特点,它们是分布的,异构的,无结构或者半结构的,这就对传统信息检索技术提出了新的挑战。
查看全文
junsheng
发表于:2005.11.16 11:38
::分类:
(
研究
)
::阅读:(1034次)
::
评论
(0)
===========================================================
搜索引擎技术及趋势(转载)
===========================================================
随着因特网的迅猛发展、WEB信息的增加,用户要在信息海洋里查找信息,就象大海捞针一样,搜索引擎技术恰好解决了这一难题(它可以为用户提供信息检索服务)。目前,搜索引擎技术正成为计算机工业界和学术界争相研究、开发的对象。
查看全文
junsheng
发表于:2005.11.15 16:07
::分类:
(
研究
)
::阅读:(2888次)
::
评论
(0)
===========================================================
知识管理是什么?
===========================================================
知识管理是什么?
1997年,达文波特做了一项开创性的研究,其结果至今对知识管理仍具指导意义。达文波特研究了23家公司的31个知识管理项目,对企业知识管理需求、应用和评估提出了系统的观点。他认为知识管理需求与应用可分为四类:
查看全文
junsheng
发表于:2005.11.10 22:42
::分类:
(
研究
)
::阅读:(1274次)
::
评论
(0)
===========================================================
数据挖掘摘录
===========================================================
高维数据的重要属性:
(1) 数据集的大小随着维数呈指数级增长。
(2)在高维样本空间中,需要一个更大的数据才能把小部分的数据放入。
(3) 在高维度空间中,几乎每一个点都比其他样本点更接近于某一边界;
(4) 几乎每一个点都是异常点。
查看全文
junsheng
发表于:2005.11.10 21:19
::分类:
(
研究
)
::阅读:(875次)
::
评论
(2)
===========================================================
XML Handbook读书摘记(2)
===========================================================
World Wide Web继续迅速发展,最火的网站仍然是那些提供多媒体炫目内容之流。
从简单提供娱乐消费到商务贸易转移,动态个性化内容正在逐渐变火。个人认为blog的兴起就是由于个人媒体发布的流行。
查看全文
junsheng
发表于:2005.11.10 14:26
::分类:
(
研究
)
::阅读:(912次)
::
评论
(1)
===========================================================
未来的数据库(转载)
===========================================================
你也许无法相信未来数据管理产品的功能。因此让我们从目前数据库的一些新特性着手。
一位年轻人因患某种相对罕见的流感而到医院就诊。这是检查医师本周遇到的第三个相似的病例,他需要更多的信息。困惑不解的医师取了血样并安排了其他一些程序。然后,他坐在计算机前面,(通过一个简单的图形用户界面)申请了一系列血样分析项目,并将结果与世界各地具有相似症状的患者进行比较。他还请求检索与该年轻人情况相似的患者的诊断、治疗和结果记录。然后,医师向疾病控制与预防中心(CDC)请求获得该病症发展的相关信息。几分钟后,医师就为其他患者找到了这种不寻常流感的治疗方法,该流感近期在污染程度较为严重的一些城市流行。
查看全文
junsheng
发表于:2005.11.09 16:11
::分类:
(
研究
)
::阅读:(2752次)
::
评论
(0)
===========================================================
什么是Web Service?
===========================================================
Web Service 是一种新的web应用程序分支,他们是自包含、自描述、模块化的应用,可以发布、定位、通过web调用。Web Service可以执行从简单的请求到复杂商务处理的任何功能。一旦部署以后,其他Web Service应用程序可以发现并调用它部署的服务。
查看全文
junsheng
发表于:2005.11.08 11:52
::分类:
(
研究
)
::阅读:(3411次)
::
评论
(4)
===========================================================
AJAX是什么
===========================================================
AJAX全称为“Asynchronous JavaScript and XML”(异步JavaScript和XML),是指一种创建交互式网页应用的网页开发技术。它有机地包含了以下几种技术:
查看全文
junsheng
发表于:2005.11.04 21:36
::分类:
(
研究
)
::阅读:(4325次)
::
评论
(7)
===========================================================
XML Handbook读书摘记
===========================================================
这两天想深入了解XML的功能,翻了翻XML Handbook,受益匪浅,随手把一下字句摘录下来,有时间时候再整理吧。
查看全文
junsheng
发表于:2005.11.03 17:33
::分类:
(
研究
)
::阅读:(1006次)
::
评论
(0)
===========================================================
关于XML在文档排版中的应用
===========================================================
前段时间看到一篇文章介绍用XML或者SGML格式来表示有格式的文档。估计PDF和Word等文件格式也是XML或者SGML的一种变形。
查看全文
junsheng
发表于:2005.11.02 18:03
::分类:
(
研究
)
::阅读:(679次)
::
评论
(0)
===========================================================
关于浏览器和操作系统的统计
===========================================================
统计了有四天半的数据吧,中间有几次宕机,所以数据不一定很准确,但能反映一点问题。
通过这两天对我的blog进行统计,数字如下。
Windows XP 814 (65.4%) 561 (59.5%) 1375 (62.8%)
Windows 2000 302 (24.3%) 271 (28.7%) 573 (26.2%)
Windows 98 61 (4.9%) 16 (1.7%) 77 (3.5%)
Windows NT 57 (4.6%) 86 (9.1%) 143 (6.5%)
Linux 7 (0.6%) 5 (0.5%) 12 (0.5%)
unknown 3 (0.2%) 2 (0.2%) 5 (0.2%)
Mac OS 1 (0.1%) 2 (0.2%) 3 (0.1%)
查看全文
junsheng
发表于:2005.11.02 18:01
::分类:
(
研究
)
::阅读:(742次)
::
评论
(0)
===========================================================
How does search engine work?
===========================================================
1. Crawling the Web, following links to find pages.
2. Indexing the pages to create an index from every word to every place it occurs.
查看全文
junsheng
发表于:2005.11.01 19:03
::分类:
(
研究
)
::阅读:(766次)
::
评论
(0)
===========================================================
网络读书摘记
===========================================================
《网络读书摘记》
IPv6介绍
IP网络取得了巨大的成功
Internet成功的背后:
所有服务都运行在IP上;
IP运行在所有的网络上;
IP网络成功的基础:
可靠的体系结构;
技术的演进
查看全文
junsheng
发表于:2005.11.01 12:28
::分类:
(
研究
)
::阅读:(916次)
::
评论
(0)
===========================================================
计算机的编码
===========================================================
常常沉迷于技术,许多基本原理有时候都记不清楚了,写作这里,备忘兼复习吧。
计算机中数字的表示
正数: 原码=反码=补码
负数: 原码
反码=原码除符号位以外的位0/1互换
补码=反码+1
原码可以直观的表示,易于理解和进制转换;但是同符号数不能相减,异号数不能相加;
补码可以对正负数,符号一起运算,转换成原码即可得到正确的值。
junsheng
发表于:2005.11.01 12:26
::分类:
(
研究
)
::阅读:(769次)
::
评论
(0)
===========================================================
About DataMining
===========================================================
一.关键词
1.DM(Data Mining),DW(Data Warehouse),OLAP,BI 查看全文
junsheng
发表于:2005.11.01 10:09
::分类:
(
研究
)
::阅读:(823次)
::
评论
(0)
===========================================================
你还会做初中几何题目吗?进来测试一下:)
===========================================================
哈哈,难为了我10分钟呢,初中题目好久好久没做了... ...
题目:已知:在平行四边形ABCD中(A在左上角,四顶点按逆时针排列),AE垂直AD交BD于E。若CD=1/2 DE,求证:角ADB=1/2 角BDC 。
你用几分钟?不会的话,看答案,哈哈。
查看全文
junsheng
发表于:2005.10.23 20:38
::分类:
(
研究
)
::阅读:(1267次)
::
评论
(0)
===========================================================
blog和mybase比较
===========================================================
今天写了会报告,然后研究了一下blog和mybase的各自特点。
查看全文
junsheng
发表于:2005.10.11 15:53
::分类:
(
研究
)
::阅读:(1652次)
::
评论
(1)
===========================================================
Gmail初体验
===========================================================
GMail,很久以前就很向往有一个。
首先感谢CoolWinds兄给我一个GMail蛋,哈哈。
说真的,GMail的结界面并不美观,我看了一下与163的还存在很多差距,也许这在遵从简单就是美的原则。
查看全文
junsheng
发表于:2005.10.08 11:59
::分类:
(
研究
)
::阅读:(704次)
::
评论
(0)
===========================================================
文字与图片的魅力
===========================================================
文字和图片作为网上传递信息的重要方式,当然我也感觉以后可能流媒体会成为网上信息传播的主流,像电视一样,不过人们可以浏览,自己选择喜欢的内容。
到目前为止的信息交流方式还是图片和文字。图片可以直观的表达出许多通过文字表达不出来的内容,更加直观和丰富。
查看全文
junsheng
发表于:2005.10.07 10:43
::分类:
(
研究
)
::阅读:(806次)
::
评论
(0)
===========================================================
不错的交互方式
===========================================================
不错的交互方式:
1)像金山词霸那样的鼠标移动加以提示;
2)划词搜索,鼠标选中后自动出现搜索、复制等提示;省去了右键的麻烦,感觉不错。
3)前段时间觉得导航栏在右面很不舒服,可能习惯了主题在左,内容在右的样式,但实际上,在右侧更适合鼠标点击选取;只不过先入为主而已。
所以,习惯的未必是最好的,最近出现的东西未必是最新的、最好的。
junsheng
发表于:2005.10.04 16:57
::分类:
(
研究
)
::阅读:(750次)
::
评论
(0)
===========================================================
Windows XP IE6.0 Java Applet 无法显示解决方案
===========================================================
最近在Windows XP IE6.0中,Java Applet 无法显示;老是出现一片灰色,上网查一下,许多帖子说IE6不支持,建议改变使用其它的浏览器;难道只能这样?心中很是不满,于是折腾了一个小时实验了很多方法。
查看全文
junsheng
发表于:2005.09.27 17:41
::分类:
(
研究
)
::阅读:(4352次)
::
评论
(5)
===========================================================
Semantic Web V.S. Web Intelligence
===========================================================
Semantic Web
–Understanding XML and its impact on the Semantic Web
–Understanding Web Services
–Understanding RDF and RDF Schema
–Understanding Taxonomies and Topic Map
–Understanding Ontologies and DAML+OIL
Web Intelligence
–Web Mining and Farming
–Web Information Retrieval
–Web Knowledge Management
–Web Agents
–Infrastructure for Web Intelligent Systems
–Social Network Intelligence
junsheng
发表于:2005.09.26 16:25
::分类:
(
研究
)
::阅读:(814次)
::
评论
(0)
===========================================================
blog访问次数的一点疑问
===========================================================
同一个blog,点击查看时候,点击不同的链接会出现不同的访问次数。通常的访问次数是用一个全局变量放在application里面加以记录控制的。如果说,访问次数没有更新,那么应该是在浏览器缓存或者cookie里面记录,难道访问同一个页面还有不同的cookie,心里有点疑惑。谁能给我解释一下?
junsheng
发表于:2005.09.26 09:52
::分类:
(
研究
)
::阅读:(707次)
::
评论
(0)
===========================================================
Integrating JSP and Web Service
===========================================================
Thinking in JSP and Web Services
Integrating a Web Service into a JSP Page
When Should You Build Your Own Web Service?
Building a Corporate Web Service
Apache SOAP Help
Summary
查看全文
junsheng
发表于:2005.09.22 18:59
::分类:
(
研究
)
::阅读:(1213次)
::
Permanent link
===========================================================
搜索引擎优化的五大技术难题
===========================================================
本文将向大家阐述在搜索引擎优化中最棘手的几种网站设计技术。无疑,这些技术和设计无论对于网站开发人员,站点管理员,还是普通文员来说,都具备其各自的优势和独到之处。但同时这些技术也会给网站在搜索引擎对网站的检索甚至是搜索引擎优化工作增加相当的难度。还需提醒各位注意的是:搜索引擎亦认识到这些设计技术为其搜索所带来的问题,因此它们很可能正在着手开发解决方案。同样,这些技术的开发商亦会注意到其软件对于搜索引擎遍历所存在的问题,所以也在着手研究相关的解决方案。在这些技术中,最使优化人员感到棘手的应该是FLASH技术。
优化难点之一:FLASH
FLASH如果运用得当,可以为网站增色不少。但若运用不当,不但会为网站带来用户体验方面的种种问题,而且还会很大程度地影响到网站的搜索引擎排名。许多网民都有打开一个网站,首先展现眼前的是一个纯图片介绍或FLASH介绍信息的经历。
查看全文
junsheng
发表于:2005.09.21 20:14
::分类:
(
研究
)
::阅读:(766次)
::
评论
(0)
===========================================================
用户浏览网页的一些习惯统计
===========================================================
Tauscher and Greenberg [21] pre-sented the following statistics on the types of actions users may carry out:
(1) 58% of pages visited are revisits,
(2) 90% of all user actions are related to navigation,
(3) 30% of navigation actions are through the ‘Back’ button,
(4) less than 1% of navigation actions use a history mechanism
junsheng
发表于:2005.09.20 21:54
::分类:
(
研究
)
::阅读:(806次)
::
评论
(0)
===========================================================
The Semantic Web
===========================================================
A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities
By Tim Berners-Lee, James Hendler and Ora Lassila
查看全文
junsheng
发表于:2005.09.19 21:53
::分类:
(
研究
)
::阅读:(1047次)
::
评论
(1)
===========================================================
什么是语义网(转载)
===========================================================
语义网
一种能让计算机理解的新型Web内容形式,将引发对新的未知可能性的探索
查看全文
junsheng
发表于:2005.09.19 21:50
::分类:
(
研究
)
::阅读:(18177次)
::
评论
(2)
===========================================================
一点思考:团队知识的推荐
===========================================================
用一个系统管理研究团队的知识资源,重要的一块就是知识资源的推荐;
我想,可以借用blog的推荐机制;Itpub blog首页的推荐,包括热门博客、积极博客、新入门博客;
其中热门博客我发现并非以点击次数来决定;所以如何知道热门博客推荐函数?是以点击数目,加上日平均点击次数,用权重加起来得到的结果进行排序吗?希望对此有研究的同仁能交流一下;
积极博客应该是在近期内日平均发帖数和登录blog次数共同决定的;
新入门的博客应该是通过注册时间排序即可,不存在悬念;
junsheng
发表于:2005.09.14 19:05
::分类:
(
研究
)
::阅读:(676次)
::
评论
(0)
===========================================================
知识管理的一点小看法
===========================================================
现在知识管理的目标应侧重有效合理的组织相关的信息,提供多种检索方式;更为重要的是按照系统使用者的意图,有语义的检索出用户真正需要的信息;目前的检索多侧重关键词匹配,因此会出现驴唇不对马嘴的结果。
数据库系统管理的只是一些基本的数据,不能称作知识,充其量可作为信息。从大量的信息中获取真正有用的,正确的知识需要通过数据挖掘的方法来实现。
junsheng
发表于:2005.09.14 10:30
::分类:
(
研究
)
::阅读:(666次)
::
评论
(0)
===========================================================
读书摘记
===========================================================
每条规则都有例外;
有错误就是有错误;
使用编译程序所有的可选警告设施;
既要维护程序的交付版本,又要维护程序的调试版本;
不要浪费别人的时间 ─── 详细说明不清楚的断言;
不要等待错误发生,要使用初始检查程序;
要利用不同的算法对程序的结果进行确认;
冲掉无用的信息,以免被错误地使用;
junsheng
发表于:2005.09.05 11:11
::分类:
(
研究
)
::阅读:(730次)
::
评论
(0)
===========================================================
统计学与计算机科学
===========================================================
统计学:(注重) 模型 评分函数 计算方法 ; (忽略)计算 实现
计算机科学:(注重) 高效搜索和数据管理;(忽略) 模型和评分算法
我们要做的事情: 结合统计学和计算机科学的各自的特点,达到一种妥协;
junsheng
发表于:2005.09.02 17:19
::分类:
(
研究
)
::阅读:(780次)
::
评论
(0)
===========================================================
可视化可以采用的几种形式
===========================================================
线形
彩色
星形图标
散点图
直方图
时序图
等高线
junsheng
发表于:2005.09.02 17:17
::分类:
(
研究
)
::阅读:(2623次)
::
评论
(0)
===========================================================
有关逻辑
===========================================================
经典数理逻辑是理想化的逻辑,恩格斯:理想的东西不现实 现实的东西不理想
人工智能需要面对现实问题!
形式逻辑的三大基本问题: 概念、判断、推理
集合、逻辑和代数是一个事物的三个不同方面:集合是事物的外延;逻辑是事物的内涵;代数则描述了集合和逻辑的共同数学性质,它们是三位一体的关系。一种逻辑学理论,必然有一种集合理论和代数理论与之对应,充分利用这种三位一体的关系,可以加快集合、逻辑和代数理论的协同发展。
junsheng
发表于:2005.09.02 17:16
::分类:
(
研究
)
::阅读:(2721次)
::
评论
(0)
===========================================================
本体库的建立与标注
===========================================================
本观点:本体的建立及本体库的标注问题;
在本体的建模阶段,大部分的建模工作都集中在领域知识的抽象表示上,即发现领域内的概念、概念的继承层次、潜在的关系和公理等。对于领域中的实例,在建模时一般不需要考虑它们,除非建模时就能确定该本体所涉及的所有实例。实际上,通常的本体都具有一定的通用性,表示特定领域内的知识,但由于领域内可能的实例数目无穷无尽且动态变化,因此,只有本体和一个具体的应用结合时考虑实例才有意义。将现实应用中涉及的实例和抽象的本体概念相联系,这正是语义标注(Semantic Annotation)所要做的工作。和数据库类比,语义标注就如同为建立好的数据库表添加具体的纪录。
查看全文
junsheng
发表于:2005.08.26 13:29
::分类:
(
研究
)
::阅读:(1042次)
::
评论
(0)
===========================================================
Paper Notes
===========================================================
Domain Knowledge in Planning: Representation and Use
What is an Ontology?
Tom Gruber <gruber@ksl.stanford.edu>
Short answer:
An ontology is a specification of a conceptualization.
The word "ontology" seems to generate a lot of controversy in discussions about AI. It has a long history in philosophy, in which it refers to the subject of existence. It is also often confused with epistemology, which is about knowledge and knowing.
查看全文
junsheng
发表于:2005.08.26 13:16
::分类:
(
研究
)
::阅读:(614次)
::
评论
(0)
===========================================================
FAQ about Ontology
===========================================================
Q:Why would someone want to develop an ontology?
A:Some of the reasons are:
(1) To share common understanding of the structure of information among people or
software agents
(2) To enable reuse of domain knowledge
(3) To make domain assumptions explicit
(4) To separate domain knowledge from the operational knowledge
(5) To analyze domain knowledge
Q:What is the goal of ontology?
A:Sharing common understanding of the structure of information among people or software
agents is one of the more common goals in developing ontologies (Musen 1992; Gruber 1993).
查看全文
junsheng
发表于:2005.08.26 13:07
::分类:
(
研究
)
::阅读:(545次)
::
评论
(0)
===========================================================
About Ontology
===========================================================
IR types:
(1) text retrieve
(2) Data retrieve
(3) Knowledge retrieve
How deal with ontology?
(1) use Graph to express ontology, store the related data in RDBMS. Matrix express graph structure.
(2) inference ability needs the ontology to be expressed with description language such as owl, loom etc.
Ontology projects:
(1) ontology on web ontology: use the ontologies on the web;
(2) ontology broker: retrieve the webpages, find the content that users are intrested in.
(3) resolve the semantic heterogeneous problem using an algebra system.
junsheng
发表于:2005.08.26 13:06
::分类:
(
研究
)
::阅读:(617次)
::
评论
(0)
===========================================================
概率知识
===========================================================
当样本空间为一维实数集合时,则称该一维实变量为随机变量
当样本空间为一维复数集合时,则称该一维复数变量为复随机变量
当样本空间为高维实数空间时,则称该高维实数空间为随机向量
当样本空间为定义于某个数集上的函数组成,则称该函数集合为随机过程
junsheng
发表于:2005.08.26 10:48
::分类:
(
研究
)
::阅读:(2721次)
::
评论
(0)
===========================================================
semantic web resource
===========================================================
junsheng
发表于:2005.05.25 19:05
::分类:
(
研究
)
::阅读:(1238次)
::
评论
(0)
===========================================================
six challenges of semantic web
===========================================================
six challenges of semantic web
(i) the availability of content: there are not enough data orgnized in semantic web;
(ii) ontology availability, development and evolution : how to build the web ontology? how to compose the existed ontologies? every domain has their own ontologies, is there a method to orgnize the different ontologies?
(iii) scalability: how to route the query information from the semantic web semantically?
(iv) multilinguality: different languages have different expressions to the same concepts, how to orgnize and identify the concept?
(v) visualization to reduce information overload : visualization is a very important retrospect to express information intuitively. but now I have no the corresponding information background of graphics and images, so now this direction is very hard for me to choose.
(vi) stability of Semantic Web languages: build a kind of semantic web language to form the semantic web. a semantic language need to define what content in detailed?
junsheng
发表于:2005.05.09 21:55
::分类:
(
研究
)
::阅读:(609次)
::
评论
(0)
===========================================================
semantic web sites
===========================================================
junsheng
发表于:2005.04.22 12:23
::分类:
(
研究
)
::阅读:(613次)
::
评论
(0)