语义网是什么意思(语义 意思)

今天给各位分享语义网是什么意思的知识,其中也会对语义 意思进行解释,现在开始吧!semantic-aware什么意思 semantic-aware语义感知双语例句1The transfer chara...

今天给各位分享语义网是什么意思的知识,其中也会对语义 意思进行解释,现在开始吧!

semantic-aware什么意思

semantic-aware

语义感知

双语例句

1

The transfer characteristics of Web flows are analyzed. On the basis of existing tail-drop and random early detection algorithms, an improved queue management algorithm based on packet semantic-aware is proposed.

对Web流的传输特性进行了分析,并在现有尾部丢弃和随机早期检测算法的基础上提出了基于流分组语义感知的改进队列管理算法。

2

The purpose of Semantic Web is to build a web that is able to describe things in a way that computers can understand, and to automatically access and exchange between semantic-aware applications.

语义网的目标是建立一个机器可理解信息的网络,它能够在语义感知的应用之间自动地访问和交换。

英语翻译软件的原理

机器翻译基本工作原理和基本分类

机器翻译(Machine Translation,MT)是建立在多学科基础上的综合学科,现代理论语言学的发展,计算机科学的进步,信息学和概率统计学的应用,对机器翻译的发展和演变产生了重要影响。机器翻译的基本思想是利用计算机对自然语言进行翻译,而各种机器翻译系统采用的技术和理念不尽相同;面对各种各样的机器翻译系统,文献上有各种分类方式。本文根据所应用的基本工作原理对机器翻译系统分类作一综述。

1. 基本类型的机器翻译系统:现有的机器翻译系统按照其基本工作原理,可以分为基于规则的(Rule-Based)机器翻译,基于实例的(Example-Based)机器翻译和统计型的(Statistical)机器翻译这三种基本类型。

1.1. 基于规则的机器翻译系统(Rule-Based Machine Translation, RBMT):其基本工作原理基于一个假设,即语言无限的句子可以由有限的规则推导出来。基于这个假设的机器翻译方法又可以分为三类:直接翻译法(Direct Translation),中间语言法(Interlingual Approach),和转换法(Transfer Approach)。它们都需要用到大规模的双语词典,需要用到源语言推导规则,语言转换规则和目标语言生成规则;其不同点在于对语言进行的分析深度不同。如直译法几乎不需要进行语言分析,中间语言法和转换法需要对源语言和目标语言进行某种程度的语言分析。

1.1.1直接翻译法(Direct Translation):这种翻译方法直接对源文字中的字词进行逐个翻译,译后文字顺序按照原文顺序进行排列。这是基于规则的机器翻译的最早的工作方法。这种译法简单、直观,其弊端也是明显的:由这种方法得到的翻译结果质量很不令人满意。人们已经逐渐不再使用这种直接翻译法。

1.1.2中间语言法(Interlingual Approach):这种翻译方法对源语言文字进行透彻的语言分析,将其转化为一种中间语言表达形式,进而由这种中间语言(Interlingua)进一步生成和输出符合目标语言语法规则的文字。这种中间语言是一种非自然语言,即不是任何国家地区人们使用的语言;而且它是一种没有歧义的表达方式。此外,中间语言不是唯一的,不同的系统采用不同的中间语言。任意一种语言经由中间语言译为其它任意一种语言,理论上这种中间语言法是最有效率的一种翻译方式。假定世界上总共有n种自然语言,使用中间语言法,只需2n个模块就可以解决所有自然语言之间的互译问题。不使用中间语言,这些语言间的互译则需要n(n-1)个模块。当n大于3时,2n小于n(n-1)。我们知道,世界上的自然语言种类远大于3,因此2n个模块的数量远小于n(n-1)个模块的数量。

1.1.3 转换法(Transfer Approach):这种翻译方法先对源语言文字进行一定程度的语言分析,去除语法的因素,生成源语言的中间表达方式,然后经由转换,生成目标语言的中间表达方式,再由目标语言的中间表达方式生成和输出符合目标语言语法规则的文字。目前来说,转换法的语言分析和实现方法在三种方法中最为复杂,得到的翻译质量在三种方法中也是最好的,是目前商业上最常使用的翻译方法,在商业上最为成功。

在许多基于规则的机器翻译系统中,由语言学家辅助编写一系列关于源语言和目标语言的语法规则,以及将源语言数据转换为目标语言数据的转换规则。然而使用全人工来制作这些规则非常昂贵、费时,而且易于出错。一个解决方法便是将以往的历史翻译结果作为资源库,其中的源语言文字和它对应的目标语言译文作为例子,从中尝试提取出恰当的规则。方法之一是对源文字和目标语言译文作人工标记以示关联。Sato言和Nagao[1]研发出一个系统,用“平面依赖关系树”来表示源语言文字和目标语言文字。这种关系树型数据结构是计算机高效识别的一种形式。通常用两个层次代表源语言和目标语言之间的关联:第一层次依赖于文字的表面形式(如字、词顺序),用于源语言的分析和目标语言的生成;第二层次依赖于字词间的语义关联,用于从源语言向目标语言的转换。这种机器翻译系统在基于规则的机器翻译基础上,利用了实例库的优势。

随着大量历史翻译结果的积累,出现了基于实例的机器翻译系统,人们将这些已经完成的翻译结果作为资源库,利用到机器翻译中来。

1.2. 基于实例的机器翻译(Example-Based Machine Translation,EBMT):其基本工作原理是基于类比(Analogy)的原则,从实例库中匹配出与源文字片段最相似的文字片段,取出实例文字片段对应的目标语言翻译结果,进行适当的改造,最终得出完整的翻译结果。基于实例的机器翻译其核心思想最早由MakonNagao 提出,他提出:人们在翻译简单句子时并不作深层语言分析,而是翻译。首先把源句子分解成若干片段,然后将这些片段译为目标语言,每个片段的翻译都是通过与例句做匹配以类比的原则得到的,最后将这些译后句子组合成一个长句子。

1.2.1. 实例库的构成:实例库也称为语料库(Corpus),由已经完成的翻译结果构成。这些现成的翻译结果也称为语料,包括人工翻译的结果和经过人工编辑的机器翻译结果。语料库由双语对构成,包括源语言文字片段和目标语言译文文字片段两部分。这些翻译结果要先经过拆分和对齐处理,才可以成为语料库中的可用语料。因此语料库也称为平行双语语料库(Parallel的 Corpus)。拆分和对齐目前有多种形式,如句子水平的对齐和短语水平的对齐。对齐的文字片段大小的选择,会直接影响匹配的效率和翻译结果。

1.2.2. 语料拆分的碎片化问题:Nirenburg等(1993)指出,在基于实例的机器翻译系统(EBMT) 中,实例语料存在一个文字片段长度和相似度之间的一个矛盾。文字片段越长,越不易得到一个相似度高的匹配;文字片段越短,越可能得到一个大致匹配,但是得到低质量翻译结果的风险也越大。比如由段落划分边界产生的重叠问题以及不恰当的划分导致的翻译质量下降。直观上似乎是选择以句子为单位划分得到的语料对比较好,有诸多优势如:句子的边界划分清楚,一些简单句子的结构清晰。然而在实际应用中,以句子为单位并不是最恰当的方式。实践证明匹配和重组过程需要使用更加短小的片段。(当然,这些研究结果是以欧美语系语言之间的翻译研究结果为基础的。)

1.2.3. 实例库定制:实例语料的的范围和质量影响着基于实例的机器翻译系统(EBMT)的翻译质量水平。在某特定领域获取高质量语料可以大大提高机器翻译在此领域的翻译质量,称为语料(实例)库的定制。

1.3. 统计型机器翻译系统(Statistical MT):IBM公司的Brown在1990年首先将统计模型用于法-英机器翻译。其基本思想是:把机器翻译问题看成是一个噪声信道问题,然后用信道模型来进行解码。翻译过程被看作是一个解码的过程,进而变成寻求最优翻译结果的过程。基于这种思想的机器翻译重点是定义最合适的语言概率模型和翻译概率模型,然后对语言模型和翻译模型的概率参数进行估计。语言模型的参数估计需要大量的单语语料,翻译模型的参数估计需要大量平行双语语料。统计机器翻译的质量很大程度上取决于语言模型和翻译模型的性能,此外,要找到最优的译文,还需要有好的搜索算法。简单说,统计机器翻译首先建立统计模型,然后使用实例库中的实例对统计模型进行训练,得到需要的语言模型和翻译模型用于翻译。

统计型机器翻译,除了基于噪声信道理论的系统以外,还有基于最大熵方法的系统。博格(A.L.Berger)在1996年 提出自然语言处理中“最大熵方法”(Maximum Entropy Approach)。德国人奥赫 (Franz Joseph Och)等发现, 把IBM公司的统计机器翻译基本方程式中的翻译模型转变为反向翻译模型,总体的翻译正确率并没有降低,由此,他们提出基于最大熵方法的机器翻译模型。

统计型机器翻译取得了一定的成绩,然而纯统计设计却不能解决所有困难。统计型的方法不考虑语言的语义、语法因素,单纯用数学的方法来处理语言问题,有着巨大的局限性。于是人们开始探索基于统计方法和其它翻译方法的联合应用。如统计的和基于实例的机器翻译系统,统计的和基于规则的机器翻译系统,等等。

2. 综合类型的机器翻译系统:

以上三个基本机器翻译系统各有优势和长处,同时又不可避免的具有某种缺陷和局限性。如基于规则的机器翻译系统(RBMT)可以准确的描述语言学特征和规律,然而制定适用和完备的语言规则却不是一件容易的事;基于实例的机器翻译系统(EBMT)可以充分利用已有的翻译结果,但是实例库的维护需要大量的人工和费用;统计型的机器翻译(Statistical以MT)可以缓解知识获取的瓶颈问题,但是纯数学的方法难于完全解决语言中的复杂问题。为进一步提高机器翻译系统的翻译水平,人们综合以上几个基本类型的优势,又发明了混合型机器翻译系统(Hybrid器MT),多引擎机器翻译系统(Multi-Engine MT)和提出了基于知识的机器翻译系统(Knowledge-Based MT)的理论。

2.1 混合型机器翻译系统(Hybrid MT):翻译过程使用两种或以上机器翻译原理。比如:基于规则的机器翻译方法的核心是构造完备的、适应性较强的规则系统。如何得到完备和适应性强的规则系统成为研究焦点。使用传统的方法,语法规则库的建立需要大量的人力、物力,大量的语言语法规则之间往往存在着不可避免的冲突,规则的完备性和适应性不能得到保证。随着人们翻译工作的进行,生成大量已完成的翻译结果,形成大量语料。人们想到了使用统计方法从现有语料中自动提取我们需要的语言语法信息。从实例中抽取语言转换规则,将基于实例的机器翻译作为研究技术来建立语言规则基础,而不是单纯用来进行类比翻译。通过一个归纳的过程,从大量例句中提出抽象的规则 。这样传统的基于规则的机器翻译方法发展成为以规则为基础,语料库为辅助的机器翻译方法。这种翻译模型可以称之为混合型机器翻译系统(Hybrid MT)。

2.2 多引擎机器翻译系统(Multi-Engine MT):这种机器翻译系统的基本思想是几架机器翻译引擎同时进行并行翻译,并行翻译的这几架翻译引擎分别基于不同的工作原理,给出多个翻译结果,然后通过某种机制或算法筛选并生成最优翻译结果进行输出。多引擎机器翻译系统的一种工作方式如:接收到源文字后,先将文字转化为若干文字片段,由多个机器翻译引擎进行并行翻译,型各个文字片段均得到多个翻译结果, 通过某种机制选择最优的翻译片段组成最优组合,最后输出最优的翻译结果。或者是接收到源文字后,由多个机器翻译引擎进行并行翻译,得到多个翻译结果,然后对各个翻译结果进行字词的比较,通过某种假设检验和算法,选择适当的字词翻译组成最优翻译结果输出。

2.3. 基于知识的机器翻译系统(Knowledge-Based MT):在机器翻译研究中,人们越来越发现在翻译过程中正确的理解、领会源语言的重要性。语言有着其复杂性。其中语言的模糊性是各种机器翻译系统所面对的最顽固的难题。语言的模糊性指语言文字同一表层结构对应着两种或两种以上的深层结构,简单说就是一种形式对应着两种或两种以上的解释,必须通过上下文内容的提示和综合知识背景、常识才可能做出正确的诠释。受人工智能,知识工程的发展影响,人们开始强调对源语言更为彻底的理解,提出不仅需要进行深层语言分析,还需要进行世界知识的积累和处理,建立知识库,以助于理解语言。通过对世界知识的了解,解决机器翻译中遇到的语言模糊问题。为了从根本上彻底的解决机器翻译所面对的语言的模糊性问题,人们提出了基于知识的机器翻译系统。

2.3.1 基于语义网的机器翻译(Semantic Web based Machine Translation, SWMT):是基于知识的机器翻译系统的一种实现方式。语义网(Semantic Web),指通过某种技术,将现有网络上的知识内容转化为机器可以辨识的内容,成为机器翻译的“世界知识库”。这些理论基于Tim Berners-Lee提出的观点“知识一旦经定义和形式化后,便可以通过任意方式访问”。万维网最初的设计是希望它简单,去中心化并且尽可能的易于互动。网络的发展证明它是一个巨大的成功。然而,网络上面的信息都是面向人类大脑的。为了让计算机也能够接受和利用这些信息资源,在新的世纪一种扩展和补充性质的技术出现了,分称为W3C,Semantic Web3 (三维语义网)。三维语义网络的基础技术是数据格式的“资源描述构架”( ‘Resource Description Framework’,RDF), 它定义了一种结构,用一种自然的方式来描述计算机处理的巨大量的数据[8]。目前人们已经 在尝试将现有的机器翻译系统整合入语义网,以充分利用世界知识/专家知识, 提高机器翻译质量。

3.语音翻译(Speech Translation):语音翻译是与文字翻译相对应的一种机器翻译分类,与前面的分类有着不同。但是有着广泛的应用,如日常交谈、电话通话、会议讲话等对语音交流内容的自动翻译,在实际应用中非常重要。语音翻译在翻译之前增加了一个语言识别(SpeechB Recognition)过程,形成正确的文字内容输入,并且在翻译过程完成后增加了一个语音合成(Speech Synthesis)过程,

形成一个正确的语音内容输出。其中语音识别技术和语音合成技术都有着专门研究,这里不再赘述。

作者姓名:洪洁

工作单位:传神语联网网络科技股份有限公司 多语工程中心

作者姓名:洪雷

工作单位:中国科学院大学 外语系

什么是语义网?

文/Thomas Claburn

一些公司联手致力于语义网开发环境和数据库的研发。

有人把语义网(Semantic Web)称为Web3.0,现在它就要粉墨登场了。编程工具开发商TopQuadrant公司和Franz公司日前表示,他们将把前者的TopBraid Composer和Franz的AllegroGraph 64位RDF存储数据库结合起来,形成一个语义网开发环境和数据库,提高计算机的“智力”。

语义技术可增强计算机对数据的理解,在整合大型数据集时用处特别显著。它对于搜索应用的用处也很大,因为语义技术让计算机推断出未有明确定义的数据元素之间的关系。一个关键词搜索通常仅仅返回包含查询关键字的文档,而语义搜索则能返回与搜索词汇的含义有关的结果(例如:Tank一词,有坦克、水容器等两种含义,语义技术能予以辨别),或者是与搜索词汇的同义字有关的结果(例如:Tank意为坦克时,同义字有Armored Vehicle,装甲车)。

目前,还没有出现真正意义上的语义网,这在很大程度上是因为现有工具还无法承担这样的任务。TopQuadrant的联合创始人和执行合伙人拉尔夫·霍奇森(Ralph Hodgson)说:“我们必须要创建出合适的工具,来支持语义网的实现。”他说,包括Protege和Swoop等在内的公共领域许可软件都还无法商用。

使用标准数据库和开发环境的语义程序似乎不能很好地拓展。“你可以用自己的方式进行编程,”霍奇森说,“就是费点劲。”

语义网有许多的标准、协议以及包括RDF、OWL(Web Ontology Language,Web本体语言)、Sparql等在内的多种语言,此外还有可让开发者在语义框架下组织数据的XML相关技术。上述两家公司的产品组合,提供了一个基于Eclipse的图形开发环境和一个能与大量RDF数据同比扩大的数据库。

葛兰素史克公司(GlaxoSmithKline,下称GSK)正在对AllegroGraph进行测试,以提供一个更为灵活的IT基础设施并通过自动化提高生产力。这家制药公司正在利用一个语义数据提取层进行试验。这项生物实验室工作有很多制药公司参与其中,因而产生了许多数据,GSK的一位主管罗宾·麦克伊泰(Robin McEntire)说:“因此我们希望把它聚合起来,并在更高的一个层级上把它呈现出来,语义技术大有用处。”

该公司的目标是应用基于计算机的推理,从而对大量实验数据进行评估和过滤。“低层级的推理是很好的开端,我们的科学家从事的任务并非‘高科技’,但是特别耗时的任务就可以利用这项技术实现自动化。”麦克伊泰说。

伊士曼-柯达公司(Eastman Kodak,下称柯达)也在使用AllegroGraph软件,它从可视化数据中进行含义推断,从而来帮助客户更好地维护他们日渐庞大、难以管理的数字影像。

“语义理解技术将帮助消费者更好地管理自己的的图片,”柯达主席兼首席执行官(CEO)彭安东(Antonio Perez)去年在一场演讲中表示,“照片之间也能相互‘认识’了—不用人们指点,利用元数据(Metadata),一张照片便可寻找到具有相关元数据的另一张照片,因此,所有的照片便能以新的类别进行重新组合,无非取决于它们之间不同的关联方式而已。”

物联网这个概念是什么意思,谁提出来的,具体什么含义,和语义网有什么区别吗

物联网通俗来讲就是物物相连的网络,根本上还是以互联网为基础,只是在它的基础上做了一些延伸和扩展,延伸到了任何物体和物体之间,进行信息交换和通信。它其实很早就提出来了,只是一直到08年以后,为了促进科技发展,寻找经济新的增长点,各国政府开始重视下一代技术规划,所以将目光放在了物联网上。现在很多企业都把目光放在物联网市场上,会是一个很有前景的方向。我现在在无锡国家软件园实习,这里就是江苏物联网中心,连吃饭的餐厅都是物联网餐厅,挺不错的,相信这里面的企业在政府的扶持下会很有发展劲头。

语义网络ako是什么意思

AKO是用简单语言定义的首字母缩写词或缩写词。除了VK,Instagram,Whatsapp和Snapchat等社交网络软件之外,AKO在消息传递和聊天论坛中的用法。从上表中,您可以查看AKO的所有含义:一些是教育术语,其他是医学术语,甚至是计算机术语。

关于语义网是什么意思和语义 意思的介绍到此就结束了,记得收藏关注本站。

上一篇:百年人寿电话(哈尔滨百年人寿电话)
下一篇:教育金是什么(可以分为终身型和非终身型子女教育金保险)

为您推荐

发表评论