|
|
|
 |
 |
机器翻译需要质的飞跃
您目前的位置:首页>>翻译纵横>>
翻译技巧
|
[中国商务翻译网]发布,第1320次点击 |
|
|
80%以上的互联网站建立在主要讲英语的国家,95%以上的网络信息以英语表达。对于英语水平有限的用户来说,语言障碍已经成为影响网络信息实际利用程度的重要因素。
机器翻译原理
由于相同文字在不同环境情况下表达的意义不同、表达相同意义可以采取不同文字等因素,而且不同语言之间历史文化、风俗等因素存在固有差异,机器翻译实现十分困难。
1. 机器翻译主要实现原理
到目前为止,从实现的原理讲,机器翻译技术主要有三种,如表所示。
而实用翻译系统几乎都是基于分析的方法实现的,但最新系统都不同程度综合使用了另外两种方法。
2. 基于分析技术的翻译系统
人们逐渐认识到,高质量的翻译系统不但需要对原文的内在组成、语法结构进行把握,而且需要了解各组成单位之间复杂的相互作用关系,即语法、语义和语用等知识。此外,上下文环境、相关的常识都是正确翻译的必需知识。因此,随着研究的深入和相关技术的发展,翻译系统也逐渐从词法型、语法型发展到语义型。
国内机器翻译应用现状
机器翻译研究开发需要巨大的投入和长时间的技术积累,往往令投资方却步。而机器翻译巨大的市场前景又使得众多商家跟进,造成技术、资金和人力的严重分散和低水平重复。目前,在与汉语相关的机器翻译研发单位中,中科院华建集团技术积累雄厚,其翻译技术应用产品已经创造了数十亿元人民币的产值,能同时提供高端机器翻译产品、低端普及型产品和应用于多种软硬件平台的全面翻译解决方案。
目前在国内市场上,机器翻译系统主要有两种:高性能机器翻译系统和面向普通用户的普及型翻译系统。前者因为系统面向大型用户,不为个人用户知晓。而普及型翻译系统因为直接面向个人用户,为广大用户所熟悉。
1. 高性能翻译处理系统
高性能翻译系统对翻译质量、翻译速度、并发处理能力具有很高要求,目前产品主要在网络平台上应用,提供全面的网络信息翻译处理能力。该类系统将翻译技术与网络技术结合起来,不仅因为高性能服务器在处理速度和存储容量方面的优势,便于对不同领域的语言知识充分表达和深入处理,提高了翻译处理的质量,而且因为直接将翻译功能与网络服务结合,提供的翻译处理更为全面和实用。此外,网站升级换代较客户端软件要简便,便于收集广大用户对翻译系统改善的意见,集中许多人的力量,因此有利于系统快速发展和完善。
目前,华建已开始将其高性能翻译技术应用于低端产品,在国内开始推出一系列普及型翻译产品。考虑到低端产品受销售价格和软件容量的限制,翻译知识难以尽善尽美,影响翻译系统性能,于是又推出了最新的基于“.net”理念的网站和客户端结合的“高端性能、低端价格”的新软件——金桥译港世界通(v1.0)。
2. 普及型翻译处理系统
机器翻译技术产品可以以多种软硬件形式存在,但目前还是主要以软件形式存在。普及型翻译软件主要存在词典软件、翻译软件和辅助翻译平台等种类。就市场知名度来讲,金山的词典、实达的翻译软件在国内具有较大影响。华建集团以前一直致力于海外软件市场和大型专用系统市场,目前,华建系列软件和翻译网站也已开始走向国内市场。
(1) 词典类系统
词典类系统主要以词典软件为代表,不少系统还与中文平台处理技术相结合,以“即指即译”、“选单汉化”等形式存在。虽然目前词典软件在专业分类、关联模糊查找等方面为用户提供了极为实用的功能,但是从纯粹技术的角度来讲,其主要的难度在于建立词典的巨大工程量和数据库快速查找技术。原文和译文的对应关系十分固定,也不需要从多种候选答案中选择,因此从翻译本身的特点来讲,不应算为真正意义上的翻译系统。
词典类系统主要以金山词霸系列软件为主要代表,该软件在词汇量、附属功能等方面具有优势,其最新的2001“.net”在词汇量等方面又有进展。华建的词海在通用词汇量、软件界面友好性、专业词汇的提供、生僻词的收集等方面也表现良好。
虽然词典从严格意义上讲不能算作翻译软件,但至少在现阶段,词典的市场拥有量及其在实际工作中发挥的作用较其他类别的翻译软件要大得多。
(2) 全句自动翻译软件
国内翻译软件功能参差不齐,有的软件翻译质量过差,以至于损害了机器翻译软件在用户中的声誉。目前国内的翻译软件主要以“东方快车”和“金山快译”系列软件为市场熟悉。因为机器翻译核心技术研究开发力量的限制,翻译软件版本之间的翻译质量提升缓慢。北京金桥译港公司最近推出的“世界通”翻译软件值得注意,该软件是国内第一款“.net”中英文双向全文翻译软件,它采用了华建机器翻译技术,而且通过与网站的结合,为网络用户提供更加全面的翻译解决方案。该软件质量能随网站翻译内核提升而自动提高,对于用户来讲可以说是一劳永逸,而且购买了该软件就能享受网络全面翻译服务,这实质已经发展成为了一种服务销售。此外,ibm也在国内推出了自己的词典和全文翻译软件。
(3) 辅助翻译工具和平台 因为机器翻译技术无法达到人工翻译的效果,因此出现了“人助机译”和“机助人译”等辅助翻译软件,较具有代表性的有德国的trados系统、华建的“专业人员协同翻译平台”和实达公司的“雅信译霸”等系统。这些系统的主要思想是充分发挥人和计算机各自的优势。计算机查找词汇快捷,语言知识存储容量大,对以往知识“回忆”速度快。而以往的经验对于当前的翻译很有帮助,因此人可以在以前相同或相似原文的高质量译文的基础上进行简单处理就可以得到好的结果。其中,trados系统在语种数量方面具有明显优势,而华建的协同翻译系统对于专人翻译人员协同任务分配和管理的处理十分恰当。在这些系统中,基本都是单机版本或者适用于局域网环境。而华建还推出了与其网络翻译平台配套的管理人员交互翻译系统,为希望通过互联网络提供翻译(机助人译)规模服务提供了支持。
机器翻译发展趋势
从一般意义上说,当前的机器翻译系统还不能满足人们的实际需要,机器翻译技术和系统质量需要质的提升。机器翻译系统在近期内的主要发展将集中在以下几个方面:
1. 机器翻译系统专业化
在系统对场景的自动判断能力和处理能力有限的情况下,将翻译系统的应用领域细化,简化翻译系统的复杂度,将大大提高系统的处理性能。
2. 翻译性能自适应性
具有高度智能化的自适应是十分困难的,但提供人工干预和调整的接口和工具,具有环境适应性的翻译系统也将是实用翻译系统的发展方向之一。
3. 多平台及其统一性
机器翻译技术需要较大的时间和空间的需求,而当前的信息终端又偏向于微型化和智能化。因此,机器翻译技术必将以一种集中处理、分散服务的模式在实际生活中发挥重要作用。
4. 与语音、图像处理等技术集成
作为实用信息处理系统的一部分,机器翻译技术需要与改变人机交互手段的其他技术充分融合,如语音识别、图像识别、ocr和手写识别技术等前端处理技术,语音合成、图像合成以及其他后端处理技术。
类别 描述 特点
基于分析的自动翻译 模拟人脑的翻译处理过程,即先对原文进行分析、理解,弄清原文表达的意思,生成译文字串。 原文表达的意义与分析的深度有关,虽然分析越深,对原文表达内容的把握也就越丰富,生成的质量就越高,但随着分析深度的增强,难度增强,分析结果的可靠度下降。因此实际系统总是一个折中的处理方式。
基于语料统计的自动翻译 将不同语言的字词都看作符号,根据已经存在的大规模原译文语料库,计算出不同符号字符串之间存在翻译对应关系的可能性。在翻译处理时,将最大可能对应的字符串作为原文字串的翻译结果。 该方法在一定程度上避免了知识库构建的庞大工作量,建立的数学模型可以通过细化翻译单位的颗粒度和丰富环境参数提高翻译质量,但是语料库的合理建设和计算模型的精确建立也是十分困难的。该方法一般只是作为翻译的辅助手段而存在。
基于例子的自动翻译 在不断积累的正确翻译知识的基础上。对于新的翻译任务,首先在建立的翻译例子库中寻找。若以前翻译过,直接得到高质量的翻译结果。对于某些系统而言,还可以在准确查找失败后找一个最相近的语句的译文作为构造基础,对差异进行改动,从而得到译文。 如果语言是一个可以列举的有限集合,这类方法的效果是显然的,但因为语言生成的无限性,该类方法对于通用机器翻译系统的作用是有限的。此外,这一方法也无法解决相同原文对应不同译文的难题,通常作为辅助手段存在。
|
|
|
| 注:本文摘自网络,旨在帮助网友共同提供外语水平,版权属于原作者! |
【我要评论】 【推荐给好友】 【打印本文】 【关闭窗口】
|
|
|
 |
|