什么是自然语言理解_自然语言理解与机器翻译实现

来源:读书笔记 发布时间:2019-10-08 06:40:01 点击:
第 2 5卷 第 2期 2 0 0 6年 3月 许 昌学院学报 J OURNAl OF XUCHANG UNI VERS I TY Vo 1 .2 5.No.2 Ma r . 2 o 0 6 文章 编 号 :
1 6 7 1 —9 8 2 4 ( 2 0 0 6 ) 0 2 —0 1 1 4 —0 4 自然语言理解与机器翻译实现 李振 亭 ,任靖娟 ( 河南师范大学 物理与信息工程学院, 河南 新 乡 4 5 3 0 0 2 ) 摘 要:
计算机技术对人类社会的全方位渗透引起 了语言的重构, 不断创造出不同于传统 自 然语言的计算机语言, 这种语言从简单的应用到各种复杂的对话 , 并逐步发展到能象自然语言一 样表达和传递 . 但基 于语料库技术的应用潜力有限, 机器翻译的人工修 正也十分必要 . 关键 词 :
自然语 言理 解 ;

机 器翻译 ;

人 工智 能 中图分 类号 :
H 3 1 5 . 9 文献 标识 码 :
A 0 引言 自然语言理解研究是实现人与计算机之间用 自然语言进行有效通信的各种理论和方法 . 语言信息处 理 , 也就是机器翻译( 简称 M T ) , 是数字计算机在非数值领域 的最早应用 . 自然语言理解和机器翻译是计算 机科学与人工智能领域 中的一个重要方向⋯ . 随着计算机和人工智能技术的发展 , 自然语言理解不断取得 进展 , 机器翻译是自然语言理解最早的研究领域 . 由于早期研究中理论 和技术的局限 , 所开发 的机译 系统 的技术水平较低 , 不能满足实际应用的要求 . 上世纪 8 0年代之后 , 自然语言理解 的应用研究广泛开展 , 机 器学习研究又十分活跃 , 并出现了许多具有较高水平的实用系统 . 这标志着 自然语言理解在理论上和应用 上取得 了突破性进展 . 谈 到 自然语言理解 N L U ( N a t u r a l L a n g u a g e U n d e r s t a n d i n g )与机器翻译 MT ( M a c h i n e T r a n s l a t i o n ) , 有关专家曾经提出这样的设想 :
利用现代信息技术 , 特别是 自然语言理解 的最新科学技术成 就 , 研制“ 面 向奥运 的多语言智能信息服务网络系统” , 力争在 2 0 0 8年北京奥运会期间为各国运动员 、 记 者 、 观众和来 自全世界数以百万计的旅游者提供综合 、 全面、 多语种 、 可定制的信息服务 , 以实现 申奥报告 提出的“ 任何人 、 在任何时间、 任何场所都能够安全 、 方便 、 快捷高效地获取可支付得起 的、 丰富的 、 无语言 障碍的、 个性化的信息服务” L 2 j 的承诺 . 这个设想非常有启发性和学科导向意义 , 对于从事 自然语言理解和 机器翻译技术 的工作人员提出了具有创造性的挑战和思考 . 1 对 自然语言理解 和机器 翻译 的认识 自然语言是在人类文明发展的漫长过程中 自然形成的 . 所谓 自然形成, 意味着它的形成是基于每个人 所拥有的一种基本权利 :
自由创造语言符号和 自由约定符号语义 . 而 自然语言的“ 标准化” 工作 , 则不得不 以自由创造成果的自然流行为基础和前提 . 令人眼花缭乱的网络语言虽然有点另类, 但却是 自然语言这一 基本特征的有力证明. 俞士汶教授曾撰文指出:
自然语言理解一直是计算机科学中的一个引人人胜的 、 富 有挑战性的课题 . 由于 自然语言十分复杂 , 人是如何理解语言的, 怎样 给“ 理解” 下一个确切的定义是极其 困难的 J . 结构主义理论认为机器的理解机制与人相 同, 问题在于谁也说不清 自己理解语言的步骤 ;

而功 能主义理论认为机器的表现与人相同 , 由图灵测试表明 , 如果通过 自然语言的问答 , 一个人无法识别和他 对话的是人还是机器 , 那么就应该承认机器具有智能 . 从信息处理的角度看 , 语言既然是信息的载体, 如果 计算机实现了机器翻译或 自动文摘或人机会话等语言信息处理功能 , 则认为计算机具备了理解 自然语言 的能力 . 为 了实 现这些 功能 , 计算 机除 了需要 具备 会分 析输 入 给 计算 机 的文 章 或话 语 的能力 之 外 , 还 需 要 具备能生成语句与文章的本领 J . 因此 , 在计算机科学 中, 经常使用“ 自然语言处理” 或“ 语言信息处理” 这 类术语来概括这些研究内容 . 目前理论界公认 自然语言处理是一门交叉学科 , 它涉及到语言学 、 数学 、 逻辑 收稿 日期 :
2 0 0 5 —0 5 —2 3 作者简介 :
李振 亭( 1 9 5 4一) , 男, 河南禹州人 , 副教授, 硕士研 究生导师, 研 究方 向:
现代教育技 术、 计算机辅助 教育及数 字媒体创作 维普资讯 第 2 5卷 第 2期 李振 亭 , 等 :
自然语 言理 解与机 器翻 译 实现 l l 5 学 、 计算机学等等多个学科口 j . 机 器翻 译 MT是利 用计 算 机把 一种 自然语 言转 变成 另 一种 自然语 言的过 程 . 用 以 完成 这一 过 程 的软 件组合叫做机器翻译系统 . 机器翻译的理论基础——计算机语言学有两大 目标 :
技术方面和心理学方面 . 前者借助计算机分析 和处理 自然 语言;

后者则有助 于理解 人类如何处理 自然语 言. 关 于机器 翻译的历 史l 5 j , 可以追述到 1 6 2 9年笛卡儿主张的一种“ 泛语言” ( u n i v e r s a l l a n g u a g e ) ,就是对各种不同语声而有相 同 含义 的词赋 以 同一个 符号 . 这 实 际上就 是语 言转 换 和语言 翻译 最初 的设想 . 到 1 9 3 9年 , 贝尔 试验 室 在纽 约 的世界博览会第一次演示了电子语音合成设备 ;

1 9 5 2年 , Y e h o s h u a B a r — H i l l e l 作为 MI T的全职机器翻译 的 研 究员 , 组织 了第 一次 M T的学术 会 议 ;

此 后长 期 以来 世 界 上许 多 国家都 一 直 在从 事 机 器 翻译 研 究 , 尤 其 是在上1 廿 纪 4 0年代电子计算机的诞生之 13起 , 就开始了将计算机应用于语言翻译的探索 , 但一直没有获 得 成功 . 到 1 9 6 6年 , 美 国 向全 世界 发表 了有 名 的 A L P A C报 告 , 宣 布 了机 器 翻译 在 可 预见 的将 来是 不 可 实 现的 , 由此 , 机器翻译走入低谷 . 上世纪 7 0年代中期一直到整个 8 0年代 , 由于需求 的推动和计算机软 、 硬 件技 术 的飞 速发 展 , 使得 机器 翻译 的研 究开 始在 世界范 围 内复苏 并 日趋走 向繁 荣 . 这 时 的机器 翻译 系统 主 要 采用 两种 方法 :
基 于转 换 的方法 与基 于 中介 语 言的方 法 . 这 两种 系 统都 依赖 于对 语 言 的分 析 , 也 就 是 某 种 程度 的“ 理 解” . 由于这 时 的系统 主要 依赖 于语 言专家 人工 编写语 言 规则 , 所 以这 一 类方 法又 被称 为基 于 “ 规则” 的方法 . 但人们也发现 , 由于机器翻译涉及的知识过于复杂 , 知识库规模庞大 , 规则之间的冲突变得 越来越多, 翻译的正确率在达到一定程度后很难再提高. 1 9 9 6年, 联合国教科文组织委托 日本联合国大学 组织实施重大跨 国世纪性异种语 言 自动处理软件开发工程——通用 网络语 言( U n i v e r s a l N e t w o r k i n g L a n . gua g e , 简称 U N L ) 工程 的 研究开 发工作 , 受 到机器 翻 译界 的瞩 目 , 该项 目的最 终 目的是通 过 中间语 言 , 实 现 联 合 国一 百八 十多个 成员 国之 间的语 言 自动转 换 , 从 而 克服 语 言 障碍 , 达 到各 国语 言 的 网上 互通 , 增 进 各 成员国之间在政治 、 经济 、 科技 、 文化等领域的联系和交流 . 该项 目的提出是在机器翻译界进行 的一次有益 探索 . 我国的机器翻译研究从 1 9 5 6 年开始就得到了国家的高度重视 , 具有多方面不同知识结构人员的协同 攻关的特点 . 这是该项研究 自身的特点所决定的 , 因为它需要至少计算机科学 、 数学 、 语 言学等多方面知 识 . 1 9 5 9年 , 中国的机 器翻译 研究 者成 功地进 行 了 中国首次 机 器 翻译 试验 表 演 , 成 为 世 界上 第 五个 进 行这 种实验的国家 . 1 9 8 0 年 ,心理研究所李家治 , 陈永明建立 了机器理解汉语的 C L U S系统 ;

语言研究所范继 淹 、 徐志敏开发了 R J D一 8 0汉语人机对话系统 ;

1 9 8 3年,马希文设计 了 F I N L通用句法分析 系统 ;

1 9 8 5年 , 董振东、 张德王 A 研制了科译一号 ;

1 9 8 6—1 9 9 3年 , 由中软总公 司、 清华大学 、 北京语言大学 、 中国人民大学等 单位参加的研制了亚洲多国语机器翻译系统 ;

1 9 9 2年 , 计算研究所陈肇雄等开发 了智能英汉机译系统- 6 J . 从 上 世纪 9 0年 代初期 至今 , 中国的机 器翻译 走 入 了快 速发 展的 时期 , 出现 了许 多商 品化 系统 . 近期 的 机译 系统大 体上 有这样 一些 特点 :
多数 配有 大规模 的 多种领 域 的专 业词 典 , 多数 能 在 网 上运 行 , 有 相 当不 错 的 方 便 用户的 界面[ 7 1 . 2 基 于语法分析和基于语 料库的机器 翻译技术 机器翻译是一个极其复杂的系统工程 , 它所涉及的每一个领域的发展都会严重制约机器翻译的进展 . 由于人工智能技术在现阶段还不成熟 , 与人脑机制存在很大的差距 , 计算机实现 自动识别 、 自动推理的功 能还很有限 , 很难在没有固定规律的语言学之中提取出我们想要的信息, 现阶段的电脑没有办法“ 看懂” 人 类的语言 , 而机器翻译取得突破性进展依赖于计算机技术与人工智能的发展 . 实际上 , 机器翻译的复杂性 是由人类 自然语言本身的复杂性所决定 的, 是无法避免的 . 由于影响人类 自然语言的因素太多( 包括韵律 、 词法 、 句法和语义等等) , 而这些因素又互相交错在一起 , 再加上 自然语言处理技术( N L P ) 需要的知识非常 复杂 ;

理 解语 言 的过程是 动态 的而不 是静 态 ;

N L P需 要 的 知识 大 多是 归 纳 的 而不 是 演绎 的 ;

对 于 同 样 的语 言 现象 , 即使 人也 不一定 能够得 出一 致 的理解结 果 , 所 有这 些 因素 决定 了 N L P的非 确 定 性 , 加上 对歧 义 的 限制和系统的覆盖率矛盾 , 以及领域词典不充分等 , 这些都大大制约着机器翻译研究 的进展 . 机器 翻译之 所 以被列 为 “ 二十 世纪 的十大科 技难题 之 一” , 是 因为从 目前机译 系统 的现 状看 , 无论 是基 于规则 的系统 还 是基于经验的系统 , 都无法突破高准确率这一难关 , 有人甚至把这个技术难题称为机器 翻译系统研究 的 “ 哥德 巴赫猜想” [ . 现今的机器翻译实现技术原理主要有两大分支:
基于语法分析和基于语料库 . ①基于语法分析的技术就是对源语言语句的词法 、 语义、 语法和句法进行分析并进行判断和取舍 , 然 后重新进行排列组合 , 最后生成 目标语言 . 这一系列过程均是模仿人脑进行翻译的过程, 尽管计算机具有 维普资讯 1 l 6 许 昌学 院学报 2 0 0 6年 3月 良好 的存储 记忆 和执 行功 能 , 但 它 却缺少 良好

推荐访问:
上一篇:缤纷的快乐小学六年级作文|小学六年级的快乐作文
下一篇:最后一页

Copyright @ 2013 - 2018 韩美范文网- 精品教育范文网 All Rights Reserved

韩美范文网- 精品教育范文网 版权所有 湘ICP备11019447号-73