任 溪:计算 语言学 的 发展 有赖 语言 现代化
计算 语言学(computational linguistics)是 采用 计算机 技术 来 研究 和 处理 自然 语言 的 一门 新兴 的 学科,是 计算机 科学 和 语言学、心理学、哲学 等 多种 学科 结合 的 一门 交叉 学科。
计算 语言学 的 出现 使 语言学 不仅 成为 一门 基础性 的 人文 学科,而且 成为 对 信息 社会 的 发展 具有 带动性 的 前沿 学科。计算 语言学 的 研究 目标 是 让 计算机 能够 对 人类 语言 进行 编辑、校对、分类、检索、摘要、翻译 等 技术 处理。这些 都 立足于 计算机 对 人类 语言 的 理解。因此,计算 语言学 研究 的 最终 目标 就是 让 计算机 能够 理解 人类 的 语言。为了 实现 这 一点,我们 需要 语言 现代化。
计算机 对 自然 语言 的 理解 主要 是 依靠 人们 事先 为 它 制定 的 工作 程序 来 进行,程序 的 基础 是 语言 的 规范 系统。例如 针对 汉语 的 信息 处理,首先 要求 人们 必须 比较 准确 地 掌握 普通话,计算机 才能 把 口述 语言 转化 为 相应 的 文本 或 其他 文字 符号,或者 按照 口述 的 命令 进行 准确 的 运行。其次,要求 计算机 有 很强 的 理解 字、音节、词 的 功能,在 这些 单位 的 复杂 关系 面前 能够 做出 准确 的 反应。
在 听 李 宇明 司长 讲座 的 时候,有 一句 话 让 我 印象 深刻。他 说 搞 计算 语言学 的 同志 说,如果 能 把 现代 汉语 中 的 顿号 去掉,只 保留 逗号,那么 对 计算 语言学 来说 将 是 一个 重大 的 进步,会 省去 很多 麻烦。
目前 的 现代 汉语 规范 系统,在 一些 方面 仍然 存在 许多 不 整齐 的 倾向。例如 各种 音变,包括 上声 的 变调,“一”、“不”的 变调,儿化 的 音变,各种 重叠 形容词 的 变调 等等。这些 规范,作为 模式 程序 输入 计算机,如果 人们 能够 准确 地 读 出来,计算机 也许 能够 反应 出来。关键 是 像 这样 的 规范,在 语言 实践 中,只有 很少 一部分 人 可以 做到。这 直接 导致 了 人 与 计算机 的 对话 仍 无法 良好 实现。
另外 汉语 中 的 多音字 数量 极多,读音 比较 复杂,计算机 都 难以 反映 出来。尽管 人们 能够 通过 一定 的 语境、语义 来 认知 和 运用,但是 计算机 就 不行 了。它 没有 思维,无法 建立 现实 世界 和 语言 的 联系。它 无法 知道 某个 名词 所 涉及 的 具体 事物 到底 应该 用“支”、“只”、“枝”中 的 哪 一个。
参考 文献
[1]杜 鹃,张 卓.人机 对话 的 前提:语言 文字 彻底 简易化——发展 汉语 计算 语言学 的 一种 思考[J].郑州 航空 工业 管理 学院 学报,2010(2).
[2]雒 自清,张 雪荣.计算 语言学—— 一门 新兴 的 交叉 学科[J]科学学 研究,2003(21)。
[3]彭 泽润.词 和 词式 书写 研究[M].长沙:湖南 人民 出版社,2007.
(郭 巧玲、王 婧 点评:作者 能够 结合 自己 的 学习 体会,紧跟 时代 的 步伐,思考 语言 现代化 与 计算 语言学 的 紧密 联系。彭 泽润 点评:语言 可以 规范,但是 不能 改革,所以 有些 主张 是 削足适履 的 主张。当然 文字 和 书面语 可以 适当 改革。这 应该 区分 对待。)