依存语法与AI:语言学专家刘海涛谈人工智能中的语言学元素
AI导读:
依存语法为AI处理自然语言提供了理论框架,复旦大学刘海涛教授指出,尽管汉语有独特性,但AI技术还难以充分利用其优势。他强调语言学需与时俱进,引入AI元素,以发现语言系统运作的统计规律。
20世纪50年代,现代语言学的重要理论之一——依存语法诞生,其核心思想是通过分析词与词之间的依存关系来揭示句子的结构模式和语义联系。70多年后的今天,依存语法从冷门变成“显学”,为人工智能(AI)处理自然语言提供了清晰的理论框架和实践工具。随着AI技术向“认知智能”发展,依存语法与深度学习的结合成为提升AI语言理解能力的重要方向。
前不久加盟复旦大学的国际知名计量语言学和依存语法研究专家刘海涛,凭借在计量依存语法等领域的研究,连续11年入选爱思唯尔“中国高被引学者”榜单。在“教机器说人话”的人工智能发展历程中,文科能够助力几何?汉语是否是AI研究的优势语言?初夏的一个上午,记者专访了复旦大学刘海涛教授。
刘海涛教授指出,尽管汉语有其独特性,但从语言科学的角度来讲,语言和文字不能混为一谈,字和词也不是一回事。他强调,目前广泛采用的大数据+深度学习的AI技术还难以充分利用汉语的优势。同时,汉语与人类其他语言之间的共性是多于个性的,因为人类语言的普遍性是由人的生物意义的普遍性来决定的。
刘海涛教授还提到了依存语法中的一个重要概念——依存距离。依存距离指句子中两个有句法关系的词之间的线性距离。他在20多年前的研究中发现,“依存距离最小化”可能是人类语言的一种普遍规律,而在这20种语言中,汉语的依存距离最大。这一发现引发了学界对汉语特殊性的进一步探究。
在谈到人工智能与语言学的关系时,刘海涛教授表示,人工智能是一个涉及多种学科的交叉学科,其中语言学是绕不开的重要学科。然而,传统意义的语言学对数基智能的价值和意义很小,因为数据与智能的关系对于传统语言学而言是非常陌生的一个话题。因此,语言学需要与时俱进,引入数据、概率、统计等“AI元素”,以发现语言系统运作的统计规律。
刘海涛教授认为,尽管人工智能的硬件与人类不同,但其产品(语言)已经与绝大多数人大致相当了。他强调,语言数据之所以能涌现语言智能,是因为数基AI系统能从海量文本中习得语言规律,并使用这些规律生成符合人类使用习惯的语言符号序列。同时,他也提到了大语言模型隐式捕捉语言模式的能力,以及将语言模式显式化对于语言学家的重要性。
此外,刘海涛教授还谈到了人工智能兴起后对传统文科的影响。他认为,人文与科学没有本质区别,只是研究的对象不一样。数基人工智能的成功迫使人文学者反思如何更好地理解人类“软件”。他强调,破解人类“软件”的责任在人文学科的研究者身上,而语言学家则需要行动起来,努力使人工智能成为人类的一部分。
(注:本文涉及的人工智能技术、依存语法等概念及观点均基于刘海涛教授的访谈内容整理,不代表本网立场。)
(文章来源:上观新闻)
郑重声明:以上内容与本站立场无关。本站发布此内容的目的在于传播更多信息,本站对其观点、判断保持中立,不保证该内容(包括但不限于文字、数据及图表)全部或者部分内容的准确性、真实性、完整性、有效性、及时性、原创性等。相关内容不对各位读者构成任何投资建议,据此操作,风险自担。股市有风险,投资需谨慎。如对该内容存在异议,或发现违法及不良信息,请发送邮件至yxiu_cn@foxmail.com,我们将安排核实处理。

