编辑: 元素吧里的召唤 2019-07-06
妓友迅? 文档下载 免费文档下载 https://www.

51wendang.com/ 本文档下载自文档下载网,内容可能不完整,您可以点击以下网址继续阅读或下载: http://www.51wendang.com/doc/bf1cb3aa3b2722cccf2e6ba5 Computational_Linguistics_01计算语言学概论 北京大学常宝宝《计算语言学概论》课件 计算语言学概论常宝宝北京大学计算语言学研究所 chbb@http://www.51wendang.com [此处图片未下载成功] 课程信息名称:计算语言学授课时间:周四 9-11节(16:50~19:40?)授课地点:一教 104助教陈亮 chenlianglucky@http://www.51wendang.com [此处图片未下载成功] 成绩评定平时成绩(60%)上机作业出勤 期末笔试(40%) [此处图片未下载成功] 主要参考书1.计算语言学概论,俞士汶主编,商务印书馆,2003 2. Speech and Language Processing, Jurafsky, D.&

Martin, J.H., Prentice Hall, 2000(中译本:自然语言处理综论,冯志伟等译,电子工业出版社, 2005) [此处图片未下载成功] 其它参考书

(一)1. 2. 3. 4. 5.Foundations of Statistical Natural Language Processing, Manning,C.D.&

Sch&

#252;

tze,H., The MIT press,

1999 (有中译本) Statistical Language Learning. Charniak, E., The MIT Press. 1996. Natural Language Understanding, Allen, J., The Benjamins/Cummins Publishing Co.,

1994 (有中译本) Natural Language Processing: An Introduction to Computational Linguistics, Gazdar, G.&

Mellish, C., AddisonWesley, 1989. Introduction to Natural Language Processing, Harris, M.D., Reston Publishing Co., 1985://www.51wendang.com/doc/bf1cb3aa3b2722cccf2e6ba5r [此处图片未下载成功] 其它参考书

(二)1. 2. 3. 4. 5. 6. 7. 8.现代汉语语法信息词典详解,俞士汶等,清华大学出版社,2003自然语言理解,姚天顺,清华大学出版社,2002自然语言处理技术基础,王晓捷、常宝宝,北京邮电大学出版社,2002计算语言学,刘颖,清华大学出版社,2002计算语言学基础,冯志伟,商务印书馆,2001计算语言学导论,翁富良、王野翊,中国社会科学出版社,1998自然语言的计算机处理,冯志伟,上海外语教育出版社,1997自然语言处理,刘开瑛、郭炳炎,科学出版社,1991 [此处图片未下载成功] 相关学术期刊和会议1. 2. 3. 4. 5. 6. 1. 2. 3. 4.Computational Linguistics (ACL) Machine Translation International Journal of Corpus Linguistics中文信息学报 (中文信息学会)计算机学报、软件学报汉语语言与计算学报(新加坡) Annual Meeting of the Association for Computational Linguistics (ACL年会) International Conference on Computational Linguistics (COLING)全国计算语言学联合学术会议(JSCL)全国学生计算语言学研讨会(SWCL) [此处图片未下载成功] 什么是计算语言学?计算语言学是通过建立形式化的计算模型来分析、理解和处理自然语言的学科.什么是自然语言?其它术语自然语言处理(Natural Language Processing)自然语言理解(Natural Language Understanding)人类语言技术(Human Language Technology) [此处图片未下载成功] 什么是计算语言学?计算语言学是一门交叉学科.计算语言学研究需要多个学科的知识.语言学 (自然语言是处理对象)计算机科学(计算语言学的研究工具)数学 (自http://www.51wendang.com/doc/bf1cb3aa3b2722cccf2e6ba5然语言的建模工具) [此处图片未下载成功] 为什么要研究计算语言学?语言障碍人-人之间的语言障碍(自动翻译)人-机之间的语言障碍(人-机接口)自然语言输入计算机理解生成 自然语言输出 [此处图片未下载成功] 计算语言学的研究目标终极目标研制能理解并生成人类语言的计算机系统. 当前目标研制出具有一定人类语言能力的计算机文本或语音处理系统. [此处图片未下载成功] 计算语言学的研究内容建立形式化的适于计算机处理的语言模型.研制分析、生成以及处理语言的各种算法. [此处图片未下载成功] 计算语言学研究的挑战性大量的词汇、大量的句子OED收词40万、汉语中有多少词? 无法象处理人工语言那样,写出一个完备的、有限的规则系统来进行定义和描述.自然语言的规则很少没有例外.(photo、potato)自然语言中有大量的歧义现象.自然语言的理解不仅和语言本身的规律有关,还和语言之外的知识(例如常识)有关.因此语言处理涉及的常是海量知识,知识库的建造维护代价很高. [此处图片未下载成功] 计算语言学研究的挑战性什么是歧义?对同一个语言形式有不止一种解读. 歧义是自然语言的固有属性,即使对于人类自身而言,也是如此.(人工语言有歧义吗?)语言单位无论大小都有歧义现象.语言学家常把语言研究区分为不同的层次,例如:音韵学、形态学、句法学、语义学、语用学等,在这些层面歧义都会有所表现. [此处图片未下载成功] 计算语言学研究的挑战性歧义举例: (1)The boy saw the girl with a telescope.Who has the telescope? (2) At last, a computer that understands you like your motherThe computer understands you as well as your mother http://www.51wendang.com/doc/bf1cb3aa3b2722cccf2e6ba5understands you. The computer understands that you like your mother. The computer understands you as well as it understands your mother. [此处图片未下载成功] 常见对策由于歧义等因素的存在,自然语言处理的性能还不能满足一般应用的需要,为了满足某些特殊的应用需求,常采用下面的对策交互式处理受限语言受控语言人机互助进行处理限定处理文本的领域限定语言的词汇和句法,降低复杂度 我们在做计算语言学研究时,时刻都要避免贪大求全,应注意限定自己的研究范围. [此处图片未下载成功] 计算语言学的研究方法1.规则驱动的方法 2.数据驱动的方法 3.二者融合的方法 [此处图片未下载成功] 计算语言学的研究方法规则驱动的方法(符号主义) 1.研究人员(例如语言学家)对语言的规律进行总结,形成规则形式的知识库. 2.研制语言处理算法,利用这些规则对自然语言进行处理. 3.研究人员根据处理结果,调整规则,改进处理效果. [此处图片未下载成功] 计算语言学的研究方法规则方法举例例如:S NP NP VP VP PP NP VP DET N NP PP VP PP V NP P NP [此处图片未下载成功] 计算语言学的研究方法用上述规则分析句子 the boy saw the girl with a telescope [此处图片未下载成功] 计算语言学的研究方法All grammar leak (Sapir 1921)对于自然语言而言,不大可能写出一部完备的规则集,语言规则有很强的伸缩性. 一般而言,很多基于规则的系统不能满足真实语言文本处理的要求,而只能处理真实语言的某个很小的子集.toy system? [此处图片未下载成功] 计算语言学http://www.51wendang.com/doc/bf1cb3aa3b2722cccf2e6ba5的研究方法数据驱动的方法(统计方法) 1.建立可以反映语言使用情况的语料库. 2.研究人员对自然语言进行统计建模. 3.利用统计技术或机器学习技术,基于语料库训练统计语言模型. 4.利用得到的模型设计算法对语言进行处理. 5.根据处理效果改进模型,提高处理性能. [此处图片未下载成功] 计算语言学的研究方法在数据驱动的方法中,语言模型通常体现为一组参数,这些参数通常表示某个语言形式发生的概率值.例如: P (w3|w1w2) P (公鸡|一只)>

下载(注:源文件不在本站服务器,都将跳转到源网站下载)
备用下载
发帖评论
相关话题
发布一个新话题