课程描述
本课程是研究生自然语言处理的入门课程,主要涉及从计算机的观点研究人类語言。
课程内容涵盖语法、语义和篇章层次的处理。重点是基于语料库的方法和算法,例如隐马尔可夫模型(Hidden Markov Model)和概率上下文无关文法。我们將在多种应用中讨论这些方法和模型的使用,包括句法分析,信息抽取,统计机器翻译和自动摘要等。
本学科是一门人工智能及应用的综合学科。
阅读材料
可在阅读材料部分找到可用的与课程相关的阅读材料 。
成绩评定成绩表
項目 百分比
期中考试 35%
两次家庭作业 (各占15%) 30%
学期专题 35%
专题(独立完成或合作完成)是涉及本课程的其中一个论题或其它与语言处理相关的某个论题,可由每个听课的同学和教授磋商确定。专题涉h:
学术诚信
抄袭或变相抄袭別人的作品(包括源码),或者允许別人抄袭或变相抄袭自己的作品,哪怕是部分抄袭也是不允许的。如有违反,整个作业自动以0分计算。
Course Description
This course is a graduate level introduction to natural language processing, the primary concern of which is the study of human language from a computational perspective.
The class will cover models at the level of syntactic, semantic and discourse processing. The emphasis will be on corpus-based methods and algorithms, such as Hidden Markov Models and probabilistic context free grammars. We will discuss the use of these methods and models in a variety of applications including syntactic parsing, information extraction, statistical machine translation, and summarization.
This subject qualifies as an Artificial Intelligence and Applications concentration subject.
Readings
Course readings are available in the readings section.
AssessmentGrading Table
activities percentages
Midterm 35%
Two Homeworks (15% each) 30%