有时候当我被一个问题问到两次的时候,我就觉得我应该把对这个问题的回答整理成一篇文章。基于这个原因和为了节约我未来的时间,今天我就对“如何入门NLP”这个话题,写成了一篇文章。
在你阅读下面的资料之前,我想说明一下。这个资料可能只是一个非常通用的入门材料(也可能不是很完整)。为了避免阅读大量的材料,我对每个资料都做了一个简单的描述和难度评估。编程语言,我推荐使用 Python 。
Dan Jurafsky & Chris Manning: Natural Language Processing [一个很好的视频课程]
Stanford CS224d: Deep Learning for Natural Language Processing [该课程包含很多优秀的机器学习算法,深度学习和神经网络架构在NLP中的应用]
Coursera: Introduction to Natural Language Processing [NLP的入门课程 the University of Michigan]
spaCy (官网, 博客) [Python; 新兴的开源库和非常完美的使用例子,API文档齐全,demo 例子]
Natural Language Toolkit (NLTK) (官网, 书籍) [Python; NLP的入门库,主要用于教学]
Stanford CoreNLP (官网) [Java, 高质量的分析工具]Introduction to Information Retrieval (Chris Manning, Prabhakar Raghavan and Hinrich Schütze) [在排序和搜索上面非常经典的书籍]
Neural Network Methods in Natural Language Processing (Yoav Goldberg) [深度学习在NLP中的应用, primer here]
How to build a word2vec model in TensorFlow [教程]
Deep Learning for NLP resources [按照话题组织了一些高水平的深度学习资源]
Last Words: Computational Linguistics and Deep Learning — A look at the importance of Natural Language Processing. (Chris Manning) [文章]
Natural Language Understanding with Distributed Representation(Kyunghyun Cho) [关于NLU的ML/NN方法的独立讲解]Bayesian Inference with Tears (Kevin Knight) [教程]
Association for Computational Linguistics (ACL) [期刊]
Quora: How do I learn Natural Language Processing?
Nicolas Iderhoff 已经创建了一个公开的NLP数据集列表。除了这些,我还整理了一些小项目给任何想入门的小伙伴:
Implement a part-of-speech (POS) tagger based on a hidden Markov model (HMM)Implement the CYK algorithm for parsing context-free grammarsImplement semantic similarity between two given words in a collection of text, e.g. pointwise mutual information (PMI) Implement a Naive Bayes classifier to filter spamImplement a spell checker based on edit distances between wordsImplement a Markov chain text generatorImplement a topic model using latent Dirichlet allocation (LDA)Use word2vec to generate word embeddings from a large text corpus, e.g. Wikipedia来源:Medium
如果觉得内容有用,帮助多多分享哦 :)
长按或者扫描如下二维码,关注 “CoderPai” 微信号(coderpai)。添加底部的 coderpai 小助手,小助手会拉你进AI实战群。
如果你想加入基础算法讨论群,请加QQ群:294609183