了解自然语言处理的基础知识以及如何在Python中应用机器学习解决NLP问题。以学习自然语言处理的基础知识,然后逐步发展并使用机器学习解决复杂的NLP问题。本课程中讲授的所有内容都是完全动手的。
MP4 | 视频:h264,1280×720 | 音频:AAC,44.1 KHz,2声道
类型:在线学习| 语言:英文+ .srt | 时长:56堂课(5小时18分钟)| 大小:1.56 GB,
你会学到什么
自然语言处理的基础知识 标记
化,词干和 词法化
命名实体识别以及语音标记
计数向量化和TF-IDF向量化的一部分
使用N-gram改进性能
如何使用NLTK,SpaCy和Scikit-学习解决NLP问题
数据清理和文本预处理
Python中使用机器学习进行处理情感分析
文本使用Python中使用机器学习的文本分类
与Twitter API集成
要求
不。只有一些编程语言的编码经验,
您不需要任何有关NLP或Python的先验知识
描述
您不需要自然语言处理,机器学习甚至Python方面的经验。但是您应该熟悉编程,并且应该至少熟悉一种编程语言。到目前为止,Python是解决机器学习问题的最佳编程语言之一,它也适用于此。如果您不熟悉Python,请放心,在使用它之前,我将解释您需要了解的内容。
在本课程中,我们使用Google Colab运行代码。因此,您不必在计算机中安装或配置任何东西。只要您可以访问Internet,什么操作系统或硬件规格都没有关系。但是,如果您有兴趣,可以在安装在计算机中的Jupyter Notebook上运行相同的代码。
首先,我们将探讨自然语言处理的基本概念,例如使用NLTK的标记化,词干和词形化。您将学到不止一种方法来完成这些事情,因此您可以了解不同方法的利弊。然后,我们将研究一些用于去除停用词,空格,标点符号,符号,换行符等的预处理技术。
接下来,我们将转到SpaCy-行业中广泛使用的最先进的NLP库。我们将探索NLP管道,以及更高级的概念,例如命名实体识别和语法相关性。这些技术使您的代码可以通过分析文本信息来自动理解金钱,时间,公司,产品,位置等概念。
在这里,我们还将介绍词性标记,您的代码将能够自动将文本中的单词分配给其适当的词性,例如名词,动词,副词和形容词,这是构建智能语言系统的重要组成部分。
之后,您将学习如何将文本转换为计算机可以理解的格式。此过程称为矢量化。有多种方法可以做到这一点,您将学习两种最常见的机制。计数向量化和TF-IDF向量化。
接下来,我们将转到“文本分类”,在这里我们将开始使用机器学习进行自然语言处理。我们将建立一个功能全面的模型来对IMDb电影评论进行分类。在那里,您将学习如何执行数据清理,预处理,功能工程,模型训练和测试。我们将尝试使用scikit-learn库中的几种不同的机器学习算法,例如Logistic回归,朴素贝叶斯和线性SVC,并且我们将探索如何在每种情况下提高性能。您将能够使用本节中的知识来解决现实世界中的NLP问题,例如审阅分类或垃圾邮件检测。
然后,我们将转向自然语言处理中最苛刻的领域之一,即情感分析。首先,我们将探讨如何使用一些内置的情绪分析工具,例如TextBlob和VADER。然后,我们将开始使用Logistic回归和朴素贝叶斯来构建自己的情感分析器。在那里,我们将完成从头开始构建情绪分析器所需的所有步骤,包括预处理,功能工程,培训和测试。
最后,我们将通过学习如何集成Twitter的API来提取Twitter数据来完成本课程。就文本数据而言,Twitter是迄今为止最强大的社交媒体。一些投资者,银行和对冲基金已经在使用Twitter数据来了解市场情绪。因此,为什么不学习如何使用这种宝贵的资源作为NLP问题的数据源。
自然语言处理正在成为技术行业中最苛刻的技能之一,本课程将帮助您开始NLP之旅。
本课程适合谁:
致力于学习NLP
领域的机器学习和数据科学机器学习工程师的开发
人员有兴趣学习NLP的学生
对解决NLP问题感兴趣的任何人
资源均来自第三方,谨慎下载,前往第三方网站下载