标签:机器学习

Coding

Transformers自然语言处理第二章 文本分类

Transformers自然语言处理第二章 文本分类
其它章节内容请见机器学习之PyTorch、Scikit-Learn和Transformers文本分类是自然语言处理中最常见的任务之一,它可用于各种应用,例如将客户反馈标记为不同的类别,或者根据语言分发工单。电子邮件程序的垃圾邮件过滤器很有可能正在使用文本分类来保护收件箱免受大量不需要的垃圾邮件的侵扰!另一种常见的文本分类是情感分析,正如我们在第1章中所看……继续阅读 »

Alan 9个月前 (06-17) 732浏览 0评论0个赞

Coding

Transformers自然语言处理第一章 你好Transformer

Transformers自然语言处理第一章 你好Transformer
其它章节内容请见机器学习之PyTorch、Scikit-Learn和Transformers2017年,Google的研究人员发表了一篇论文,提出了一种新的用于序列建模(sequence modeling)的神经网络架构[1]。称之为Transformer,这种架构在机器翻译任务中的表现无论在翻译质量还是训练成本层面均优于循环神经网络(RNN)。同时,一……继续阅读 »

Alan 9个月前 (06-16) 889浏览 0评论0个赞

Coding

第7章 组合不同的模型进行集成学习

第7章 组合不同的模型进行集成学习
其它章节内容请见机器学习之PyTorch和Scikit-Learn上一章中,我们专注于调优和评估不同的分类模型的最佳实践。本章中,我们将基于这些技术,并探索构建一组分类器的方法,这些方法通常比各个成员具备更好的预测性能。本章我们学习的主要内容有:基于多数投票做出预测使用装袋法重复从训练数据集中随机抽取组合降低过拟合应用提升方法通过弱学习器构建强大的……继续阅读 »

Alan 9个月前 (06-08) 761浏览 0评论0个赞

Python

第6章 学习模型评估和超参数调优的最佳实践

第6章 学习模型评估和超参数调优的最佳实践
其它章节内容请见机器学习之PyTorch和Scikit-Learn在前面的章节中,我们学习了用于分类的基本机器学习算法以及如何在喂给这些算法前处理好数据。下面该学习通过调优算法和评估模型表现来构建良好机器学习模型的最佳实践了。本章中,我们将学习如下内容:评估机器学习模型表现诊断机器学习算法常见问题调优机器学习模型使用不同的性能指标评估预测模型……继续阅读 »

Alan 10个月前 (04-25) 1384浏览 0评论0个赞

Python

第5章 通过降维压缩数据

第5章 通过降维压缩数据
其它章节内容请见机器学习之PyTorch和Scikit-Learn在第4章 构建优秀的训练数据集 – 数据预处理中,我们学习了使用特征选择技术对数据集降维的不同方法。特征选择以外的另一种降维方法是特征提取。本章中我们会学习两种基本技术,可帮助我们通过将其变换为比原来更低维度的特征子空间总结出数据集中的信息内容。数据压缩是机器学习中非常重要的课题,它有助于我……继续阅读 »

Alan 11个月前 (04-17) 2044浏览 0评论0个赞

Python

第4章 构建优秀的训练数据集 – 数据预处理

第4章 构建优秀的训练数据集 – 数据预处理
其它章节内容请见机器学习之PyTorch和Scikit-Learn数据质量及所包含的有用信息量是决定机器学习算法能学到多好的关键因素。因此,在将数据集喂给机器学习算法前对其进行检查和预处理绝对很重要。本章中,我们会讨论一些基本数据预处理技术,有助于我们构建很好的机器学习模型。本章将要讨论的内容有:删除和替换数据集缺失值为机器学习算法准备分类数据为……继续阅读 »

Alan 11个月前 (04-08) 2642浏览 0评论0个赞

Python

第3章 使用Scikit-Learn的机器学习分类器之旅

第3章 使用Scikit-Learn的机器学习分类器之旅
其它章节内容请见机器学习之PyTorch和Scikit-Learn本章中,我们会学习一些学术界和工业界常用的知名强大机器学习算法。在学习各种用于分类的监督学习算法的不同时,我们还会欣赏到它们各自的优势和劣势。另外,我们会开始使用scikit-learn库,它为高效、有生产力地使用这些算法提供了用户友好且一致的接口。本章讲解的主要内容有:介绍用于分类的……继续阅读 »

Alan 11个月前 (04-03) 2323浏览 0评论1个赞

Python

机器学习之PyTorch、Scikit-Learn和Transformers

机器学习之PyTorch、Scikit-Learn和Transformers
一不小心又立了一个新Flag,关于人工智能或者机器学习业界普遍认为要先学个博士才能找到好工作(这里我们不去争论学历与能力的问题),因为其中涉及的知识广度和深度都不是“30天速成”的课程所能覆盖的,甚至很多从业者也只是笑称自己是“调包侠”。笔者双非本科后就工作了,还不是计算机专业,这显得有点自不量力了。确实在学习的过程中发现高数和线性代数知识早都还给老师了。但……继续阅读 »

Alan 11个月前 (04-01) 4221浏览 2评论7个赞

Python

第2章 为分类训练简单机器学习算法

第2章 为分类训练简单机器学习算法
其它章节内容请见机器学习之PyTorch和Scikit-Learn本章中我们会使用所讲到的机器学习中的第一类算法中两种算法来进行分类:感知机(perceptron)和自适应线性神经元(adaptive linear neuron)。我们先使用Python逐步实现感知机,然后对鸢尾花数据集训练来分出不同花的品种。这有助于我们理解用于分类的机器学习算法概念以及……继续阅读 »

Alan 11个月前 (03-31) 2003浏览 0评论0个赞

Python

第1章 赋予计算机学习数据的能力

第1章 赋予计算机学习数据的能力
其它章节内容请见机器学习之PyTorch和Scikit-Learn在作者的心目中,机器学习这一解释推理数据的应用和算法科学,是计算机科学中最令人振奋的领域!我们生活在数据多到泛滥的时代,使用机器学习领域的自学习算法 ,可以将数据转换为知识。借助近些年来开发的众多开源库,我们迎来了进入机器学习领域最好的时代,可以学习利用强大的算法来一窥数据的模式并对未来事件……继续阅读 »

Alan 11个月前 (03-24) 1863浏览 0评论3个赞