其它章节内容请见机器学习之PyTorch、Scikit-Learn和Transformers代码参见GitHub仓库2017年,Google的研究人员发表了一篇论文,提出了一种新的用于序列建模(sequence modeling)的神经网络架构[1]。称之为Transformer,这种架构在机器翻译任务中的表现无论在翻译质量还是训练成本层面均优于循环神经……继续阅读 » Alan 2年前 (2023-06-16) 1791浏览 0评论0个赞
本文来自正在规划的Go语言&云原生自我提升系列,欢迎关注后续文章。使用Go进行开发的最大优势之一是其标准库。与Python类似,Go也采取了“内置电池”的理念,提供了构建应用程序所需的许多工具。由于Go是一种相对较新的语言,它附带了一个专注于现代编程环境中遇到的问题的库。我们无法涵盖所有标准库包,所幸也不需要,因为有许多优秀的信息源可以了解标准库……继续阅读 » Alan 2年前 (2023-06-09) 1382浏览 0评论0个赞
其它章节内容请见机器学习之PyTorch和Scikit-Learn上一章中,我们专注于调优和评估不同的分类模型的最佳实践。本章中,我们将基于这些技术,并探索构建一组分类器的方法,这些方法通常比各个成员具备更好的预测性能。本章我们学习的主要内容有:基于多数投票做出预测使用装袋法重复从训练数据集中随机抽取组合降低过拟合应用提升方法通过弱学习器构建强大的……继续阅读 » Alan 2年前 (2023-06-08) 1364浏览 0评论0个赞
体验过 OpenAI的ChatGPT的朋友们应该都会发现交谈的内容都是一个字一个字蹦出来的,熟悉其背后原理的朋友都知道除了一些预先调校的回复实际上AI的回复都是实时生成的,或者更专业的说法应该是实时预测出来的。所以这种显示效果也是一种无奈之举,但小伙伴有没有发现其实它还蛮酷的,至少不太容易让人产生反感。既然内容是实时生成的,那自然是后端接口实时喂数据给前端……继续阅读 » Alan 2年前 (2023-06-06) 1848浏览 0评论0个赞
环境搭建首先要在电脑上安装 Python,直接在官网下载安装包进行安装即可:https://www.python.org/downloads/ # 创建文件夹,可随意命名mkdir chatgpt-pdfcd chatgpt-pdf# 创建虚拟环境(第二个venv为虚拟环境的名称,之所以使用venv是因为一般通用的……继续阅读 » Alan 2年前 (2023-05-19) 2545浏览 0评论0个赞
Nuxt为Nuxt3启用了全新域名https://nuxt.com/(原域名为https://nuxtjs.org/),Alan没有深度使用过Nuxt 2,但变化应该还是比较大的,因为Nuxt 3正式版与之前的beta版本都有不小的变化。选择Nuxt 的主要原因应该都是SEO吧,毕竟官方的SSR方案尤雨溪自己都说不完善。当然对于的约定大于配置的理念也是褒贬不……继续阅读 » Alan 2年前 (2023-05-08) 2838浏览 0评论0个赞
其它章节内容请见机器学习之PyTorch和Scikit-Learn在前面的章节中,我们学习了用于分类的基本机器学习算法以及如何在喂给这些算法前处理好数据。下面该学习通过调优算法和评估模型表现来构建良好机器学习模型的最佳实践了。本章中,我们将学习如下内容:评估机器学习模型表现诊断机器学习算法常见问题调优机器学习模型使用不同的性能指标评估预测模型……继续阅读 » Alan 2年前 (2023-04-25) 2603浏览 0评论0个赞
其它章节内容请见机器学习之PyTorch和Scikit-Learn在第4章 构建优秀的训练数据集 – 数据预处理中,我们学习了使用特征选择技术对数据集降维的不同方法。特征选择以外的另一种降维方法是特征提取。本章中我们会学习两种基本技术,可帮助我们通过将其变换为比原来更低维度的特征子空间总结出数据集中的信息内容。数据压缩是机器学习中非常重要的课题,它有助于我……继续阅读 » Alan 2年前 (2023-04-17) 3116浏览 0评论0个赞
其它章节内容请见机器学习之PyTorch和Scikit-Learn数据质量及所包含的有用信息量是决定机器学习算法能学到多好的关键因素。因此,在将数据集喂给机器学习算法前对其进行检查和预处理绝对很重要。本章中,我们会讨论一些基本数据预处理技术,有助于我们构建很好的机器学习模型。本章将要讨论的内容有:删除和替换数据集缺失值为机器学习算法准备分类数据为……继续阅读 » Alan 2年前 (2023-04-08) 4488浏览 0评论0个赞
其它章节内容请见机器学习之PyTorch和Scikit-Learn本章中,我们会学习一些学术界和工业界常用的知名强大机器学习算法。在学习各种用于分类的监督学习算法的不同时,我们还会欣赏到它们各自的优势和劣势。另外,我们会开始使用scikit-learn库,它为高效、有生产力地使用这些算法提供了用户友好且一致的接口。本章讲解的主要内容有:介绍用于分类的……继续阅读 » Alan 2年前 (2023-04-03) 3603浏览 0评论1个赞