生成式模型在近年来广泛流行。在阅读本文时,读者很可能已经在与生成模型进行过互动。或许是使用ChatGPT生成文本,或许是在Instagram等应用中使用风格转换,亦或是看过那些引发热议的深度伪造视频。这些都是生成式模型的实际应用!在系列文章中,我们将探索生成式模型的世界,从两大生成模型阵营——transformers和扩散模型(diffusion)的基础开……继续阅读 » Alan 2年前 (2024-06-05) 2000浏览 0评论1个赞
尽管前赴后继有各种厂商声称在某些基准测试上超越了GPT 4,OpenAI旗下的ChatGPT仍然是用户量最高且公认的最优质的人工智能产品。OpenAI在GPT 2之后就不再开源其大模型,这也正是马斯克吐槽其应改名为ClosedAI。大佬们的口水战与我等无关,对于开发者来说,要在自己的系统里集成优秀的 GPT,就需要通过调用其 API。本文的相关代码请见 G……继续阅读 » Alan 2年前 (2024-03-27) 3234浏览 0评论1个赞
多模态大语言模型世界已然很丰富, 图片领域前有Midjourney,后有DALL·E的追赶,开源界还有Stable Diffusion垫后。视频领域Runway的Gen 2一骑绝尘,也不乏大量的追赶者,Deforum配合Stable Diffusion也可实现文生视频。今天我们探讨的是3D模型,如果未来增强现实以及Apple所倡导的空间计算能够走入大众市场,……继续阅读 » Alan 2年前 (2023-11-21) 3217浏览 0评论0个赞
其它章节内容请见机器学习之PyTorch、Scikit-Learn和Transformers代码参数GitHub仓库文本分类是自然语言处理中最常见的任务之一,它可用于各种应用,例如将客户反馈标记为不同的类别,或者根据语言分发工单。电子邮件程序的垃圾邮件过滤器很有可能正在使用文本分类来保护收件箱免受大量不需要的垃圾邮件的侵扰!另一种常见的文本分类是情感分……继续阅读 » Alan 3年前 (2023-06-17) 4032浏览 0评论0个赞
其它章节内容请见机器学习之PyTorch、Scikit-Learn和Transformers代码参见GitHub仓库2017年,Google的研究人员发表了一篇论文,提出了一种新的用于序列建模(sequence modeling)的神经网络架构[1]。称之为Transformer,这种架构在机器翻译任务中的表现无论在翻译质量还是训练成本层面均优于循环神经……继续阅读 » Alan 3年前 (2023-06-16) 3585浏览 0评论0个赞
其它章节内容请见机器学习之PyTorch和Scikit-Learn上一章中,我们专注于调优和评估不同的分类模型的最佳实践。本章中,我们将基于这些技术,并探索构建一组分类器的方法,这些方法通常比各个成员具备更好的预测性能。本章我们学习的主要内容有:基于多数投票做出预测使用装袋法重复从训练数据集中随机抽取组合降低过拟合应用提升方法通过弱学习器构建强大的……继续阅读 » Alan 3年前 (2023-06-08) 2987浏览 0评论0个赞
环境搭建首先要在电脑上安装 Python,直接在官网下载安装包进行安装即可:https://www.python.org/downloads/ # 创建文件夹,可随意命名mkdir chatgpt-pdfcd chatgpt-pdf# 创建虚拟环境(第二个venv为虚拟环境的名称,之所以使用venv是因为一般通用的……继续阅读 » Alan 3年前 (2023-05-19) 4566浏览 0评论0个赞
其它章节内容请见机器学习之PyTorch和Scikit-Learn在前面的章节中,我们学习了用于分类的基本机器学习算法以及如何在喂给这些算法前处理好数据。下面该学习通过调优算法和评估模型表现来构建良好机器学习模型的最佳实践了。本章中,我们将学习如下内容:评估机器学习模型表现诊断机器学习算法常见问题调优机器学习模型使用不同的性能指标评估预测模型……继续阅读 » Alan 3年前 (2023-04-25) 5806浏览 0评论0个赞
其它章节内容请见机器学习之PyTorch和Scikit-Learn在第4章 构建优秀的训练数据集 – 数据预处理中,我们学习了使用特征选择技术对数据集降维的不同方法。特征选择以外的另一种降维方法是特征提取。本章中我们会学习两种基本技术,可帮助我们通过将其变换为比原来更低维度的特征子空间总结出数据集中的信息内容。数据压缩是机器学习中非常重要的课题,它有助于我……继续阅读 » Alan 3年前 (2023-04-17) 5187浏览 0评论0个赞
其它章节内容请见机器学习之PyTorch和Scikit-Learn数据质量及所包含的有用信息量是决定机器学习算法能学到多好的关键因素。因此,在将数据集喂给机器学习算法前对其进行检查和预处理绝对很重要。本章中,我们会讨论一些基本数据预处理技术,有助于我们构建很好的机器学习模型。本章将要讨论的内容有:删除和替换数据集缺失值为机器学习算法准备分类数据为……继续阅读 » Alan 3年前 (2023-04-08) 9625浏览 0评论0个赞