人人学AI:一门务实和严谨的AI入门课

发布时间:2025-02-14 | 阅读次数:3824 次

本教程采用小步快跑、快速迭代的方式,最近更新时间:2025年3月10日,增加AI代码学习的第三、第四阶段学习安排

本教程包含的PDF资源来源于热心会员的贡献,感谢大家的支持!

会员是面试天下网最核心的竞争力,所以本教程所包含的PDF资源仅限于会员使用,申请入口:请点击链接...

前言

《人人学AI》的门槛很低,只要是高中以上的学历就可以学起来,真正人人可学AI。

《人人学AI》总共有三大部分构成,如下图所示:

一、AI笑话

AI看似高深,实则并不难,人人都可以学好它。

纵观科学发展史,当计算机刚发明出来的时候,只有科学家这类少数人群才能接触和使用这一高端产品,后来慢慢扩散到普通大众,成为人们生活中习以为常的普通商品。

AI技术也是如此,大家不要觉得AI只能高学历人群才能玩转,实际上他们也会闹出很多笑话。下面给大家举个真实的例子,破除大家对高端人士的迷信,同时树立自我学习AI的信心。

2024年4月中旬,第三届智能决策论坛召开了。这次论坛采用线下参会和线上同步直播的方式进行,线下参会人员200余人,线上参与人数超过8.5万,受到了学界的广泛关注。但是,如此众目睽睽之下,竟然发生了一件匪夷所思的奇葩事故---上海交通大学的温颖竟然将实验图片放置反了,如下图所示:

上面红框是出错的图片,其中左边是人形智能体,右边是半猎豹智能体。

备注:半猎豹指的是把猎豹从中间分开,只保留一侧的前后腿,简化模型,有助于学习训练。

这两个图片用于展示智能体学习走路的实验过程,正确的图片应该是地板在下,腿脚踏着地板前进,类似下面这样的形式:

而在交大温颖的PPT上,地板却是在上面,智能体呈现四脚朝天的运动状态,真是滑稽可笑。

俗话说,一叶知秋,见微知著。从这个错误的图片来看,我有点怀疑交大温颖的演示实验是否真实可靠。作为一名学者,弄虚作假,实属一个严重的问题。当然,从人性的角度来看,科研本来就枯燥无味,每个人都在摸鱼,本也无可厚非罢了。

其实,我希望大家通过这个笑料,破除对高学历人士的迷信,不要觉得他们都很厉害,AI只有他们能才能搞,世界本来就是由草台班子组成,你只要想去做,你也可以的!

二、AI资源

关于学习AI技术的路线图,网上有很多。但是,这个路线图有一个明显的特点,它是活的,不是死的。针对这个学习路线出现的任何问题,都可以找我来反馈和沟通,我会给出令你满意的解答。

本路线图的时间单位为周,你可以知道自己每周应该干些什么。当然,你也可以根据自己的情况从一周变成两周,但是你不能沉醉其中,从而因小失大,你应该继续向前行进才行。

学习分为两种形式:读书和动手。人读书可以很快,一天一本,但是动手则会慢得多。动手能力本质是一个习惯问题,任何问题一旦上升到习惯层面,则是一件非常困难的事。就拿Python编码来说,新人需要差不多半年的时间,才能流畅的写代码。但是,在本路线图中,不会留给你半年时间卡在编码节点,你只需要了解即可。

第一阶段:准备阶段。

在这个阶段,不需要学习数学和编程知识,重点是了解和熟悉深度学习的历史和发展现状,从而对深度学习有个心里印象。在本阶段,重点推荐下面几本书:

  • 1、人工智能导论,出版时间2022年8月,作者金军委。

  • 2、人工智能导论:模型与算法,出版时间2020年5月,作者吴飞。

  • 3、人工智能导论(第2版),出版时间2024年11月,作者郭军。

提醒1:可解释人工智能导论,这本书不推荐,飞燕最讨厌这种出书方式,搞一堆作者,完全是为了“政绩”,心思完全不在书上,还要点脸吗?

第二阶段:AI数学学习阶段。

对于AI数学的学习,我觉得一定要体现出“AI味道”,具体来说,总共有两点:

(一)一定要紧抓AI,不要跑偏,不要变成了纯粹的数学学习。很多出版社,为了让书更加厚重,东拉西扯,高了很多没有用的东西,浪费了读者的宝贵时间。比如说,机器学习的数学,出版时间2021年1月,作者雷明。

(二)抓住核心的几点,一定要多复习多思考。对于核心的数学知识,我觉得有下面五个:

(1)理解梯度的概念,掌握梯度下降法和梯度上升法求函数的最小值和最大值。

(2)掌握迭代法求解方程的思想。因为学校教育的终点是考试,所以给大家灌输的是“公式思维”,而在真正的社会实践中根本没有公式可言,所以迭代法才是真正有用的思维。其实,思维习惯很难纠正的,所以我建议大家对待迭代法要多思考多体会,多读相关的数学读物,重点推荐《数值计算》类型的书籍。

(3)带约束条件的优化问题:拉格朗日乘子法。拉格朗日是非常出名的大数学家,影响力极其深远。在深度学习领域,拉格朗日乘子法是我们深入了解这位伟大科学家的好机会。

(4)正态分布相关的知识。正态分布又叫高斯分布,据说高斯一生有几百个数学发现,但是只有正态分布才是对人类最大的贡献,可见正态分布的分量有多重。另外,高斯过程也是非常重要的。

(5)数据空间的变换:核函数。这是一个抽象的领域,最能体现出数学的抽象之美。

在本阶段,重点推荐下面几本书:

  • 1、机器学习的数学,出版时间2021年1月,作者雷明。虽然在上文中点名对这本书进行了批评,但是红花需要绿叶配,大家读完这本书的繁琐无味,更能体会其他精品书籍的畅快淋漓。

  • 2、机器学习中的数学,出版时间2019年11月,作者孙博。

  • 3、人工智能数学基础,出版时间2020年10月,作者唐宇迪。

  • 4、人工智能数学基础,出版时间2021年4月,作者陈华。

  • 5、人工智能的数学基础,出版时间2022年9月,作者冯朝路。

提醒1:人工智能数学基础,出版时间2022年9月,作者董久祥。这本书就是坑,虽然名字带上了人工智能,但是里面很多纯数学的东西,真是一本大忽悠之书。

提醒2:此阶段的学习时间建议控制在2-3个月即可。千万不要时间太长,看得越久,你会发现不会的东西越多,你会为了满足自己的好奇心而深挖,如此一来,你的方向就跑偏了。需要注意下,后面有个阶段是PyTorch的学习,它的本质也是数学,它才是你要真正学习的AI数学。

第三阶段:AI入门阶段(掌握PyTorch技术)。

这个阶段以PyTorch技术为核心,重点推荐下面几本书。

需要提醒大家一下:别搞什么TensorFlow,更别搞什么百度飞桨,这些玩意都是坑,坑到你怀疑人生,所以你就踏踏实实的用PyTorch。

  • 1、动手学深度学习(PyTorch版),出版时间是2023年02月,作者是阿斯顿·张、李沐等

  • 2、深度学习框架PyTorch:入门与实践(第2版),出版时间是2022年07月,作者是王博、陈云

  • 3、动手学PyTorch深度学习建模与应用,出版时间是2022年03月,作者是王国平

  • 4、深度学习原理与PyTorch实战,出版时间是2022年4月,作者是集智俱乐部

提醒大家:这些书你需要走马观花的读上几遍就行了,不需要花费太多的时间,只需要明白PyTorch的基本用法就行了。PyTorch可以用在多个方面,例如计算机视觉,自然语言处理,强化学习等领域,每个领域都有很多的知识,所以仅仅靠这些书上某章的介绍,你很难吃透这些领域的。很多人读完这些书之后,感觉内心很空虚,这完全是正常现象,不必过于担心。

第四阶段:计算机视觉学习阶段。

深度学习最初的爆发点就是计算机视觉领域,所以搞AI的人不懂点计算机视觉那就说不过去了,所以下面几本书可以看看。

另外,计算机视觉的项目基本上人人都可以玩的开,数据是现成的,而且收敛也快,很快就能拿到结果。当进入后面阶段的强化学习和大模型,那就吃力多了。强化学习项目,你可能跑上几天几夜都无法收敛,而大模型则更能难搞,太耗费算力了,普通人根本无法玩转。所以,深度学习最初的爆发点为什么集中于计算机视觉领域,是有得天独厚条件的。

  • 1、PyTorch计算机视觉实战:目标检测、图像处理与深度学习,出版时间是2023年9月,作者是基肖尔·阿耶德瓦拉

提醒:大家品一品这本书的书名,明显有问题,“目标检测”、“图像处理”、“深度学习”这个三个概念不是一类事物,没有并列关系,好比是:苹果、八宝粥、午餐,三者并列放在一起十分诡异!

  • 2、PyTorch深度学习与计算机视觉实践,出版时间是2024年7月,作者是王晓华。

  • 3、计算机视觉中的深度学习,出版时间:2021年6月,作者是姜竹青。

  • 4、计算机视觉实战:语义分割与目标检测,出版时间是2024年7月,作者是贾壮。

  • 5、YOLO目标检测,出版时间是2023年12月,作者是杨建华。

第五阶段:自然语言处理学习阶段。

  • 1、自然语言处理:基于预训练模型的方法,出版时间是2021年7月,作者是车万翔。

  • 2、PyTorch深度学习指南:序列与自然语言处理 卷III,出版时间是2024年4月,作者是丹尼尔·沃格特·戈多伊。

  • 3、Transformer自然语言处理实战,出版时间是2024年1月,作者是Lewis Tunstall。

第六阶段:大模型学习阶段。

关于大模型的学习,我给出的学习路线是这样的:

学习Transformer技术->了解BERT技术->了解ChatGPT技术->学习大模型与强化学习交叉技术->了解模型压缩和知识蒸馏技术->了解DeepSeek技术

需要提醒大家的是,在上面学习路线中,有的地方需要你去学习它,而有的地方需要你去了解它,因为大模型技术设计到的东西太多了,如果你面面俱到则花费时间是巨大的,而且容易走入死胡同。

由于大模型技术的发展还处于历史早期,所以很多技术更新迭代的太快,今日你所学的炙手可热的新技术,也许明天就是无人问津的老古董,所以大家没有必要把自己搞得很专一很深情,只需要蜻蜓点水,走马观花的态度就可以了。

针对上面提出的学习路线,每个节点我给出的参考书如下所示:

  • 1、学习Transformer技术,请阅读《Transformer自然语言处理》,出版时间是2024年1月,作者是Hugging Face的开发工程师。

  • 2、了解BERT技术,请阅读《BERT基础教程》,出版时间是2023年2月,作者是苏达哈尔桑.拉维昌迪兰

  • 3、了解了解ChatGPT技术,请阅读《ChatGPT原理与架构》,出版时间是2023年12月,作者是程戈。

  • 4、学习大模型与强化学习交叉技术,请阅读《大模型强化学习入门精华》,网上开源教程。

  • 5、了解模型压缩和知识蒸馏技术,请阅读《高效深度学习:模型压缩与设计》,出版时间是2024年7月,作者是汪玉。

后记

读书,不在于多,而在于精。对于初学者来说,要不断地降低目标,哪怕走马观花地把书翻一遍,就相当于完成了一个小目标,往前迈出了一步。抱着这样的心态,我相信每个人都可以学会AI的。

三、AI代码

下面给大家推荐一些精品代码,非常重要,值得每个人都要看看。

第一阶段:PyTorch入门代码

这份教程是PyTorch官方编写的,非常重要,建议初学者一定要仔细的阅读几遍。长久以来,我向很多人推荐过这个入门教程,它值得每个初学者认真的阅读:PyTorch官方入门指导文档

这份教程总共分为8个小节,如下所示。从数据处理到模型构建,再到训练模型以及优化参数,最后保存模型,一气呵成,短小精悍,非常有价值,值得每个初学者认真的阅读:

第二阶段:ReLu函数实现非线性拟合

ReLU函数是最常见的激活函数,它的出现是AI技术的一大革命。ReLu函数虽然看似简单,但是却能实现强大的非线性功能,如下所示:

具体的代码实现,请移步:ReLu与非线性的理解

第三阶段:Transformer的复现

AI代码部分是严格按照深入浅出、承上启下的顺序进行布局的。在上面带领大家学习了全连接线性网络的神奇之处,接下来带来大家学习Transformer的脑洞大开。

很多人可能会反驳我,觉得全连接线性网络并无神奇之处。在我看来,那是因为你熟视无睹罢了。就拿电脑来说,这是人类科技史的重大突破,但是因为人人手持电脑,所以忘却了它的神奇罢了。

真正的“脑洞大开”这顶帽子,我觉得应该更应该戴在LSTM头上,因为它有遗忘门,记忆门等各种门,完全模拟了人脑的基本原理。令人可惜的是,Transformer最终把LSTM干趴下了。

Transformer最大的特点是:自注意力和位置编码。请看下面的代码:

......

第四阶段:学习开源框架MiniMind

2024年2月份我发现了一个非常好的大模型项目MiniMind,它完全是基于PyTorch手搓的。

......