How to Learn AI on Your Own

<非原创申明>

Non-Original Content Disclaimer:
This article was originally written by Thu Vu. It was first published on 2024.1.6 on Towards Data Science
Original URL：🔗How to Learn AI on Your Own (a self-study guide)

This website is non-profit and for educational purposes only. If the original author wishes for this content to be removed, we will promptly delete it upon request.

(1) Technical Aspects

>>> Python & IDEs:

matplotlib库用于数据可视化， spacy库用于基本的文本处理功能，等等。对于与语言模型进行交互，Langchain是一个非常有用的库，可以帮助你学习如何在LLMs之上开发多个应用程序。

>>> Git version control:

我接下来要推荐学习的是 Git 版本控制。

我认为开始使用Git的最简单方法是使用Github Desktop，它是Git的用户界面工具。如果您更喜欢使用命令行/终端，也可以使用这种方式的Git。

>> APIs

另一项必须学习的是API（应用程序编程接口）。懂得如何使用API是一种神奇的技能，它可以为您打开一个全新的可能性世界！

是计算机程序之间进行通信的一种方式。您需要了解的基本术语有两项：

API request (which also referred to as “API call”)

API response.

每次你打开Instagram并向下滚动你的Instagram信息流时，你实际上是在向Instagram应用程序背后的推荐模型API发出请求，并得到相应的响应。

取决于API，您可以请求数据或模型预测（仅在使用OpenAI API的情况下）等其他功能。如果不知道如何使用API，您将仅限于使用聊天界面（例如OpenAI网站）。ChatGPT网站是使用ChatGPT模型的绝佳方式，但您无法开发自己的工具或将ChatGPT/GPT-4模型集成到当前系统中。要实现这一点，您需要使用其模型API。

👉 有用的资源：

🎥什么是API

short courses

(2) Theoretical Fundamentals

图片原链接: https://github.com/Hannibal046/Awesome-LLM

在深入研究其细节之前，我建议先观看一些 YouTube 视频以获得高水平的理解。如果您想深入研究细节， Andrej Karpathy 的这个视频将向您展示如何从头开始编写 GPT。

>>> Training a Language Model

在与AI模型合作时，你也希望对这些模型背后的基础模型的训练方法有一个高层次的理解。

例如，OpenAI的ChatGPT模型以GPT-3为基础模型，但它还经过了一些额外的训练步骤，即监督微调和基于人类反馈的强化学习（RLHF）。

我建议观看Andrej Karpathy Introduction to LLMs 的“LLMs入门”视频，以更深入地了解训练LLM背后的过程。

>>> Embeddings & Vector Database

如果你使用语言模型构建AI应用程序，你需要自行创建这个向量数据库，可以选择适合的开源向量数据库。流行的开源向量数据库包括Chroma和FAISS，你可以直接在Python中安装并使用它们来构建你的AI项目。

Source: https://www.linkedin.com/pulse/choosing-vector-database-your-gen-ai-stack-abhinav-srivastava/

来源：《选择向量数据库以构建下一代AI堆栈》，作者阿比纳夫·斯里瓦斯塔瓦（Abhinav Srivastava）

👉 Useful resources: 有用的资源：

3Blue1Brown Neural Network playlist
Fast AI resources
CodeEmporium Transformers playlist
Deep Learning Specialization (Coursera/ Deeplearning.ai
Deep learning book (Ian Goodfellow and Yoshua Bengio and Aaron Courville)《深度学习》（Ian Goodfellow、Yoshua Bengio和Aaron Courville著）
Natural Language Processing Specialization (Coursera/ Deeplearning.ai
Let’s Build GPT from scratch (Andrej Karpathy)

(3) Build Real-world Projects & Share

如果你准备好处理更复杂的人工智能项目，你可以构建一个现实世界的应用。例如，你可以使用Langchain创建一个文档检索应用程序，基本上就是创建一个类似于ChatwithPDF的应用程序，可以在文档中询问特定信息。或者你可以在特定的领域主题中创建自己的聊天机器人。

🎥 Building a Chatbot with ChatGPT API and Reddit Data

使用ChatGPT API和Reddit数据构建聊天机器人

就我个人而言，我发现在主流媒体上，关于人工智能的很多重要话题并没有得到更广泛的讨论。人工智能领域有很多不同的方面，这些方面并不会成为新闻头条。例如：

采用高级提示工程方法来提升LLM（大型语言模型）响应的质量，比如自洽性提示、连贯性提示或自动提示。
AutoGen (微软)：一个框架，允许您使用多个能够相互对话以完成任务的代理来开发LLM应用程序。
高级文档QA（或检索增强生成 – RAG），适用于多模态文档，能够很好地处理复杂的表格、图像和其他数据结构。
AI安全与黑客攻击：前几天我看到一位研究人员发现了机器学习模型中一些严重的安全问题。这一领域此前并未受到足够的重视，如果你在计算机安全方面有专长，请为人类做件好事，深入研究一下这个问题吧！
人工智能安全是研究如何使AI的目标与人类目标保持一致的领域。随着AI能力的提升，理解大型AI模型并确保其安全的重要性正日益与提升AI能力相提并论。
最后，如果您对法律感兴趣，那么AI法规和AI治理也是值得关注的。在欧洲，《欧盟人工智能法案》是即将出台的一项重大法规，旨在规范AI的使用。同样，美国政府最近也通过了《关于安全、可靠和可信的人工智能开发与使用行政令》（EO），以应对AI可能带来的风险。

📩 Useful AI newsletters:有用的人工智能新闻通讯：

The Batch (Deeplearning.ai)
The Algorithm (MIT Technology Review)
Paper with Code Newsletter
AI Ethics Brief (Montreal AI Ethics Institute)

🚀 Specialized AI courses:专业人工智能课程：

AI Alignment Course — Developed with Richard Ngo (OpenAI)
AI Governance Course AI 治理课程