如果您一直在关注有了计算机能力,我们就可以继续我们的人工智能项目。在这一部分中,我们将讨论设置环境并安装为后续步骤做好准备所需的库。这部分既快速又简单,但很重要,包含很多有用的信息。
对于这个项目,我们将使用 Visual Studio Code (VS Code) 编辑器,您可以从他们的网站免费获取该编辑器。它功能强大、轻量级、功能齐全,并且与我们将要使用的编程语言 Python 配合得很好。
如果您需要安装 Visual Studio Code 方面的帮助,。
运行 VS Code 后,使用您的 DIY AI 名称 (My_DIY_AI) 创建一个项目文件夹。然后,设置您的虚拟环境。
如果您需要帮助设置虚拟环境,。
一旦虚拟环境运行起来,就可以开始安装项目所需的库了。
操作系统和 Shutil
os 和 Shutil 已预先安装在 Python 中,因此我们不需要安装它们,但因为我们将使用它们进行文件和目录管理以及复制、移动和删除文件和目录。
熊猫
Pandas 非常适合处理大型数据集,支持多种数据格式,并与其他 Python 库无缝集成。
PyPDF2、菲兹
PyPDF2、fitz是读写PDF文件的库
python 魔法
python-magic 将通过检查文件内容而不仅仅是文件扩展名来帮助检测文件类型,这有助于确保准确识别,而不管命名约定如何。
嗖嗖
Whoosh 非常适合在本地或嵌入式应用程序中创建和管理搜索功能。它允许您有效地索引文件并检索内容。
变形金刚和火炬
Transformers 和 Torch 是支持自然语言处理任务的库,例如摘要、情感分析和文本分类。 Transformers 包含用于问答、文本生成和摘要等任务的预训练模型。 Torch 是一种广泛用于深度学习的机器学习框架,支持自定义 NLP 模型的训练。
Numpy 和 Scipy
Numpy 和 Scipy 是数学库,对于在任何数据科学或机器学习项目中执行计算和预处理都很重要。它们负责处理数组、矩阵和大型数据集。
FastAPI 和 Uvicorn
FastAPI 和 Uvicorn 用于构建快速、轻量级的 API,以离线提供数据或机器学习模型。
要安装这些库,请在虚拟环境中的终端中使用以下命令。安装这些库后,我们的人工智能项目的骨干就已经就位了。在下一篇指南中,我们将创建文件结构并尝试一下。