如果您一直在關注有了電腦能力,我們就可以繼續我們的人工智慧專案。在這一部分中,我們將討論設定環境並安裝為後續步驟做好準備所需的程式庫。這部分既快速又簡單,但很重要,包含許多有用的信息。
對於這個項目,我們將使用 Visual Studio Code (VS Code) 編輯器,您可以從他們的網站免費取得該編輯器。它功能強大、輕量級、功能齊全,並且與我們將要使用的程式語言 Python 配合得很好。
如果您需要安裝 Visual Studio Code 方面的協助,。
執行 VS Code 後,使用您的 DIY AI 名稱 (My_DIY_AI) 建立一個專案資料夾。然後,設定您的虛擬環境。
如果您需要協助設定虛擬環境,。
一旦虛擬環境運作起來,就可以開始安裝專案所需的程式庫了。
作業系統和 Shutil
os 和 Shutil 已預先安裝在 Python 中,因此我們不需要安裝它們,但因為我們將使用它們進行檔案和目錄管理以及複製、移動和刪除檔案和目錄。
貓熊
Pandas 非常適合處理大型資料集,支援多種資料格式,並與其他 Python 程式庫無縫整合。
PyPDF2、菲茲
PyPDF2、fitz是讀寫PDF檔的庫
python 魔法
python-magic 將透過檢查文件內容而不僅僅是文件副檔名來幫助檢測文件類型,這有助於確保準確識別,而不管命名約定如何。
咻咻
Whoosh 非常適合在本機或嵌入式應用程式中建立和管理搜尋功能。它允許您有效地索引文件並檢索內容。
變形金剛和火炬
Transformers 和 Torch 是支援自然語言處理任務的函式庫,例如摘要、情緒分析和文字分類。 Transformers 包含用於問答、文字產生和摘要等任務的預訓練模型。 Torch 是一種廣泛用於深度學習的機器學習框架,支援自訂 NLP 模型的訓練。
Numpy 和 Scipy
Numpy 和 Scipy 是數學庫,對於在任何資料科學或機器學習專案中執行計算和預處理都很重要。它們負責處理數組、矩陣和大型資料集。
FastAPI 和 Uvicorn
FastAPI 和 Uvicorn 用於建立快速、輕量級的 API,以離線提供資料或機器學習模型。
若要安裝這些庫,請在虛擬環境中的終端機中使用下列命令。安裝這些庫後,我們的人工智慧專案的骨幹就已經就位了。在下一篇指南中,我們將建立文件結構並嘗試。