Anaconda for Ubuntu 安装步骤详解 – wiki基地


Anaconda for Ubuntu 安装步骤详解:从零开始构建强大的 Python 数据科学生态

Anaconda 已经成为 Python 数据科学领域事实上的标准环境管理和包分发平台。它不仅预装了数百个常用的数据科学库(如 NumPy, Pandas, SciPy, Matplotlib, Scikit-learn 等),还提供了一个强大的包管理器 Conda,以及便捷的环境管理功能,使得在不同项目间切换 Python 版本和依赖库变得异常简单。对于 Ubuntu 这个广受欢迎的 Linux 发行版用户来说,掌握 Anaconda 的安装和基本使用是进行数据分析、机器学习、深度学习等工作的必备技能。

本文将以详尽的步骤,引导您在 Ubuntu 系统上成功安装 Anaconda,并介绍一些基础的配置和使用方法,帮助您快速搭建起一个稳定、高效的 Python 开发环境。本文力求覆盖安装过程中的每一个细节,并解释相关概念,即使是 Linux 或 Python 新手也能轻松跟随。

文章目标:

  1. 理解 Anaconda 的核心价值及其与系统 Python 的区别。
  2. 掌握在 Ubuntu 上下载和验证 Anaconda 安装脚本的方法。
  3. 熟悉 Anaconda 的交互式安装过程及其各项配置选项。
  4. 验证 Anaconda 是否安装成功并能正常工作。
  5. 了解 Conda 环境的基本管理(创建、激活、切换、删除)。
  6. 掌握使用 Conda 安装、更新和管理软件包的基础。
  7. 了解 Anaconda Navigator 图形界面的使用。
  8. 提供常见问题的排查思路和卸载方法。

读者对象:

  • 需要在 Ubuntu 系统上进行 Python 数据科学、机器学习开发的初学者或有经验的开发者。
  • 希望了解 Anaconda 安装细节和环境管理机制的用户。
  • 寻求一个稳定、隔离的 Python 开发环境的用户。

系统要求:

  • 一个正在运行的 Ubuntu 发行版(本文以较新的 LTS 版本为例,但步骤适用于大多数现代 Ubuntu 版本)。
  • 具有 sudo 权限的用户账户(虽然安装 Anaconda 本身到用户目录通常不需要 sudo,但在某些系统配置或解决依赖问题时可能需要)。
  • 稳定的互联网连接(用于下载 Anaconda 安装包)。
  • 足够的磁盘空间(Anaconda 完整安装通常需要 3GB 以上,随着环境和包的增多会更大)。
  • 基本的 Linux 命令行(Terminal)操作知识。

第一部分:理解 Anaconda 与准备工作

1.1 什么是 Anaconda?为什么选择它?

Anaconda 是一个开源的 Python 和 R 语言发行版,专注于简化包管理和部署。它的核心优势在于:

  • 预装丰富库: 安装后即拥有超过 250 个流行的数据科学包,省去了逐个安装的麻烦。
  • 强大的 Conda 包管理器: Conda 不仅能管理 Python 包,还能管理非 Python 的软件依赖(如 C/C++ 库、CUDA 等),解决了 pip 在处理复杂依赖时的诸多痛点。它能检查依赖冲突,确保安装的包能够协同工作。
  • 便捷的环境管理: Conda 允许用户创建相互隔离的虚拟环境。每个环境可以拥有独立的 Python 版本和一套特定的库,避免了项目间的版本冲突。例如,你可以同时拥有一个基于 Python 3.8 的项目和一个基于 Python 3.10 的项目,它们各自的依赖库互不干扰。
  • 跨平台支持: Anaconda 支持 Windows, macOS 和 Linux,保证了开发环境的一致性。
  • 包含 Anaconda Navigator: 一个图形用户界面(GUI),方便用户管理环境、包和启动应用程序(如 Jupyter Notebook, Spyder IDE)。

与系统 Python 的区别:

Ubuntu 系统通常会自带一个或多个 Python 版本(通常是 Python 2.x 和/或 Python 3.x),主要供系统内部脚本和工具使用。直接使用 pip 在系统 Python 环境中安装大量第三方库,尤其是数据科学库,可能会遇到以下问题:

  • 权限问题: 向系统目录安装包通常需要 sudo 权限,操作不当可能影响系统稳定性。
  • 版本冲突: 系统自带的 Python 版本可能不满足某些库的要求,或者不同项目需要不同版本的库,容易产生冲突。
  • 环境混乱: 所有包都安装在同一个全局环境中,难以管理和复现。

Anaconda 通过将所有内容安装在用户的主目录下,并利用 Conda 环境进行隔离,完美地避开了这些问题,提供了一个干净、独立且易于管理的开发空间。

1.2 准备工作

在开始安装之前,建议执行以下操作:

  • 更新系统包列表: 打开终端(快捷键 Ctrl+Alt+T),运行以下命令确保系统包信息是最新状态:
    bash
    sudo apt update
    sudo apt upgrade -y
  • 安装必要的依赖(通常已存在): Anaconda 安装脚本通常依赖一些基础工具,如 curlwget(用于下载)和 bzip2(用于解压)。大多数 Ubuntu 桌面版已经预装,但以防万一可以运行:
    bash
    sudo apt install curl bzip2 -y

第二部分:下载 Anaconda 安装脚本

2.1 访问 Anaconda 官方网站

前往 Anaconda Distribution 的官方下载页面:https://www.anaconda.com/products/distribution

2.2 选择合适的版本

在下载页面,你会看到针对不同操作系统(Windows, macOS, Linux)的下载选项。找到 Linux 部分。你需要关注以下几点:

  • 架构: 绝大多数现代 Ubuntu 桌面和服务器都是 64 位 (x86_64) 架构。选择对应的 64-Bit (x86) Installer。如果你使用的是 ARM 架构的设备(如某些服务器或树莓派等),需要选择对应的 ARM 版本(如果提供)。
  • Python 版本: Anaconda 通常会提供基于最新稳定 Python 3.x 版本的安装包。强烈建议选择 Python 3.x 版本(例如 Python 3.9, 3.10, 3.11 等),因为 Python 2 已于 2020 年停止支持。即使你需要使用 Python 2,也可以在安装 Anaconda 后创建一个 Python 2 的 Conda 环境。

点击对应的下载链接,浏览器会开始下载 .sh 结尾的安装脚本文件。文件通常命名类似于 Anaconda3-<version>-Linux-x86_64.sh

2.3 (可选但推荐)使用命令行下载

如果你更喜欢使用命令行,或者在没有图形界面的服务器上操作,可以使用 curlwget 下载。

  1. 在下载页面找到你需要的 Linux 安装包。
  2. 右键点击下载链接,选择“复制链接地址”或类似选项。
  3. 打开终端,进入你想要保存下载文件的目录(例如,cd ~/Downloads)。
  4. 使用 curl 下载(将下面的 URL 替换为你复制的实际链接):
    bash
    curl -O https://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-x86_64.sh

    或者使用 wget
    bash
    wget https://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-x86_64.sh

    请务必将 URL 替换为官网提供的最新版本的链接。

第三部分:验证安装脚本的完整性(重要步骤)

下载大型软件安装包后,验证其完整性是一个好习惯,可以确保文件在下载过程中没有损坏或被篡改。Anaconda 官方提供了 SHA256 哈希值用于校验。

3.1 获取官方 SHA256 哈希值

通常在 Anaconda 的下载页面或者相关的文档页面(如 https://docs.anaconda.com/anaconda/install/hashes/),可以找到与你下载文件版本对应的 SHA256 哈希值。找到你下载的那个 .sh 文件的哈希值并复制下来。

3.2 在本地计算 SHA256 哈希值

打开终端,切换到你下载 .sh 文件的目录(例如 cd ~/Downloads)。然后运行 sha256sum 命令,后面跟上你下载的文件名:

bash
sha256sum Anaconda3-2023.09-0-Linux-x86_64.sh

<filename> 替换为你实际下载的文件名。命令执行后会输出一长串十六进制字符,这就是本地计算出的 SHA256 哈希值。

3.3 比对哈希值

仔细比较你在终端计算出的哈希值和从 Anaconda 官方获取的哈希值。两者必须完全一致。

  • 如果一致: 说明下载的文件是完整且未经篡改的,可以安全地进行安装。
  • 如果不一致: 说明文件可能已损坏或被篡改,请勿使用该文件进行安装。删除它,然后重新下载,并再次进行校验,直到哈希值匹配为止。

这一步虽然看似繁琐,但对于保证软件来源的安全性和安装的稳定性至关重要。


第四部分:运行 Anaconda 安装脚本

验证通过后,就可以开始执行安装了。

4.1 赋予脚本执行权限

默认情况下,下载的 .sh 文件可能没有执行权限。在终端中,使用 chmod 命令添加执行权限:

bash
chmod +x Anaconda3-2023.09-0-Linux-x86_64.sh

同样,记得替换成你下载的实际文件名。

4.2 运行安装脚本

在终端中,运行以下命令启动安装程序:

bash
./Anaconda3-2023.09-0-Linux-x86_64.sh

或者,如果你的 .sh 文件不在当前目录下,需要提供完整路径,例如:

bash
bash ~/Downloads/Anaconda3-2023.09-0-Linux-x86_64.sh

使用 bash 命令显式执行也是一个好习惯。

4.3 跟随交互式安装向导

运行脚本后,你会进入一个基于文本的交互式安装过程。请仔细阅读屏幕上的提示信息。

  • 欢迎信息与许可协议:

    • 首先会显示欢迎信息。按 Enter 继续。
    • 接着会显示软件许可协议(License Agreement)。你需要按住 EnterSpace 键向下滚动阅读(或者按 q 跳过阅读,但不推荐)。
    • 阅读完毕后,它会问你是否接受许可条款。输入 yes 并按 Enter 接受。如果你输入 no,安装将中止。
  • 选择安装位置:

    • 安装程序会询问你想要将 Anaconda 安装在哪个目录下。默认位置通常是你用户主目录下的 anaconda3 文件夹(例如 /home/your_username/anaconda3)。
    • 强烈建议接受默认位置。将 Anaconda 安装在用户的主目录下有几个好处:
      • 不需要 sudo 权限,避免了权限问题。
      • 保持了用户环境的整洁,不干扰系统文件。
      • 卸载时也更方便。
    • 如果你确实需要安装到其他位置(例如,你有单独的分区给开发工具),可以在这里输入你选择的绝对路径。但请确保你对该路径有写入权限,并且了解这样做的潜在影响。
    • 确认安装位置后,按 Enter。如果目录不存在,安装程序会自动创建。
  • 开始安装:

    • 确认安装路径后,安装程序会开始解压文件并将 Anaconda 安装到指定位置。这个过程可能需要几分钟,具体时间取决于你的系统性能和磁盘速度。终端会显示解压和安装的进度。
  • 初始化 Anaconda3:

    • 安装接近尾声时,安装程序会询问:“Do you wish the installer to initialize Anaconda3 by running conda init?” (您希望安装程序通过运行 conda init 来初始化 Anaconda3 吗?)
    • 强烈建议输入 yes 并按 Enter
    • conda init 会修改你的 shell 配置文件(通常是 ~/.bashrc 对于 Bash shell,或者 ~/.zshrc 对于 Zsh shell),添加必要的路径和配置,使得每次打开新的终端时,Conda 的 base 环境能被自动激活(或者让 conda 命令可用)。这是让 Anaconda 无缝集成到你的终端环境中最推荐的方式。
    • 如果你选择 no,安装依然会完成,但你需要手动配置环境变量或每次使用 Anaconda 前手动激活。这对于新手来说比较麻烦。
  • 安装完成:

    • 当看到类似 “Thank you for installing Anaconda3!” 的消息时,表示安装过程已成功完成。

4.4 应用 conda init 的更改

如果你在上一步选择了 yes 来运行 conda init,那么你需要让当前的 shell 会话加载这些更改。你有两个选择:

  • 关闭当前终端窗口,然后重新打开一个新的终端窗口。 这是最简单直接的方法。
  • 在当前终端运行 source ~/.bashrc (如果你的默认 shell 是 Bash) 或 source ~/.zshrc (如果你的默认 shell 是 Zsh)。这将重新加载配置文件,使更改生效。

当你重新打开终端或执行 source 命令后,你可能会注意到终端提示符前面多了一个 (base) 字样。这表示 Anaconda 的基础(base)环境已经被自动激活了,说明 conda init 配置成功。

bash
(base) your_username@your_hostname:~$

如果你不希望每次打开终端都自动激活 base 环境(有时可能会干扰其他非 Conda 的工作流),可以运行以下命令禁止自动激活:

bash
conda config --set auto_activate_base false

之后,你需要手动使用 conda activate base 来激活基础环境,或者激活其他你创建的环境。


第五部分:验证 Anaconda 安装

安装完成后,进行验证以确保一切正常工作。

5.1 检查 conda 命令

在一个新的终端窗口中(确保 (base) 环境已激活,或者如果禁用了自动激活,先手动 conda activate base),运行:

bash
conda --version

如果安装成功并正确初始化,它应该输出 Conda 的版本号,例如 conda 23.7.4

5.2 查看 Conda 信息

运行以下命令可以查看更详细的 Conda 配置和环境信息:

bash
conda info

这将显示包括 Anaconda 安装路径、当前 Conda 版本、当前激活的环境、Python 版本、环境变量配置等关键信息。检查 active environment 是否是 base,以及 anaconda location 是否指向你之前选择的安装路径。

5.3 检查 Python 版本

(base) 环境激活的状态下,运行:

bash
python --version

这应该输出 Anaconda 安装的 Python 版本(例如 Python 3.9.18),而不是系统自带的 Python 版本。这证明了 Conda 环境正在正确地管理 Python 解释器。

5.4 查看已安装的包列表

运行以下命令可以列出当前激活环境(base)中所有已安装的包:

bash
conda list

你会看到一个长长的列表,包含 NumPy, Pandas 等数百个预装的库。这表明 Anaconda 的核心优势——丰富的预装包——已经到位。

如果以上所有命令都能正常执行并返回预期的结果,那么恭喜你,Anaconda 已经在你的 Ubuntu 系统上成功安装并配置好了!


第六部分:Anaconda 基础使用入门

安装只是第一步,了解如何使用 Conda 进行环境和包管理是发挥 Anaconda 威力的关键。

6.1 更新 Anaconda

保持 Anaconda 及其组件更新是一个好习惯。建议定期运行更新命令:

  • 更新 Conda 本身:
    bash
    conda update conda
  • 更新 Anaconda 发行版(包括所有元数据包和关联的核心库):
    bash
    conda update anaconda
  • 更新当前环境中所有可更新的包:
    bash
    conda update --all

通常建议先更新 conda,再更新 anaconda--all

6.2 Conda 环境管理

这是 Conda 最核心的功能之一。

  • 创建新环境:
    假设你想创建一个名为 myenv 的新环境,并指定使用 Python 3.10:
    bash
    conda create --name myenv python=3.10

    Conda 会查找并解决依赖,然后提示你确认安装。输入 y 继续。
    你还可以在创建环境时直接安装一些包:
    bash
    conda create --name datasci pandas numpy matplotlib scikit-learn python=3.9

  • 激活环境:
    要开始在某个环境工作,你需要先激活它:
    bash
    conda activate myenv

    激活后,你的终端提示符会变成 (myenv) your_username@...,表示你现在正处于 myenv 环境中。在此环境下安装的包和运行的 Python 代码都将与 base 环境或其他环境隔离。

  • 查看所有环境:
    列出所有已创建的 Conda 环境:
    bash
    conda env list


    bash
    conda info --envs

    当前激活的环境旁边会有一个星号 *

  • 停用环境:
    当你完成在一个环境中的工作,想要返回 base 环境或关闭环境时,使用:
    bash
    conda deactivate

    执行后,终端提示符会恢复到之前的状态(通常是 (base),或者如果没有自动激活 base,则没有前缀)。

  • 删除环境:
    如果你不再需要某个环境,可以将其彻底删除(请谨慎操作,删除后无法恢复):
    bash
    conda remove --name myenv --all

    这将删除 myenv 环境及其包含的所有包。

6.3 包管理

在激活了目标环境后,你可以使用 Conda 管理包。

  • 安装包:
    bash
    conda install package_name

    例如,安装 seaborn 可视化库:
    bash
    conda install seaborn

    可以同时安装多个包:
    bash
    conda install requests beautifulsoup4

    可以指定包的版本:
    bash
    conda install numpy=1.23

  • 从特定渠道安装包:
    Conda 从“渠道”(channels)获取包。默认是 defaults 渠道。有些包可能在其他渠道,如 conda-forge(一个社区维护的流行渠道)。
    bash
    conda install -c conda-forge package_name

    可以将常用渠道添加到配置中,避免每次指定 -c
    bash
    conda config --add channels conda-forge
    conda config --set channel_priority strict # 推荐设置,优先使用高优先级渠道的包

  • 更新包:
    bash
    conda update package_name

  • 卸载包:
    bash
    conda remove package_name

  • 搜索包:
    查找某个包是否存在于已配置的渠道中:
    bash
    conda search package_name

6.4 使用 pip within Conda Environments

虽然 Conda 是首选的包管理器,但有时某些包可能只在 PyPI (Python Package Index) 上提供,或者你需要一个 Conda 渠道中尚未提供的最新版本。在这种情况下,可以在激活的 Conda 环境中使用 pip

bash
pip install some_package_only_on_pypi

最佳实践: 尽量优先使用 conda install。只有当 Conda 渠道中找不到所需包或特定版本时,才在 Conda 环境中使用 pip install。混用两者时,建议先用 Conda 安装所有能找到的依赖,最后再用 pip 安装剩余的。

6.5 使用 Anaconda Navigator

如果你偏爱图形界面,可以在终端中输入以下命令启动 Anaconda Navigator:

bash
anaconda-navigator

Navigator 提供了一个可视化的界面,用于:

  • 管理 Conda 环境(创建、克隆、导入、删除)。
  • 管理已安装的包(搜索、安装、更新、卸载)。
  • 启动应用程序,如 Jupyter Notebook, JupyterLab, Spyder, VS Code (如果已安装并集成), RStudio (如果安装了 R Essentials)。

对于不熟悉命令行的用户,Navigator 是一个很好的起点。


第七部分:常见问题排查 (Troubleshooting)

7.1 conda: command not found

这通常意味着 Anaconda 的路径没有被正确添加到你的 shell 环境中。

  • 原因: 安装时选择了不对 conda init 进行初始化,或者初始化后没有重新打开终端或 source ~/.bashrc
  • 解决方案:
    1. 找到你的 Anaconda 安装路径(默认为 ~/anaconda3)。
    2. 手动运行初始化命令:~/anaconda3/bin/conda init bash (或 zsh 等,根据你的 shell)。
    3. 关闭并重新打开终端,或运行 source ~/.bashrc (或 ~/.zshrc)。
    4. 如果仍然不行,检查你的 ~/.bashrc (或 ~/.zshrc) 文件末尾是否包含由 conda init 添加的块。如果没有,可能需要手动添加 Anaconda 的 bin 目录到 PATH 环境变量(但不推荐,conda init 是更好的方式)。

7.2 安装过程中出现错误

  • 权限问题: 如果你试图安装到需要 sudo 权限的目录(如 /opt)但没有使用 sudo 运行安装脚本。建议安装到用户主目录下。
  • 磁盘空间不足: 确保安装目标分区有足够的空间(至少 3-5GB 可用)。
  • 下载文件损坏: 如果没有进行 SHA256 校验,下载的文件可能不完整。重新下载并校验。
  • 依赖问题: 极少数情况下,可能缺少某些基础系统库。检查安装过程中的错误信息,可能需要使用 sudo apt install 安装缺失的依赖。

7.3 Conda 下载/更新速度慢

  • 网络问题: 检查你的网络连接。
  • 官方渠道服务器负载: Anaconda 的默认渠道有时可能因为地理位置或服务器负载导致速度慢。
  • 解决方案:
    • 更换镜像源: 使用国内的镜像源可以显著提高速度。例如,清华大学 TUNA 镜像源。编辑 Conda 配置文件 ~/.condarc (如果不存在则创建),添加以下内容:
      “`yaml
      channels:

      • defaults
        show_channel_urls: true
        default_channels:
      • https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main
      • https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/r
      • https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/msys2
        custom_channels:
        conda-forge: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
        pytorch: https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud
        ``
        保存文件后,运行
        conda clean -i清除索引缓存,然后重试conda installupdate`。请注意,镜像源地址可能变化,请参考 TUNA 或其他镜像站的最新帮助文档。

7.4 与系统 Python 的冲突

正确安装并使用 conda init 后,当 (base) 或其他 Conda 环境激活时,终端会优先使用该环境的 Python 和包。当你 conda deactivate 后,应该会回到系统 Python(如果 PATH 设置正确)。通常 Anaconda 能很好地管理这一点,避免直接冲突。关键在于始终通过激活目标 Conda 环境来工作。


第八部分:卸载 Anaconda

如果你决定不再使用 Anaconda,可以按照以下步骤将其从 Ubuntu 系统中移除:

8.1 使用 anaconda-clean 工具(推荐)

Anaconda 提供了一个小工具 anaconda-clean 来帮助移除配置文件和可能产生备份的文件。

  1. 安装 anaconda-clean(如果尚未安装):
    bash
    conda install anaconda-clean
  2. 运行 anaconda-clean
    bash
    anaconda-clean

    它会询问你是否确认删除每个找到的 Anaconda 相关配置文件或目录。它默认不会删除文件,而是将其重命名并在末尾添加 .bak。如果你想直接删除,可以添加 --yes 参数:anaconda-clean --yes

8.2 手动删除 Anaconda 目录

anaconda-clean 主要处理配置文件。你需要手动删除整个 Anaconda 安装目录:

bash
rm -rf ~/anaconda3

请将 ~/anaconda3 替换为你实际的 Anaconda 安装路径。这个命令会彻底删除该目录及其所有内容,请务必确认路径无误!

8.3 移除 conda init 添加的配置

打开你的 shell 配置文件(通常是 ~/.bashrc~/.zshrc),找到由 conda init 添加的代码块(通常包含 # >>> conda initialize >>># <<< conda initialize <<< 标记)。将这整个代码块删除。

8.4 清理可能残留的隐藏文件/目录(可选)

检查主目录下是否有隐藏的 Conda 相关文件或目录,如 .conda.continuum,并手动删除它们:

bash
rm -rf ~/.conda
rm -rf ~/.continuum

8.5 重新加载 Shell 配置

关闭并重新打开终端,或者运行 source ~/.bashrc (或 ~/.zshrc),以使对配置文件的更改生效。此时 conda 命令应该不再可用。

至此,Anaconda 应该已经从你的 Ubuntu 系统中完全卸载了。


结论

在 Ubuntu 上安装 Anaconda 是开启 Python 数据科学生态大门的钥匙。通过本文详细的步骤指导,您应该已经成功地在您的系统上部署了 Anaconda,并掌握了其核心组件 Conda 的基本用法,包括环境管理和包安装。

记住,Anaconda 的真正威力在于其环境隔离能力。养成在特定项目中使用独立 Conda 环境的习惯,将使您的开发工作更加清晰、可复现,并能有效避免依赖冲突。随着您在数据科学领域的深入,Conda 强大的环境和包管理功能将持续为您提供坚实的支持。

现在,您可以开始创建您的第一个项目环境,安装所需的库,启动 Jupyter Notebook 或您喜欢的 IDE,尽情探索数据的奥秘和机器学习的魅力了!祝您在 Ubuntu 和 Anaconda 的陪伴下,编码愉快!

发表评论

您的邮箱地址不会被公开。 必填项已用 * 标注

滚动至顶部