Невозможно получить пакеты с частного сервера pypi в Amazon EC2

По нескольким причинам мы решили разместить все наши частные и общедоступные зависимости Python (и их зависимости) на Amazon S3. Мы намерены скачивать/устанавливать пакеты только с S3 и больше нигде.

Я выполнил шаги, указанные в https://stackoverflow.com/a/57552988/3007402 (я написал ответ), чтобы настроить сервер pypi на S3.

Чтобы загрузить общедоступные пакеты в S3, я сначала загружал их с помощью
pip download numpy==1.14.2
pip download statsmodels==0.6.1

Чтобы установить любой пакет, я бы использовал

pip install pandas --index-url=http://<s3_endpoint> --trusted-host=<s3_endpoint> --no-cache-dir

Все нормально работает с пакетами, которые загружаются в виде .whl файлов. Такие пакеты (например, pandas) могут без проблем устанавливать себя и свои зависимости (numpy в случае pandas).

Проблема связана с пакетами, отличными от whl, такими как statsmodels-0.6.1.tar.gz. В то время как pip используется для установки statsmodels, для установки зависимостей statsmodels использует easy_install.
Аргумент pip --index-url не используется easy_install, и он загружает зависимость - numpy с pypi.org.

Чтобы исправить это (загрузка только с S3), я извлек statsmodels-0.6.1.tar.gz, отредактировал setup.cfg, переупаковал и загрузил на S3. Ниже приведено содержание setup.cfg:

[egg_info]
tag_build =
tag_date = 0
tag_svn_revision = 0

# lines below are added by me
[easy_install]
index_url = http://<s3_link>
find_links = http://<s3_link>

С этим изменением statsmodels извлекает зависимость numpy из S3 и успешно устанавливает ее.

По какой-то странной причине это работает только в Ubuntu (локальный и EC2 под управлением Ubuntu), но не работает в EC2 под управлением Amazon Linux. Ниже приведен журнал, который я сохранил, используя аргумент --log <file> для pip. Я удалил временную метку для краткости.

Created temporary directory: /tmp/pip-ephem-wheel-cache-7SD5Bu
Created temporary directory: /tmp/pip-req-tracker-du4AEi
Created requirements tracker '/tmp/pip-req-tracker-du4AEi'
Created temporary directory: /tmp/pip-install-G2qw36
Looking in indexes: http://<s3_link>
Collecting statsmodels
  1 location(s) to search for versions of statsmodels:
  * http://<s3_link>/statsmodels/
  Getting page http://<s3_link>/statsmodels/
  Found index url http://<s3_link>
  Analyzing links from page http://<s3_link>/statsmodels/
    Found link http://<s3_link>/statsmodels/statsmodels-0.6.1.tar.gz (from http://<s3_link>/statsmodels/), version: 0.6.1
  Given no hashes to check 1 links for project 'statsmodels': discarding no candidates
  Using version 0.6.1 (newest of versions: 0.6.1)
  Created temporary directory: /tmp/pip-unpack-r8lKU4
  Found index url http://<s3_link>
  Downloading http://<s3_link>/statsmodels/statsmodels-0.6.1.tar.gz (7.1MB)
  Downloading from URL http://<s3_link>/statsmodels/statsmodels-0.6.1.tar.gz (from http://<s3_link>/statsmodels/)
  Added statsmodels from http://<s3_link>/statsmodels/statsmodels-0.6.1.tar.gz to build tracker '/tmp/pip-req-tracker-du4AEi'
    Running setup.py (path:/tmp/pip-install-G2qw36/statsmodels/setup.py) egg_info for package statsmodels
    Running command python setup.py egg_info
    No local packages or download links found for numpy
    Traceback (most recent call last):
      File "<string>", line 1, in <module>
      File "/tmp/pip-install-G2qw36/statsmodels/setup.py", line 449, in <module>
        **setuptools_kwargs)
      File "/usr/lib64/python2.7/distutils/core.py", line 111, in setup
        _setup_distribution = dist = klass(attrs)
      File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/setuptools/dist.py", line 265, in __init__
        self.fetch_build_eggs(attrs['setup_requires'])
      File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/setuptools/dist.py", line 311, in fetch_build_eggs
        replace_conflicting=True,
      File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/pkg_resources/__init__.py", line 797, in resolve
        dist = best[req.key] = env.best_match(req, ws, installer)
      File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/pkg_resources/__init__.py", line 1047, in best_match
        return self.obtain(req, installer)
      File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/pkg_resources/__init__.py", line 1059, in obtain
        return installer(requirement)
      File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/setuptools/dist.py", line 378, in fetch_build_egg
        return cmd.easy_install(req)
      File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/setuptools/command/easy_install.py", line 617, in easy_install
        raise DistutilsError(msg)
    distutils.errors.DistutilsError: Could not find suitable distribution for Requirement.parse('numpy')

Вывод cat /etc/os-release (детали Amazon Linux):

NAME="Amazon Linux AMI"
VERSION="2017.03"
ID="amzn"
ID_LIKE="rhel fedora"
VERSION_ID="2017.03"
PRETTY_NAME="Amazon Linux AMI 2017.03"

person Shiva    schedule 09.09.2019    source источник


Ответы (1)


Судя по всему, в EC2 под управлением Amazon Linux использовалась более старая версия setuptools.
Я обновился до последней версии, и установка прошла нормально. ????

person Shiva    schedule 09.09.2019