По нескольким причинам мы решили разместить все наши частные и общедоступные зависимости Python (и их зависимости) на Amazon S3. Мы намерены скачивать/устанавливать пакеты только с S3 и больше нигде.
Я выполнил шаги, указанные в https://stackoverflow.com/a/57552988/3007402 (я написал ответ), чтобы настроить сервер pypi на S3.
Чтобы загрузить общедоступные пакеты в S3, я сначала загружал их с помощьюpip download numpy==1.14.2
pip download statsmodels==0.6.1
Чтобы установить любой пакет, я бы использовал
pip install pandas --index-url=http://<s3_endpoint> --trusted-host=<s3_endpoint> --no-cache-dir
Все нормально работает с пакетами, которые загружаются в виде .whl
файлов. Такие пакеты (например, pandas
) могут без проблем устанавливать себя и свои зависимости (numpy
в случае pandas
).
Проблема связана с пакетами, отличными от whl, такими как statsmodels-0.6.1.tar.gz
. В то время как pip
используется для установки statsmodels
, для установки зависимостей statsmodels
использует easy_install
.
Аргумент pip --index-url
не используется easy_install
, и он загружает зависимость - numpy
с pypi.org.
Чтобы исправить это (загрузка только с S3), я извлек statsmodels-0.6.1.tar.gz
, отредактировал setup.cfg
, переупаковал и загрузил на S3. Ниже приведено содержание setup.cfg
:
[egg_info]
tag_build =
tag_date = 0
tag_svn_revision = 0
# lines below are added by me
[easy_install]
index_url = http://<s3_link>
find_links = http://<s3_link>
С этим изменением statsmodels
извлекает зависимость numpy
из S3 и успешно устанавливает ее.
По какой-то странной причине это работает только в Ubuntu (локальный и EC2 под управлением Ubuntu), но не работает в EC2 под управлением Amazon Linux. Ниже приведен журнал, который я сохранил, используя аргумент --log <file>
для pip. Я удалил временную метку для краткости.
Created temporary directory: /tmp/pip-ephem-wheel-cache-7SD5Bu
Created temporary directory: /tmp/pip-req-tracker-du4AEi
Created requirements tracker '/tmp/pip-req-tracker-du4AEi'
Created temporary directory: /tmp/pip-install-G2qw36
Looking in indexes: http://<s3_link>
Collecting statsmodels
1 location(s) to search for versions of statsmodels:
* http://<s3_link>/statsmodels/
Getting page http://<s3_link>/statsmodels/
Found index url http://<s3_link>
Analyzing links from page http://<s3_link>/statsmodels/
Found link http://<s3_link>/statsmodels/statsmodels-0.6.1.tar.gz (from http://<s3_link>/statsmodels/), version: 0.6.1
Given no hashes to check 1 links for project 'statsmodels': discarding no candidates
Using version 0.6.1 (newest of versions: 0.6.1)
Created temporary directory: /tmp/pip-unpack-r8lKU4
Found index url http://<s3_link>
Downloading http://<s3_link>/statsmodels/statsmodels-0.6.1.tar.gz (7.1MB)
Downloading from URL http://<s3_link>/statsmodels/statsmodels-0.6.1.tar.gz (from http://<s3_link>/statsmodels/)
Added statsmodels from http://<s3_link>/statsmodels/statsmodels-0.6.1.tar.gz to build tracker '/tmp/pip-req-tracker-du4AEi'
Running setup.py (path:/tmp/pip-install-G2qw36/statsmodels/setup.py) egg_info for package statsmodels
Running command python setup.py egg_info
No local packages or download links found for numpy
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "/tmp/pip-install-G2qw36/statsmodels/setup.py", line 449, in <module>
**setuptools_kwargs)
File "/usr/lib64/python2.7/distutils/core.py", line 111, in setup
_setup_distribution = dist = klass(attrs)
File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/setuptools/dist.py", line 265, in __init__
self.fetch_build_eggs(attrs['setup_requires'])
File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/setuptools/dist.py", line 311, in fetch_build_eggs
replace_conflicting=True,
File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/pkg_resources/__init__.py", line 797, in resolve
dist = best[req.key] = env.best_match(req, ws, installer)
File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/pkg_resources/__init__.py", line 1047, in best_match
return self.obtain(req, installer)
File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/pkg_resources/__init__.py", line 1059, in obtain
return installer(requirement)
File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/setuptools/dist.py", line 378, in fetch_build_egg
return cmd.easy_install(req)
File "/home/ec2-user/tempenv/local/lib/python2.7/site-packages/setuptools/command/easy_install.py", line 617, in easy_install
raise DistutilsError(msg)
distutils.errors.DistutilsError: Could not find suitable distribution for Requirement.parse('numpy')
Вывод cat /etc/os-release
(детали Amazon Linux):
NAME="Amazon Linux AMI"
VERSION="2017.03"
ID="amzn"
ID_LIKE="rhel fedora"
VERSION_ID="2017.03"
PRETTY_NAME="Amazon Linux AMI 2017.03"