实习的时候,因为要在远程服务器上配置开发环境。作为小白,遇上很多坑。这里把自己遇到的一些问题写出来,如果能帮助到其他人,那就再好不过了。
1、需求:在配置好的多核环境中python2.7中安装pyspark工具。
2、遇到的问题:1、利用 pip install pyspark命令安装时,会报错:HTTPSConnectionPool(host=‘files.pythonhosted.org’, port=443): Read timed out
解决方法:pip --default-timeout=100 install -U (这里加上你要下载的库的名字),如:
pip --default-timeout=100 install -U pyspark
2、下载过慢的问题:
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pip -U pyspark
依次输入以下两行命令:
pip --default-timeout=100
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple pip -U pyspark