编程语言
首页 > 编程语言> > python-read_csv()中的S3阅读器是先将文件下载到磁盘还是使用流式传输?

python-read_csv()中的S3阅读器是先将文件下载到磁盘还是使用流式传输?

作者:互联网

我正在使用read_csvin Pandas从S3读取数据.我想知道它是否先将文件下载到本地磁盘,然后加载到内存中,还是直接将传入的数据流传输到内存中,而没有中间步骤将其加载到磁盘.

我对Spark的sqlContext.read.load函数有相同的问题.

解决方法:

pandas uses boto用于访问s3,其中does appear to stream是文件数据.

标签:apache-spark,pandas,pyspark,python
来源: https://codeday.me/bug/20191118/2031253.html