python – 创建HDF5文件而不关闭文件时损坏文件(h5py)
作者:互联网
我正在使用h5py将实验数据存储在HDF5容器中.
在交互式会话中,我使用以下命令打开文件:
measurement_data = h5py.File('example.hdf5', 'a')
然后我使用一些自编写的函数将数据写入文件(可以在几天的实验中获得数GB的数据).在实验结束时,我通常会使用关闭文件
measurement_data.close()
不幸的是,不时发生这种情况,交互式会话结束时没有明确关闭文件(意外杀死会话,停电,因某些其他软件导致操作系统崩溃).这总是会导致文件损坏并丢失完整数据.当我尝试打开它时,我收到错误:
OSError: Unable to open file (File signature not found)
我也无法在HDFview或我试过的任何其他软件中打开文件.
>有没有办法避免损坏的文件,即使它没有明确关闭?我已经阅读了有关使用with语句here的内容,但是当会话意外结束时,我不确定这是否会有所帮助.
>我可以以某种方式恢复损坏文件中的数据吗?有修复程序吗?
始终为每次写入访问打开和关闭文件对我来说都是非常不利的,因为我不断地从许多不同的函数和线程中写入数据.所以我对另一种解决方案更满意.
解决方法:
HDF5设计人员已知腐败问题.他们正在努力在版本1.10到adding journalling之前修复此问题.与此同时,您可以定期调用flush()以确保您的写入已被刷新,这应该最大限度地减少一些损害.您也可以尝试使用external links,它允许您将数据存储在单独的文件中,但在阅读时将它们链接在一起.
标签:python,corruption,h5py 来源: https://codeday.me/bug/20190528/1169885.html