我们介绍了IEPILE,这是一个全面的双语(英语和中文)信息提取指令语料库,包含约0.32B个令牌。我们通过收集和清理33个现有的信息提取数据集,并引入基于模式的指令生成来挖掘出这个大规模语料库。实验结果表明,使用IEPILE可以提高大语言模型在信息提取任务上的性能,特别是在零样本泛化方面。