石鑫华机器视觉网:DjVu(读作déjà vu)是一种计算机文件格式,主要用于存储扫描的文档。这种格式的特色包括图像分层、渐进载入、算术编码、对二进制图像进行有损压缩,从而以较小的空间,存放高质量的可读图像。
渐进载入使得DjVu适合于应用于因特网。DjVu对于大部分的扫描文档,表现都优于PDF,故被作为PDF的替代品来进行推广。这种格式已经在文件共享网络中,被广泛使用于分发数学书籍。跟PDF类似,DjVu也可以包含光学文字识别的文本层,这样就可以使用复制与粘贴操作。
DjVu技术最初由AT&T实验室的Yann Le Cun、Léon Bottou、Patrick Haffner和Paul G. Howard于1996年开发。DjVu是一种开放的文件格式,文件格式规范与参考库的源代码都公开发布。商业开发的所有权几年来被转给了不同的公司,包括AT&T和LizardTech。原来作者维护一个GPL实现,称为DjVuLibre。
2002年,DjVu文件格式(还有TIFF和PDF格式)被Internet Archive的百万书籍工程选中,作为公有领域书籍扫描后上线的格式。
DjVu